基于Apache Spark的流處理
陳志鵬 譯
出版時(shí)間:2021年04月
頁數(shù):422
“這本書將帶你了解Spark在流處理方面的支持,從早期的 DStream API到后來基于SQL 的Structured Streaming。本書是學(xué)習(xí)這些知識必備的權(quán)威指南。”
——Dean Wampler
Lightbend副總裁、負(fù)責(zé)快速數(shù)據(jù)工程建設(shè), 《Programming Scala》的共同作者
利用分析工具可以快速獲取商業(yè)洞察,為此你需要了解如何對數(shù)據(jù)進(jìn)行實(shí)時(shí)處理。通過這本實(shí)用指南,對于熟悉Apache Spark的讀者來說,你們將了解如何將這個(gè)內(nèi)存框架應(yīng)用于流數(shù)據(jù)。你會發(fā)現(xiàn)Spark讓你幾乎可以像面對批處理作業(yè)一樣來開發(fā)流處理作業(yè)。
本書介紹了Apache Spark的理論基礎(chǔ)。這本綜合指南通過兩個(gè)部分比較了Spark支持的流處理AP:早期的Spark Streaming和后來的 Structured Streaming。
● 學(xué)習(xí)流處理的基本概念、研究各種流處理架構(gòu)。
● 通過具體實(shí)例來研究Structured Streaming、深入理解流處理概念。
● 通過Spark Streaming創(chuàng)建并管理流作業(yè),使用其他Spark API與Spark Streaming集成。
● 學(xué)習(xí)Spark Streaming高級技巧,包括近似算法和機(jī)器學(xué)習(xí)算法。
● 將Apache Spark與其他流處理項(xiàng)目比較,包括Apache Storm、Apache Flink和Apache Kafka Streams。
書名:基于Apache Spark的流處理
譯者:陳志鵬 譯
國內(nèi)出版社:中國電力出版社
出版時(shí)間:2021年04月
頁數(shù):422
書號:978-7-5198-5294-8
原版書書名:Stream Processing with Apache Spark
原版書出版商:O'Reilly Media
Gerard Maas
Gerard Maas是Lightbend的首席工程師,致力于將Structured Streaming與其他可擴(kuò)展的流處理技術(shù)無縫地集成到Lightbend平臺上。此前他在一家云原生物聯(lián)網(wǎng)創(chuàng)業(yè)公司工作,帶領(lǐng)數(shù)據(jù)處理團(tuán)隊(duì)構(gòu)建流式管道,將Spark Streaming的吞吐量推上了極限。當(dāng)時(shí)還發(fā)布了第一篇關(guān)于Spark Streaming性能調(diào)優(yōu)的全面指南。
Gerard曾在幾家創(chuàng)業(yè)公司和大型企業(yè)中擔(dān)任領(lǐng)導(dǎo)角色,構(gòu)建數(shù)據(jù)科學(xué)管理、云原生物聯(lián)網(wǎng)平臺、電信平臺,以及可擴(kuò)展的API。此外經(jīng)常在技術(shù)會議上發(fā)言,并參與貢獻(xiàn)各種大大小小的開源項(xiàng)目。Gerard擁有委內(nèi)瑞拉的西蒙玻利瓦爾大學(xué)的計(jì)算機(jī)工程學(xué)位。你可以通過推特@maasg找到他。
Francois Garillot
Francois Garillot住在西雅圖,在Facebook從事于分布式計(jì)算。于2011在巴黎綜合理工學(xué)院獲得博士學(xué)位,曾于2015年在Lightbend從事Spark Streaming反壓機(jī)制研究。他的興趣包括類型系統(tǒng)、利用編程語言簡化分析的表示方法,熱愛Scala、Spark以及阿拉比卡(咖啡豆)烘焙。不工作的時(shí)候,喜歡在太平洋西北部的山脈享受生活。
本書封面上的動物是歐亞喜鵲(學(xué)名:Pica pica),遍布于北歐與亞洲,從西班牙、愛爾蘭一直到俄羅斯東北部的堪察加半島。在英語中,鵲(magpie)指的是歐亞喜鵲,不過它們在歐洲、亞洲、中東、北非以及北美各地的鴉族中都有不同的說法。
歐洲喜鵲的雄性和雌性都有引人注目的羽毛。腹部和肩部都是明亮的白色,與光滑、黑色的頭部、胸部以及翅膀形成對比。這些黑色區(qū)域會根據(jù)光線不同閃爍著藍(lán)色或綠色的光澤。雄性喜鵲身長17~18英寸(尾巴約占一半),翼展為20~24英寸;雌性略小一些。喜鵲通常會避開人類,但你可能聽過它們響亮的叫聲。
歐亞喜鵲是雜食動物。它們以昆蟲、腐肉、小型哺乳動物,甚至其他鳥類的幼鳥和蛋、谷物、種子等為食。它們是所有動物中最聰明的一種,擁有像類人猿那樣的認(rèn)知能力:使用工具、記憶、推理以及社會交往。這些特點(diǎn)導(dǎo)致了對喜鵲的一些迷信。歐洲和斯堪的納維亞文化將它們與偷竊甚至巫術(shù)聯(lián)系起來。在亞洲則相反,人們將它們與好運(yùn)及客人的光臨聯(lián)系在一起。
雖然歐亞喜鵲種群分布廣泛、數(shù)量眾多,但是O'Reilly出版物封面上的許多動物都瀕臨滅絕。所有這些動物對世界來說都是很重要的。如果你想了解更多關(guān)于如何為它們提供幫助,請?jiān)L問animals.oreilly.com。
封面的彩色插圖由Karen Montgomery根據(jù)“Meyers Kleines詞典”中的黑白版畫創(chuàng)作而成。