利用Dask擴展Python性能
馬宏華 譯
出版時間:2024年08月
頁數(shù):193
“本書寫得非常棒,如果你是Dask的新用戶或考慮在項目中使用Dask,那么這幾乎是一本必讀書冊。Dask提供了強大的功能以及許多需要牢記的微妙技巧,而本書則是探索這一新領域的理想工具?!?br />
——Adam Breindel
數(shù)據(jù)工程和ML/AI獨立顧問
“很高興能看到本領域專家寫的有關Dask的圖書。”
——Matthew Rocklin
初始Dask維護者和Coiled Computing首席執(zhí)行官
現(xiàn)代系統(tǒng)包含具有并行計算潛力的多核CPU和GPU,但許多科學Python工具的設計并沒有很好地利用這種并行性。通過本書的深入介紹,數(shù)據(jù)科學家和Python程序員將了解Dask并行計算開源庫,掌握如何利用它提供的API,使包括NumPy、Pandas和scikit-learn在內的PyData庫易于并行化。
本書作者Holden Karau和Mika Kimmins向你展示了如何在本地系統(tǒng)中使用Dask計算,然后擴展到云端以應對更繁重的工作負載。這本實用手冊解釋了為什么Dask在行業(yè)專家和學者中很受歡迎,并被沃爾瑪、Capital One、哈佛醫(yī)學院和美國國家航空航天局(NASA)等組織使用。
在本書中你會學習到:
● 如何使用Dask進行批量數(shù)據(jù)并行處理
● 理解Dask的關鍵分布式系統(tǒng)概念
● 將Dask與高級API和構建塊一起使用的方法
● 如何使用集成庫
● 如何將Dask與GPU結合使用
書名:利用Dask擴展Python性能
譯者:馬宏華 譯
國內出版社:清華大學出版社
出版時間:2024年08月
頁數(shù):193
書號:978-7-302-66629-5
原版書書名:Scaling Python with Dask
原版書出版商:O'Reilly Media
Holden Karau
Holden Karau是一位加拿大人,在IBM的Spark技術中心擔任軟件開發(fā)工程師。同時作為一位Spark committer,經常在PySpark和機器學習方面進行貢獻。另外曾在多次國際會議中發(fā)表關于Spark的演講。
Databricks的軟件開發(fā)工程師,活躍于開源社區(qū)。她還著有《Spark快速數(shù)據(jù)處理》。
Mika Kimmins
Mika Kimmins是一名數(shù)據(jù)工程師、分布式系統(tǒng)研究員和機器學習顧問。她參與了各種自然語言處理(NLP)項目,包括語言建模、強化學習和機器學習管道等。