Java數(shù)據(jù)科學(xué)實戰(zhàn)
姜建錦, 趙緒營, 張巖 譯
出版時間:2020年04月
頁數(shù):186
“這是一本不可多得的、采用Java來實現(xiàn)與應(yīng)用數(shù)據(jù)科學(xué)的書。書中對機(jī)器學(xué)習(xí)所需的線 性代數(shù)和統(tǒng)計學(xué)的討論簡潔有力。本書匯集了布茹斯托維奇在該領(lǐng)域的豐富實戰(zhàn)經(jīng)驗,我強(qiáng)烈推薦?!?br />
——Terence Parr
舊金山大學(xué)計算機(jī)科學(xué)和數(shù)據(jù)科學(xué)教授,語法分析器生成工具ANTLR之父
數(shù)據(jù)科學(xué)近年來迅速成為了熱門研究領(lǐng)域,但很少有數(shù)據(jù)科學(xué)從業(yè)人士冒險涉足Java世界??紤]到在工程與科學(xué)的交叉地帶所需的可伸縮性、穩(wěn)健性以及便利性,Java其實是一門理想的語言。本書將循序漸進(jìn)地引導(dǎo)讀者進(jìn)入數(shù)據(jù)科學(xué)的工作流程,在解釋數(shù)學(xué)原理的同時給出代碼示例。書中解釋了數(shù)據(jù)科學(xué)流程每一步背后的基本數(shù)學(xué)原理,以及如何采用Java來應(yīng)用這些原理。
本書內(nèi)容涉及數(shù)據(jù)輸入與輸出、線性代數(shù)、統(tǒng)計學(xué)、數(shù)據(jù)操作、學(xué)習(xí)與預(yù)測,以及Hadoop MapReduce在這個過程中所扮演的關(guān)鍵角色。
● 討論獲取數(shù)據(jù)、清理數(shù)據(jù),以及以純粹方式排列數(shù)據(jù)的眾多方法
● 理解數(shù)據(jù)應(yīng)采用的矩陣結(jié)構(gòu)
● 學(xué)習(xí)測試數(shù)據(jù)來源及數(shù)據(jù)有效性的基本概念
● 把數(shù)據(jù)轉(zhuǎn)換為穩(wěn)定且可用的數(shù)值
● 理解監(jiān)督型學(xué)習(xí)算法與無監(jiān)督型學(xué)習(xí)算法,以及評估這些算法是否成功的方法
● 采用適合數(shù)據(jù)科學(xué)算法的定制組件,設(shè)置和運(yùn)行MapReduce任務(wù)
書名:Java數(shù)據(jù)科學(xué)實戰(zhàn)
譯者:姜建錦, 趙緒營, 張巖 譯
國內(nèi)出版社:人民郵電出版社
出版時間:2020年04月
頁數(shù):186
書號:978-7-115-53330-2
原版書書名:Data Science with Java
原版書出版商:O'Reilly Media
Michael R. Brzustowicz
邁克爾·R.布茹斯托維奇(Michael R. Brzustowicz),從研究物理的博士后轉(zhuǎn)型為經(jīng)驗豐富的數(shù)據(jù)科學(xué)家,專注于建立分布式數(shù)據(jù)系統(tǒng),并從海量數(shù)據(jù)中提取知識。他大部分的時間都在編寫(日常大數(shù)據(jù)問題的)統(tǒng)計模型方法及機(jī)器學(xué)習(xí)方法的定制多線程代碼。他是多家創(chuàng)業(yè)公司的合伙人,并在舊金山大學(xué)擔(dān)任兼職教授。