社交網(wǎng)站的數(shù)據(jù)挖掘與分析(原書第3版)
蘇統(tǒng)華, 郭勇, 潘巍 譯
出版時間:2021年01月
頁數(shù):347
“基于認(rèn)知計算技術(shù),數(shù)據(jù)可以為你帶來無限活力。對于那些希望使用現(xiàn)代數(shù)據(jù)科學(xué)方法動手挖掘當(dāng)前龐大的社交網(wǎng)站數(shù)據(jù)的人來說,本書是必不可少的。”
——Rohan Khairnar
北卡羅來納大學(xué)夏洛特分校
高級數(shù)據(jù)和知識發(fā)現(xiàn)學(xué)院
分析師和數(shù)據(jù)科學(xué)家
“在這個數(shù)字時代,從社交網(wǎng)站的虛擬世界中獲得真知灼見已成為一項必不可少的技能。對于任何想使用神奇的挖掘和分析技術(shù)來善用社交數(shù)據(jù)的人而言,本書都是完整而簡明的指南。”
——Stuthi Parameshwara Rao
北卡羅來納大學(xué)夏洛特分校
信息技術(shù)學(xué)院數(shù)據(jù)分析師
本書指導(dǎo)你挖掘隱藏在Twitter、Facebook、LinkedIn、Instagram和GitHub等流行社交網(wǎng)站上的豐富數(shù)據(jù)。通過這本暢銷指南,數(shù)據(jù)科學(xué)家、分析師和程序員將學(xué)習(xí)如何在Jupyter Notebook或者Docker容器中使用Python代碼分析社交媒體中的真知灼見——哪些人正在通過社交媒體進(jìn)行聯(lián)系?他們正在談?wù)撌裁??他們目前身在何處?br />
在本書的第一部分,每一章都聚焦社交網(wǎng)站生態(tài)的某個具體方面,囊括了各大主流社交網(wǎng)站,也包括了網(wǎng)頁、博客和訂閱源、郵箱、GitHub以及新增加的Instagram的內(nèi)容。第二部分提供了實用指南,其中包括超過20個供挖掘Twitter數(shù)據(jù)之用的簡短代碼解決方案。
通過閱讀本書,你將能夠:
● 極速鳥瞰社交網(wǎng)站生態(tài)。
● 將每章的代碼打包為Jupyter Notebook,并使用Docker輕松運行。
● 借用并活用開源GitHub代碼庫。
● 了解如何使用Python 3工具對收集的數(shù)據(jù)條分縷析。
● 使用先進(jìn)的數(shù)據(jù)挖掘技術(shù),如TF-IDF、余弦相似度、共現(xiàn)分析、團(tuán)檢測和圖像識別。
● 借助Python和JavaScript工具包構(gòu)建漂亮的數(shù)據(jù)可視化。
書名:社交網(wǎng)站的數(shù)據(jù)挖掘與分析(原書第3版)
譯者:蘇統(tǒng)華, 郭勇, 潘巍 譯
國內(nèi)出版社:機械工業(yè)出版社
出版時間:2021年01月
頁數(shù):347
書號:978-7-111-67404-7
原版書書名:Mining the Social Web, 3rd Edition
原版書出版商:O'Reilly Media
Matthew A. Russell
馬修·羅塞爾(Matthew A. Russell),Digital Reasoning Systems公司的技術(shù)副總裁和Zaffra公司的負(fù)責(zé)人,是熱愛數(shù)據(jù)挖掘、開源和Web應(yīng)用技術(shù)的計算機科學(xué)家。他也是《Dojo: The Definitive Guide》(O’Reilly出版社)的作者。在Linkedin上聯(lián)系他或在Twitter關(guān)注@ptwobrussell,可隨時了解他的最新動態(tài)。
Mikhail Klassen
Mikhail Klassen是Paladin AI公司的聯(lián)合創(chuàng)始人和首席數(shù)據(jù)科學(xué)家,該公司坐落于蒙特利爾,是面向航空領(lǐng)域提供數(shù)據(jù)分析服務(wù)的初創(chuàng)公司。他的工作是借助數(shù)據(jù)挖掘和機器學(xué)習(xí)技術(shù)為飛行員設(shè)計下一代基于數(shù)據(jù)驅(qū)動的自適應(yīng)培訓(xùn)方案。