91精品国产综合久久四虎久久_国产成人午夜高潮毛片_99er视频精品免费观看_2020亚洲熟女在线观看_日本女优人体写真_国内黄色毛片_年轻的老师中文版在线_丰满女邻居做爰_久久久久久精品成人免费图片

 
社交網(wǎng)站的數(shù)據(jù)挖掘與分析(原書第3版)
社交網(wǎng)站的數(shù)據(jù)挖掘與分析(原書第3版)
Matthew A. Russell, Mikhail Klassen
蘇統(tǒng)華, 郭勇, 潘巍 譯
出版時間:2021年01月
頁數(shù):347
“基于認(rèn)知計算技術(shù),數(shù)據(jù)可以為你帶來無限活力。對于那些希望使用現(xiàn)代數(shù)據(jù)科學(xué)方法動手挖掘當(dāng)前龐大的社交網(wǎng)站數(shù)據(jù)的人來說,本書是必不可少的。”
——Rohan Khairnar
北卡羅來納大學(xué)夏洛特分校
高級數(shù)據(jù)和知識發(fā)現(xiàn)學(xué)院
分析師和數(shù)據(jù)科學(xué)家
“在這個數(shù)字時代,從社交網(wǎng)站的虛擬世界中獲得真知灼見已成為一項必不可少的技能。對于任何想使用神奇的挖掘和分析技術(shù)來善用社交數(shù)據(jù)的人而言,本書都是完整而簡明的指南。”
——Stuthi Parameshwara Rao
北卡羅來納大學(xué)夏洛特分校
信息技術(shù)學(xué)院數(shù)據(jù)分析師
本書指導(dǎo)你挖掘隱藏在Twitter、Facebook、LinkedIn、Instagram和GitHub等流行社交網(wǎng)站上的豐富數(shù)據(jù)。通過這本暢銷指南,數(shù)據(jù)科學(xué)家、分析師和程序員將學(xué)習(xí)如何在Jupyter Notebook或者Docker容器中使用Python代碼分析社交媒體中的真知灼見——哪些人正在通過社交媒體進(jìn)行聯(lián)系?他們正在談?wù)撌裁??他們目前身在何處?br /> 在本書的第一部分,每一章都聚焦社交網(wǎng)站生態(tài)的某個具體方面,囊括了各大主流社交網(wǎng)站,也包括了網(wǎng)頁、博客和訂閱源、郵箱、GitHub以及新增加的Instagram的內(nèi)容。第二部分提供了實用指南,其中包括超過20個供挖掘Twitter數(shù)據(jù)之用的簡短代碼解決方案。
通過閱讀本書,你將能夠:
● 極速鳥瞰社交網(wǎng)站生態(tài)。
● 將每章的代碼打包為Jupyter Notebook,并使用Docker輕松運行。
● 借用并活用開源GitHub代碼庫。
● 了解如何使用Python 3工具對收集的數(shù)據(jù)條分縷析。
● 使用先進(jìn)的數(shù)據(jù)挖掘技術(shù),如TF-IDF、余弦相似度、共現(xiàn)分析、團(tuán)檢測和圖像識別。
● 借助Python和JavaScript工具包構(gòu)建漂亮的數(shù)據(jù)可視化。
  1. 前言
  2. 第一部分 社交網(wǎng)站導(dǎo)引
  3. 序幕
  4. 第1章 挖掘Twitter:探索熱門話題、發(fā)現(xiàn)人們的談?wù)搩?nèi)容等
  5. 1.1 概述
  6. 1.2 Twitter風(fēng)靡一時的原因
  7. 1.3 探索Twitter API
  8. 1.3.1 基本的Twitter術(shù)語
  9. 1.3.2 創(chuàng)建一個Twitter API連接
  10. 1.3.3 探索熱門話題
  11. 1.3.4 搜索推文
  12. 1.4 分析140字(或更多)的推文
  13. 1.4.1 提取推文實體
  14. 1.4.2 使用頻率分析技術(shù)分析推文和推文實體
  15. 1.4.3 計算推文的詞匯豐富性
  16. 1.4.4 檢視轉(zhuǎn)推模式
  17. 1.4.5 使用直方圖將頻率數(shù)據(jù)可視化
  18. 1.5 本章小結(jié)
  19. 1.6 推薦練習(xí)
  20. 1.7 在線資源
  21. 第2章 挖掘Facebook:分析粉絲頁面、查看好友關(guān)系等
  22. 2.1 概述
  23. 2.2 探索Facebook的圖譜API
  24. 2.2.1 理解圖譜API
  25. 2.2.2 理解開放圖協(xié)議
  26. 2.3 分析社交圖譜聯(lián)系
  27. 2.3.1 分析Facebook頁面
  28. 2.3.2 使用pandas作數(shù)據(jù)
  29. 2.4 本章小結(jié)
  30. 2.5 推薦練習(xí)
  31. 2.6 在線資源
  32. 第3章 挖掘Instagram:計算機視覺、神經(jīng)網(wǎng)絡(luò)、對象識別和人臉檢測
  33. 3.1 概述
  34. 3.2 探索Instagram API
  35. 3.2.1 建立Instagram API請求
  36. 3.2.2 獲取你自己的Instagram訂閱源
  37. 3.2.3 通過主題標(biāo)簽檢索媒體
  38. 3.3 Instagram帖子的剖析
  39. 3.4 人工神經(jīng)網(wǎng)絡(luò)速成
  40. 3.4.1 訓(xùn)練神經(jīng)網(wǎng)絡(luò)“看”圖片
  41. 3.4.2 手寫數(shù)字識別
  42. 3.4.3 使用預(yù)訓(xùn)練的神經(jīng)網(wǎng)絡(luò)在照片中識別物體
  43. 3.5 神經(jīng)網(wǎng)絡(luò)在Instagram帖子中的應(yīng)用
  44. 3.5.1 標(biāo)記圖像內(nèi)容
  45. 3.5.2 在圖像中檢測人臉
  46. 3.6 本章小結(jié)
  47. 3.7 推薦練習(xí)
  48. 3.8 在線資源
  49. 第4章 挖掘LinkedIn:分組職位、聚類同行等
  50. 4.1 概述
  51. 4.2 探索LinkedIn API
  52. 4.2.1 發(fā)起LinkedIn API請求
  53. 4.2.2 下載LinkedIn的聯(lián)系人并保存為CSV文件
  54. 4.3 數(shù)據(jù)聚類速成
  55. 4.3.1 對數(shù)據(jù)進(jìn)行規(guī)范化處理以便進(jìn)行分析
  56. 4.3.2 測量相似度
  57. 4.3.3 聚類算法
  58. 4.4 本章小結(jié)
  59. 4.5 推薦練習(xí)
  60. 4.6 在線資源
  61. 第5章 挖掘文本文件:計算文檔相似度、提取搭配等
  62. 5.1 概述
  63. 5.2 文本文件
  64. 5.3 TF-IDF簡介
  65. 5.3.1 詞頻
  66. 5.3.2 逆文檔頻率
  67. 5.3.3 TF-IDF
  68. 5.4 用TF-IDF查詢?nèi)祟愓Z言數(shù)據(jù)
  69. 5.4.1 自然語言工具包概述
  70. 5.4.2 對人類語言使用TF-IDF
  71. 5.4.3 查找相似文檔
  72. 5.4.4 分析人類語言中的二元文法
  73. 5.4.5 分析人類語言數(shù)據(jù)的反思
  74. 5.5 本章小結(jié)
  75. 5.6 推薦練習(xí)
  76. 5.7 在線資源
  77. 第6章 挖掘網(wǎng)頁:使用自然語言處理理解人類語言、總結(jié)博客內(nèi)容等
  78. 6.1 概述
  79. 6.2 抓取、解析和爬取網(wǎng)頁
  80. 6.3 通過解碼語法來探索語義
  81. 6.3.1 一步步講解自然語言處理
  82. 6.3.2 人類語言數(shù)據(jù)中的句子檢測
  83. 6.3.3 文檔摘要
  84. 6.4 以實體為中心的分析:范式轉(zhuǎn)換
  85. 6.5 人類語言數(shù)據(jù)處理分析的質(zhì)量
  86. 6.6 本章小結(jié)
  87. 6.7 推薦練習(xí)
  88. 6.8 在線資源
  89. 第7章 挖掘郵箱:分析誰和誰說什么以及說的頻率等
  90. 7.1 概述
  91. 7.2 獲取和處理郵件語料庫
  92. 7.2.1 Uni郵箱指南
  93. 7.2.2 獲得Enron數(shù)據(jù)
  94. 7.2.3 將郵件語料轉(zhuǎn)換為Uni郵箱
  95. 7.2.4 將Uni郵箱轉(zhuǎn)換為pandas DataFrame
  96. 7.3 分析Enron語料庫
  97. 7.3.1 根據(jù)日期/時間范圍查詢
  98. 7.3.2 發(fā)件人/收件人通信的分析模式
  99. 7.3.3 根據(jù)關(guān)鍵詞查找郵件
  100. 7.4 分析你自己的郵件數(shù)據(jù)
  101. 7.4.1 通過OAuth訪問你的Gmail
  102. 7.4.2 獲取和解析郵件
  103. 7.4.3 Immersion對電子郵件的可視化模式
  104. 7.5 本章小結(jié)
  105. 7.6 推薦練習(xí)
  106. 7.7 在線資源
  107. 第8章 挖掘GitHub:檢查軟件協(xié)同習(xí)慣、構(gòu)建興趣圖譜等
  108. 8.1 概述
  109. 8.2 探索GitHub的API
  110. 8.2.1 建立GitHub API連接
  111. 8.2.2 建立GitHub API請求
  112. 8.3 使用屬性圖為數(shù)據(jù)建模
  113. 8.4 分析GitHub興趣圖譜
  114. 8.4.1 初始化一個興趣圖譜
  115. 8.4.2 計算圖的中心度度量
  116. 8.4.3 為用戶添加“關(guān)注”邊來擴展興趣圖譜
  117. 8.4.4 以節(jié)點為中心獲得更高效的查詢
  118. 8.4.5 興趣圖譜的可視化
  119. 8.5 本章小結(jié)
  120. 8.6 推薦練習(xí)
  121. 8.7 在線資源
  122. 第二部分 Twitter數(shù)據(jù)挖掘與分析實用指南
  123. 第9章 Twitter數(shù)據(jù)挖掘與分析
  124. 9.1 訪問Twitter的API(開發(fā)目的)
  125. 9.2 使用OAuth訪問Twitter的API(產(chǎn)品目的)
  126. 9.3 探索流行話題
  127. 9.4 查找推文
  128. 9.5 構(gòu)造方便的函數(shù)調(diào)用
  129. 9.6 使用文本文件存儲JSON數(shù)據(jù)
  130. 9.7 使用MongoDB存儲和訪問JSON數(shù)據(jù)
  131. 9.8 使用信息流API對Twitter數(shù)據(jù)管道抽樣
  132. 9.9 采集時序數(shù)據(jù)
  133. 9.10 提取推文實體
  134. 9.11 在特定的推文范圍內(nèi)查找流行的推文
  135. 9.12 在特定的推文范圍內(nèi)查找流行的推文實體
  136. 9.13 對頻率分析制表
  137. 9.14 查找轉(zhuǎn)推了狀態(tài)的用戶
  138. 9.15 提取轉(zhuǎn)推的屬性
  139. 9.16 創(chuàng)建健壯的Twitter請求
  140. 9.17 獲取用戶檔案信息
  141. 9.18 從任意的文本中提取推文實體
  142. 9.19 獲得用戶的所有好友和關(guān)注者
  143. 9.20 分析用戶的好友和關(guān)注者
  144. 9.21 獲取用戶的推文
  145. 9.22 爬取好友關(guān)系圖
  146. 9.23 分析推文內(nèi)容
  147. 9.24 提取鏈接目標(biāo)摘要
  148. 9.25 分析用戶收藏的推文
  149. 9.26 本章小結(jié)
  150. 9.27 推薦練習(xí)
  151. 9.28 在線資源
  152. 第三部分 附錄
  153. 附錄A 關(guān)于本書虛擬機體驗的信息
  154. 附錄B OAuth入門
  155. 附錄C Python和Jupyter tebook的使用技巧
書名:社交網(wǎng)站的數(shù)據(jù)挖掘與分析(原書第3版)
譯者:蘇統(tǒng)華, 郭勇, 潘巍 譯
國內(nèi)出版社:機械工業(yè)出版社
出版時間:2021年01月
頁數(shù):347
書號:978-7-111-67404-7
原版書書名:Mining the Social Web, 3rd Edition
原版書出版商:O'Reilly Media
Matthew A. Russell
 
馬修·羅塞爾(Matthew A. Russell),Digital Reasoning Systems公司的技術(shù)副總裁和Zaffra公司的負(fù)責(zé)人,是熱愛數(shù)據(jù)挖掘、開源和Web應(yīng)用技術(shù)的計算機科學(xué)家。他也是《Dojo: The Definitive Guide》(O’Reilly出版社)的作者。在Linkedin上聯(lián)系他或在Twitter關(guān)注@ptwobrussell,可隨時了解他的最新動態(tài)。
 
 
Mikhail Klassen
 
Mikhail Klassen是Paladin AI公司的聯(lián)合創(chuàng)始人和首席數(shù)據(jù)科學(xué)家,該公司坐落于蒙特利爾,是面向航空領(lǐng)域提供數(shù)據(jù)分析服務(wù)的初創(chuàng)公司。他的工作是借助數(shù)據(jù)挖掘和機器學(xué)習(xí)技術(shù)為飛行員設(shè)計下一代基于數(shù)據(jù)驅(qū)動的自適應(yīng)培訓(xùn)方案。
 
 
購買選項
定價:119.00元
書號:978-7-111-67404-7
出版社:機械工業(yè)出版社