91精品国产综合久久四虎久久_国产成人午夜高潮毛片_99er视频精品免费观看_2020亚洲熟女在线观看_日本女优人体写真_国内黄色毛片_年轻的老师中文版在线_丰满女邻居做爰_久久久久久精品成人免费图片

 
數(shù)據(jù)算法
數(shù)據(jù)算法
Mahmoud Parsian
蘇金國, 楊健康 譯
出版時(shí)間:2016年12月
頁數(shù):696
《數(shù)據(jù)算法:Hadoop/Spark大數(shù)據(jù)處理技巧》介紹了很多基本設(shè)計(jì)模式、優(yōu)化技術(shù)和數(shù)據(jù)挖掘及機(jī)器學(xué)習(xí)解決方案,以解決生物信息學(xué)、基因組學(xué)、統(tǒng)計(jì)和社交網(wǎng)絡(luò)分析等領(lǐng)域的很多問題。這還概要介紹了MapReduce、Hadoop和Spark。
主要內(nèi)容包括:
· 完成超大量交易的購物籃分析。
· 數(shù)據(jù)挖掘算法(K-均值、KNN和樸素貝葉斯)。
· 使用超大基因組數(shù)據(jù)完成DNA和RNA測(cè)序。
· 樸素貝葉斯定理和馬爾可夫鏈實(shí)現(xiàn)數(shù)據(jù)和市場(chǎng)預(yù)測(cè)。
· 推薦算法和成對(duì)文檔相似性。
· 線性回歸、Cox回歸和皮爾遜(Pearson)相關(guān)分析。
· 等位基因頻率和DNA挖掘。
· 社交網(wǎng)絡(luò)分析(推薦系統(tǒng)、三角形計(jì)數(shù)和情感分析)。
  1. 前言
  2. 第1章 二次排序:簡(jiǎn)介
  3. 二次排序問題解決方案
  4. MapReduce/Hadoop的二次排序解決方案
  5. Spark的二次排序解決方案
  6. 第2章 二次排序:詳細(xì)示例
  7. 二次排序技術(shù)
  8. 二次排序的完整示例
  9. 運(yùn)行示例——老版本Hadoop API
  10. 運(yùn)行示例——新版本Hadoop API
  11. 第3章 Top 10列表
  12. Top N設(shè)計(jì)模式的形式化描述
  13. MapReduce/Hadoop實(shí)現(xiàn):唯一鍵
  14. Spark實(shí)現(xiàn):唯一鍵
  15. Spark實(shí)現(xiàn):非唯一鍵
  16. 使用takeOrdered()的Spark Top 10解決方案
  17. MapReduce/Hadoop Top 10解決方案:非唯一鍵
  18. 第4章 左外連接
  19. 左外連接示例
  20. MapReduce左外連接實(shí)現(xiàn)
  21. Spark左外連接實(shí)現(xiàn)
  22. 使用leftOuterJoin()的Spark實(shí)現(xiàn)
  23. 第5章 反轉(zhuǎn)排序
  24. 反轉(zhuǎn)排序模式示例
  25. 反轉(zhuǎn)排序模式的MapReduce/Hadoop實(shí)現(xiàn)
  26. 運(yùn)行示例
  27. 第6章 移動(dòng)平均
  28. 示例1:時(shí)間序列數(shù)據(jù)(股票價(jià)格)
  29. 示例2:時(shí)間序列數(shù)據(jù)(URL訪問數(shù))
  30. 形式定義
  31. POJO移動(dòng)平均解決方案
  32. MapReduce/Hadoop移動(dòng)平均解決方案
  33. 第7章 購物籃分析
  34. MBA目標(biāo)
  35. MBA的應(yīng)用領(lǐng)域
  36. 使用MapReduce的購物籃分析
  37. Spark解決方案
  38. 運(yùn)行Spark實(shí)現(xiàn)的YARN腳本
  39. 第8章 共同好友
  40. 輸入
  41. POJO共同好友解決方案
  42. MapReduce算法
  43. 解決方案1: 使用文本的Hadoop實(shí)現(xiàn)
  44. 解決方案2: 使用ArrayListOfLongsWritable的Hadoop實(shí)現(xiàn)
  45. Spark解決方案
  46. 第9章 使用MapReduce實(shí)現(xiàn)推薦引擎
  47. 購買過該商品的顧客還購買了哪些商品
  48. 經(jīng)常一起購買的商品
  49. 推薦連接
  50. 第10章 基于內(nèi)容的電影推薦
  51. 輸入
  52. MapReduce階段1
  53. MapReduce階段2和階段3
  54. Spark電影推薦實(shí)現(xiàn)
  55. 第11章 使用馬爾可夫模型的智能郵件營銷
  56. 馬爾可夫鏈基本原理
  57. 使用MapReduce的馬爾可夫模型
  58. Spark解決方案
  59. 第12章 K-均值聚類
  60. 什么是K-均值聚類
  61. 聚類的應(yīng)用領(lǐng)域
  62. K-均值聚類方法非形式化描述:分區(qū)方法
  63. K-均值距離函數(shù)
  64. K-均值聚類形式化描述
  65. K-均值聚類的MapReduce解決方案
  66. K-均值算法Spark實(shí)現(xiàn)
  67. 第13章 k-近鄰
  68. kNN分類
  69. 距離函數(shù)
  70. kNN示例
  71. kNN算法非形式化描述
  72. kNN算法形式化描述
  73. kNN的類Java非MapReduce解決方案
  74. Spark的kNN算法實(shí)現(xiàn)
  75. 第14章 樸素貝葉斯
  76. 訓(xùn)練和學(xué)習(xí)示例
  77. 條件概率
  78. 深入分析樸素貝葉斯分類器
  79. 樸素貝葉斯分類器:符號(hào)數(shù)據(jù)的MapReduce解決方案
  80. 樸素貝葉斯分類器Spark實(shí)現(xiàn)
  81. 使用Spark和Mahout
  82. 第15章 情感分析
  83. 情感示例
  84. 情感分?jǐn)?shù):正面或負(fù)面
  85. 一個(gè)簡(jiǎn)單的MapReduce情感分析示例
  86. 真實(shí)世界的情感分析
  87. 第16章 查找、統(tǒng)計(jì)和列出大圖中的所有三角形
  88. 基本的圖概念
  89. 三角形計(jì)數(shù)的重要性
  90. MapReduce/Hadoop解決方案
  91. Spark解決方案
  92. 第17章 K-mer計(jì)數(shù)
  93. K-mer計(jì)數(shù)的輸入數(shù)據(jù)
  94. K-mer計(jì)數(shù)應(yīng)用
  95. K-mer計(jì)數(shù)MapReduce/Hadoop解決方案
  96. K-mer計(jì)數(shù)Spark解決方案
  97. 第18章 DNA測(cè)序
  98. DNA測(cè)序的輸入數(shù)據(jù)
  99. 輸入數(shù)據(jù)驗(yàn)證
  100. DNA序列比對(duì)
  101. DNA測(cè)試的MapReduce算法
  102. 第19章 Cox回歸
  103. Cox模型剖析
  104. 使用R的Cox回歸
  105. Cox回歸應(yīng)用
  106. Cox回歸POJO解決方案
  107. MapReduce輸入
  108. 使用MapReduce的Cox回歸
  109. 第20章 Cochran-Armitage趨勢(shì)檢驗(yàn)
  110. Cochran-Armitage算法
  111. Cochran-Armitage應(yīng)用
  112. MapReduce解決方案
  113. 第21章 等位基因頻率
  114. 基本定義
  115. 形式化問題描述
  116. 等位基因頻率分析的MapReduce解決方案
  117. MapReduce解決方案,階段1
  118. MapReduce解決方案,階段2
  119. MapReduce解決方案,階段3
  120. 染色體X 和Y的特殊處理
  121. 第22章 T檢驗(yàn)
  122. 對(duì)bioset完成T檢驗(yàn)
  123. MapReduce問題描述
  124. 輸入
  125. 期望輸出
  126. MapReduce解決方案
  127. Spark實(shí)現(xiàn)
  128. 第23章 皮爾遜相關(guān)系數(shù)
  129. 皮爾遜相關(guān)系數(shù)公式
  130. 皮爾遜相關(guān)系數(shù)示例
  131. 皮爾遜相關(guān)系數(shù)數(shù)據(jù)集
  132. 皮爾遜相關(guān)系數(shù)POJO解決方案
  133. 皮爾遜相關(guān)系數(shù)MapReduce解決方案
  134. 皮爾遜相關(guān)系數(shù)的Spark解決方案
  135. 運(yùn)行Spark程序的YARN腳本
  136. 使用Spark計(jì)算斯皮爾曼相關(guān)系數(shù)
  137. 第24章 DNA堿基計(jì)數(shù)
  138. FASTA格式
  139. FASTQ格式
  140. MapReduce解決方案:FASTA格式
  141. 運(yùn)行示例
  142. MapReduce解決方案: FASTQ格式
  143. Spark 解決方案: FASTA格式
  144. Spark解決方案: FASTQ格式
  145. 第25章 RNA測(cè)序
  146. 數(shù)據(jù)大小和格式
  147. MapReduce工作流
  148. RNA測(cè)序分析概述
  149. RNA測(cè)序MapReduce算法
  150. 第26章 基因聚合
  151. 輸入
  152. 輸出
  153. MapReduce解決方案(按單個(gè)值過濾和按平均值過濾)
  154. 基因聚合的Spark解決方案
  155. Spark解決方案:按單個(gè)值過濾
  156. Spark解決方案:按平均值過濾
  157. 第27章 線性回歸
  158. 基本定義
  159. 簡(jiǎn)單示例
  160. 問題描述
  161. 輸入數(shù)據(jù)
  162. 期望輸出
  163. 使用SimpleRegression的MapReduce解決方案
  164. Hadoop實(shí)現(xiàn)類
  165. 使用R線性模型的MapReduce解決方案
  166. 第28章 MapReduce和幺半群
  167. 概述
  168. 幺半群的定義
  169. 幺半群和非幺半群示例
  170. MapReduce示例:非幺半群
  171. MapReduce示例:幺半群
  172. 使用幺半群的Spark示例
  173. 使用幺半群的結(jié)論
  174. 函子和幺半群
  175. 第29章 小文件問題
  176. 解決方案1:在客戶端合并小文件
  177. 解決方案2:用CombineFileInputFormat解決小文件問題
  178. 其他解決方案
  179. 第30章 MapReduce的大容量緩存
  180. 實(shí)現(xiàn)方案
  181. 緩存問題形式化描述
  182. 一個(gè)精巧、可伸縮的解決方案
  183. 實(shí)現(xiàn)LRUMap緩存
  184. 使用LRUMap的MapReduce解決方案
  185. 第31章 Bloom過濾器
  186. Bloom過濾器性質(zhì)
  187. 一個(gè)簡(jiǎn)單的Bloom過濾器示例
書名:數(shù)據(jù)算法
作者:Mahmoud Parsian
譯者:蘇金國, 楊健康 譯
國內(nèi)出版社:中國電力出版社
出版時(shí)間:2016年12月
頁數(shù):696
書號(hào):978-7-5123-9594-7
原版書書名:Data Algorithms
原版書出版商:O'Reilly Media
Mahmoud Parsian
 
Mahmoud Parsian,計(jì)算機(jī)科學(xué)博士,是一位熱衷于實(shí)踐的軟件專家,作為開發(fā)人員、設(shè)計(jì)人員、架構(gòu)師和作者,他有30多年的軟件開發(fā)經(jīng)驗(yàn)。目前領(lǐng)導(dǎo)著Illumina的大數(shù)據(jù)團(tuán)隊(duì),在過去15年間,他主要從事Java (服務(wù)器端)、數(shù)據(jù)庫、MapReduce和分布式計(jì)算的有關(guān)工作。Mahmoud還著有《JDBC Recipes》和《JDBC Metadata, MySQL,and Oracle Recipes》等書(均由Apress出版)。
 
 
購買選項(xiàng)
定價(jià):128.00元
書號(hào):978-7-5123-9594-7
出版社:中國電力出版社