91精品国产综合久久四虎久久_国产成人午夜高潮毛片_99er视频精品免费观看_2020亚洲熟女在线观看_日本女优人体写真_国内黄色毛片_年轻的老师中文版在线_丰满女邻居做爰_久久久久久精品成人免费图片

 
R語言整潔建模
R語言整潔建模
Max Kuhn, Julia Silge
厲越, 陳立銘, 倪昱橙 譯
出版時(shí)間:2024年07月
頁數(shù):399
“tidymodels框架結(jié)合了以人為中心的設(shè)計(jì)和統(tǒng)計(jì)最佳實(shí)踐,我想不出比Max和Julia給出的更好的學(xué)習(xí)方法?!?br /> ——Hadley Wickham
RStudio首席科學(xué)家
“這本書提供了一種統(tǒng)一和系統(tǒng)的方法來構(gòu)建、分析和評(píng)估R中的統(tǒng)計(jì)模型?!?br /> ——Balasubramanian Narasimhan
斯坦福大學(xué)高級(jí)研究科學(xué)家

tidymodels是一組用于建模和機(jī)器學(xué)習(xí)的R語言包。無論你是新手還是擁有多年建模經(jīng)驗(yàn),這本實(shí)踐用書將為數(shù)據(jù)分析師、業(yè)務(wù)分析師和數(shù)據(jù)科學(xué)家展示tidymodels框架如何為你的工作提供一致、靈活的方法。
RStudio的工程師Max Kuhn和Julia Silge展示了通過專注于一種被稱為tidyverse的R方言來創(chuàng)建模型的方法。采用tidyverse原則的軟件共享高層設(shè)計(jì)理念和低層語法及數(shù)據(jù)結(jié)構(gòu),因此學(xué)習(xí)生態(tài)系統(tǒng)的一部分有助于掌握下一部分。你會(huì)明白為什么tidymodels框架被人們廣泛使用。

本書內(nèi)容包括:
● 學(xué)習(xí)從頭到尾構(gòu)建模型所需的步驟
● 理解如何流暢地使用不同的建模和特征工程方法
● 研究如何避免建模的常見缺陷,比如過擬合
● 學(xué)習(xí)為建模準(zhǔn)備數(shù)據(jù)的實(shí)用方法
● 調(diào)整模型以獲得最佳性能
● 使用良好的統(tǒng)計(jì)實(shí)踐來比較、評(píng)估和選擇模型
  1. 前言
  2. 第一部分 簡(jiǎn)介
  3. 第1章 建模軟件
  4. 1.1 建模軟件基礎(chǔ)
  5. 1.2 模型的類型
  6. 1.3 不同模型間的關(guān)系
  7. 1.4 術(shù)語說明
  8. 1.5 建模和數(shù)據(jù)分析的關(guān)系
  9. 1.6 本章小節(jié)
  10. 第2章 tidyverse入門
  11. 2.1 tidyverse設(shè)計(jì)原則
  12. 2.2 tidyverse語法示例
  13. 2.3 本章小結(jié)
  14. 第3章 R建?;A(chǔ)
  15. 3.1 一個(gè)例子
  16. 3.2 R中的公式有什么作用?
  17. 3.3 為什么整潔對(duì)建模很重要
  18. 3.4 結(jié)合base R和tidyverse
  19. 3.5 tidymodels包
  20. 3.6 本章小結(jié)
  21. 第二部分 建?;A(chǔ)
  22. 第4章 埃姆斯市房?jī)r(jià)數(shù)據(jù)
  23. 4.1 探索數(shù)據(jù)特征
  24. 4.2 本章小結(jié)
  25. 第5章 數(shù)據(jù)分配
  26. 5.1 基本的數(shù)據(jù)劃分方法
  27. 5.2 驗(yàn)證集是什么?
  28. 5.3 多水平數(shù)據(jù)
  29. 5.4 數(shù)據(jù)分配的其他注意
  30. 5.5 本章小結(jié)
  31. 第6章 用parsnip創(chuàng)建模型
  32. 6.1 創(chuàng)建模型
  33. 6.2 使用模型結(jié)果
  34. 6.3 進(jìn)行預(yù)測(cè)
  35. 6.4 parsnip擴(kuò)展包
  36. 6.5 創(chuàng)建模型設(shè)定的工具
  37. 6.6 本章小結(jié)
  38. 第7章 模型工作流
  39. 7.1 模型的起點(diǎn)和終點(diǎn)在哪里?
  40. 7.2 工作流入門
  41. 7.3 向workflow()中添加原始變量
  42. 7.4 workflow()如何使用公式?
  43. 7.5 同時(shí)創(chuàng)建多個(gè)工作流
  44. 7.6 使用測(cè)試集評(píng)估模型
  45. 7.7 本章小結(jié)
  46. 第8章 用recipes實(shí)現(xiàn)特征工程
  47. 8.1 一個(gè)簡(jiǎn)單的配方
  48. 8.2 使用配方
  49. 8.3 recipe()如何處理數(shù)據(jù)
  50. 8.4 step_*函數(shù)示例
  51. 8.5 對(duì)新數(shù)據(jù)跳過操作
  52. 8.6 獲取整潔的配方
  53. 8.7 列的角色
  54. 8.8 本章小結(jié)
  55. 第9章 衡量模型性能
  56. 9.1 性能指標(biāo)和推斷模型
  57. 9.2 回歸模型
  58. 9.3 二分類數(shù)據(jù)
  59. 9.4 多分類數(shù)據(jù)
  60. 9.5 本章小結(jié)
  61. 第三部分 創(chuàng)建高質(zhì)量模型
  62. 第10章 用重抽樣評(píng)估模型
  63. 10.1 重代入法
  64. 10.2 重抽樣法
  65. 10.3 評(píng)估性能
  66. 10.4 并行處理
  67. 10.5 保存重抽樣對(duì)象
  68. 10.6 本章小結(jié)
  69. 第11章 比較重抽樣結(jié)果
  70. 11.1 用工作流集合創(chuàng)建多個(gè)模型
  71. 11.2 比較重抽樣得到的性能指標(biāo)
  72. 11.3 簡(jiǎn)單的假設(shè)檢驗(yàn)方法
  73. 11.4 貝葉斯方法
  74. 11.5 本章小結(jié)
  75. 第12章 模型調(diào)優(yōu)和過擬合
  76. 12.1 模型參數(shù)
  77. 12.2 不同類型的超參數(shù)
  78. 12.3 我們?cè)趦?yōu)化什么?
  79. 12.4 超參數(shù)選擇不當(dāng)?shù)暮蠊?
  80. 12.5 超參數(shù)調(diào)優(yōu)的兩種策略
  81. 12.6 tidymodels中的調(diào)參
  82. 12.7 本章小結(jié)
  83. 第13章 網(wǎng)格搜索
  84. 13.1 規(guī)則網(wǎng)格和不規(guī)則網(wǎng)格
  85. 13.2 評(píng)估網(wǎng)格
  86. 13.3 確定最終模型
  87. 13.4 創(chuàng)建調(diào)優(yōu)設(shè)定的工具
  88. 13.5 實(shí)現(xiàn)高效網(wǎng)格搜索
  89. 13.6 本章小結(jié)
  90. 第14章 迭代搜索
  91. 14.1 支持向量機(jī)模型
  92. 14.2 貝葉斯優(yōu)化
  93. 14.3 模擬退火
  94. 14.4 本章小結(jié)
  95. 第15章 篩選多個(gè)模型
  96. 15.1 對(duì)混凝土強(qiáng)度建模
  97. 15.2 創(chuàng)建工作流集合
  98. 15.3 調(diào)優(yōu)并評(píng)估模型
  99. 15.4 高效篩選模型
  100. 15.5 確定最終模型
  101. 15.6 本章小結(jié)
  102. 第四部分 其他高級(jí)方法
  103. 第16章 降維
  104. 16.1 降維可以解決哪些問題?
  105. 16.2 一圖勝千……豆
  106. 16.3 基礎(chǔ)配方
  107. 16.4 使用配方
  108. 16.5 特征提取技術(shù)
  109. 16.6 建模
  110. 16.7 本章小結(jié)
  111. 第17章 編碼分類數(shù)據(jù)
  112. 17.1 數(shù)據(jù)需要編碼嗎?
  113. 17.2 編碼有序分類變量
  114. 17.3 使用結(jié)果變量的編碼方法
  115. 17.4 特征哈希
  116. 17.5 更多編碼方法
  117. 17.6 本章小結(jié)
  118. 第18章 模型解釋
  119. 18.1 可用于模型解釋的R包
  120. 18.2 局部解釋
  121. 18.3 全局解釋
  122. 18.4 從局部解釋構(gòu)建全局解釋
  123. 18.5 回到干豆數(shù)據(jù)集!
  124. 18.6 本章小結(jié)
  125. 第19章 何時(shí)相信預(yù)測(cè)結(jié)果?
  126. 19.1 模棱兩可的結(jié)果
  127. 19.2 確定模型適用性
  128. 19.3 本章小結(jié)
  129. 第20章 模型集成
  130. 20.1 為堆疊模型準(zhǔn)備訓(xùn)練集
  131. 20.2 融合基模型的預(yù)測(cè)結(jié)果
  132. 20.3 擬合候選模型
  133. 20.4 測(cè)試集結(jié)果
  134. 20.5 本章小結(jié)
  135. 第21章 推斷分析
  136. 21.1 計(jì)數(shù)數(shù)據(jù)的統(tǒng)計(jì)推斷
  137. 21.2 與兩樣本檢驗(yàn)的比較
  138. 21.3 對(duì)數(shù)線性模型
  139. 21.4 更復(fù)雜的模型
  140. 21.5 更多推斷分析
  141. 21.6 本章小結(jié)
  142. 附錄 推薦的預(yù)處理步驟
  143. 參考文獻(xiàn)
書名:R語言整潔建模
作者:Max Kuhn, Julia Silge
譯者:厲越, 陳立銘, 倪昱橙 譯
國(guó)內(nèi)出版社:東南大學(xué)出版社
出版時(shí)間:2024年07月
頁數(shù):399
書號(hào):978-7-5766-0944-8
原版書書名:Tidy Modeling with R
原版書出版商:O'Reilly Media
Max Kuhn
 
Max Kuhn是RStudio的一名軟件工程師,致力于提高R語言的建模能力。他在制藥和診斷行業(yè)應(yīng)用各種模型超過18年。
 
 
Julia Silge
 
Julia Silge是RStudio的一名軟件工程師,致力于開發(fā)開源建模工具。她擁有天體物理學(xué)博士學(xué)位,曾在科技和非營(yíng)利部門擔(dān)任數(shù)據(jù)科學(xué)家。
 
 
本書封面上的動(dòng)物是歐洲知更鳥(拉丁學(xué)名:Erithacus rubecula),是一種主要生活在歐洲大陸、英國(guó)、俄羅斯西部和非洲北部地區(qū)的鳥類。
歐洲知更鳥通常呈灰褐色,胸部呈橙色,腹部為白色。雌鳥和雄鳥看起來很相似,主要的區(qū)別在于喙的形狀。它們喜歡生活在森林、植被或樹木附近。歐洲知更鳥在冬季通常不會(huì)遷徙很遠(yuǎn)的距離(除了生活在斯堪的納維亞和俄羅斯北部的種群),但雌鳥在冬季會(huì)離開雄鳥一段距離,而雄鳥在冬季和夏季都保持相同的領(lǐng)地。
歐洲知更鳥通常從3月份開始繁殖,每次會(huì)筑多個(gè)巢,每個(gè)巢中有4枚到6枚蛋,孵化時(shí)間為13天到14天。這些巢在孵化時(shí)可能會(huì)有一定程度的重疊,雄鳥會(huì)在雌鳥孵蛋期間喂養(yǎng)新生幼鳥,而雌鳥則開始孵下一個(gè)巢的蛋。雄鳥通過給雌鳥喂食來與其建立緊密的聯(lián)系,這對(duì)于不熟悉情況的觀察者來說可能會(huì)看起來像是母鳥在喂養(yǎng)幼鳥。它們的食物包括昆蟲、種子、堅(jiān)果和水果。
歐洲知更鳥在出生后的第一年內(nèi)的死亡率非常高。在這之后它們的預(yù)期壽命會(huì)顯著增加。在第一年之后的死亡中,有10%是由于知更鳥之間的爭(zhēng)斗導(dǎo)致的,因?yàn)樾坌灾B非常具有攻擊性且領(lǐng)地意識(shí)非常強(qiáng)。年輕的知更鳥胸部的橙色不夠明顯,這也減少了它們?cè)诘谝荒隊(duì)帄Z領(lǐng)地的機(jī)會(huì),但這時(shí)它們的死亡率已經(jīng)很高了。
自1960年以來,歐洲知更鳥一直是英國(guó)的國(guó)鳥,但在歐洲其他地區(qū)并不那么受歡迎。它們是圣誕節(jié)的流行象征,因?yàn)榫S多利亞時(shí)期的郵遞員由于制服顏色而被稱為“紅胸鳥”。美國(guó)知更鳥是因?yàn)橥庥^與歐洲知更鳥相似而得名,但它們實(shí)際上并沒有密切的親緣關(guān)系。
歐洲知更鳥的保護(hù)狀態(tài)為“低?!保↙east Concern,LC)。
購買選項(xiàng)
定價(jià):129.00元
書號(hào):978-7-5766-0944-8
出版社:東南大學(xué)出版社