91精品国产综合久久四虎久久_国产成人午夜高潮毛片_99er视频精品免费观看_2020亚洲熟女在线观看_日本女优人体写真_国内黄色毛片_年轻的老师中文版在线_丰满女邻居做爰_久久久久久精品成人免费图片

 
SQL數(shù)據(jù)分析
SQL數(shù)據(jù)分析
Cathy Tanimura
王薇, 時(shí)暢 譯
出版時(shí)間:2023年08月
頁數(shù):370
“雖然我已經(jīng)在數(shù)據(jù)分析領(lǐng)域工作超過20年,也對(duì)不同的SQL環(huán)境無比熟悉,在閱讀本書的過程中仍有無數(shù)個(gè)令我驚喜的‘啊哈’時(shí)刻。我會(huì)將此書買給我當(dāng)前以及未來團(tuán)隊(duì)中的每一位成員?!?br /> —— Stuart Kim-Brown PhD
B2C和SaaS產(chǎn)品分析專家
“終于有一本專門為想從事數(shù)據(jù)分析相關(guān)工作的人所寫的介紹SQL的書籍出版了。任何一位熱愛數(shù)據(jù)的分析師或數(shù)據(jù)科學(xué)家都會(huì)從中受益,學(xué)會(huì)運(yùn)用SQL進(jìn)行各類數(shù)據(jù)分析的方法。詳細(xì)的示例和代碼也幫助讀者更快地學(xué)習(xí)運(yùn)用SQL進(jìn)行數(shù)據(jù)分析。”
—— Dan Voorhies
Zillow數(shù)據(jù)分析部總監(jiān)

隨著數(shù)據(jù)、算力和云數(shù)據(jù)倉庫的激增,對(duì)于有經(jīng)驗(yàn)的分析師或數(shù)據(jù)科學(xué)家來說,SQL已經(jīng)成為一個(gè)更加不可或缺的工具。本書展示了提高SQL技能、解決問題,以及在工作流程中充分利用SQL新的和隱藏的方法。
你將學(xué)習(xí)如何以創(chuàng)新的方式使用常用的和特殊的SQL函數(shù)(如連接、窗口函數(shù)、子查詢和正則表達(dá)式),以及如何用可理解的代碼,通過組合SQL技術(shù)更快地完成目標(biāo)。如果你在平常工作中也會(huì)用到SQL數(shù)據(jù)庫,本書會(huì)是必備的參考資料。
● 學(xué)習(xí)準(zhǔn)備分析數(shù)據(jù)的關(guān)鍵步驟。
● 使用SQL的日期和時(shí)間操作進(jìn)行時(shí)間序列分析。
● 使用同期群分析研究群體如何隨時(shí)間變化。
● 使用SQL的強(qiáng)大功能和操作符進(jìn)行文本分析。
● 檢測(cè)數(shù)據(jù)中的異常值,并用代替值替換它們。
● 使用實(shí)驗(yàn)分析建立因果關(guān)系,也稱為A/B測(cè)試。
  1. 前言
  2. 第1章 用SQL來做數(shù)據(jù)分析
  3. 1.1 什么是數(shù)據(jù)分析
  4. 1.2 為什么用SQL
  5. 1.2.1 SQL是什么
  6. 1.2.2 SQL的優(yōu)勢(shì)
  7. 1.2.3 SQL與R和Python的對(duì)比
  8. 1.2.4 SQL作為數(shù)據(jù)分析流程中的一部分
  9. 1.3 數(shù)據(jù)庫類型以及如何使用
  10. 1.3.1 行存儲(chǔ)數(shù)據(jù)
  11. 1.3.2 列存儲(chǔ)數(shù)據(jù)
  12. 1.3.3 其他的數(shù)據(jù)結(jié)構(gòu)類型
  13. 1.4 總結(jié)
  14. 第2章 為數(shù)據(jù)分析做準(zhǔn)備
  15. 2.1 數(shù)據(jù)類型
  16. 2.1.1 數(shù)據(jù)庫的數(shù)據(jù)類型
  17. 2.1.2 結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)
  18. 2.1.3 定量和定性數(shù)據(jù)
  19. 2.1.4 第一方、第二方和第三方數(shù)據(jù)
  20. 2.1.5 稀疏數(shù)據(jù)
  21. 2.2 SQL查詢結(jié)構(gòu)
  22. 2.3 數(shù)據(jù)剖析:分布
  23. 2.3.1 直方圖和頻率
  24. 2.3.2 分箱
  25. 2.3.3 n-Tiles
  26. 2.4 數(shù)據(jù)剖析:數(shù)據(jù)質(zhì)量
  27. 2.4.1 檢測(cè)重復(fù)數(shù)據(jù)
  28. 2.4.2 用GROUP BY和DISTINCT來處理重復(fù)數(shù)據(jù)
  29. 2.5 準(zhǔn)備:數(shù)據(jù)清理
  30. 2.5.1 通過CASE轉(zhuǎn)換來清理數(shù)據(jù)
  31. 2.5.2 數(shù)據(jù)類型轉(zhuǎn)換
  32. 2.5.3 處理空值:coalesce, nulliff, nvl函數(shù)
  33. 2.5.4 缺失的數(shù)據(jù)
  34. 2.6 準(zhǔn)備:數(shù)據(jù)構(gòu)形
  35. 2.6.1 你需要怎樣的輸出:BI,可視化,統(tǒng)計(jì),機(jī)器學(xué)習(xí)
  36. 2.6.2 用CASE語句進(jìn)行數(shù)據(jù)透視
  37. 2.6.3 用UNION語句來取消數(shù)據(jù)透視
  38. 2.6.4 pivot(透視)和unpivot(取消透視)函數(shù)
  39. 2.7 總結(jié)
  40. 第3章 時(shí)間序列分析
  41. 3.1 日期、日期時(shí)間和時(shí)間操作
  42. 3.1.1 時(shí)區(qū)轉(zhuǎn)換
  43. 3.1.2 日期和時(shí)間戳的格式轉(zhuǎn)換
  44. 3.1.3 日期相關(guān)的計(jì)算
  45. 3.1.4 時(shí)間相關(guān)的計(jì)算
  46. 3.1.5 連接不同來源的數(shù)據(jù)
  47. 3.2 零售銷售數(shù)據(jù)集
  48. 3.3 對(duì)數(shù)據(jù)進(jìn)行趨勢(shì)分析
  49. 3.3.1 簡單的趨勢(shì)
  50. 3.3.2 比較時(shí)間序列的組成部分
  51. 3.3.3 計(jì)算占總數(shù)的百分比
  52. 3.3.4 運(yùn)用索引以查看隨時(shí)間變化的百分比
  53. 3.4 滾動(dòng)時(shí)間窗口
  54. 3.4.1 計(jì)算滾動(dòng)時(shí)間窗口
  55. 3.4.2 稀疏數(shù)據(jù)的滾動(dòng)時(shí)間窗口
  56. 3.4.3 計(jì)算累計(jì)值
  57. 3.5 季節(jié)性分析
  58. 3.5.1 同期比較:YoY和MoM
  59. 3.5.2 同期比較:與去年的同月進(jìn)行對(duì)比
  60. 3.5.3 與多個(gè)以前的周期做對(duì)比
  61. 3.6 總結(jié)
  62. 第4章 同期群分析
  63. 4.1 同期群:一種有用的分析框架
  64. 4.2 立法者數(shù)據(jù)集
  65. 4.3 留存
  66. 4.3.1 基本留存曲線的 SQL
  67. 4.3.2 調(diào)整時(shí)間序列以提高留存率的準(zhǔn)確性
  68. 4.3.3 從時(shí)間序列數(shù)據(jù)構(gòu)建同期群
  69. 4.3.4 從單獨(dú)的表構(gòu)建同期群
  70. 4.3.5 處理稀疏同期群
  71. 4.3.6 用除第一個(gè)日期以外的其他日期定義同期群
  72. 4.4 相關(guān)同期群分析
  73. 4.4.1 生存
  74. 4.4.2 返回或重復(fù)購買行為
  75. 4.4.3 累積計(jì)算
  76. 4.5 透過同期群看橫斷面分析
  77. 4.6 總結(jié)
  78. 第5章 文本分析
  79. 5.1 為什么使用SQL進(jìn)行文本分析
  80. 5.1.1 什么是文本分析
  81. 5.1.2 為什么SQL是文本分析的好選擇
  82. 5.1.3 什么情況下SQL不是一個(gè)好的選擇
  83. 5.2 UFO目擊數(shù)據(jù)集
  84. 5.3 文本特征
  85. 5.4 解析文本
  86. 5.5 文本轉(zhuǎn)換
  87. 5.6 在較大的文本塊中查找元素
  88. 5.6.1 通配符匹配:LIKE,ILIKE
  89. 5.6.2 精確匹配:IN,NOT IN
  90. 5.6.3 正則表達(dá)式
  91. 5.7 構(gòu)建與重塑文本
  92. 5.7.1 拼接
  93. 5.7.2 重塑文本
  94. 5.8 總結(jié)
  95. 第6章 異常檢測(cè)
  96. 6.1 SQL異常檢測(cè)的能力和限制
  97. 6.2 數(shù)據(jù)集
  98. 6.3 檢測(cè)異常值
  99. 6.3.1 通過排序查找異常
  100. 6.3.2 通過計(jì)算百分比和標(biāo)準(zhǔn)偏差發(fā)現(xiàn)異常
  101. 6.3.3 通過作圖可視化查找異常
  102. 6.4 異常的形式
  103. 6.4.1 異常值
  104. 6.4.2 異常的計(jì)數(shù)或頻率
  105. 6.4.3 數(shù)據(jù)缺失引起的異常
  106. 6.5 處理異常
  107. 6.5.1 探查
  108. 6.5.2 刪除
  109. 6.5.3 替代值替換
  110. 6.5.4 縮放
  111. 6.6 總結(jié)
  112. 第7章 實(shí)驗(yàn)分析
  113. 7.1 用SQL進(jìn)行實(shí)驗(yàn)分析的優(yōu)勢(shì)與局限性
  114. 7.2 數(shù)據(jù)集
  115. 7.3 實(shí)驗(yàn)的類型
  116. 7.3.1 二元結(jié)果實(shí)驗(yàn):卡方檢驗(yàn)
  117. 7.3.2 具有連續(xù)結(jié)果的實(shí)驗(yàn):t檢驗(yàn)
  118. 7.4 實(shí)驗(yàn)的挑戰(zhàn)和拯救有缺陷的實(shí)驗(yàn)的方法 312
  119. 7.4.1 變體分配
  120. 7.4.2 異常值
  121. 7.4.3 時(shí)間盒
  122. 7.4.4 重復(fù)暴露實(shí)驗(yàn)
  123. 7.5 當(dāng)無法進(jìn)行控制實(shí)驗(yàn)時(shí):替代分析
  124. 7.5.1 前/后分析
  125. 7.5.2 自然實(shí)驗(yàn)分析
  126. 7.5.3 閾值附近的群體分析
  127. 7.6 總結(jié)
  128. 第8章 創(chuàng)建用于分析的復(fù)雜數(shù)據(jù)集
  129. 8.1 何時(shí)對(duì)復(fù)雜數(shù)據(jù)集使用SQL
  130. 8.1.1 使用SQL的優(yōu)點(diǎn)
  131. 8.1.2 什么時(shí)候構(gòu)建ETL
  132. 8.1.3 何時(shí)將邏輯放入其他工具中
  133. 8.2 代碼組織
  134. 8.2.1 注釋
  135. 8.2.2 大寫,縮進(jìn),括號(hào)和其他格式技巧
  136. 8.2.3 存儲(chǔ)代碼
  137. 8.3 組織計(jì)算
  138. 8.3.1 理解SQL子句的計(jì)算順序
  139. 8.3.2 子查詢
  140. 8.3.3 臨時(shí)表
  141. 8.3.4 公共表表達(dá)式
  142. 8.3.5 grouping sets
  143. 8.4 管理數(shù)據(jù)集大小和隱私問題
  144. 8.4.1 使用% 、mod進(jìn)行抽樣
  145. 8.4.2 降低維數(shù)
  146. 8.4.3 PII和數(shù)據(jù)隱私
  147. 8.5 總結(jié)
  148. 第9章 結(jié)論
  149. 9.1 漏斗分析
  150. 9.2 流失、中止和其他離開的定義
  151. 9.3 購物籃分析
  152. 9.4 資源
  153. 9.4.1 書籍和博客
  154. 9.4.2 數(shù)據(jù)集
  155. 9.5 最終的想法
書名:SQL數(shù)據(jù)分析
作者:Cathy Tanimura
譯者:王薇, 時(shí)暢 譯
國內(nèi)出版社:中國電力出版社
出版時(shí)間:2023年08月
頁數(shù):370
書號(hào):978-7-5198-7951-8
原版書書名:SQL for Data Analysis
原版書出版商:O'Reilly Media
Cathy Tanimura
 
Cathy Tanimura熱衷于將人們和組織與他們需要的數(shù)據(jù)聯(lián)系起來,以產(chǎn)生價(jià)值和影響。20多年來,她一直在分析各種行業(yè)的數(shù)據(jù),從金融到B2B軟件,再到消費(fèi)者服務(wù)。她有在大多數(shù)主流的專有和開源數(shù)據(jù)庫中使用SQL分析數(shù)據(jù)的經(jīng)驗(yàn)。她在多家領(lǐng)先的科技公司建立并管理數(shù)據(jù)團(tuán)隊(duì)和數(shù)據(jù)基礎(chǔ)設(shè)施。Cathy還經(jīng)常在頂級(jí)會(huì)議上發(fā)表演講,主題包括構(gòu)建數(shù)據(jù)文化、數(shù)據(jù)驅(qū)動(dòng)產(chǎn)品開發(fā)和包容性數(shù)據(jù)分析。
 
 
本書封面上的動(dòng)物是一只綠鵲(學(xué)名:Cissa chinensis)。它們通常被稱為普通綠鵲,這種寶石色的鳥是烏鴉科的一員。這種鳥分布于印度東北部、泰國中部、馬來西亞、蘇門答臘和婆羅洲西北部的低地常綠和竹林中,它們一般很吵鬧,且高度群居社交性強(qiáng)。在野外,可以通過翡翠色的羽毛來識(shí)別它們,這與它們的紅色喙和沿著眼睛延伸的黑色條紋形成了優(yōu)雅的對(duì)比。它們也有白色的尾巴和淡紅色的翅膀。
綠喜鵲社交性強(qiáng)又噪音大,可以通過它刺耳的尖叫聲和空洞而果斷的“撲通”聲來識(shí)別。它們通常也很難被發(fā)現(xiàn),因?yàn)樗鼈冊(cè)谏值闹猩蠈訌囊豢脴浠蛄硪豢脴?。它們?cè)跇?、大灌木和各種攀援藤蔓的纏結(jié)中筑巢。有時(shí)被稱為狩獵綠鵲,它們主要是食肉動(dòng)物,食用各種無脊椎動(dòng)物,以及幼鳥和蛋、小型爬行動(dòng)物和哺乳動(dòng)物。
綠鵲因其變色能力而迷人。雖然它們?cè)谝巴獬属浯渚G色,但據(jù)觀察,它們?cè)谌︷B(yǎng)時(shí)會(huì)變成明顯的綠松石色。它們的綠色來自兩種來源的組合:一種特殊的羽毛結(jié)構(gòu),由于羽毛折射光而產(chǎn)生藍(lán)色,以及類胡蘿卜素——來自鳥類飲食的黃色、橙色和紅色色素。長時(shí)間暴露在強(qiáng)烈的陽光下會(huì)破壞類胡蘿卜素,從而使鳥看起來呈青綠色。
綠鵲的種類范圍非常大,雖然種群數(shù)量似乎呈下降趨勢(shì),但下降速度還不足以將該物種歸入易危類別。因此,它們目前的保護(hù)狀態(tài)是“低關(guān)注度物種(或無危物種)”。
封面插圖由Karen Montgomery根據(jù)English Cyclopedia的一幅黑白雕刻繪制而成。
購買選項(xiàng)
定價(jià):128.00元
書號(hào):978-7-5198-7951-8
出版社:中國電力出版社