利用Python進(jìn)行數(shù)據(jù)分析 (原書(shū)第3版)
陳松 譯
出版時(shí)間:2023年10月
“本書(shū)是學(xué)習(xí)Python和pandas相關(guān)數(shù)據(jù)分析知識(shí)的首選。我鄭重向讀者推薦此書(shū)!”
——Paul Barry
Head First Python一書(shū)(O’Reilly出版)的作者兼講師
閱讀本書(shū)可以學(xué)習(xí)使用Python對(duì)數(shù)據(jù)集進(jìn)行操作、處理、清洗和規(guī)整。第3版針對(duì)Python 3.10和pandas 1.4進(jìn)行了更新,并通過(guò)實(shí)操講解和實(shí)際案例向讀者展示了如何高效地解決一系列數(shù)據(jù)分析問(wèn)題。讀者將在閱讀過(guò)程中學(xué)習(xí)新版本的pandas、NumPy、IPython和Jupyter。
本書(shū)作者Wes McKinney是Python pandas項(xiàng)目的創(chuàng)始人。本書(shū)對(duì)Python數(shù)據(jù)科學(xué)工具的介紹既貼近實(shí)戰(zhàn)又內(nèi)容新穎,非常適合剛開(kāi)始學(xué)習(xí)Python的數(shù)據(jù)分析師或剛開(kāi)始學(xué)習(xí)數(shù)據(jù)科學(xué)和科學(xué)計(jì)算的Python程序員閱讀。讀者可以從GitHub獲取數(shù)據(jù)文件和相關(guān)資料。
學(xué)完本書(shū),你將能夠:
● 使用Jupyter notebook和IPython shell進(jìn)行探索性計(jì)算。
● 掌握NumPy的基礎(chǔ)功能和高級(jí)功能。
● 掌握pandas庫(kù)中的數(shù)據(jù)分析工具。
● 使用靈活的工具對(duì)數(shù)據(jù)進(jìn)行加載、清洗、轉(zhuǎn)換、合并和重塑。
● 使用matplotlib進(jìn)行信息可視化。
● 使用pandas的groupBy功能對(duì)數(shù)據(jù)集進(jìn)行切片、切塊和匯總。
● 分析并處理規(guī)則的時(shí)間序列數(shù)據(jù)和不規(guī)則的時(shí)間序列數(shù)據(jù)。
● 利用完整、詳細(xì)的示例學(xué)習(xí)如何解決現(xiàn)實(shí)中的數(shù)據(jù)分析問(wèn)題。
- 前言
- 第1章 準(zhǔn)備工作
- 1.1 本書(shū)內(nèi)容
- 1.2 為什么使用Python進(jìn)行數(shù)據(jù)分析
- 1.3 重要的Pytho 庫(kù)
- 1.4 安裝和設(shè)置
- 1.5 社區(qū)和會(huì)議
- 1.6 本書(shū)導(dǎo)航
- 第2章 Python語(yǔ)法基礎(chǔ)、IPython和Jupyter notebook
- 2.1 Python解釋器
- 2.2 IPython基礎(chǔ)
- 2.3 Python語(yǔ)法基礎(chǔ)
- 2.4 總結(jié)
- 第3章 Python的數(shù)據(jù)結(jié)構(gòu)、函數(shù)和文件
- 3.1 數(shù)據(jù)結(jié)構(gòu)和序列
- 3.2 函數(shù)
- 3.3 文件和操作系統(tǒng)
- 3.4 總結(jié)
- 第4章 NumPy基礎(chǔ):數(shù)組和向量化計(jì)算
- 4.1 NumPy的ndarray:多維數(shù)組對(duì)象
- 4.2 生成偽隨機(jī)數(shù)
- 4.3 通用函數(shù):快速的元素級(jí)數(shù)組函數(shù)
- 4.4 利用數(shù)組進(jìn)行面向數(shù)組編程
- 4.5 使用數(shù)組進(jìn)行文件輸入和輸出
- 4.6 線性代數(shù)
- 4.7 示例:隨機(jī)漫步
- 4.8 總結(jié)
- 第5章 pandas入門(mén)
- 5.1 pandas的數(shù)據(jù)結(jié)構(gòu)介紹
- 5.2 基本功能
- 5.3 描述性統(tǒng)計(jì)的匯總和計(jì)算
- 5.4 總結(jié)
- 第6章 數(shù)據(jù)加載、存儲(chǔ)與文件格式
- 6.1 讀寫(xiě)文本格式的數(shù)據(jù)
- 6.2 二進(jìn)制數(shù)據(jù)格式
- 6.3 與Web API交互
- 6.4 與數(shù)據(jù)庫(kù)交互
- 6.5 總結(jié)
- 第7章 數(shù)據(jù)清洗和準(zhǔn)備
- 7.1 處理缺失數(shù)據(jù)
- 7.2 數(shù)據(jù)轉(zhuǎn)換
- 7.3 擴(kuò)展數(shù)據(jù)類型
- 7.4 字符串操作
- 7.5 分類數(shù)據(jù)
- 7.6 總結(jié)
- 第8章 數(shù)據(jù)規(guī)整:連接、聯(lián)合和重塑
- 8.1 層次化索引
- 8.2 聯(lián)合與合并數(shù)據(jù)集
- 8.3 重塑和透視
- 8.4 總結(jié)
- 第9章 繪圖和可視化
- 9.1 matplotlib API入門(mén)
- 9.2 使用pandas和seaborn繪圖
- 9.3 其他Python可視化工具
- 9.4 總結(jié)
- 第10章 數(shù)據(jù)聚合與分組操作
- 10.1 GroupBy機(jī)制
- 10.2 數(shù)據(jù)聚合
- 10.3 Apply:通用的“拆分-應(yīng)用-聯(lián)合”范式
- 10.4 分組轉(zhuǎn)換和“展開(kāi)式”GroupBy運(yùn)算
- 10.5 透視表和交叉表
- 10.6 總結(jié)
- 第11章 時(shí)間序列
- 11.1 日期和時(shí)間數(shù)據(jù)的類型及工具
- 11.2 時(shí)間序列基礎(chǔ)知識(shí)
- 11.3 日期的范圍、頻率以及移位
- 11.4 時(shí)區(qū)處理
- 11.5 周期及其算術(shù)運(yùn)算
- 11.6 重采樣及頻率轉(zhuǎn)換
- 11.7 移動(dòng)窗口函數(shù)
- 11.8 總結(jié)
- 第12章 Python建模庫(kù)介紹
- 12.1 pandas與模型代碼的接口
- 12.2 用Patsy創(chuàng)建模型描述
- 12.3 statsmodels介紹
- 12.4 scikit-learn介紹
- 12.5 總結(jié)
- 第13章 數(shù)據(jù)分析案例
- 13.1 來(lái)自1.USA.gov的Bitly數(shù)據(jù)
- 13.2 MovieLens 1M數(shù)據(jù)集
- 13.3 1880—2010年間全美嬰兒姓名
- 13.4 USDA食品數(shù)據(jù)庫(kù)
- 13.5 2012年聯(lián)邦選舉委員會(huì)數(shù)據(jù)庫(kù)
- 13.6 總結(jié)
- 附錄A 高階NumPy
- 附錄B 更多關(guān)于IPython的內(nèi)容
書(shū)名:利用Python進(jìn)行數(shù)據(jù)分析 (原書(shū)第3版)
譯者:陳松 譯
國(guó)內(nèi)出版社:機(jī)械工業(yè)出版社
出版時(shí)間:2023年10月
書(shū)號(hào):978-7-111-72672-2
原版書(shū)書(shū)名:Python for Data Analysis, 3rd Edition
原版書(shū)出版商:O'Reilly Media
Wes McKinney
Wes McKinney是紐約的一名數(shù)據(jù)分析高手和企業(yè)主。在2007年獲得MIT的數(shù)學(xué)學(xué)士學(xué)位之后,他到位于康涅狄格州格林威治市(Greenwich,CT)的AQR Capital Management公司從事定量金融方面的工作。由于不滿那些數(shù)據(jù)分析工具的各種不好用,他開(kāi)始學(xué)習(xí)Python,并于2008年開(kāi)始構(gòu)建pandas項(xiàng)目。他目前是Python科學(xué)計(jì)算社區(qū)的活躍分子,而且積極倡導(dǎo)在數(shù)據(jù)分析、金融以及統(tǒng)計(jì)應(yīng)用中使用Python。