Python數(shù)據(jù)處理:如何又快又好
愛飛翔 譯
出版時間:2024年01月
頁數(shù):378
“Susan E. McGregor給各種水平的學(xué)生都講授過數(shù)據(jù)新聞學(xué),她的經(jīng)驗在本書中很好地展示了出來。她通過各種現(xiàn)實示例,詳細(xì)告訴大家如何用切實可行的方式獲取、審查和分析數(shù)據(jù)?!?br />
——Joanna S. Kao
《金融時報》視覺與數(shù)據(jù)新聞團(tuán)隊技術(shù)主管
數(shù)據(jù)無處不在,它們蘊(yùn)含著獨特的信息和有價值的故事,本書將幫助你發(fā)掘它們。無論你已經(jīng)開始處理數(shù)據(jù),還是想要學(xué)習(xí)如何處理數(shù)據(jù),都能通過本書中的示例與技術(shù),學(xué)會更好地清洗、評估并分析數(shù)據(jù),以形成有意義的洞見,并制作出有說服力的可視化圖表。
作者既講解了基本概念,也給出了專業(yè)建議,并且提供了相應(yīng)的資源來幫助大家學(xué)會提取、評估并分析各種數(shù)據(jù)源和數(shù)據(jù)格式。另外,作者還講解了相應(yīng)的工具,讓你能夠有效地與他人交流,讓對方了解自己通過分析這些數(shù)據(jù)所得到的觀點。本書沒有艱深的術(shù)語,適合各種水平的數(shù)據(jù)從業(yè)者閱讀,無論你是純粹的新手還是有經(jīng)驗的專業(yè)人士,都可以通過本書學(xué)會如何駕馭數(shù)據(jù)。
通過學(xué)習(xí)本書,你將:
● 使用Python 3.8以上的版本讀寫和轉(zhuǎn)換各種來源的數(shù)據(jù)。
● 理解并使用基本的Python編程技術(shù)來處理大規(guī)模的數(shù)據(jù)。
● 使用各種經(jīng)驗法則來組織代碼的結(jié)構(gòu)并為其撰寫文檔。
● 從結(jié)構(gòu)化數(shù)據(jù)文件、網(wǎng)頁和API中收集數(shù)據(jù)。
● 執(zhí)行基本的統(tǒng)計分析,以便從數(shù)據(jù)集中得出有意義的結(jié)論。
● 用清晰且具有說服力的方式可視化和展示數(shù)據(jù)。
- 前言
- 第1章 數(shù)據(jù)整理與數(shù)據(jù)質(zhì)量簡介
- 1.1 什么是數(shù)據(jù)整理
- 1.2 什么是數(shù)據(jù)質(zhì)量
- 1.3 為什么選用Python語言整理數(shù)據(jù)
- 1.4 編寫并運行Python代碼
- 1.5 如何在自己的設(shè)備上編寫Python代碼
- 1.6 在網(wǎng)頁版的開發(fā)環(huán)境中編寫Python代碼
- 1.7 編寫“Hello World!”程序
- 1.8 添加代碼
- 1.9 運行代碼
- 1.10 撰寫文檔、保存工作資料和管理不同版本的資料
- 1.11 小結(jié)
- 第2章 Python入門
- 2.1 詞性
- 2.2 用循環(huán)結(jié)構(gòu)與條件結(jié)構(gòu)控制程序的走向
- 2.3 代碼中可能出現(xiàn)的各種錯誤
- 2.4 用Citi Bike數(shù)據(jù)來演示如何編寫數(shù)據(jù)整理程序
- 2.5 小結(jié)
- 第3章 了解數(shù)據(jù)質(zhì)量
- 3.1 判斷數(shù)據(jù)是否合適
- 3.2 判斷數(shù)據(jù)是否完整
- 3.3 提升數(shù)據(jù)的質(zhì)量
- 3.4 小結(jié)
- 第4章 用Python處理基于文件與基于feed的數(shù)據(jù)
- 4.1 結(jié)構(gòu)化的數(shù)據(jù)與非結(jié)構(gòu)化的數(shù)據(jù)
- 4.2 處理結(jié)構(gòu)化的數(shù)據(jù)
- 4.3 以了解失業(yè)情況為例來整理現(xiàn)實數(shù)據(jù)
- 4.4 處理非結(jié)構(gòu)化的數(shù)據(jù)
- 4.5 小結(jié)
- 第5章 訪問網(wǎng)絡(luò)數(shù)據(jù)
- 5.1 聯(lián)網(wǎng)訪問在線的XML與JSON數(shù)據(jù)
- 5.2 API 簡介
- 5.3 以搜索引擎為例講解如何調(diào)用基本的API
- 5.4 如何調(diào)用帶有基本身份認(rèn)證機(jī)制的API
- 5.5 閱讀API文檔
- 5.6 使用Python時保護(hù)你的API密鑰
- 5.7 如何調(diào)用帶有OAuth認(rèn)證機(jī)制的API
- 5.8 調(diào)用API時所應(yīng)遵循的行為準(zhǔn)則
- 5.9 獲取數(shù)據(jù)的最后一招:網(wǎng)頁抓取
- 5.10 小結(jié)
- 第6章 評估數(shù)據(jù)質(zhì)量
- 6.1 流行病與PPP
- 6.2 評估數(shù)據(jù)的完整程度
- 6.3 評估數(shù)據(jù)的適合程度
- 6.4 小結(jié)
- 第7章 清洗、轉(zhuǎn)換和增強(qiáng)數(shù)據(jù)
- 7.1 如何從Citi Bike數(shù)據(jù)中選取一部分內(nèi)容
- 7.2 把數(shù)據(jù)文件清洗干凈
- 7.3 把Excel表格中的日期處理好
- 7.4 把定寬數(shù)據(jù)轉(zhuǎn)換成真正的CSV文件
- 7.5 修正拼寫不一致的現(xiàn)象
- 7.6 為了找到簡單方案而走過的彎路
- 7.7 一些容易出錯的地方
- 7.8 增強(qiáng)數(shù)據(jù)
- 7.9 小結(jié)
- 第8章 調(diào)整并重構(gòu)代碼
- 8.1 重新思考自定義的函數(shù)
- 8.2 什么是作用域
- 8.3 為函數(shù)設(shè)計參數(shù)
- 8.4 返回值
- 8.5 以嵌套的形式調(diào)用函數(shù)
- 8.6 既有趣又有用的重構(gòu)
- 8.7 用pydoc給自定義的腳本與函數(shù)撰寫文檔
- 8.8 讓Python腳本支持命令行參數(shù)
- 8.9 命令行腳本與notebook的區(qū)別
- 8.10 小結(jié)
- 第9章 數(shù)據(jù)分析入門
- 9.1 情境很重要
- 9.2 常規(guī)與反常
- 9.3 評估集中趨勢
- 9.4 另辟蹊徑:識別異常值
- 9.5 數(shù)據(jù)分析可視化
- 9.6 這些200萬美元的貸款記錄是怎么回事
- 9.7 注意按比例計算
- 9.8 小結(jié)
- 第10章 展示數(shù)據(jù)
- 10.1 視覺說服力
- 10.2 把整理數(shù)據(jù)后形成的觀點表達(dá)出來
- 10.3 如何選擇圖表
- 10.4 視覺說服力要素
- 10.5 通過seaborn與matplotlib庫自定義更好的可視化圖表
- 10.6 提高設(shè)計水平
- 10.7 小結(jié)
- 第11章 Python以外的工具
- 11.1 查看數(shù)據(jù)的其他工具
- 11.2 分享并展示數(shù)據(jù)的其他工具
- 11.3 考慮原則問題
- 11.4 小結(jié)
- 附錄A 其他Python編程資源
- 附錄B 再講一講Git
- 附錄C 獲取數(shù)據(jù)的渠道
- 附錄D 與可視化及信息設(shè)計有關(guān)的資源
書名:Python數(shù)據(jù)處理:如何又快又好
譯者:愛飛翔 譯
國內(nèi)出版社:機(jī)械工業(yè)出版社
出版時間:2024年01月
頁數(shù):378
書號:978-7-111-74115-2
原版書書名:Practical Python Data Wrangling and Data Quality
原版書出版商:O'Reilly Media
Susan E. McGregor
Susan E. McGregor是哥倫比亞大學(xué)數(shù)據(jù)科學(xué)研究所的研究員,也是該研究所數(shù)據(jù)、媒體和社會中心的聯(lián)合主管。十多年來,她一直在向非理工科的專業(yè)人士、研究生及本科生講授編程與數(shù)據(jù)分析課程,并不斷完善自己的教學(xué)方式。
本書封面上的動物是馬蹄鞭蛇,學(xué)名為Hemorrhois hippocrepis。
這種蛇原產(chǎn)自歐洲西南部與北非,它棲息于各種環(huán)境中,例如,灌木叢、巖質(zhì)與沙質(zhì)法岸、牧場、種植場、鄉(xiāng)村的田園以及城市的某些區(qū)域。成年的馬蹄鞭蛇總長可達(dá)1.5米。它的鱗片較為光滑,身體呈黃色或紅色,有一系列黑色或深棕色的大斑點,一直延伸至背部。這種蛇之所以叫馬蹄鞭蛇,是因為其頸部與后腦勺有馬蹄形的淡色印記。
馬蹄鞭蛇善于攀爬,能夠在樹頂、屋頂或巖石峭壁上捕捉鳥類、小型爬行動物和小型哺乳動物。雖然它在受到觸摸時容易發(fā)怒并用力咬人,但這種蛇沒有毒,對人來說不是特別危險。
馬蹄鞭蛇的適應(yīng)能力很強(qiáng),它目前的受保護(hù)狀態(tài)是“LeastConcern”,即它屬于無危物種。O'Reilly封面上的許多動物都瀕臨滅絕,它們對世界都很重要。