利用Python進(jìn)行數(shù)據(jù)分析
唐學(xué)韜 等譯
出版時(shí)間:2013年10月
頁(yè)數(shù):451
“科學(xué)計(jì)算和數(shù)據(jù)分析社區(qū)已經(jīng)等待這本書(shū)很多年了:大量具體的實(shí)踐建議,以及大量綜合應(yīng)用方法。本書(shū)在未來(lái)幾年里肯定會(huì)成為Python領(lǐng)域中技術(shù)計(jì)算的權(quán)威指南。”
——Fernando Pérez
加州大學(xué)伯克利分校研究科學(xué)家,
IPython的創(chuàng)始人之一
還在苦苦尋覓用Python控制、處理、整理、分析結(jié)構(gòu)化數(shù)據(jù)的完整課程?本書(shū)含有大量的實(shí)踐案例,你將學(xué)會(huì)如何利用各種Python庫(kù)(包括NumPy、pandas、matplotlib以及IPython等)高效地解決各式各樣的數(shù)據(jù)分析問(wèn)題。
由于作者Wes McKinney是pandas庫(kù)的主要作者,所以本書(shū)也可以作為利用Python實(shí)現(xiàn)數(shù)據(jù)密集型應(yīng)用的科學(xué)計(jì)算實(shí)踐指南。本書(shū)適合剛剛接觸Python的分析人員以及剛剛接觸科學(xué)計(jì)算的Python程序員。
· 將IPython這個(gè)交互式Shell作為你的首要開(kāi)發(fā)環(huán)境。
· 學(xué)習(xí)NumPy(Numerical Python)的基礎(chǔ)和高級(jí)知識(shí)。
· 從pandas庫(kù)的數(shù)據(jù)分析工具開(kāi)始。
· 利用高性能工具對(duì)數(shù)據(jù)進(jìn)行加載、清理、轉(zhuǎn)換、合并以及重塑。
· 利用matplotlib創(chuàng)建散點(diǎn)圖以及靜態(tài)或交互式的可視化結(jié)果。
· 利用pandas的groupby功能對(duì)數(shù)據(jù)集進(jìn)行切片、切塊和匯總操作。
· 處理各種各樣的時(shí)間序列數(shù)據(jù)。
· 通過(guò)詳細(xì)的案例學(xué)習(xí)如何解決Web分析、社會(huì)科學(xué)、金融學(xué)以及經(jīng)濟(jì)學(xué)等領(lǐng)域的問(wèn)題。
Wes McKinney 資深數(shù)據(jù)分析專(zhuān)家,對(duì)各種Python庫(kù)(包括NumPy、pandas、matplotlib以及IPython等)都有深入研究,并在大量的實(shí)踐中積累了豐富的經(jīng)驗(yàn)。撰寫(xiě)了大量與Python數(shù)據(jù)分析相關(guān)的經(jīng)典文章,被各大技術(shù)社區(qū)爭(zhēng)相轉(zhuǎn)載,是Python和開(kāi)源技術(shù)社區(qū)公認(rèn)的權(quán)威人物之一。開(kāi)發(fā)了用于數(shù)據(jù)分析的著名開(kāi)源Python庫(kù)——pandas,廣獲用戶(hù)好評(píng)。在創(chuàng)建Lambda Foundry(一家致力于企業(yè)數(shù)據(jù)分析的公司)之前,他曾是AQR Capital Management的定量分析師。
- 前言
- 第1章 準(zhǔn)備工作
- 本書(shū)主要內(nèi)容
- 為什么要使用Python進(jìn)行數(shù)據(jù)分析
- 重要的Python庫(kù)
- 安裝和設(shè)置
- 社區(qū)和研討會(huì)
- 使用本書(shū)
- 致謝
- 第2章 引言
- 來(lái)自bit.ly的1.usa.gov數(shù)據(jù)
- MovieLens 1M數(shù)據(jù)集
- 1880—2010年間全美嬰兒姓名
- 小結(jié)及展望
- 第3章 IPython:一種交互式計(jì)算和開(kāi)發(fā)環(huán)境
- IPython基礎(chǔ)
- 內(nèi)省
- 使用命令歷史
- 與操作系統(tǒng)交互
- 軟件開(kāi)發(fā)工具
- IPython HTML Notebook
- 利用IPython提高代碼開(kāi)發(fā)效率的幾點(diǎn)提示
- 高級(jí)IPython功能
- 致謝
- 第4章 NumPy基礎(chǔ):數(shù)組和矢量計(jì)算
- NumPy的ndarray:一種多維數(shù)組對(duì)象
- 通用函數(shù):快速的元素級(jí)數(shù)組函數(shù)
- 利用數(shù)組進(jìn)行數(shù)據(jù)處理
- 用于數(shù)組的文件輸入輸出
- 線(xiàn)性代數(shù)
- 隨機(jī)數(shù)生成
- 范例:隨機(jī)漫步
- 第5章 pandas入門(mén)
- pandas的數(shù)據(jù)結(jié)構(gòu)介紹
- 基本功能
- 匯總和計(jì)算描述統(tǒng)計(jì)
- 處理缺失數(shù)據(jù)
- 層次化索引
- 其他有關(guān)pandas的話(huà)題
- 第6章 數(shù)據(jù)加載、存儲(chǔ)與文件格式
- 讀寫(xiě)文本格式的數(shù)據(jù)
- 二進(jìn)制數(shù)據(jù)格式
- 使用HTML和Web API
- 使用數(shù)據(jù)庫(kù)
- 第7章 數(shù)據(jù)規(guī)整化:清理、轉(zhuǎn)換、合并、重塑
- 合并數(shù)據(jù)集
- 重塑和軸向旋轉(zhuǎn)
- 數(shù)據(jù)轉(zhuǎn)換
- 字符串操作
- 示例:USDA食品數(shù)據(jù)庫(kù)
- 第8章 繪圖和可視化
- matplotlib API入門(mén)
- pandas中的繪圖函數(shù)
- 繪制地圖:圖形化顯示海地地震危機(jī)數(shù)據(jù)
- Python圖形化工具生態(tài)系統(tǒng)
- 第9章 數(shù)據(jù)聚合與分組運(yùn)算
- GroupBy技術(shù)
- 數(shù)據(jù)聚合
- 分組級(jí)運(yùn)算和轉(zhuǎn)換
- 透視表和交叉表
- 示例:2012聯(lián)邦選舉委員會(huì)數(shù)據(jù)庫(kù)
- 第10章 時(shí)間序列
- 日期和時(shí)間數(shù)據(jù)類(lèi)型及工具
- 時(shí)間序列基礎(chǔ)
- 日期的范圍、頻率以及移動(dòng)
- 時(shí)區(qū)處理
- 時(shí)期及其算術(shù)運(yùn)算
- 重采樣及頻率轉(zhuǎn)換
- 時(shí)間序列繪圖
- 移動(dòng)窗口函數(shù)
- 性能和內(nèi)存使用方面的注意事項(xiàng)
- 第11章 金融和經(jīng)濟(jì)數(shù)據(jù)應(yīng)用
- 數(shù)據(jù)規(guī)整化方面的話(huà)題
- 分組變換和分析
- 更多示例應(yīng)用
- 第12章 NumPy高級(jí)應(yīng)用
- ndarray對(duì)象的內(nèi)部機(jī)理
- 高級(jí)數(shù)組操作
- 廣播
- ufunc高級(jí)應(yīng)用
- 結(jié)構(gòu)化和記錄式數(shù)組
- 更多有關(guān)排序的話(huà)題
- NumPy的matrix類(lèi)
- 高級(jí)數(shù)組輸入輸出
- 性能建議
- 附錄A Python語(yǔ)言精要
書(shū)名:利用Python進(jìn)行數(shù)據(jù)分析
譯者:唐學(xué)韜 等譯
國(guó)內(nèi)出版社:機(jī)械工業(yè)出版社
出版時(shí)間:2013年10月
頁(yè)數(shù):451
書(shū)號(hào):978-7-111-43673-7
原版書(shū)書(shū)名:Python for Data Analysis
原版書(shū)出版商:O'Reilly Media
Wes McKinney
Wes McKinney是紐約的一名數(shù)據(jù)分析高手和企業(yè)主。在2007年獲得MIT的數(shù)學(xué)學(xué)士學(xué)位之后,他到位于康涅狄格州格林威治市(Greenwich,CT)的AQR Capital Management公司從事定量金融方面的工作。由于不滿(mǎn)那些數(shù)據(jù)分析工具的各種不好用,他開(kāi)始學(xué)習(xí)Python,并于2008年開(kāi)始構(gòu)建pandas項(xiàng)目。他目前是Python科學(xué)計(jì)算社區(qū)的活躍分子,而且積極倡導(dǎo)在數(shù)據(jù)分析、金融以及統(tǒng)計(jì)應(yīng)用中使用Python。
本書(shū)封面上的那只動(dòng)物是一只筆尾樹(shù)鼩(拉丁名為Ptilocercus lowii)。筆尾樹(shù)鼩是筆尾樹(shù)鼩科(Ptilocercidae)筆尾樹(shù)鼩屬(Ptilocercus)中的唯一物種,其他樹(shù)鼩都屬于樹(shù)鼩科(Tupaiidae)。樹(shù)鼩的特征是長(zhǎng)長(zhǎng)的尾巴和柔軟的紅棕色皮毛。從名字上就能看出來(lái),筆尾樹(shù)鼩有一條形如羽毛筆的尾巴。樹(shù)鼩是雜食性動(dòng)物,以昆蟲(chóng)、水果、種子以及小型脊椎動(dòng)物為主要食物。
主要分布于印度尼西亞、馬來(lái)西亞和泰國(guó),這些野生哺乳動(dòng)物以慣于長(zhǎng)期飲酒而著稱(chēng)。馬來(lái)西亞樹(shù)鼩每天要花費(fèi)數(shù)小時(shí)食用天然發(fā)酵的玻淡棕櫚花蜜,相當(dāng)于大約10到12杯酒精含量為3.8%的酒。盡管如此,從來(lái)也沒(méi)有一只筆尾樹(shù)鼩喝醉過(guò),這得歸功于它們那令人印象深刻的乙醇降解能力,包括一種人類(lèi)所沒(méi)有的酒精代謝方式。跟其他哺乳動(dòng)物相比(包括人類(lèi)?),它們還有另外一個(gè)令人印象深刻的特點(diǎn)——大腦跟身體的質(zhì)量比。
雖然這種野生動(dòng)物的名字叫筆尾樹(shù)鼩(pen-tailed tree-shrew),但它們并不是真正的鼠類(lèi)(shrew),而是更接近于靈長(zhǎng)類(lèi)(primates)。因此,樹(shù)鼩在近視、心理社會(huì)應(yīng)激、肝炎等醫(yī)學(xué)實(shí)驗(yàn)中成為靈長(zhǎng)類(lèi)動(dòng)物的一種替代品。