云端基因組學(xué)
杜春曉 譯
出版時(shí)間:2022年04月
頁(yè)數(shù):484
近年來(lái),基因組學(xué)領(lǐng)域數(shù)據(jù)激增。未來(lái)幾年,美國(guó)國(guó)立衛(wèi)生研究院(NIH)等機(jī)構(gòu)將托管50多拍字節(jié)(或5000多萬(wàn)吉字節(jié))的基因組數(shù)據(jù)。它們已開始利用云基礎(chǔ)設(shè)施托管數(shù)據(jù),以便將其開放給研究社區(qū)使用。你如何改進(jìn)基因組分析工具和協(xié)議,才能訪問(wèn)和分析云端海量數(shù)據(jù)?
本書緊貼工作實(shí)際,研究者可從本書學(xué)到如何用基因組分析工具集GATK、Docker容器、WDL語(yǔ)言和Terra平臺(tái)等開源工具編制和運(yùn)行基因組學(xué)分析算法。作者Geraldine A. Van der Auwera長(zhǎng)期管理GATK用戶社區(qū),作者Brian D. O’Connor則來(lái)自加利福尼亞大學(xué)圣克魯茲分校基因組研究所。閱讀本書的過(guò)程,就仿佛是兩位專家?guī)阃瓿稍贫嘶蚪M分析項(xiàng)目。你將學(xué)習(xí)用基因組學(xué)分析算法處理真實(shí)數(shù)據(jù)。
本書主要內(nèi)容如下:
● 基因組學(xué)和計(jì)算科學(xué)背景知識(shí)。
● 云計(jì)算操作基礎(chǔ)。
● 帶你入門GATK和三個(gè)主要GATK最佳實(shí)踐流水線。
● 用WDL語(yǔ)言編寫工作流,用Cromwell系統(tǒng)管理工作流,實(shí)現(xiàn)自動(dòng)分析。
● 用并行技術(shù)在云端大規(guī)模執(zhí)行工作流,降低成本。
● 在云端用Jupyter筆記本做交互分析。
● 用Terra平臺(tái)實(shí)現(xiàn)安全協(xié)作和計(jì)算可復(fù)現(xiàn)。
書名:云端基因組學(xué)
譯者:杜春曉 譯
國(guó)內(nèi)出版社:中國(guó)電力出版社
出版時(shí)間:2022年04月
頁(yè)數(shù):484
書號(hào):978-7-5198-6442-2
原版書書名:Genomics in the Cloud
原版書出版商:O'Reilly Media
Geraldine A. Van der Auwera
Geraldine A. Van der Auwera博士是博德研究所數(shù)據(jù)科學(xué)平臺(tái)(Outreach and Communications for the Data Sciences Platform,DSP)的外聯(lián)和通信主任。該研究所由麻省理工學(xué)院和哈佛大學(xué)聯(lián)合創(chuàng)辦。作為外聯(lián),她擔(dān)負(fù)教育和倡導(dǎo)研究者使用DSP軟件和服務(wù)的職責(zé),幫助研究者使用博德研究所行業(yè)領(lǐng)先的變異發(fā)現(xiàn)分析工具集GATK、Cromwell/WDL工作流管理系統(tǒng)和云分析平臺(tái)Terra.bio。Terra平臺(tái)整合計(jì)算資源、方法庫(kù)和數(shù)據(jù)管理工具,其工作環(huán)境對(duì)用戶非常友好。Van der Auwera原是微生物學(xué)家,2007年從比利時(shí)魯汶大學(xué)獲得生物工程博士學(xué)位,隨后到哈佛醫(yī)學(xué)院做了四年博士后。她于2012年加入博德研究所,成為GATK用戶社區(qū)仁慈的獨(dú)裁者,永遠(yuǎn)告別工作臺(tái)和移液器。
Brian D. O’Connor
Brian D. O’Connor博士是加利福尼亞大學(xué)圣克魯茲分校(UCSC)基因組研究所計(jì)算基因組平臺(tái)(Computational Genomics Platform)主任。他重點(diǎn)研究基因組數(shù)據(jù)分析所用的大規(guī)模和基于云的系統(tǒng)的開發(fā)和部署,其中包括NHGRI AnVIL和NHLBI Bio Data Catalyst平臺(tái)以及工作流和工具分享站點(diǎn)Dockstore。Brian積極從事標(biāo)準(zhǔn)制定工作。他擔(dān)任全球基因組學(xué)和健康聯(lián)盟云工作流(Global Alliance for Genomics and Health Cloud Work Stream)的聯(lián)合主席,從事API標(biāo)準(zhǔn)制定工作,以實(shí)現(xiàn)云端互操作。Brian從加拿大安大略癌癥研究所加入U(xiǎn)CSC。他之前從事的項(xiàng)目包括:帶隊(duì)開發(fā)全基因組泛癌分析(PanCancer Analysis of Whole Genomes)項(xiàng)目,實(shí)現(xiàn)全球性云端分析系統(tǒng),創(chuàng)建Dockstore站點(diǎn),并成功重建國(guó)際癌癥基因組聯(lián)盟(International Cancer Genome Consortium)的數(shù)據(jù)門戶。
本書封面的動(dòng)物是一種生有牛奶斑點(diǎn)的四齒鲀科魚類(凹鼻鲀,學(xué)名Chelonodon patoca),原見(jiàn)于印度洋—太平洋地區(qū)的江河入???、紅樹林、沿海地區(qū)和淡鹽水區(qū)域,現(xiàn)今在這些區(qū)域仍有分布。四齒鲀科魚類又稱河豚(blowfish),它們以其富有彈性的腹部而聞名,腹部膨脹可阻擋捕食者。
生有牛奶斑點(diǎn)的這種鲀,就像四齒鲀科其他魚類一樣,其皮膚也含毒素。其皮膚上的粘液層對(duì)人和其他捕食者有劇毒。其鱗片呈棕灰色,生有深色條紋和白斑。其腹部為白色,帶點(diǎn)淺黃,眼睛有一個(gè)黃環(huán)。成年凹鼻鲀可長(zhǎng)至10英寸。這種魚以無(wú)脊椎動(dòng)物為食,如軟體動(dòng)物、蠕蟲。它們也吃海草等植物。