91精品国产综合久久四虎久久_国产成人午夜高潮毛片_99er视频精品免费观看_2020亚洲熟女在线观看_日本女优人体写真_国内黄色毛片_年轻的老师中文版在线_丰满女邻居做爰_久久久久久精品成人免费图片

學(xué)習(xí)數(shù)據(jù)科學(xué)并沒(méi)有什么神秘之處
專業(yè)數(shù)據(jù)科學(xué)家的5大首要習(xí)慣
編者注:對(duì)于向往“獨(dú)角獸”技能的人士,歡迎在2016年9月27日(星期二)參加紐約Strata + Hadoop World大會(huì),跟隨Jerry Overton學(xué)習(xí)“實(shí)用數(shù)據(jù)科學(xué):設(shè)計(jì)數(shù)據(jù)驅(qū)動(dòng)的業(yè)務(wù)提升的最佳實(shí)踐,使之成為現(xiàn)實(shí)從而推動(dòng)企業(yè)的變革”的教程。在課程里可以學(xué)習(xí)如何構(gòu)建和執(zhí)行數(shù)據(jù)戰(zhàn)略、如何編寫(xiě)算法以及如何在企業(yè)級(jí)別上進(jìn)行實(shí)驗(yàn)。

更多內(nèi)容可以參考Strata北京2017的相關(guān)議題

有些人可以想出用數(shù)據(jù)來(lái)提升企業(yè)業(yè)務(wù)的方法。這些人可以解釋這些方法并使之變?yōu)楝F(xiàn)實(shí),從而影響他們機(jī)構(gòu)的變革。盡管他們的工作是編寫(xiě)和修改代碼,但他們是可以(或至少是努力的)從容地跟主管們對(duì)話。我們有時(shí)稱他們?yōu)椤蔼?dú)角獸”,這是因?yàn)樗麄儞碛械木C合技能可以說(shuō)是神秘的、神奇的…和難以想象的。

但是我不認(rèn)為碰到一些希望自己的工作對(duì)人們有確實(shí)影響的人是一件不尋常的事。我也不認(rèn)為學(xué)習(xí)數(shù)據(jù)科學(xué)技能有什么神秘之處。你可以在這個(gè)15小時(shí)的講座和視頻中了解機(jī)器學(xué)習(xí)的基礎(chǔ)知識(shí)。你可以通過(guò)20個(gè)小時(shí)(為期一個(gè)月,每天45分鐘)的專注的強(qiáng)化訓(xùn)練變得對(duì)大部分機(jī)器學(xué)習(xí)技能有相當(dāng)?shù)牧私狻?/p>

所以一個(gè)“獨(dú)角獸”甚至是專業(yè)數(shù)據(jù)科學(xué)家基本上是可以被培訓(xùn)出來(lái)的。雖然學(xué)習(xí)所有的相關(guān)技能是很難的,但是也非常簡(jiǎn)潔明。在O’Reilly的伙伴幫助下,我們?cè)诩~約Strata + Hadoop World大會(huì)上為那些向往學(xué)習(xí)“獨(dú)角獸”的技能的人設(shè)計(jì)了一個(gè)教程“實(shí)用數(shù)據(jù)科學(xué):設(shè)計(jì)數(shù)據(jù)驅(qū)動(dòng)的業(yè)務(wù)提升的最佳實(shí)踐,并使之成為現(xiàn)實(shí)從而推動(dòng)企業(yè)的變革”。本教程的宗旨是幫助你通過(guò)采納以下最優(yōu)秀的習(xí)慣,來(lái)讓你在通往專業(yè)數(shù)據(jù)科學(xué)家的道路上少走彎路。

5. 放棄技術(shù)棧思維

數(shù)據(jù)科學(xué)中使用的工具和技術(shù)通常被稱為一個(gè)技術(shù)棧。技術(shù)棧是一個(gè)問(wèn)題,因?yàn)樗鼤?huì)使你被技術(shù)問(wèn)題而不是業(yè)務(wù)問(wèn)題所激勵(lì)。當(dāng)你關(guān)注于一個(gè)技術(shù)棧時(shí),你會(huì)問(wèn)類(lèi)似這樣的問(wèn)題“這個(gè)工具可以跟那個(gè)工具相連嗎?”或者“我需要什么樣的硬件設(shè)備來(lái)安裝這個(gè)產(chǎn)品?”。這些都是重要的問(wèn)題,但是它們不是能夠激勵(lì)一個(gè)專業(yè)數(shù)據(jù)科學(xué)家的問(wèn)題。

數(shù)據(jù)科學(xué)領(lǐng)域的專業(yè)人員傾向于將工具和技術(shù)看作是一個(gè)有洞察力的應(yīng)用程序的一部分而不是一個(gè)技術(shù)棧。專注于構(gòu)建一個(gè)應(yīng)用程序會(huì)迫使你基于應(yīng)用程序需要產(chǎn)生的洞察來(lái)選擇技術(shù)組件?;趹?yīng)用程序的思維,你會(huì)問(wèn)類(lèi)似這樣的問(wèn)題“我需要做什么來(lái)發(fā)現(xiàn)一個(gè)新見(jiàn)解?”和“這個(gè)技術(shù)是否會(huì)讓我更接近我的業(yè)務(wù)目標(biāo)?”。

iml-blog1-d736ba6f2fc404dae518a3eb79451cb2

圖1 數(shù)據(jù)科學(xué)工具和技術(shù)是一個(gè)有洞察力的應(yīng)用程序的組件,而不是一個(gè)技術(shù)棧。圖片來(lái)源:Jerry Overton

在紐約Strata + Hadoop World大會(huì)的課程中,我會(huì)教授從技術(shù)棧思維轉(zhuǎn)向有洞察力的應(yīng)用程序思維的簡(jiǎn)單策略。

4. 保證數(shù)據(jù)的供給

數(shù)據(jù)科學(xué)故事通常是以它們實(shí)際發(fā)生的相反順序來(lái)被講述的。在寫(xiě)得很好的故事中,作者會(huì)以一個(gè)重要的問(wèn)題開(kāi)頭,引導(dǎo)你通過(guò)收集數(shù)據(jù)來(lái)回答問(wèn)題,描述實(shí)驗(yàn)步驟,展示最終結(jié)論。但在真正的數(shù)據(jù)科學(xué)實(shí)踐中,故事通常是在有人查看已有數(shù)據(jù)并提出問(wèn)題開(kāi)始的:“嘿,我想知道我們是否可以利用這些數(shù)據(jù)做一些很酷的事情呢”?這個(gè)問(wèn)題帶來(lái)了變革,進(jìn)一步帶來(lái)了構(gòu)建有用的事情,以及帶來(lái)尋找可能的受益人。大部分工作是致力于彌合發(fā)現(xiàn)的新見(jiàn)解和利益相關(guān)者的需求之間的差距。但是當(dāng)講述故事的時(shí)候,讀者經(jīng)歷的是從利益相關(guān)者的需求到新見(jiàn)解的發(fā)現(xiàn)的平滑過(guò)程。

你提出的問(wèn)題通常是你可以訪問(wèn)足夠的數(shù)據(jù)來(lái)回答的問(wèn)題。真正的數(shù)據(jù)科學(xué)通常需要一個(gè)健全的可自由裁量數(shù)據(jù)的存儲(chǔ)系統(tǒng)。在本教程中,我會(huì)介紹構(gòu)建和使用數(shù)據(jù)通道來(lái)確保你始終有足夠的數(shù)據(jù)來(lái)做一些有用的事情。

3.有一個(gè)策略

數(shù)據(jù)策略常會(huì)與數(shù)據(jù)治理混淆。當(dāng)我想到策略時(shí)我就會(huì)想起國(guó)際象棋。想要玩國(guó)際象棋你必須知道游戲規(guī)則,但如果想要贏,你必須有一個(gè)策略。你必須知道“D2的卒可以移動(dòng)到D3,除非在D3有阻礙或者這個(gè)移動(dòng)會(huì)使國(guó)王暴露而被直接攻擊”這個(gè)規(guī)則。但是僅知道這個(gè)規(guī)則并不能幫助我走出致勝的一步。我真正需要的模式是能幫助我把棋子放在更好的位置以贏得比賽的模式:“如果我可以讓我的車(chē)和后在棋盤(pán)的中間連在一起,那么我就可以迫使對(duì)手的國(guó)王陷入一個(gè)角落的陷阱里”。

iml-blog2-5a4bd92dd023088c67cdd95cec5131ad

圖2 一個(gè)數(shù)據(jù)策略圖。數(shù)據(jù)策略與數(shù)據(jù)治理不同。你需要一個(gè)策略圖來(lái)執(zhí)行數(shù)據(jù)策略。 圖片來(lái)源:Jerry Overton

國(guó)際象棋的這個(gè)經(jīng)驗(yàn)也適用于利用數(shù)據(jù)來(lái)贏得比賽。專業(yè)的數(shù)據(jù)科學(xué)家明白,要贏得比賽必須有一個(gè)策略;要建立一個(gè)策略必須要有一個(gè)策略圖。在本教程中我們會(huì)介紹如何根據(jù)最重要的業(yè)務(wù)問(wèn)題來(lái)構(gòu)建策略圖、建立數(shù)據(jù)策略以及執(zhí)行基于應(yīng)用程序思維的策略。

2. 黑客

這里的黑客當(dāng)然不是指從事破壞性或者非法的活動(dòng),我是指拼湊出有用的解決方案(的能力)。專業(yè)的數(shù)據(jù)科學(xué)家通常需要快速構(gòu)建解決方案。雖然工具可以使你更有效率,但是僅僅工具本身并不會(huì)在你需要時(shí)帶來(lái)高效。

想要達(dá)到專業(yè)數(shù)據(jù)科學(xué)家的水平,你必須掌握黑客的藝術(shù)。你需要善于運(yùn)用已有資源來(lái)產(chǎn)生新的、最小可行的數(shù)據(jù)產(chǎn)品。在紐約我們會(huì)介紹一些能將數(shù)據(jù)產(chǎn)品組合在一起,并構(gòu)建你能理解的、適合目標(biāo)的解決方案的技術(shù)。

1. 實(shí)驗(yàn)

對(duì)于實(shí)驗(yàn),我不是指簡(jiǎn)單嘗試不同的事情然后看看會(huì)發(fā)生什么。我的意思是用科學(xué)方法指導(dǎo)的更正式的實(shí)驗(yàn)。還記得你在小學(xué)科學(xué)課上做的那些實(shí)驗(yàn)、寫(xiě)的那些報(bào)告和在課堂上做的那些演講么?對(duì),就像那樣。

進(jìn)行實(shí)驗(yàn)并評(píng)估結(jié)果是數(shù)據(jù)科學(xué)家發(fā)揮影響力的最有效的方法之一。我發(fā)現(xiàn)在企業(yè)里,好的故事和宏圖并不足以說(shuō)服他人來(lái)采用新的方法。我發(fā)現(xiàn)能強(qiáng)大到足以影響變革的唯一方法就是一個(gè)成功的案例。很少有人愿意嘗試新的方法除非它被證明是成功的。你沒(méi)法證明一種方法的成功除非你讓人們來(lái)嘗試它。走出這種惡性循環(huán)的方法就是進(jìn)行一系列的小實(shí)驗(yàn)。

iml-blog3-3c4a07e17de8dd2f99fe18cc937c3aad

圖3. 小而持續(xù)性的實(shí)驗(yàn)是一個(gè)數(shù)據(jù)科學(xué)家影響變革的最有效的方法之一。圖片來(lái)源:Jerry Overton

在紐約Strata + Hadoop World大會(huì)的教程中,我們還會(huì)學(xué)習(xí)在非常短的沖刺階段進(jìn)行實(shí)驗(yàn)的技術(shù),這會(huì)迫使我們專注于發(fā)現(xiàn)新見(jiàn)解并在小而有意義的批次中來(lái)提升企業(yè)。

我們正處于大數(shù)據(jù)領(lǐng)域的一個(gè)新階段的開(kāi)端。這一階段與大規(guī)模數(shù)據(jù)的獲取和存儲(chǔ)的技術(shù)細(xì)節(jié)關(guān)系不大,而與發(fā)現(xiàn)有影響力的可擴(kuò)展的新見(jiàn)解更相關(guān)。能適應(yīng)和學(xué)會(huì)讓數(shù)據(jù)得到充分利用的機(jī)構(gòu)將會(huì)一如既往地超越同行。能夠構(gòu)思數(shù)據(jù)驅(qū)動(dòng)的業(yè)務(wù)提升,使它們變?yōu)楝F(xiàn)實(shí)并驅(qū)動(dòng)變革的人才是企業(yè)最需要的。我不知道有多少人真正有興趣接受這個(gè)挑戰(zhàn),但我真的期待遇到他們。

Jerry Overton

Jerry Overton是CSC的數(shù)據(jù)科學(xué)家和杰出工程師(CSC是下一代IT解決方案的全球領(lǐng)導(dǎo)者)。Jerry是CSC高級(jí)分析研究的負(fù)責(zé)人,也是其高級(jí)分析實(shí)驗(yàn)室的創(chuàng)始人。在他的博客“做數(shù)據(jù)科學(xué)”中,Jerry分享了他在數(shù)據(jù)科學(xué)領(lǐng)域開(kāi)拓研究的寶貴經(jīng)驗(yàn)。

Fish Magic, 1925. (source: Google Art Project on Wikimedia Commons).