關(guān)于我們
書(shū)單推薦
新書(shū)推薦
|
終極算法:機(jī)器學(xué)習(xí)和人工智能如何重塑世界 購(gòu)物網(wǎng)站用算法來(lái)為你推薦商品,點(diǎn)評(píng)網(wǎng)站用算法來(lái)幫你選擇餐館,GPS系統(tǒng)用算法來(lái)幫你選擇*佳路線,公司用算法來(lái)選擇求職者…… 當(dāng)機(jī)器最終學(xué)會(huì)如何學(xué)習(xí)時(shí),將會(huì)發(fā)生什么? 不同于傳統(tǒng)算法,現(xiàn)在悄然主導(dǎo)我們生活的是“能夠?qū)W習(xí)的機(jī)器”,它們通過(guò)學(xué)習(xí)我們瑣碎的數(shù)據(jù),來(lái)執(zhí)行任務(wù);它們甚至在我們還沒(méi)提出要求,就能完成我們想做的事。 什么是終ji算法? 機(jī)器學(xué)習(xí)五大學(xué)派,每個(gè)學(xué)派都有自己的主算法,能幫助人們解決特定的問(wèn)題。而如果整合所有這些算法的優(yōu)點(diǎn),就有可能找到一種“終ji算法”,該算法可以獲得過(guò)去、現(xiàn)在和未來(lái)的所有知識(shí),這也必將創(chuàng)造新的人類文明。 你為什么必須了解終ji算法? 不論你身處什么行業(yè)、做什么工作,了解終ji算法都將帶給你嶄新的科學(xué)世界觀,預(yù)測(cè)以后的科技發(fā)展,布局未來(lái),占位未來(lái)! —————— 在《終ji算法》中,全球著名的算法問(wèn)題專家、機(jī)器學(xué)習(xí)領(lǐng)域的先驅(qū)人物佩德羅·多明戈斯,為我們揭開(kāi)了算法的神秘面紗,讓我們一窺谷歌以及你的智能手機(jī)背后的機(jī)器學(xué)習(xí)原理。他闡釋了機(jī)器學(xué)習(xí)的五大學(xué)派思想,解釋了它們?nèi)绾螌⑸窠?jīng)科學(xué)、心理學(xué)、物理等領(lǐng)域的理論轉(zhuǎn)變?yōu)樗惴ú槟惴⻊?wù),并提出了“終ji算法”的設(shè)想,探討了終ji算法對(duì)未來(lái)商業(yè)、科學(xué)、社會(huì)以及對(duì)每個(gè)人的意義。對(duì)于想要理解未來(lái)將發(fā)生怎樣的變革、以及想走在變革前沿的人來(lái)說(shuō),這是一本必不可少的思想指南。 “如果這種終ji算法存在,那么它將可以通過(guò)數(shù)據(jù)獲得世界上過(guò)去、現(xiàn)在、未來(lái)的所有知識(shí)。這個(gè)算法的發(fā)明將會(huì)是科學(xué)史上偉大的進(jìn)步之一。” 比爾·蓋茨年度薦書(shū)!《終ji算法》近20年人工智能領(lǐng)域具轟動(dòng)性的著作!揭秘機(jī)器學(xué)習(xí)的終ji邏輯,全景勾勒人工智能的商業(yè)未來(lái)!秵滩妓箓鳌纷髡呶譅柼·艾薩克森、圖靈獎(jiǎng)得主朱迪亞·珀?duì)枴⒅袊?guó)大數(shù)據(jù)領(lǐng)航人車(chē)品覺(jué)、今日頭條首席算法架構(gòu)師曹歡歡 傾力推薦! Google X、微軟研究院 密切關(guān)注! 如果你先想了解人工智能,那么推薦佩德羅·多明戈斯所著的《終ji算法》,非常值得一讀!葼·蓋茨 序 你也許不知道,但機(jī)器學(xué)習(xí)就在你身邊。當(dāng)你把查詢信息輸入搜索引擎時(shí),它確定該向你顯示哪些搜索結(jié)果(包括顯示哪些廣告)。當(dāng)你打開(kāi)郵箱時(shí),大部分垃圾郵件你無(wú)法看到,因?yàn)橛?jì)算機(jī)已經(jīng)把這些垃圾郵件過(guò)濾了。登錄亞馬遜網(wǎng)站購(gòu)買(mǎi)一本書(shū),或登錄網(wǎng)飛(Netflix)公司網(wǎng)站觀看視頻,機(jī)器學(xué)習(xí)系統(tǒng)會(huì)推薦一些你可能喜歡的產(chǎn)品。臉書(shū)(Facebook)利用機(jī)器學(xué)習(xí)決定該向你展示哪些更新,推特(Twitter)也同樣會(huì)決定顯示哪些文章。你使用計(jì)算機(jī)的任何時(shí)候,都有可能涉及機(jī)器學(xué)習(xí)。 傳統(tǒng)上認(rèn)為,讓計(jì)算機(jī)完成某件事情的唯一方法(從把兩個(gè)數(shù)相加到駕駛飛機(jī)),就是非常詳細(xì)地記錄某個(gè)算法并解釋其如何運(yùn)行。但機(jī)器學(xué)習(xí)算法就不一樣:通過(guò)從數(shù)據(jù)中推斷,它們自己會(huì)弄明白做事方法。掌握的數(shù)據(jù)越多,它們的工作就越順利,F(xiàn)在我們不用給計(jì)算機(jī)編程,它們自己給自己編程。 機(jī)器學(xué)習(xí)不僅存在于網(wǎng)絡(luò)空間,它還存在于你每天的生活中:從你醒來(lái)到入睡,每時(shí)每刻無(wú)所不在。 早上7 點(diǎn)你的收音機(jī)鬧鐘響起,播放的是你之前從未聽(tīng)過(guò)的歌曲,但你的確很喜歡這首歌。Pandora 電臺(tái)(可免費(fèi)根據(jù)你的喜好播放歌曲)的優(yōu)勢(shì)在于,根據(jù)你聽(tīng)的音樂(lè),電臺(tái)掌握了你的品位,就像你自己的radio jock 賬號(hào)一樣。這些歌曲本身可能借助機(jī)器學(xué)習(xí)來(lái)播放。接下來(lái)你吃早餐,閱讀早報(bào)。早報(bào)在幾個(gè)小時(shí)前印好,利用學(xué)習(xí)算法,印刷過(guò)程經(jīng)過(guò)仔細(xì)調(diào)整,以免報(bào)紙出現(xiàn)折痕。你房間的溫度剛剛好,電費(fèi)明顯少了很多,因?yàn)槟惆惭b了Nest智能溫控器。 你開(kāi)車(chē)去上班,車(chē)持續(xù)調(diào)整燃油噴射和排氣再循環(huán),以達(dá)到最佳的油耗。你利用一個(gè)交通預(yù)報(bào)系統(tǒng)(Inrix)來(lái)縮短高峰時(shí)段上下班的時(shí)間,這當(dāng)然能減緩你的壓力。上班時(shí),機(jī)器學(xué)習(xí)幫你克服信息超載。你利用數(shù)據(jù)立方體來(lái)匯總大量數(shù)據(jù),從每個(gè)角度觀察該立方體,獲取最有用的信息。你要決定是采用布局方案A,還是采用布局方案B,以便為網(wǎng)站帶來(lái)更多的業(yè)務(wù)。網(wǎng)絡(luò)學(xué)習(xí)系統(tǒng)會(huì)嘗試兩種布局方案,并給予反饋。你得對(duì)潛在供應(yīng)商的網(wǎng)站進(jìn)行調(diào)查,但網(wǎng)站的語(yǔ)言是外語(yǔ)。沒(méi)關(guān)系,谷歌會(huì)自動(dòng)為你翻譯。E–mail 會(huì)自動(dòng)分類并歸入相應(yīng)的文件夾,只把最重要的信息留在郵箱里,非常方便。文字處理軟件幫你查找語(yǔ)法和拼寫(xiě)錯(cuò)誤。你為即將到來(lái)的行程查找到一個(gè)航班,但決定推遲購(gòu)買(mǎi)機(jī)票,因?yàn)楸貞?yīng)旅行(Bing Travel)預(yù)測(cè)票價(jià)很快會(huì)下降。也許你沒(méi)有意識(shí)到以上這些,要不是機(jī)器學(xué)習(xí)幫助你,你可能要馬不停蹄地親自做很多事情。 你在休息時(shí)間查看自己的共同基金,大部分基金利用學(xué)習(xí)算法來(lái)選股,其中的某些基金完全由學(xué)習(xí)系統(tǒng)運(yùn)作。午餐時(shí)間到了,你走在大街上,想找個(gè)吃飯的地方,這時(shí)候用手機(jī)上的Yelp點(diǎn)評(píng)應(yīng)用程序來(lái)幫助你。你的手機(jī)充滿了學(xué)習(xí)算法,它們努力工作,改正拼寫(xiě)錯(cuò)誤、理解口頭指令、減少傳輸誤差、識(shí)別條形碼,還有其他很多事情。手機(jī)甚至可以預(yù)測(cè)你接下來(lái)會(huì)做什么,然后依此給出建議。例如,當(dāng)你吃完午餐后,它會(huì)小心翼翼地提示你,下午和外地來(lái)訪者的會(huì)面要推遲,因?yàn)樗暮桨嘌诱`了。 下班時(shí)夜幕已降臨,你走向自己的車(chē),機(jī)器學(xué)習(xí)會(huì)保證你的安全,監(jiān)測(cè)停車(chē)場(chǎng)監(jiān)控?cái)z像頭的錄像,如果探測(cè)到可疑人的行動(dòng),它會(huì)提示不在場(chǎng)的安保人員。在回家路上,你在超市門(mén)口停車(chē),走向超市貨物通道,通道借助學(xué)習(xí)算法進(jìn)行布置:該擺放哪些貨物,通道末尾該展示哪些產(chǎn)品,洋蔥番茄辣醬是否該放在調(diào)味醬區(qū)域,或是放在墨西哥玉米片旁邊。你用信用卡付款。學(xué)習(xí)算法會(huì)向你發(fā)送信用卡支付提示,并在得到你的確認(rèn)后完成支付。另外一個(gè)算法持續(xù)尋找可疑交易,如果它覺(jué)得你的卡號(hào)被盜,則會(huì)提示你。還有一種算法嘗試評(píng)估你對(duì)這張卡的滿意度,如果你是理想的客戶但對(duì)服務(wù)不太滿意,銀行會(huì)在你決定換卡之前,為你提供更貼心的服務(wù)。 你回到家,走到信箱旁,發(fā)現(xiàn)有朋友的一封來(lái)信,這是通過(guò)能閱讀手寫(xiě)地址的學(xué)習(xí)算法派送的。當(dāng)然也會(huì)有垃圾來(lái)信,由另外的學(xué)習(xí)算法進(jìn)行選擇。你停留了一會(huì)兒,呼吸夜晚清新涼爽的空氣。你所在城市的犯罪率明顯下降了,因?yàn)榫扉_(kāi)始使用統(tǒng)計(jì)算法來(lái)預(yù)測(cè)哪里的犯罪率最高,并在那里集中巡警力量。你和家人共享晚餐。市長(zhǎng)出現(xiàn)在新聞里,你為他投票,因?yàn)檫x舉那天,學(xué)習(xí)算法確定你為“關(guān)鍵未投票選民”之后,他親自給你打了電話。吃完晚餐,你觀看球賽,兩支球隊(duì)都借助統(tǒng)計(jì)學(xué)習(xí)來(lái)挑選隊(duì)員。你也可能和孩子們?cè)赬box 上玩游戲,Kinecta學(xué)習(xí)算法確定你在哪里、在做什么。你在睡前吃藥,醫(yī)生通過(guò)學(xué)習(xí)算法的輔助來(lái)設(shè)定和檢測(cè)吃藥的最佳時(shí)間。醫(yī)生也可能利用機(jī)器學(xué)習(xí)來(lái)幫你診斷疾病,例如,分析X射線結(jié)果并弄明白一系列非正常癥狀。 機(jī)器學(xué)習(xí)參與了你人生的每個(gè)階段。如果你為了參加SAT大學(xué)入學(xué)考試(美國(guó)學(xué)術(shù)能力評(píng)估測(cè)試)而在網(wǎng)上學(xué)習(xí),某學(xué)習(xí)算法會(huì)給你的練習(xí)短文打分。如果你申請(qǐng)商學(xué)院,且最近要參加GMAT(經(jīng)企管理研究生入學(xué)考試),其中的一個(gè)文章打分工具就是一個(gè)學(xué)習(xí)系統(tǒng)?赡墚(dāng)你求職時(shí),某學(xué)習(xí)算法會(huì)從虛擬文件中挑選出你的簡(jiǎn)歷,并告訴未來(lái)的雇主:這位是很不錯(cuò)的人選,看看吧。最近公司給你加薪可能還多虧另外的學(xué)習(xí)算法。如果想買(mǎi)套房子,Zillow.com網(wǎng)站會(huì)估算你看中的每套房的價(jià)值,接著房子就有了著落。之后申請(qǐng)住房貸款,某學(xué)習(xí)算法會(huì)研究你的申請(qǐng),并建議是否可以通過(guò)申請(qǐng)。最重要的是,如果你使用在線約會(huì)服務(wù),機(jī)器學(xué)習(xí)甚至可能幫你找到人生摯愛(ài)。 社會(huì)在不斷變化,學(xué)習(xí)算法也是如此。機(jī)器學(xué)習(xí)正在重塑科學(xué)、技術(shù)、商業(yè)、政治以及戰(zhàn)爭(zhēng)。衛(wèi)星、DNA(脫氧核糖核酸)測(cè)序儀以及粒子加速器以前所未有的精細(xì)程度探索自然,同時(shí),學(xué)習(xí)算法將龐大的數(shù)據(jù)轉(zhuǎn)變成新的科學(xué)知識(shí)。企業(yè)從未像現(xiàn)在這樣了解自己的用戶。在美國(guó)大選中,擁有最佳選舉模型的候選人奧巴馬最終戰(zhàn)勝了對(duì)手羅姆尼,獲得了競(jìng)選勝利。無(wú)人駕駛汽車(chē)、輪船、飛機(jī)分別在陸地、海面、空中進(jìn)行生產(chǎn)前測(cè)試。沒(méi)有人把你的喜好編入亞馬遜的推薦系統(tǒng),學(xué)習(xí)算法通過(guò)匯總你過(guò)去的購(gòu)買(mǎi)經(jīng)歷就能確定你的喜好。谷歌的無(wú)人駕駛汽車(chē)通過(guò)自學(xué),懂得如何在公路上平穩(wěn)行駛,沒(méi)有哪個(gè)工程師會(huì)編寫(xiě)算法,一步一步指導(dǎo)它該怎么走、如何從A地到達(dá)B地——這也沒(méi)必要,因?yàn)榕溆袑W(xué)習(xí)算法的汽車(chē)能通過(guò)觀察司機(jī)的操作來(lái)掌握開(kāi)車(chē)技能。 機(jī)器學(xué)習(xí)是“太陽(yáng)底下的新鮮事”:一種能夠構(gòu)建自我的技術(shù)。從遠(yuǎn)古祖先學(xué)會(huì)打磨石頭開(kāi)始,人類就一直在設(shè)計(jì)工具,無(wú)論這些工具是手工完成的,還是大批量生產(chǎn)的。學(xué)習(xí)算法本身也屬于工具,可以用它們來(lái)設(shè)計(jì)其他工具!坝(jì)算機(jī)毫無(wú)用處,”畢加索說(shuō),“它們只能給你提供答案!庇(jì)算機(jī)并沒(méi)有創(chuàng)造性,它們只能做你讓它們做的事。如果你告訴它們要做的事涉及創(chuàng)造力,那么就要用到機(jī)器學(xué)習(xí)。學(xué)習(xí)算法就像技藝精湛的工匠,它生產(chǎn)的每個(gè)產(chǎn)品都不一樣,而且專門(mén)根據(jù)顧客的需要精細(xì)定制。但是不像把石頭變成磚、把金子變成珠寶,學(xué)習(xí)算法是把數(shù)據(jù)變成算法。它們掌握的數(shù)據(jù)越多,算法也就越精準(zhǔn)。 現(xiàn)代人希望讓世界來(lái)適應(yīng)自己,而不是改變自己來(lái)適應(yīng)世界。機(jī)器學(xué)習(xí)是100 萬(wàn)年傳奇中最新的篇章:有了它,不費(fèi)吹灰之力,世界就能感知你想要的東西,并依此做出改變。就像身處魔法林,在你通過(guò)時(shí),周?chē)沫h(huán)境(今天虛擬,明天現(xiàn)實(shí))會(huì)進(jìn)行自我重組。你在樹(shù)木和灌木中選出的路線會(huì)變成一條路,迷路的地方還會(huì)出現(xiàn)指路標(biāo)志。 這些看似有魔力的技術(shù)十分有用,因?yàn)闄C(jī)器學(xué)習(xí)的核心就是預(yù)測(cè):預(yù)測(cè)我們想要什么,預(yù)測(cè)我們行為的結(jié)果,預(yù)測(cè)如何能實(shí)現(xiàn)我們的目標(biāo),預(yù)測(cè)世界將如何改變。從前,我們依賴巫醫(yī)和占卜師進(jìn)行預(yù)測(cè),但他們太不可靠;科學(xué)的預(yù)測(cè)就更值得信賴,但也僅限于我們能系統(tǒng)觀察和易于模仿的事物,大數(shù)據(jù)和機(jī)器學(xué)習(xí)卻大大超出這個(gè)范圍。我們可通過(guò)獨(dú)立的思維來(lái)預(yù)測(cè)一些常見(jiàn)的事情,包括接球和與人對(duì)話,但有些事情,即便我們很努力,也無(wú)法預(yù)測(cè)?深A(yù)測(cè)與難以預(yù)測(cè)之間的巨大鴻溝,可以交給機(jī)器學(xué)習(xí)來(lái)填補(bǔ)。 矛盾的是,盡管學(xué)習(xí)算法在自然和人類行為領(lǐng)域開(kāi)辟了新天地,但它們?nèi)曰\罩在神秘之中。媒體每天都報(bào)道涉及機(jī)器學(xué)習(xí)的新聞:蘋(píng)果公司發(fā)布Siri 個(gè)人助理,IBMa沃森(IBM的超級(jí)計(jì)算機(jī))在《危險(xiǎn)邊緣》游戲中戰(zhàn)勝了人類,塔吉特(Target)能在未成年媽媽的父母發(fā)現(xiàn)之前通知她懷孕,美國(guó)國(guó)家安全局在尋找信息連接點(diǎn)……在這些新聞事件中,學(xué)習(xí)算法如何起作用仍不得而知。計(jì)算機(jī)“吞入”數(shù)以萬(wàn)億的字節(jié),并神奇地產(chǎn)生新的觀點(diǎn),關(guān)于大數(shù)據(jù)的書(shū)籍甚至也避談“這個(gè)過(guò)程到底發(fā)生了什么”。我們一般認(rèn)為學(xué)習(xí)算法就是找到兩個(gè)事件之間的聯(lián)結(jié)點(diǎn),例如,用谷歌搜索“感冒藥”和患感冒之間的聯(lián)系。然而,尋找聯(lián)結(jié)點(diǎn)與機(jī)器學(xué)習(xí)的關(guān)系就像是磚與房子的關(guān)系,房子是由磚組成的,但一堆磚頭肯定不能稱之為“房子”。 當(dāng)一項(xiàng)新技術(shù)同機(jī)器學(xué)習(xí)一樣流行且具有革命性時(shí),不弄明白其中的奧妙實(shí)在太可惜。模棱兩可會(huì)導(dǎo)致誤差和濫用。亞馬遜的算法能斷定當(dāng)今世界人們?cè)谧x什么書(shū),這一點(diǎn)比誰(shuí)都強(qiáng)。美國(guó)國(guó)家安全局的算法能斷定你是否為潛在恐怖分子。氣候模型可以判定大氣中二氧化碳的安全水平。選股模型比我們當(dāng)中的多數(shù)人更能推動(dòng)經(jīng)濟(jì)發(fā)展。你無(wú)法控制自己理解不了的東西,這也是追求幸福的公民、專家或普通人需要了解機(jī)器學(xué)習(xí)的原因。 本書(shū)的第一個(gè)目標(biāo)就是揭示機(jī)器學(xué)習(xí)的秘密。只有工程師和機(jī)修工有必要知道汽車(chē)發(fā)動(dòng)機(jī)如何運(yùn)作,但每位司機(jī)都必須明白轉(zhuǎn)動(dòng)方向盤(pán)會(huì)改變汽車(chē)的方向、踩剎車(chē)會(huì)讓車(chē)停下。當(dāng)今極少有人知道學(xué)習(xí)算法對(duì)應(yīng)的原理是什么,更不用說(shuō)如何使用學(xué)習(xí)算法。心理學(xué)家丹·諾曼(Don Norman)創(chuàng)造了“概念模型”(conceptual model)這個(gè)新詞,代指為了有效利用某項(xiàng)技術(shù)而需粗略掌握的知識(shí)。本書(shū)就將介紹機(jī)器學(xué)習(xí)的概念模型。 并不是所有算法的工作原理都相同,這些差異會(huì)產(chǎn)生不同的結(jié)果,比如亞馬遜和網(wǎng)飛的推薦系統(tǒng)。假設(shè)這兩個(gè)系統(tǒng)試著根據(jù)“你喜歡的東西”來(lái)對(duì)你進(jìn)行引導(dǎo),亞馬遜很有可能會(huì)把你帶到你之前常瀏覽的書(shū)籍類別,網(wǎng)飛則可能會(huì)把你帶到你不熟悉且似乎有點(diǎn)奇怪的區(qū)域,并引導(dǎo)你愛(ài)上那里。在本書(shū)當(dāng)中,我們會(huì)看到諸如亞馬遜、網(wǎng)飛之類的公司使用的各式各樣的算法。與亞馬遜相比,網(wǎng)飛公司的算法對(duì)你的愛(ài)好理解得更深(盡管還是很有限),然而具有諷刺意味的是,這并非意味著亞馬遜也應(yīng)該利用這個(gè)算法。網(wǎng)飛的商業(yè)模式是依靠晦澀的電影、電視節(jié)目的長(zhǎng)尾效應(yīng)來(lái)推動(dòng)需求,這些電影和節(jié)目的成本很低。它一般不推薦大片,因?yàn)槟愕臅?huì)員訂閱費(fèi)可能有限。亞馬遜則沒(méi)有這樣的問(wèn)題:盡管擅長(zhǎng)利用長(zhǎng)尾效應(yīng),但它同樣樂(lè)意把更昂貴的熱銷商品賣(mài)給你,這也會(huì)簡(jiǎn)化其物流工作。對(duì)于那些奇怪的產(chǎn)品,如果是訂閱會(huì)員可免費(fèi)享用的,我們可能會(huì)樂(lè)意去嘗試,而如果需要另外掏錢(qián),我們?nèi)ミx擇它們的可能性就小得多。 每年都會(huì)出現(xiàn)上百種新的算法,但它們都是基于幾個(gè)相似的基本思路。為了明白機(jī)器學(xué)習(xí)如何改變世界,你有必要理解這些思路。本書(shū)就將對(duì)此進(jìn)行介紹。學(xué)習(xí)算法并不是那么深?yuàn)W難懂,除了運(yùn)用在計(jì)算機(jī)上,對(duì)于我們來(lái)說(shuō)很重要的問(wèn)題都可以通過(guò)學(xué)習(xí)算法找到答案,比如:我們?nèi)绾螌W(xué)習(xí)?有沒(méi)有更好的方法?我們能預(yù)測(cè)什么?我們能信任所學(xué)的知識(shí)嗎?對(duì)這些問(wèn)題,機(jī)器學(xué)習(xí)的各個(gè)學(xué)派有不同的答案。 機(jī)器學(xué)習(xí)主要有5 個(gè)學(xué)派,我們會(huì)對(duì)每個(gè)學(xué)派分別介紹:符號(hào)學(xué)派將學(xué)習(xí)看作逆向演繹,并從哲學(xué)、心理學(xué)、邏輯學(xué)中尋求洞見(jiàn);聯(lián)結(jié)學(xué)派對(duì)大腦進(jìn)行逆向分析,靈感來(lái)源于神經(jīng)科學(xué)和物理學(xué);進(jìn)化學(xué)派在計(jì)算機(jī)上模擬進(jìn)化,并利用遺傳學(xué)和進(jìn)化生物學(xué)知識(shí);貝葉斯學(xué)派認(rèn)為學(xué)習(xí)是一種概率推理形式,理論根基在于統(tǒng)計(jì)學(xué);類推學(xué)派通過(guò)對(duì)相似性判斷的外推來(lái)進(jìn)行學(xué)習(xí),并受心理學(xué)和數(shù)學(xué)最優(yōu)化的影響。在構(gòu)建機(jī)器學(xué)習(xí)的目標(biāo)推動(dòng)下,我們將回顧過(guò)去100 年的思想史,并以新的觀點(diǎn)來(lái)看待這段歷史。 機(jī)器學(xué)習(xí)的5 個(gè)學(xué)派都有自己的主算法,利用這種萬(wàn)能學(xué)習(xí)算法,原則上,你可以通過(guò)任何領(lǐng)域的數(shù)據(jù)來(lái)挖掘知識(shí):符號(hào)學(xué)派的主算法是逆向演繹,聯(lián)結(jié)學(xué)派的主算法是反向傳播,進(jìn)化學(xué)派的主算法是遺傳編程,貝葉斯學(xué)派的主算法是貝葉斯推理,類推學(xué)派的主算法是支持向量機(jī)。在實(shí)踐中,這些算法可能在有些工作中可用,而在其他工作中不可用。我們真正想要尋找的是能夠綜合這5 種算法的終極算法。雖然有些人認(rèn)為這難以實(shí)現(xiàn),但對(duì)機(jī)器學(xué)習(xí)領(lǐng)域的人來(lái)說(shuō),這個(gè)夢(mèng)想賦予我們力量,促使我們夜以繼日地工作。 如果存在終極算法,那么它可以通過(guò)數(shù)據(jù)學(xué)得包括過(guò)去的、現(xiàn)在的以及未來(lái)的所有知識(shí)。創(chuàng)造終極算法將是科學(xué)歷史上最偉大的進(jìn)步之一。它可以加速各類知識(shí)的進(jìn)步,并以我們現(xiàn)在甚至無(wú)法想象的方式改變世界。終極算法與機(jī)器學(xué)習(xí)的關(guān)系就像標(biāo)準(zhǔn)模型和粒子物理學(xué)或中心法則與分子生物學(xué)的關(guān)系:該統(tǒng)一原理能理解人類當(dāng)今知道的一切,并為未來(lái)數(shù)十年或者數(shù)百年的進(jìn)步奠定基礎(chǔ)。今天我們面臨許多難題,比如制造家用機(jī)器人和治愈癌癥,終極算法就是解決這些難題的關(guān)鍵。 以癌癥為例。治愈癌癥十分困難,因?yàn)樗且环N綜合疾病。腫瘤可由各種原因誘發(fā),且在轉(zhuǎn)移時(shí)會(huì)發(fā)生突變。殺死腫瘤細(xì)胞最可靠的方法是對(duì)其基因進(jìn)行排序,弄明白哪些藥物可以抵抗癌細(xì)胞(這種方法不會(huì)對(duì)人造成傷害,患者必須提供基因和用藥史),甚至為你專門(mén)研制一種新藥。沒(méi)有哪個(gè)醫(yī)生能夠掌握該過(guò)程所需的所有知識(shí)。對(duì)于機(jī)器學(xué)習(xí)來(lái)說(shuō),這卻是再合適不過(guò)的任務(wù)。實(shí)際上,與亞馬遜和網(wǎng)飛每天所做的搜索工作相比,它的工作是為你找到正確的療法,而不是合適的書(shū)籍或者電影,而且它的工作更為復(fù)雜,也更具挑戰(zhàn)。遺憾的是,雖然當(dāng)今的學(xué)習(xí)算法能以超出人類水平的精確度來(lái)診斷疾病,但治愈癌癥仍遠(yuǎn)遠(yuǎn)超出它們的理解范圍。如果我們可以找到終極算法,這將不再是難題。 因此,本書(shū)的第二個(gè)目標(biāo)就是幫你創(chuàng)造終極算法。你可能會(huì)認(rèn)為這需要高深的數(shù)學(xué)運(yùn)算和嚴(yán)謹(jǐn)?shù)睦碚摲矫娴墓ぷ鳎喾,它需要暫時(shí)放下數(shù)學(xué)奧秘,來(lái)觀看各種學(xué)習(xí)行為包羅萬(wàn)象的模型。對(duì)外行人來(lái)說(shuō),他們就像從遠(yuǎn)方趕到終極算法這片森林,從某些角度看,他們比專家更適合創(chuàng)造終極算法,因?yàn)閷<覍?duì)某些學(xué)科已經(jīng)過(guò)于投入。一旦我們有了概念性的解決方法,就能補(bǔ)充數(shù)學(xué)上的細(xì)節(jié),但這不是本書(shū)的目標(biāo)和重點(diǎn)。我們之所以談?wù)撁總(gè)學(xué)派,是為了收集它們的觀點(diǎn),并找到其適用之處。請(qǐng)記住,沒(méi)有哪個(gè)盲人能了解整頭大象。我們會(huì)尤其關(guān)注哪個(gè)學(xué)派能對(duì)治療癌癥做出貢獻(xiàn),也關(guān)注該學(xué)派的缺失。然后,我們會(huì)將所有觀點(diǎn)集中,一步步地變成解決方案——這個(gè)解決方案可能還不是終極算法,但已是我們能找到的最接近終極算法的方案。希望它能解放你的大腦,讓你大膽想象。當(dāng)你閱讀本書(shū)時(shí),如果覺(jué)得某些章節(jié)讀起來(lái)困難,可以隨意略讀甚至跳過(guò)它們。本書(shū)的概要才是重中之重,當(dāng)明白所有學(xué)派的觀點(diǎn)之后,如果你重讀那些困難的章節(jié),收獲可能會(huì)比之前更多。 我研究機(jī)器學(xué)習(xí)已經(jīng)有20 余年了。我對(duì)機(jī)器學(xué)習(xí)的興趣因一本書(shū)而起,大四時(shí)我在書(shū)店看到這本書(shū)名很奇怪的書(shū)——《人工智能》(Artificial Intelligence)。那本書(shū)只有一個(gè)章節(jié)是關(guān)于機(jī)器學(xué)習(xí)的,但讀那個(gè)章節(jié)時(shí),我立即確定,學(xué)習(xí)是實(shí)現(xiàn)人工智能的關(guān)鍵,而且當(dāng)時(shí)技術(shù)水平如此原始,我也許能做點(diǎn)什么。所以我擱置了讀MBA(工商管理碩士)的計(jì)劃,到加利福尼亞歐文分校攻讀博士。機(jī)器學(xué)習(xí)當(dāng)時(shí)是一個(gè)小眾且鮮為人知的領(lǐng)域,研究人員寥寥無(wú)幾,但加利福尼亞大學(xué)卻擁有一個(gè)巨大的研究團(tuán)隊(duì)。一些同學(xué)中途放棄了,因?yàn)樗麄兛床坏綑C(jī)器學(xué)習(xí)的未來(lái),而我堅(jiān)持了下來(lái)。對(duì)我來(lái)說(shuō),沒(méi)有什么能比教計(jì)算機(jī)學(xué)習(xí)更有吸引力的了:如果我們做到這一點(diǎn),其他問(wèn)題就會(huì)迎刃而解。5 年后我畢業(yè)了,那時(shí)數(shù)據(jù)挖掘技術(shù)十分流行,我開(kāi)始寫(xiě)這本書(shū)。我的博士論文結(jié)合了符號(hào)學(xué)派和類推學(xué)派的觀點(diǎn)。過(guò)去10 年,我一直在整合符號(hào)學(xué)派和貝葉斯學(xué)派的觀點(diǎn),最近又在嘗試整合它們與聯(lián)結(jié)學(xué)派的觀點(diǎn)。是時(shí)候進(jìn)行下一步研究,并嘗試綜合這5 個(gè)范式了。 寫(xiě)這本書(shū)時(shí),我的腦海里浮現(xiàn)出各式各樣但又有相似之處的讀者。 圍繞大數(shù)據(jù)以及機(jī)器學(xué)習(xí)的討論充滿爭(zhēng)議,如果你對(duì)此感到好奇,且懷疑有比論文上看到的更為深層次的東西,那么這本書(shū)就是你進(jìn)行革命的指南。 如果你的主要興趣是機(jī)器學(xué)習(xí)的商業(yè)用途,那么本書(shū)至少能通過(guò)6 種方法幫助你:成為分析學(xué)中更精明的消費(fèi)者;充分利用你的數(shù)據(jù)專家;減少許多數(shù)據(jù)挖掘項(xiàng)目的隱患;看看如果不買(mǎi)手寫(xiě)編碼軟件,你能讓什么進(jìn)行自動(dòng)操作;降低信息系統(tǒng)的僵硬度;期待正朝你走來(lái)的新技術(shù)。我見(jiàn)過(guò)太多浪費(fèi)大量時(shí)間和金錢(qián)去解決難題的人,他們使用了錯(cuò)誤的學(xué)習(xí)算法,或者誤解了學(xué)習(xí)算法的含義。要避免這些慘敗,實(shí)際上,你只需要閱讀這本書(shū)。 如果你是普通人或者決策者,關(guān)注由大數(shù)據(jù)和機(jī)器學(xué)習(xí)引發(fā)的社會(huì)和政治問(wèn)題,那么本書(shū)將為你提供該技術(shù)的入門(mén)知識(shí):什么是機(jī)器學(xué)習(xí),機(jī)器學(xué)習(xí)能干什么、不能干什么。本書(shū)沒(méi)有讓你覺(jué)得乏味的復(fù)雜細(xì)節(jié)。從隱私問(wèn)題到未來(lái)的工作,以及機(jī)器人化引起戰(zhàn)爭(zhēng)的道德觀,我們會(huì)看到真正的問(wèn)題所在,以及如何正確思考。 如果你是科學(xué)家或者工程師,那么機(jī)器學(xué)習(xí)肯定是你不想錯(cuò)過(guò)的有力武器。在大數(shù)據(jù)時(shí)代(即便是中型數(shù)據(jù)時(shí)代),陳舊的、靠得住的統(tǒng)計(jì)工具并不會(huì)讓你走得更遠(yuǎn)。你需要的是機(jī)器學(xué)習(xí)的非線性技術(shù)來(lái)精確模仿多種現(xiàn)象,它會(huì)帶來(lái)全新的、科學(xué)的世界觀。今天,“范式轉(zhuǎn)移”被人們用得過(guò)于隨意,但我可以毫不夸張地說(shuō),本書(shū)要講的內(nèi)容就是和“范式轉(zhuǎn)移”相關(guān)。 如果你是機(jī)器學(xué)習(xí)專家,那么你可能對(duì)本書(shū)的大部分內(nèi)容已經(jīng)相當(dāng)熟悉,但你仍會(huì)發(fā)現(xiàn)其中有許多新穎的看法、經(jīng)典的觀點(diǎn),以及有用的例子和類比。很大程度上,我希望本書(shū)能提出與機(jī)器學(xué)習(xí)相關(guān)的、新的看法,甚至能讓你開(kāi)始思考新的方向。我們身邊到處是容易達(dá)成的目標(biāo),我們理應(yīng)追尋這種目標(biāo),但我們也不應(yīng)忽略不遠(yuǎn)處就有更大的目標(biāo)(關(guān)于這一點(diǎn),我希望你們能原諒我詩(shī)意地用“終極算法”來(lái)指通用型學(xué)習(xí)算法)。 如果你是學(xué)生,無(wú)論你多大,是考慮該選什么專業(yè)的高中生,還是決定該研究什么領(lǐng)域的本科生,或者是考慮轉(zhuǎn)行、經(jīng)驗(yàn)豐富的專家,我希望本書(shū)能讓你對(duì)這個(gè)令人著迷的領(lǐng)域感興趣。當(dāng)今世界極度缺乏機(jī)器學(xué)習(xí)專家,如果你決定加入這一行列,你不僅能得到令人激動(dòng)的時(shí)刻和豐厚的物質(zhì)回報(bào),還有服務(wù)社會(huì)的大好機(jī)會(huì)。如果你已經(jīng)在研究并學(xué)習(xí)主算法,我希望本書(shū)能幫你了解它的歷史。如果你在旅途中偶然發(fā)現(xiàn)本書(shū),也值得你用心閱讀。 最后要強(qiáng)調(diào)一點(diǎn),如果你渴望奇跡,那么機(jī)器學(xué)習(xí)對(duì)你來(lái)說(shuō)就是一場(chǎng)精神盛宴。我誠(chéng)摯地邀請(qǐng)你一同前往。 佩德羅·多明戈斯(Pedro Domingos),美國(guó)華盛頓大學(xué)計(jì)算機(jī)科學(xué)教授,加州大學(xué)歐文分校信息與計(jì)算機(jī)科學(xué)博士,在機(jī)器學(xué)習(xí)與數(shù)據(jù)挖掘方面著有200多部專業(yè)著作和數(shù)百篇論文。國(guó)際機(jī)器學(xué)習(xí)學(xué)會(huì)聯(lián)合創(chuàng)始人,《機(jī)器學(xué)習(xí)》雜志編委會(huì)成員,JAIR前副主編。美國(guó)人工智能協(xié)會(huì)院士(AAAI Fellow,國(guó)際人工智能界的*高榮譽(yù)),榮獲SIGKDD創(chuàng)新大獎(jiǎng)(數(shù)據(jù)科學(xué)領(lǐng)域的*高獎(jiǎng)項(xiàng))、斯隆獎(jiǎng)(Sloan Fellowship)、美國(guó)國(guó)家科學(xué)基金會(huì)成就獎(jiǎng)(NSF CAREER Award)、富布賴特獎(jiǎng)學(xué)金、IBM學(xué)院獎(jiǎng)以及多個(gè)頂ji論文獎(jiǎng)項(xiàng)。 推薦序 序 第一章 機(jī)器學(xué)習(xí)革命 學(xué)習(xí)算法入門(mén) 為何商業(yè)擁護(hù)機(jī)器學(xué)習(xí) 給科學(xué)方法增壓 10 億個(gè)比爾·克林頓 學(xué)習(xí)算法與國(guó)家安全 我們將走向何方 第二章 終極算法 來(lái)自神經(jīng)科學(xué)的論證 來(lái)自進(jìn)化論的論證 來(lái)自物理學(xué)的論證 來(lái)自統(tǒng)計(jì)學(xué)的論證 來(lái)自計(jì)算機(jī)科學(xué)的論證 機(jī)器學(xué)習(xí)算法與知識(shí)工程師 天鵝咬了機(jī)器人 終極算法是狐貍,還是刺猬 我們正面臨什么危機(jī) 新的萬(wàn)有理論 未達(dá)標(biāo)準(zhǔn)的終極算法候選項(xiàng) 機(jī)器學(xué)習(xí)的五大學(xué)派 第三章 符號(hào)學(xué)派:休謨的歸納問(wèn)題 約不約 “天下沒(méi)有免費(fèi)的午餐”定理 對(duì)知識(shí)泵進(jìn)行預(yù)設(shè) 如何征服世界 在無(wú)知與幻覺(jué)之間 你能信任的準(zhǔn)確度 歸納是逆向的演繹 掌握治愈癌癥的方法 20 問(wèn)游戲 符號(hào)學(xué)派 第四章 聯(lián)結(jié)學(xué)派:大腦如何學(xué)習(xí) 感知器的興盛與衰亡 物理學(xué)家用玻璃制作大腦 世界上最重要的曲線 攀登超空間里的高峰 感知器的復(fù)仇 一個(gè)完整的細(xì)胞模型 大腦的更深處 第五章 進(jìn)化學(xué)派:自然的學(xué)習(xí)算法 達(dá)爾文的算法 探索:利用困境 程序的適者生存法則 性有何用 先天與后天 誰(shuí)學(xué)得最快,誰(shuí)就會(huì)贏 第六章 貝葉斯學(xué)派:在貝葉斯教堂里 統(tǒng)治世界的定理 所有模型都是錯(cuò)的,但有些卻有用 從《尤金·奧涅金》到Siri 所有東西都有關(guān)聯(lián),但不是直接關(guān)聯(lián) 推理問(wèn)題 掌握貝葉斯學(xué)派的方法 馬爾可夫權(quán)衡證據(jù) 邏輯與概率:一對(duì)不幸的組合 第七章 類推學(xué)派:像什么就是什么 完美另一半 維數(shù)災(zāi)難 空中蛇災(zāi) 爬上梯子 起床啦 第八章 無(wú)師自通 物以類聚,人以群分 發(fā)現(xiàn)數(shù)據(jù)的形狀 擁護(hù)享樂(lè)主義的機(jī)器人 熟能生巧 學(xué)會(huì)關(guān)聯(lián) 第九章 解開(kāi)迷惑 萬(wàn)里挑一 終極算法之城 馬爾科夫邏輯網(wǎng)絡(luò) 從休謨到你的家用機(jī)器人 行星尺度機(jī)器學(xué)習(xí) 醫(yī)生馬上來(lái)看你 第十章 建立在機(jī)器學(xué)習(xí)之上的世界 性、謊言和機(jī)器學(xué)習(xí) 數(shù)碼鏡子 充滿模型的社會(huì) 分享與否?方式、地點(diǎn)如何? 神經(jīng)網(wǎng)絡(luò)搶了我的工作 戰(zhàn)爭(zhēng)不屬于人類 谷歌+終極算法=天網(wǎng)? 進(jìn)化的第二部分 后 記 致 謝 延伸閱讀
你還可能感興趣
我要評(píng)論
|