【推薦序】 大演算顛覆世界,也顛覆我的看法
──前臺灣微軟合作夥伴技術支援顧問 林泰宏
1997年,IBM的深藍電腦擊敗了世界西洋棋冠軍,震撼了整個業界。媒體大肆報導。伴隨而來的是另一股恐慌性的思維──電腦會不會有一天取代人腦,甚至統治了人類?20年過去了,我們都還在為生活而忙碌工作。別說電腦統治人類,它連讓我早一點下班都很勉強了。
2016年,Google Alphago擊敗了世界圍棋冠軍,用的不再是超級電腦的運算能力。取而代之的,是大數據的分析能力、雲端的運算能力和機器學習。機器學習是一個廣泛的名詞,意思是讓電腦透過樣本數據來回答問題或進行預測。也許大家從前幾年開始就不斷聽到大數據,而近期從微軟語音助理Cortana進行世界盃足球的賽事預測,到美國總統大選分析,或是透過相片猜測年齡/顏值,這些都是機器學習的產物。
提到演算法,我想對於資訊相關背景的人來說都不陌生。事實上,我們現在身處的世界,到處都可以看到演算法的身影。舉凡搜尋、電子地圖上的路線、推薦系統等,無一不是透過演算法來達成。如同本書作者所說,大演算終將顛覆我們的世界,在閱讀完本書之後,我覺得這本書則是顛覆我對演算法的看法。
過去在學習演算法的時候,它對我而言,是離散數學。而大演算卻能夠把它描繪得如此生動。例如井字遊戲(Tic-Tac-Toe)使用的極大極小搜尋(Minimax Algorithm),作者卻以另一種形式來描述:
如果你或你的對手,一排已經占有兩個格子,在接續的棋步中,只要下在剩餘的另一個空格上,便可贏得這盤井字遊戲。
否則如果有一個棋步,可以創造出兩行連成兩條連線的雙頭蛇優勢,那麼下在那裡。
否則如果井字中心還是空的,那麼就下在那裡。
否則如果你的對手已經下在一個角位,那麼就下在他相反的角位。
否則如果有一個空的角位,那麼就下在那裡。
否則就下在任何一個空格裡。
當然,本書也不只針對從未接觸過演算法及機器學習的讀者。所謂外行的看熱鬧,內行的看門道。針對相關行業背景的讀者。本書也提供了機器學習所用到的大部分演算法的詳細說明,例如:決策樹、最近鄰居演算法、簡單貝氏演算法等。相信不管是對這個領域充滿好奇,或是想要深入了解的,都能從中獲得幫助。
【推薦序】 想跟上資訊革命時代的多變世界,本書是你的敲門磚
——美商凱博數據創辦人/總經理 張宗堯
自從Google的深度學習人工智慧系統AlphaGo四度打敗世界圍棋冠軍李世乭後,一夕間全球新創公司、科研機構、科技業巨頭都紛紛宣告,將在人工智慧領域投入更大量的人力與金錢,現在全世界都關切:「機器取代了勞力後,竟然也能思考、學習,那接下來還能做什麼?」顯然這股席捲全球的人工智慧熱潮正撲天蓋地而來。
事實上,人工智慧早就不是新課題,問世以來少說有60年歷史,只是這門學科近期火熱,除了受惠這場話題十足的圍城之戰,主要還是歸因行動網路、物聯網、大數據、雲端,以及GPU運算等核心關鍵技術的重大突破,人工智慧得以從in vitro (體外)階段,進入in vivo (體內)階段。人工智慧因而跨出研究中心,充分展現在生活中, 也讓令人切實感受人類正邁向下一個新時代。
如今導入人工智慧的機器,已經能夠精準地模仿出截然不同的繪畫風格、音樂曲調,這全有賴日益精進的演算法,機器可以從海量數據中,分析出各種迥異的風格,甚至還能進行預測。現階段,全世界所有硬體都面臨著「被智慧化」,而人類對於智慧化的終極追求無非為了更好的生活品質。
機器學習的演算法大致上可以分成五個理論學派,本書以深入淺出的文字分別細數之,這些學派各有優缺點,對於某些狀況處理得宜,但面對其他事情卻可能很糟,有沒有一種「終極的演算法」,可以集結各門各派的優點,從海量的數據資料中,整合出世界上所有關乎過去、現在和未來的知識,這種大演算法無疑是科學史上最偉大的進步之一,它不但會全面加速機器學習的進展,並且以我們幾乎無法想像的方式改變世界。
我從與企業接觸的經驗中觀察到一個現象:傳統企業營運思維下,要完成一份專案,通常是先設定目標與明確預期投資回報率(ROI),然後才一步步地往目標前進;然而在演算法的時代裡,專案執行前,須先經過統計思維,將所有資料進行演算、分析,在沒有得到分析結果前,這個專案是絕對無法準確估計的,這與企業現行評估計畫、資源分配的方式有顯著差異。
這種差異也正是我想推薦這本書的理由,許多企業不乏可以解決數據問題的優秀員工,然而他們的主管卻極少有數據思維,這種落差會導致企業營運出現斷層,在全球產業競爭激烈的環境下,著實是個危機。
機器替代藍領的工業革命時代過去了,在這資訊革命的時代,下一個會被取代的是白領階級,速度甚至會比想像中來得快,人類能掌握的聖杯,就是不斷適應新的時代,跟上世界的腳步,而我相信這本書會是幫助你快速適應這個多變世界的敲門磚。
【推薦序】 從5萬呎的高空鳥瞰機器學習,望見未來
──資策會技術長/大數據所所長 陳明義
探討機器學習領域,這是一本非常獨特的書,任何對機器學習有興趣的人,不論你是專家或門外漢都值得一讀。
佩德羅.多明戈斯以他豐富的學識,從5萬呎的高空鳥瞰機器學習領域的現況,展望機器學習的未來以及它對人類社會各個層面將帶來的衝擊。
他以簡單易懂的言語介紹了機器學習的五個學派,各學派演算法的精髓、理論基礎及發展的歷史,並點出其優缺點。他以專家的洞悉和豐富的想像力勾勒出機器學習終極演算法的概貌,以及這種具有自我學習的演算法對人類社會所將造成的巨變。
書中文采奕奕,作者的博學多聞以及他對機器學習的熱忱躍然紙上。不論你是否贊同他對未來世界的預言,他的論述和哲理都將引人深思。
【推薦序】 大演算,是飽覽大數據與機器學習的最佳指南
──成大資工系特聘教授兼系主任 謝孫源
你是否注意到當你在瀏覽網頁時,旁邊總是會出現一些你有興趣商品的廣告?你是否曾經好奇臉書(Facebook)為什麼總是會出現你才剛查詢過商品的廣告?因為這些都是根據你瀏覽網頁的搜尋習慣,分析而得到的結果,進而將你有興趣的商品推薦給你。其實,這些都是機器學習的成果。在這個資訊爆炸的時代,機器學習早已經悄悄進入到我們的日常生活,只是我們都沒有注意到這個變化。
你也許聽說過大數據(big data),也曾經從新聞中聽聞政府、產業界、學術界討論大數據相關的政策,然而大數據究竟是什麼?對我們生活又有什麼影響呢?其實,大數據和我們的日常生活息息相關,例如:我們幾乎每天都會使用的電話和電子郵件,根據美國國家安全局的統計,世界各地每天都有超過十億通的電話,電子郵件的數量就更可觀了。然而,美國國家安全局要如何在這龐大的電話及電子郵件中,過濾出恐怖分子的通訊呢?而如何從大數據資料中,去獲取我們所需要的資訊,是科學家、工程師一直在努力的課題,這也是機器學習很重要的一環。
《大演算》這本書的核心假設是:「透過一個單一、通用的機器學習演算法,可以從數據資料中,推論得出過去、現在和未來的所有知識。」這個假設類似於牛頓的萬有引力概念,作者大膽稱之為「大演算」(The Master Algorithm)!作者介紹了現今機器學習的五大學派,各學派都有其主要的機器學習演算法,有各自的優點,當然也會有其盲點存在。因此,到目前為止,仍然沒有一個可以一統江湖的機器學習演算法。作者期望在未來的一天,會有「大演算」的出現!
作者介紹機器學習五大學派的主要演算法,沒有艱深的數學式子推導,而是透過最簡單、最熟悉的日常生活例子來介紹,讓讀者可以更容易了解各個演算法的意涵和精髓,也可以了解到機器學習這塊領域目前發展的現況。對於一個好奇大數據和機器學習的讀者,這本書可以幫助你了解大數據和機器學習所帶來的變化;對於想要進入機器學習領域的讀者,這本書可以提供一個基礎的概念,引領你進入機器學習領域;而對於已經在機器學習領域努力的讀者,更是不能錯過這本書,讓你可以深入了解不同學派之間的異同。不論你的專長領域是什麼,相信這本書將是幫助你飽覽大數據與機器學習的最佳指南。
【推薦序】 機器學習讓我們站在巨量資料的肩膀上,看得更高更遠
──臺大資工系系主任 趙坤茂
2016年6月的最後一堂計算機概論課,我問:「十年後,你是否會和某機器人成為知己?」大約三分之一的同學回答可能會,認為人工智慧進展神速,或許會出現很貼心的機器人,比誰都了解你,甚至比你自己更了解你。另外有大約三分之二的同學回答不會,畢竟機器人只是協助人類的工具,它所說的每一句話都是「算」出來的,在情感上無法真正交心。
無論如何,未來機器人允文允武已是公認事實,其背後推動力來自於機器學習的革新、運算資源的躍進及巨量資料的累積,使得機器人能夠深度學習,不僅可以無日無夜學習,還可本尊分身一起學習,讓人類望塵莫及。
現在,就讓本書為你揭開機器學習的神祕面紗。對於有志了解機器學習的讀者,這是一本極佳的入門書籍。作者佩德羅.多明戈斯以生動活潑的專業論述,深入淺出地介紹了機器學習的五大學派:符號理論學派(Symbolists)、類神經網路學派(Connectionists)、演化論學派(Evolutionaries)、貝氏定理學派(Bayesians)、類比推理學派(Analogizers),讓讀者能理解機器學習的關鍵原理,並對現況有所掌握。
多明戈斯也呼籲開發一個結合五大學派重要特點的單一演算法,稱之為終極演算法(the ultimate master algorithm),該方法可以從數據資料中,習得這個世界上過去、現在和未來的所有知識。
我們不禁要問:終極演算法是否存在呢?如果存在的話,它必須像金庸小說《笑傲江湖》中的吸星大法,可以將別人的內力化為自己的內力;但它又不能像2016年3月微軟推出的聊天機器人Tay那樣消化不良,在網友的調教下,居然頻頻說出種族歧視的跳針發言。我個人對終極演算法是否存在抱持著比較保守的看法,追尋聖杯的結局,很可能如同《功夫熊貓》電影一般,到最後才發現最高的武功秘笈竟是一部無字天書。
不管終極演算法是否存在,機器學習已讓我們站在巨量資料的肩膀上,看得更高更遠。各位朋友,請接受多明戈斯的邀約,參加這場機器學習的知性饗宴!
【推薦序】 大演算強化「工業3.5」,讓臺灣在物聯網時代中卡位
──清華講座教授暨清華-台積電卓越製造中心主持人 簡禎富
隨著電子商務、物聯網、「工業 4.0」、機械人和聰明生產等典範移轉,全球經濟發展和產業價值鏈將革命性重構,也由於網路社群、人工智慧、大數據、機器學習和最佳化等技術創新和日益廣泛的應用,正在改變世界,人類生活和社會各個層面有翻天覆地的變化。
本書作者佩德羅.多明戈斯(Pedro Domingos)現任華盛頓大學電腦工程系教授,認為透過「大演算」(Master Algorithm)作為解析機器學習的概念模型,可以從數據資料中分析推論得出所有知識,並以清晰易懂和引人入勝的方式介紹機器學習(machine learning)及其五大學派,並有系統地介紹每一學派主要的演算法和相關的應用。
其中,有不少與我在美國威斯康辛大學麥迪遜分校(UW-Madison)攻讀決策科學與作業研究博士時,參與「綜合醫療促進支援系統」(CHESS)計畫的資料挖礦研究,乃至於領導清華大學「決策分析研究室」(DALab)研究夥伴們投入決策分析、大數據和最佳化的產學合作研究經驗相關,發現本書能夠讓讀者很容易地明白機器學習的運作原理和應用,值得推薦。
隨著軟硬體計算能力和雲網端的發展,還有處理結構化和非結構化的大數據分析能力,這些進步讓大數據和機器學習應用的趨勢已經由量化到質化的分析。各國產業結構和社會文化迥異下,所需發展的大數據產業和應用也不盡相同。臺灣長期以大量生產、規模經濟的製造模式,在「工業4.0」、物聯網和客製化時代需要轉型,而世界各國都普遍面臨因為自動化和機械人而加劇的貧富差距和年輕人就業供需不等問題。
相對於工業先進國家的製造戰略,臺灣應善用目前在「工業3.0」的供應鏈管理、整合能力和彈性應變的優勢,發展「工業3.0―工業3.5―工業4.0」的策略藍圖,利用本書介紹的「大演算」等相關技術,將既有的核心管理能力系統化、數位化,發展以大數據分析、智慧製造系統和聰明生產為核心的「工業3.5」作為現有「工業3.0」和未來「工業4.0」之間的混合策略,利用臺灣製造相對競爭優勢、供應鏈系統彈性和客製化能力,透過產品生命週期管理和大量客製化彈性以更快更聰明地滿足消費者需求,使臺灣能在被先進國家和紅色供應鏈上下夾擊之前,用「工業3.5」的破壞性創新先在物聯網時代的全球供應鏈中卡位,避免未來先進國家挾著「工業4.0」的先進系統鯨吞整個製造價值鏈。