AlphaGo Zero

2017年10月21日聯合報民意論壇

從零開始的新AlphaGo

【趙坤茂／台灣大學資訊工程系教授（台北市）】 2017-10-21 03:59

當圍棋程式AlphaGo擊敗人類棋王後，舉世能打敗AlphaGo的，大概就只有AlphaGo的變種了。

由席佛（Silver）博士領銜開發、黃士傑博士共同參與的AlphaGo Zero，從隨機對奕開始，藉由強化學習模式累積功力，僅三天棋力即超越去年打敗李世乭的AlphaGo，廿一天超越打敗柯潔的AlphaGo Master，其後棋力仍持續增進中，令人嘆為觀止。

如AlphaGo Zero的Zero所示，它完全不靠棋譜，可說是「零先備知識」。在自主學習過程中，它不僅找到人類已有的定石，還開發出新型態的定石。在布局、手筋、死活、劫爭、收官、先手等技巧上，進展得非常快，十足天才超人的氣勢。倒是初學者很快就能步步打吃的征子，它直在訓練的後期才領悟，這也反映了AlphaGo Zero的學習模式及歷程，與人類不盡相同。

AlphaGo Zero不靠人類知識就能主宰圍棋世界，可說已經到了掌握《功夫熊貓》電影裡，那神龍秘笈存乎於心而留白之境界，見招拆招，無所本，亦無無所本啊。

AlphaGo Zero所用的運算資源，遠比AlphaGo少，而且不靠棋譜餵養，卻能表現得如此出色，見證了深度學習領域除了運算資源及大數據外，演算法扮演著更關鍵的角色，值得想深度學習「深度學習」的學者專家省思。

當然，這些演算法不全是該團隊所獨創，主要還是人類智慧的結晶，例如有些棋步搜尋樹的建構及評估概念，我在卅年前修人工智慧時就已讀到雛形了。

這學期，我開授一門「前瞻資訊科技」課程，邀請系內同仁共授，希望能全方位拓展學生的專業視野。當我邀請人工智慧及機器學習的翹楚林智仁教授時，人在海外的他慨然應允，並提到基礎理論的重要性，因此將講題訂為「數學與資訊」，希望同學能明瞭線性代數與深度學習、資料科學的重要關聯，從中領悟到如果能打穩理論基礎，未來在專業領域裡才能深度發展。

AlphaGo Zero樹立了深度學習新的里程碑，在叫好之餘，我們也要知道其所解決的電腦對局問題，在人工智慧領域只是有限的一環。我相信它那「零先備知識」的演算技能，未來必將在這片浩瀚無盡的人工智慧疆土上，展現無與倫比的絕妙光環，且讓我們拭目以待吧！

【2017/10/21 聯合報】