2017年10月21日 聯合報民意論壇

從零開始的新AlphaGo

【趙坤茂/台灣大學資訊工程系教授(台北市)】    2017-10-21 03:59

當圍棋程式AlphaGo擊敗人類棋王後,舉世能打敗AlphaGo的,大概就只有AlphaGo的變種了。

由席佛(Silver)博士領銜開發、黃士傑博士共同參與的AlphaGo Zero,從隨機對奕開始,藉由強化學習模式累積功力,僅三天棋力即超越去年打敗李世乭的AlphaGo,廿一天超越打敗柯潔的AlphaGo Master,其後棋力仍持續增進中,令人嘆為觀止。

如AlphaGo Zero的Zero所示,它完全不靠棋譜,可說是「零先備知識」。在自主學習過程中,它不僅找到人類已有的定石,還開發出新型態的定石。在布局、手筋、死活、劫爭、收官、先手等技巧上,進展得非常快,十足天才超人的氣勢。倒是初學者很快就能步步打吃的征子,它直在訓練的後期才領悟,這也反映了AlphaGo Zero的學習模式及歷程,與人類不盡相同。

AlphaGo Zero不靠人類知識就能主宰圍棋世界,可說已經到了掌握《功夫熊貓》電影裡,那神龍秘笈存乎於心而留白之境界,見招拆招,無所本,亦無無所本啊。

AlphaGo Zero所用的運算資源,遠比AlphaGo少,而且不靠棋譜餵養,卻能表現得如此出色,見證了深度學習領域除了運算資源及大數據外,演算法扮演著更關鍵的角色,值得想深度學習「深度學習」的學者專家省思。

當然,這些演算法不全是該團隊所獨創,主要還是人類智慧的結晶,例如有些棋步搜尋樹的建構及評估概念,我在卅年前修人工智慧時就已讀到雛形了。

這學期,我開授一門「前瞻資訊科技」課程,邀請系內同仁共授,希望能全方位拓展學生的專業視野。當我邀請人工智慧及機器學習的翹楚林智仁教授時,人在海外的他慨然應允,並提到基礎理論的重要性,因此將講題訂為「數學與資訊」,希望同學能明瞭線性代數與深度學習、資料科學的重要關聯,從中領悟到如果能打穩理論基礎,未來在專業領域裡才能深度發展。

AlphaGo Zero樹立了深度學習新的里程碑,在叫好之餘,我們也要知道其所解決的電腦對局問題,在人工智慧領域只是有限的一環。我相信它那「零先備知識」的演算技能,未來必將在這片浩瀚無盡的人工智慧疆土上,展現無與倫比的絕妙光環,且讓我們拭目以待吧!

【2017/10/21 聯合報】