2023年12月26日 聯合報 科技.人文聯合講座

機智過人的雙子座

趙坤茂

本月十四日,三大流星雨之一的雙子座流星雨達到年度峰值,每小時流量上看百顆。更令天文愛好者振奮的是,當夜適逢早早西沉的眉月,夜空幾乎不受月光干擾,觀測條件極佳。不知那日看到流星的讀者,是否來得及許下願望呢?

無論如何,接下來的一段時光勢必相當「雙子座」(Gemini),因為就在本月上旬Google推出新世代多模態大型語言模型Gemini,展現卓越超群的語言、圖像、聲音和影片之理解與生成能力!初出茅廬的Gemini,共有三種規格:高複雜度任務的Ultra、專業使用的Pro及智慧裝置應用的Nano

趕在OpenAI的聊天機器人ChatGPT周歲之際推出Gemini,無疑是想與ChatGPT植基的GPT模型對決,並讓它所支撐的聊天機器人Bard更能與ChatGPT抗衡。在多項測試廝殺中,ProGPT-3.5略勝一籌,而Ultra則超越最新版的GPT-4,成為當代最強的多模態模型。在某些多模態智能測驗(如MMLU)裡,Ultra甚至成為首度勝過人類專家的人工智慧模型,相當值得期待。

多模態大型語言模型的應用極為廣泛,幾乎觸及人類智能駕馭的各個場域,未來將對我們的工作日常產生革命性的衝擊。它不僅可以看圖說故事,還能聽故事畫圖,乃至於自創圖文影音。它有問必答,有求必應,甚至還能無中生有,隨機組合變化。在校園學習裡,不僅學生作答時,可能會參考聊天機器人的輔助答案,或許老師命題及批閱時,也會參酌聊天機器人的建議呢!

今年四月,Google整併DeepMindGoogle Brain兩部門,成立新組織Google DeepMind。兩部門原本就已聲譽卓著,DeepMind推出的圍棋軟體AlphaGo及蛋白質結構預測軟體AlphaFold都立馬威震武林,而Google Brain在多種語言的轉譯上也令人耳目一新。它們在整併後齊心合力推出Gemini模型,必將牽動人工智慧應用領域的版圖。

大家或許好奇該語言模型為何取名Gemini?它的拉丁文字義為雙胞胎,反映其為DeepMindGoogle Brain兩強匯流的成果。另一方面,當年美國航太總署推出阿波羅登月計畫前的橋接計畫即為雙子座計畫,因此將這個起手式平台命名為Gemini,帶有振翅高飛的寓意和期許。此外,雙子座星座的特質是機智過人和博學多聞,猜測這也是命名原因吧!

猶記多年前在中部學校任教時,曾與友人驅車前往郊區熱點觀賞雙子座流星雨,等了大半夜,一顆也沒看到。待回到學校宿舍時,抬頭仰望一陣子,沒想到就看到數顆流星,還包括一顆緩緩隕落的火流星。人生冤枉繞路的不可預期性,又何嘗不是如此呢?

如今,我們透過網路觀賞天文館直播的流星雨,錯過時還可倒轉再多看幾回。雖然不如野外觀賞那般觸動,但心中仍舊有感,至少那劃過蒼穹的亮點,還是真實發生的流星,而不是人工智慧軟體生成的!

【2023/12/26 聯合報】