2021年1月18日 聯合報 科技.人文聯合講座

共享資源 同行致遠

趙坤茂

今年,蛋白質資料庫(PDB)建立五十周年,先驅們開放、合作與教育的精神將永傳不朽。

蛋白質是生命體的必要成分,幾乎所有細胞活動都得借助各類型蛋白質,包括代謝、免疫、傳遞、結構、分化、凋亡等。當你讀這篇文章時,視網膜感光細胞的視蛋白吸收字面上的光子,並將光波轉換成視覺神經訊號;如果是聽有聲書,耳朵毛細胞的蛋白質將聲波轉換成聽覺神經訊號,再逐步傳到大腦……

蛋白質原為一維線性排列的胺基酸序列,經過折疊成為決定其功能的三維立體結構。解析蛋白質結構的實驗方法主要有三種,除了傳統的X光繞射和核磁共振外,還有近年很夯的低溫電子顯微技術。任一方法都所費不貲,而且解析時間累月經年,有時甚至還解不出來。

半世紀前,結構生物學家有鑑於資源共享對促進科學發展的重要性,建立了PDB,專門收錄蛋白質及核酸的三維結構。那時候,剛萌芽的網際網路尚未普及,所有資料的送件與共享只能透過紙本或磁帶,就這樣篳路藍縷,迄今累積了十七餘萬筆資料。

去年三月,PDB設置新冠病毒專區,現存約八百筆資料,包含兩百多筆棘蛋白的結構資料,對疫苗設計和治療策略幫助極大。新冠病毒最外層的棒狀凸起物棘蛋白,宛如打開人體細胞ACE2受體的鑰匙,一旦病毒闖入細胞後,就可綁架它複製病毒,進而感染更多的細胞。因此,若能掌握棘蛋白結構,就能針對它設計更有效的防禦機制。

往年實驗室解析的蛋白質結構,常常要等到論文被接受後才公開,對迫切挑戰顯得緩不濟急。上個月結構生物學界發起#ASAPpdb連署,已有多位結構生物學家響應,誓言在同儕審查前就讓新發現的蛋白質結構在PDB開放瀏覽,以便即時分享資源。最近來勢洶洶的英國變種和南非變種,它們的棘蛋白有多處突變,或恐降低疫苗的效度,故必須早日掌握突變結構,才能適度調整防疫策略。

另一方面,聚焦於蛋白質三維結構預測的CASP競賽,去年底由新版AlphaFold深度學習軟體拔得頭籌。令人讚嘆的是,它的精確度已相當於實驗結果,因而被《科學》期刊列入二○二○年度十大科學突破。

開放的PDB結構資料,讓AlphaFold能夠訓練得更精準;而做法公開的AlphaFold,未來必可輔助解析更艱難的蛋白質結構,以及多個蛋白質組成的蛋白質複合體。同行不相忌,同行以致遠,科學家們協力拓展了更寬廣的知識疆界,共譜人類文明新樂章。

【2021/1/18 聯合報】