Research
- 演算法
(Computer Algorithms)
- 演算法設計與分析 (Design and analysis of computer algorithms)
- 傳統循序演算法的設計與分析. 隨著應用領域的不同, 設計有效且可由數學驗證的算法.
- 複本放置 (Replica
Placement)
- 分散式系統中為提升資料存取效率的複製策略 資料的存取效能是分散式系統中極為重要的目標之一。舉例來說,在一資料網格中,不同地區的科學家往往需要使用遠端的資料庫。如果資料庫的存取非常費時,會對整個計算的效能產生不利影響。
資料複製是一個解決資料存取瓶頸的重要方法。同樣以資料網格為例,如果我們將熱的資料庫複製為許多份,並擺放在資料網格中的關鍵位置,則使用者不需全部都向單一伺服器要求資料,而可以向就近的伺服器索取一份副本。如此可大量減輕資料網格伺服器的負擔,並解決資料存取瓶頸。
- 本研究的目的在於發展一套資料複製的策略,用以提升在分散式系統中的資料存取效能。我們將集中討論在資料網格上此一資料複製策略的可行性。一個資料網格是一組互相共享資料及儲存容量的叢集系統。叢集之間有網路連接,並有一中央控管機制,主控資源之管理與分享。
目前在資料網格方面的研究著重在資料分享機制的建立與維護。藉由機制的建立,使用者才能分享資料與控管權限。但我們仍需解決像是資料複製的份數,複製後的資料要如何取得才有利,要取哪一份才不會造成存取瓶頸,複製後的資料要如何擺放才能有效提升效能等問題。本計畫的具體目的即在於發展一套資料複製的策略解答以上問題,即發展有效的演算法來存取已被複製的資料,以及複製資料的擺放機制。唯有透過一套有效的資料複製策略,我們才能充分發揮資料複製所帶來的效能。
- 工作排程 (Job Scheduling)
- 格網計算是一種有效利用分散資源的重要機制. 這些資源往往分散在不同的地理位置, 但可經由格網計算加以有效整合. 格網計算可提供計算能量, 讓位於不同地域之使用者能加以利用. 格網計算也可以提供只有遠端才有的重要資料庫, 供使用者使用, 而毋須大費周章的在本地端複製一分資料. 這些服務可經由格網計算以整合的平台加以提供, 所以使用者可以毫不費力並有效的使用這些服務.
- 資料網格能整合分散於各地的儲存系統, 以供需處理大量資料的應用程式來使用.舉例來說, 生物資訊研究人員往往需要存取分散於各處之人類基因資料庫, 用於鑑定, 辨認, 及分類等用途. 這些資料庫往往具有極大之資料量, 所以無法廣泛的複製. 除此之外, 格網系統必須考慮廣域網路的延遲時間, 所以資料的存取效能就成為格網計算的重要議題之一.
- 計算網格能整合分散於各地的計算資源, 以供需使用大量計算能量的應用程式來使用這些應用程式往往會提交大數量且獨立的工作. 例如在目前潛力的藥物發展方法in silico virtual screening 中, 不同的可能藥物會和不同的蛋白質做配對, 形成大數量且獨立的工作. 這項電腦模擬可將潛在的可能藥物由數百萬降至數十, 大幅提升藥物研發的時程, 對社會福祉做出極大的正面貢獻.
- 即使計算網格主要在於提供計算能量, 任何應用程式仍須重要資料的配合. 例如在AppLeS
Parameter Sweep Template 的計算模式中, 獨立的工作仍須不同的資料才能進行. 而獨立的工作之間可分享資料. 以往的研究往往偏於工作排程或是資料放置. 工作排程的研究往往著重在CPU使用率, 整體完成時間等, 並未考慮資料傳輸時間. 而資料放置的研究往往著重在資料存取效能, 服務品質保證, 建構成本等, 而未考慮應用程式本身的執行時間.
- 本研究之重點在於提出一有效的整合工作排程及資料放置環境供格網系統使用. 本計劃強調工作排程必須與資料放置相結合, 因為雖然網路科技不斷進步, 在格網環境中由於資料量極為龐大, 資料的傳輸仍需耗費相當時間, 所以工作排程必須考慮到資料放置位置. 否則資料的傳輸極易形成效能上的瓶頸. 這是本計劃所要努力的目標.
- 分散式檔案系統 (Distributed
File System)
- 分散式檔案系統是雲端計算及格網計算關鍵技術之一. 而分散式檔案系統中metedata 的管理是一個極為重要的課題. 本研究的目的在於如何有效的利用平行與分散式計算, 提升metadata 的存取效能, 進而提升雲端計算及格網計算的效能.
- 無線網路 (Wireless
Mesh Network)
- 無線網路頻道設定: 無線網路中頻道設定不良會造成存取點互相干擾的問題. 本計畫的目的是藉由正確設定存取點多介面的頻道, 達成高通訊頻寬的目的. 借助圖論的理論分析, 可將無線網路頻道設定轉化為'邊塗色'或是'點塗色'的理論問題, 從而求解.
- 通訊最佳化
(Optimization of collective communication)
- 異質集體通訊: 平行計算中所有處理器往往需要同時彼此傳輸資料. 這種通訊模式即稱為集體通訊, 並對整體平行處理效能有重要影響. 在同質 (homogeneous) 網路架構下此種通訊最佳化並不構成嚴重問題, 因為所有的處理器均有相同的效能. 但是在異質 (heterogeneous) 網路架構下此種通訊最佳化就對通訊演算法的設計產生嚴重問題, 因為我們不能假設處理器或網路有相同的效能. 這在大型叢集計算機或是網際網路都構成同樣的問題, 所以異質網路架構中通訊最佳化的研究在叢集計算或是網際網路上均有重要應用.
回主頁