使用類神經網路製作文句生成函數
所謂文句生成函數,就是一個可以依據輸出字詞構成的函數。
簡單來說,人腦就是一個文具生成函數。而處理語言的終極目標,就是希望能做出一個文句生成函數。利用DFA可以預測下一個字詞的特性,我們可以將使用者所查詢的字句輸入訓練好的DFA,並將他所欲查詢的下一個字詞加入原先所查詢的句子裡,一起比對相似度做語意檢索。
除DFA外,本實驗另外用了NMF (Non-negative Matrix
Factorization 非負矩陣分解 ) 與SOM來做語意分析,並根據這三種方法來做語意檢索且比較他們的差異。
我們選八部馬克吐溫的作品,其八部文章分別為
1869: The Innocents Abroad. (Travel)
1872: Roughing it. (Travel)
1876: The Adventures of TOM Sawyer. (Novel)
1880: A Tramp Abroad. (Travel)
1882: The Prince and the Pauper. (Story)
1883: Life on the Mississippi. (Travel)
1884: The Adventures of Huckleberry Finn. (Novel)
1889: A Connecticut Yankee in King Arthur's Court. (Novel)
然後使用上述三種方法分別對馬克吐溫文集做語意分析,之後我們將可以利用程式來做語意分析,查詢我們想在馬克圖溫文集中想找的資料。
程式說明
程式用法
若有任何問題,請e-mail至
cyliou@csie.ntu.edu.tw

All Rights Reserved by Cheng-Yuan,
Liou,
Department of Computer Science
and Information Engineering,
National Taiwan University.
|