使用類神經網路製作文句生成函數
所謂文句生成函數,就是一個可以依據輸出字詞構成的函數。
簡單來說,人腦就是一個文具生成函數。而處理語言的終極目標,就是希望能做出一個文句生成函數。利用DFA可以預測下一個字詞的特性,我們可以將使用者所查詢的字句輸入訓練好的DFA,並將他所欲查詢的下一個字詞加入原先所查詢的句子裡,一起比對相似度做語意檢索。
除DFA外,本實驗另外用了NMF (Non-negative Matrix
Factorization 非負矩陣分解 ) 與SOM來做語意分析,並根據這三種方法來做語意檢索且比較他們的差異。
我們選16部馬克吐溫的作品,其16部文章分別為
1. The Innocents Abroad.
2. Roughing it.
3. The Adventures of TOM Sawyer.
4. A Tramp Abroad.
5. The Prince and the Pauper.
6. Life on the Mississippi.
7. The Adventures of Huckleberry Finn.
8. A Connecticut Yankee in King Arthur's Court.
9. A Horse's Tale
10.Christian Science
11.Extract From Captain Stormfield's Visit to Heaven
12.Is Shakespeare Dead From My Autobiography
13.The American Claimant
14.The Mysterious Stranger
15.The Tragedy of Pudd'n'head Wilson
16.Tom Sawyer Abroad
然後使用上述三種方法分別對馬克吐溫文集做語意分析,之後我們將可以利用程式來做語意分析,查詢我們想在馬克圖溫文集中想找的資料。
下載程式
程式說明
程式用法
若有任何問題,請e-mail至
cyliou@csie.ntu.edu.tw

All Rights Reserved by Cheng-Yuan,
Liou,
Department of Computer Science
and Information Engineering,
National Taiwan University.