指令如下 : ( 工作站實驗室本來就裝了blastall 和 formatdb, 可以直接執行 ) 1. formatdb -i test_fold_db -p T -o T test_fold_db 要先run一次 formatdb 2. blastall -p blastp -a 2 -d test_fold_db -i input.test -o tmp.log -e 10 -m 9 -d : database file, 目前也就是 fold training data file -i : input file -o : output file -e : e-value , 你可能要調整一下, e-value 越大, output file 中會列出越多 entry -m : 9 可以不用調整 1.用wscript來寫test檔的script 2.後用產生好的script自動跑blast以生成output,取名為 xxx.out 內有multiple sequence alignment後的排名 3.再用evaluate.c程式來評分 *** 1 這個檔案裡存放的是whole seq.下做3NN的結果。有特例的蛋白質 1rik_A, 1rim_A 2 這個檔案裡存放的是砍去連續10個loop下做3NN的結果 1tue_K, 1w2b_J out2 這個檔案存放的是猜錯的蛋白質的分析資料 *** blast download http://www.ncbi.nlm.nih.gov/BLAST/download.shtml database download ftp://ftp.ncbi.nlm.nih.gov/blast/db/ 基本上使用 nr database (nr.tar.gz) 跑的時候基本上是 ./blastpgp -d db/nr -j 2 -i [sequence] -C tmp.txt -Q [pssm_output.txt] *** MaQVcxpW *** dssp 檔案中的序列可能會出現'!',,也可能會跟原本的序列長度不同,中間出現斷層。