----- Message ---------
主旨: 進度報告
日期: 2018-09-05 16:07
寄件者: Kun-Mao Chao
收件者: Y

Y 好:

感覺上對該主題掌握更好,漸入佳境。先前想多了解的k-mer counting,或許還有許多潛在應用。加油。

坤茂

Y 於 2018-09-05 15:11 寫到:

趙老師您好:

本週我讀的第一篇論文為

How to apply de Bruijn graphs to genome assembly
Compeau, P. E., Pevzner, P. A., & Tesler, G. (2011). Nature biotechnology

若要入門de Bruijn graph在生物資訊領域的應用,我覺得這篇文章很值得讀,而且其實也只需要讀這篇就能了解了。

這篇文章雖然簡短,但對於de Bruijn graph一開始是如何被用到genome assembly上,以及該如何使用等等都有詳細的介紹。

第二篇為
deBGR: an efficient and near-exact representation of the weighted de Bruijn graph
Pandey, P., Bender, M. A., Johnson, R., & Patro, R. (2017). Bioinformatics

這篇論文的作者剛好跟我上學期時報告的那篇相同,內容也有連貫性,
從更之前一篇論文中提出的資料結構counting quotient filter,到我之前報告的k-mer counting system - Squeakr,再延伸到這篇的deBGR,
在這篇論文中其實就是利用與Squeaker類似的方法去儲存一個de Bruijn graph,並依edge不同的特性存在不同的set中,
再加上一些錯誤修正的方法(因為counting quotient filter是一個approximate membership query data structure,所以會產生false positive),
最後的結果與Squeakr相比起來,所需空間只多一些,卻可以完全沒有錯誤。
可能是因為我已經讀過前面兩篇論文的關係,覺得這篇的方法滿容易理解的,

比較讓我意外的是之前報告的Squeakr,本來覺得就只是一個單純的k-mer counter,
在這篇論文中只是簡單修改一下用法,卻可以用來儲存de Bruijn graph。

讓我覺得k-mer在序列分析中果然是非常重要的,所以k-mer counting或許也比我原本所想的更值得學習。

接下來一或二週,目前打算讀下列這兩篇:

Hybrid correction of highly noisy long reads using a variable-order de Bruijn graph
Morisse, P., Lecroq, T., Lefebvre, A., & Berger, B. (2018). Bioinformatics

GRIDSS: sensitive and specific genomic rearrangement detection using positional de Bruijn graph assembly
Cameron, D. L., Schröder, J., Penington, J. S., Do, H., Molania, R., Dobrovic, A., ... & Papenfuss, A. T. (2017). Genome research.

Y 敬上