Message

----- Message ---------
主旨: 進度報告
日期: 2018-09-05 16:07
寄件者: Kun-Mao Chao
收件者: Y

Y 好：

感覺上對該主題掌握更好，漸入佳境。先前想多了解的k-mer counting，或許還有許多潛在應用。加油。

坤茂

Y 於 2018-09-05 15:11 寫到:

趙老師您好：

本週我讀的第一篇論文為

How to apply de Bruijn graphs to genome assembly
Compeau, P. E., Pevzner, P. A., & Tesler, G. (2011). Nature biotechnology

若要入門de Bruijn graph在生物資訊領域的應用，我覺得這篇文章很值得讀，而且其實也只需要讀這篇就能了解了。

這篇文章雖然簡短，但對於de Bruijn graph一開始是如何被用到genome assembly上，以及該如何使用等等都有詳細的介紹。

第二篇為
deBGR: an efficient and near-exact representation of the weighted de Bruijn graph
Pandey, P., Bender, M. A., Johnson, R., & Patro, R. (2017). Bioinformatics

這篇論文的作者剛好跟我上學期時報告的那篇相同，內容也有連貫性，
從更之前一篇論文中提出的資料結構counting quotient filter，到我之前報告的k-mer counting system - Squeakr，再延伸到這篇的deBGR，
在這篇論文中其實就是利用與Squeaker類似的方法去儲存一個de Bruijn graph，並依edge不同的特性存在不同的set中，
再加上一些錯誤修正的方法(因為counting quotient filter是一個approximate membership query data structure，所以會產生false positive)，
最後的結果與Squeakr相比起來，所需空間只多一些，卻可以完全沒有錯誤。
可能是因為我已經讀過前面兩篇論文的關係，覺得這篇的方法滿容易理解的，

比較讓我意外的是之前報告的Squeakr，本來覺得就只是一個單純的k-mer counter，
在這篇論文中只是簡單修改一下用法，卻可以用來儲存de Bruijn graph。

讓我覺得k-mer在序列分析中果然是非常重要的，所以k-mer counting或許也比我原本所想的更值得學習。

接下來一或二週，目前打算讀下列這兩篇：

Hybrid correction of highly noisy long reads using a variable-order de Bruijn graph
Morisse, P., Lecroq, T., Lefebvre, A., & Berger, B. (2018). Bioinformatics

GRIDSS: sensitive and specific genomic rearrangement detection using positional de Bruijn graph assembly
Cameron, D. L., Schröder, J., Penington, J. S., Do, H., Molania, R., Dobrovic, A., ... & Papenfuss, A. T. (2017). Genome research.

Y 敬上