轉(zhuǎn)錄組分析軟件該選誰——質(zhì)控篇
爾云間? 一個專門做科研的團隊
歡迎點贊+收藏+關注
生信人R語言學習必備
立刻擁有一個Rstudio賬號
開啟升級模式吧
(56線程,256G內(nèi)存,個人存儲1T)

在學習轉(zhuǎn)錄組分析時,你是否會被鋪天蓋地的軟件搞得眼花繚亂呢,學習完一個再學習另一個,最后發(fā)現(xiàn)兩者功能竟然是一樣的!甚至有些軟件已經(jīng)不再適用于轉(zhuǎn)錄組分析,可是依然出現(xiàn)在推薦的教程里。今天小果就帶領大家擦亮眼睛,告別“老臘肉”,迎接“小鮮肉”!

在介紹軟件之前,小果先帶大家復習一下轉(zhuǎn)錄組分析的流程。轉(zhuǎn)錄組分析是一種根據(jù)不同條件下基因表達水平的差異來研究基因功能的方法。在分析之前要準備好轉(zhuǎn)錄組測序數(shù)據(jù)、參考基因組(有參)、基因組注釋文件,在這里小果要提醒一句參考基因組注釋文件一定要和參考基因組是相同版本,不然容易報錯哦!

有了數(shù)據(jù)后就可以進行后續(xù)的質(zhì)控、比對、表達分析、差異分析以及富集分析。下面小果帶大家來挑選每個環(huán)節(jié)使用的軟件。
數(shù)據(jù)質(zhì)控
原始數(shù)據(jù)質(zhì)量的好壞直接決定了是否能得到理想結(jié)果,在數(shù)據(jù)質(zhì)控環(huán)節(jié)常用的軟件有FastQC、MultiQC、Trimmomatic、Cutadapt、FASTX_Toolkit, FastQC可以對測序原始數(shù)據(jù)進行質(zhì)量檢驗,生成質(zhì)量檢測報告,是最常用的質(zhì)控軟件。

MultiQC工具可以將多個單獨的FastQC結(jié)果整合為一個文件,方便統(tǒng)一查看同一批測序結(jié)果。

Trimmomatic、Cutadapt、FASTX_Toolkit三者均為對測序結(jié)果進行處理的軟件,下面小果來給大家詳細介紹一下這三位“神秘人”。
Trimmomatic
Trimmomatic適用于illumina二代測序數(shù)據(jù)的reads處理,主要對接頭(adapter)序列和低質(zhì)量序列進行過濾。Trimmomatic的參數(shù)并不多,從字面意思可以明白含義,自v0.32版本之后可自動識別堿基編碼格式是phred33還是phred64。優(yōu)點是操作簡單、參數(shù)易懂。
FASTX-Toolkit
FASTX-Toolkit是用于短讀FASTA / FASTQ文件預處理的命令行工具的集合。新一代測序數(shù)據(jù)通常包含多個短讀序列。在將序列映射到基因組之前預處理FASTA / FASTQ文件有時能夠提高效率從而得到更好的結(jié)果。但是要注意FASTX-Toolkit不支持壓縮格式的輸入文件;不允許序列中存在N堿基,這樣的序列會自動去除;默認情況下認為FASTQ文件的堿基編碼格式為phred64??偠灾瓼ASTX-Toolkit參數(shù)眾多,如果能夠掌握可以提高工作效率,缺點就是容易報錯,對小白不友好。
Cutadapt
Cutadapt是一個比較經(jīng)典的能夠?qū)﹄p端進行接頭切除的軟件,也可以刪除primer、 polyA尾序列以及低質(zhì)量序列。Cutadapt在去除接頭方面非常專業(yè),使用時要懂得一點測序原理,參數(shù)稍微有些復雜。
經(jīng)過小果的講解大家是否對轉(zhuǎn)錄組分析質(zhì)控方面有了更多地了解呢,歡迎來和小果討論哦!

“生信果”,生信入門、R語言、生信圖解讀與繪制、軟件操作、代碼復現(xiàn)、生信硬核知識技能、服務器、生物信息學的教程,以及基于R的分析和可視化等原創(chuàng)內(nèi)容,一起見證小白和大佬的成長。