利用gatk進(jìn)行變異檢測(cè)的n步走戰(zhàn)略之一
爾云間? 一個(gè)專門做科研的團(tuán)隊(duì)
歡迎點(diǎn)贊+收藏+關(guān)注
生信人R語言學(xué)習(xí)必備
立刻擁有一個(gè)Rstudio賬號(hào)
開啟升級(jí)模式吧
(56線程,256G內(nèi)存,個(gè)人存儲(chǔ)1T)

GATK(Genome Analysis Toolkit)是由Broad Institute開發(fā)的一款廣泛使用的基因組分析軟件。
它被廣泛用于變異檢測(cè)、變異過濾、注釋等基因組數(shù)據(jù)分析任務(wù)中。GATK提供了一套強(qiáng)大的算法和工具,支持多種變異檢測(cè)和基因組分析任務(wù),如SNP和indel檢測(cè)、CNV檢測(cè)、基因組重排、變異標(biāo)記和注釋等。GATK已經(jīng)成為廣泛使用的高通量測(cè)序數(shù)據(jù)分析工具之一,尤其在人類基因組項(xiàng)目和癌癥研究中得到廣泛應(yīng)用。

GATK主要提供以下幾個(gè)方面的功能
1.數(shù)據(jù)預(yù)處理:包括質(zhì)量控制、序列比對(duì)和比對(duì)質(zhì)量控制、局部重比對(duì)、堿基質(zhì)量控制等。
2.變異檢測(cè):包括SNP和indel檢測(cè)、CNV檢測(cè)等。
3.基因組注釋:對(duì)檢測(cè)到的變異進(jìn)行注釋,包括基因型注釋、功能注釋、變異頻率注釋等。
4.基因組重排:對(duì)基因組進(jìn)行分塊,提高分析效率。
5.基因組分析管道:整合各種分析步驟,提供一條完整的基因組分析流程。
本期小果就帶大家感受一下gatk的魅力!數(shù)據(jù)還是之前處理過的擬南芥20個(gè)樣本的數(shù)據(jù)集。
先安裝一下軟件:
上期已經(jīng)利用bwa將基因組比對(duì)到參考基因組上了,我們等會(huì)直接調(diào)用這部分?jǐn)?shù)據(jù)。

使用gatk的sortsam對(duì)sam文件進(jìn)行排序,注意修改文件路徑哦:
看一下結(jié)果,怎么樣,你的結(jié)果有沒有跑出來呢?

好啦,今天的內(nèi)容暫時(shí)就到這里了,我們下期繼續(xù)!
歡迎使用:云生信??- 學(xué)生物信息學(xué)?(biocloudservice.com)
如果想用服務(wù)器私信小果哦!

“生信果”,生信入門、R語言、生信圖解讀與繪制、軟件操作、代碼復(fù)現(xiàn)、生信硬核知識(shí)技能、服務(wù)器、生物信息學(xué)的教程,以及基于R的分析和可視化等原創(chuàng)內(nèi)容,一起見證小白和大佬的成長。