国产精品天干天干,亚洲毛片在线,日韩gay小鲜肉啪啪18禁,女同Gay自慰喷水

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

非模式生物基因注釋信息不會(huì)找?不怕,小果教你用AnnotationHub包拿捏

2023-10-13 09:11 作者:爾云間  | 我要投稿

非模式生物的注釋信息檢索

自RNA測(cè)序(RNA-seq)的技術(shù)被發(fā)明以來(lái),它在分子生物學(xué)的領(lǐng)域內(nèi)得到了廣泛的應(yīng)用。與傳統(tǒng)的方法相比,RNA-seq更能夠全面和精準(zhǔn)地揭示基因在不同層面上的功能和作用。這一技術(shù)突出了mRNA剪接的復(fù)雜性,并闡明了非編碼RNA以及增強(qiáng)子RNA對(duì)于基因表達(dá)的調(diào)控機(jī)制,增強(qiáng)了我們對(duì)于生物過(guò)程的了解,推動(dòng)了生物學(xué)在基因組、轉(zhuǎn)錄組以及表觀遺傳學(xué)等方面的研究進(jìn)步。 然而,當(dāng)我們通過(guò)RNA-seq得到了一系列差異基因的geneid后,一個(gè)問(wèn)題擺在我們面前:我們并不清楚這些geneid實(shí)際上對(duì)應(yīng)的是哪些基因。此時(shí),我們需要對(duì)這些基因做進(jìn)一步的功能注釋?zhuān)簿褪钦页鲞@些基因在生物體中實(shí)際上起了什么作用,這些差異表達(dá)的基因是否與特定的表型相關(guān)?要解答這些問(wèn)題,就需要我們把得到的geneid與gene數(shù)據(jù)庫(kù)進(jìn)行比對(duì),挖掘出每一個(gè)geneid背后的基因信息。這個(gè)過(guò)程就好比查字典一樣,我們有了頁(yè)碼,接下來(lái)就需要知道這個(gè)頁(yè)碼對(duì)應(yīng)的是什么內(nèi)容。 對(duì)于像人類(lèi)、小鼠、擬南芥、大腸桿菌等模式生物來(lái)說(shuō),進(jìn)行基因注釋的過(guò)程相對(duì)容易,因?yàn)樗鼈兌加邢鄬?duì)完善的數(shù)據(jù)庫(kù)可以參考。但是,對(duì)于非模式生物,由于通常缺乏良好的參考基因庫(kù),進(jìn)行基因注釋的過(guò)程就顯得十分困難。此時(shí),R包AnnotationHub提供了一種非常有效的解決方案。它能夠輕松地檢索非模式生物的注釋信息,對(duì)過(guò)去在注釋非模式生物基因時(shí)遇到的問(wèn)題提供了有效的解決方式。

下面小果用玉米作為示范

下載AnnotationHub包并加載

BiocManager::install("AnnotationHub”)???#包下載 library(AnnotationHub)???#加載

有兩種方式可以找到想要的非模式生物注釋信息

第一種

??ah <- AnnotationHub() query(hub, "zea") AnnotationHub with 12 records # snapshotDate(): 2022-10-31 # $dataprovider: ftp://ftp.ncbi.nlm.nih.gov/gene/DATA/, NCBI,DBCLS, WikiPathways, ... # $species: Zea mays, Gibberella zeae, Zea mays_var._japonica, Heliothis zea, Heli... # $rdataclass: OrgDb, SQLiteFile, Tibble, Inparanoid8Db # additional mcols(): taxonomyid, genome, description, coordinate_1_based, #??maintainer, rdatadateadded, preparerclass, tags, rdatapath, sourceurl, #??sourcetype # retrieve records with, e.g., 'object[["AH10514"]]' ?????????????title?????????????????????????????????????? ??AH10514?| hom.Gibberella_zeae.inp8.sqlite???????????? ??AH91642?| MeSHDb for Zea mays (Corn, v001)??????????? ??AH91804?| wikipathways_Gibberella_zeae_metabolites.rda ??AH91817?| wikipathways_Zea_mays_metabolites.rda?????? ??AH97909?| MeSHDb for Zea mays (Corn, v002)??????????? ??...???????...???????????????????????????????????????? ??AH107469 | org.Zea_mays.eg.sqlite????????????????????? ??AH107470 | org.Zea_mays_var._japonica.eg.sqlite??????? ??AH108747 | org.Helicoverpa_zea.eg.sqlite?????????????? ??AH108748 | org.Heliothis_zea.eg.sqlite???????????????? ??AH109103 | org.Gibberella_zeae_PH-1.eg.sqlite 通過(guò)檢索,org.Zea_mays.eg.sqlite就是小果想找的玉米Org數(shù)據(jù)庫(kù)。

第二種

我們也可以訪問(wèn)它的官方接口來(lái)更快地獲取

BiocHub Server API

再然后我們就可以點(diǎn)擊species按照物種來(lái)進(jìn)行快速檢索 從左下角可以清楚地看到有將近6000種可用的物種,這是不是比你想象得多很多呢?

輸入小果的好朋友玉米的學(xué)名zea mays

點(diǎn)擊zea mays,太好了小果找到了玉米的org數(shù)據(jù)庫(kù)~

獲取玉米注釋信息

通過(guò)對(duì)應(yīng)的accession number,?獲取文件AH107469 。 并將文件存入maize對(duì)象中,我們可以看到它包含了玉米49905個(gè)基因的注釋。 > maize <- hub[['AH107469']] downloading 1 resources retrieving 1 resource |==============================================| 100% loading from cache > length(keys(maize)) [1] 49905 這個(gè)Org數(shù)據(jù)庫(kù),包含有以下一些注釋信息(好多小果都還未接觸過(guò)): > columns(maize) [1] "ACCNUM"?????"ALIAS"??????"CHR" [4] "ENTREZID"???"EVIDENCE"???"EVIDENCEALL" [7] "GENENAME"???"GID"????????"GO" [10] "GOALL"??????"ONTOLOGY"???"ONTOLOGYALL" [13] "PMID"??????"REFSEQ"?????"SYMBOL" [16] "UNIGENE" 有了Org數(shù)據(jù)庫(kù)之后就可以進(jìn)行后續(xù)的操作了。比如不同數(shù)據(jù)庫(kù)的ID轉(zhuǎn)化,基因/轉(zhuǎn)錄本/蛋白的ID轉(zhuǎn)化,GO注釋以及其他注釋。 ? 怎么樣是不是很方便呢,歡迎和小果討論~ 小果的云生信平臺(tái)還有更多方便實(shí)用的工具,快來(lái)瞧瞧吧

非模式生物基因注釋信息不會(huì)找?不怕,小果教你用AnnotationHub包拿捏的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國(guó)家法律
北安市| 丘北县| 裕民县| 郴州市| 浮山县| 承德县| 武强县| 新源县| 府谷县| 水富县| 青神县| 河北区| 康马县| 湘潭市| 绍兴县| 大同市| 宜春市| 南开区| 隆回县| 泌阳县| 罗定市| 瓮安县| 淮南市| 彭阳县| 思南县| 武义县| 深水埗区| 怀集县| 武宣县| 得荣县| 万年县| 酒泉市| 南陵县| 仪陇县| 大港区| 宁德市| 新余市| 丹棱县| 丹巴县| 乌鲁木齐市| 吉林省|