如何运用KEGG数据库查询信号通路(升级版)
之前我们介绍了“”,今天为大家带来升级版的内容。
学习了一段时间的KEGG数据库后,个人认为它最好用的功能是KEGG Mapper,当你想把差异性表达的基因与自己想要研究的信号通路联系起来时,这项功能就可以很好地帮你解决问题。
笔者之前为了验证药物作用后小鼠肝脏组织是否发生某些lncRNA的差异性表达,将实验组和对照组的肝脏组织送去公司进行了lncRNA的基因芯片分析。
公司反馈的数据中包括差异性高表达的lncRNA和与之相关的mRNA,但是我现在很想知道差异性高表达的lncRNA是否作用在了某个通路上。所以我利用KEGG Mapper先分析差异性高表达的mRNA的作用通路(因数据较多,为了方便,只任意列举其中一小部分,不一定有临床意义,只是为了演示过程)。
首先我们要将基因名称(genesymbol)转换成基因类型(geneID)的表现形式(小编注:此处即为geneID转换)。因为KEGG数据库只识别KEGG、NCBI和uniprot三种primaryID的形式,这里选择哪一种要看你的数据来源。
比如说,如果要转换成uniprot的ID形式,在uniprot网站中,点击retrieve/ID mapping的选项;在provide your identifiers中输入基因名称;下方选择转换类型和种属,点击submit。
点击页面左侧的reviewed swiss-prot(已经核实的基因),点击download下载Excel表格(uncompressed)。在Excel表格中,entry一栏就是转换后的geneID了。
将entry和你想标记的基因颜色重新放在一个Excel表格中,这样方便你在通路图中清楚找到你要查询的基因,将颜色和geneID输入到KEGG Mapper中,点击Exec开始分析,可以知道哪些基因参与了哪种通路的表达调控。
根据mRNA在通路上的作用情况,以及公司反馈的与之相关的lncRNA,可以间接猜测该lncRNA也可能作用在这条通路上,之后可以再通过查找文献和实验证明,会省去很多大量的筛选和验证时间。
笔者注:本文基于KEGG升级版的内容,结合了自己的一点使用方法,如果有不对的地方,请大家批评指正。
长按二维码识别关注“小张聊科研”
关注后获取《科研修炼手册》1、2、3、4、5、6、7,8和9。