KEGG在线工具比对多条序列的介绍 返回
在KEGG主页就可以看到它有6个在线工具,如下图:
1. Blast/FASTA:单序列blast
2. BlastKOALA: 多序列批量的blast
3. KEGG mapper:检索pathway 的通路图以及修改通路图
4. GhostKOALA:mega注释与通路
5. KEGG Atlas:数据库中的通路,全局查看
6. SIMCOMP:化合物结构查看
目前比较常用的是前面3种,今天我们重点介绍一下多序列比对。总的来说,只要下面3个步骤就可以了。
具体操作有以下3步:
1、在官网提交序列数据
首先登陆KEGG官网:http://www.kegg.jp/
然后点击【BlastKOALA】进入主界面
其中包括:
1)提交序列文件,为Fasta格式的蛋白序列文件;
2)Enter taxonomy group of your genome
选择物种类型(区分原核、真核)
3)Enter KEGG GENES database file to be searched
默认即可
4)Enter your email address
填写你的邮件(提交任务后,需要从邮箱确认,结果也将会发送到邮箱)
5)提交任务,并从个人邮箱确认
提交序列之后,KEGG将会发送邮件确认。
2、邮箱确认
KEGG会给你发邮件(就是你提交序列的时候留下的邮箱号),让你确认是否进行所要求的比对。确认邮件是下面这样的,点击submit即可。
确认后,你的序列比对任务就被提交到KEGG的超算系统了。
3、得到结果并查看
一般序列比对快则几分钟,慢则一个小时(取决于排队的任务数据)。比对结果将会以邮件的形式发到邮箱。
KEGG结果邮件的内容大概如下:
注意:结果只在官网保留7天;所以建议大家下载结果图片与数据到本地。否则7天后,就只能重新分析。
3、KEGG分析的结果
分析结果(共3部分):
1)Your BlastKOALA job(任务完成情况的记录);
2)Annotation data(注释信息);
3)KEGG Mapper (这四个基因在代谢通路、功能层级、模块中的信息)。
关于注释信息部分
如果你关注注释信息,也可以直接下载。
但是要注意:
1)注释的文本需要使用notepad+ 打开
Notepad + 显示:一共四行
window自带的记事本无法正确识别linux中的换行符
记事本显示:不换行
2)内容很简单,就是序列名称对应的KEGG基因编号。但这个内容可以用于后续PPT中的给KEGG通路图调色。
最后,如果你关注pathway,就点击:Reconstruct pathway,你提交的4个基因处于pathway哪个位置都已经在图中被标注出。
更多基迪奥精彩原创文章,可继续关注我们网站动态发布,同时关注基迪奥微信~扫一扫添加基迪奥好友~随时随地关注行业动态!