干货时间|序列比对,科研必备的几款软件!

本文作者:Cream转载留言即可
作为一名生物科研狗 , 在饱受实验折磨的同时 , 相信大家也都多少会受到一些生信软件的“宠爱” 。 比如需要做序列比对 , 却不知道该用什么软件 , 不知道怎么设参数、不懂怎么读结果 。
今天我们详细地给大家介绍一款必会比对程序BLAST的用法 , 再给大家说一说几种常用比对软件的优缺点 , 方便大家自己选择 。
BLAST(BasicLocalAlignmentSearchTool)可以说是短序列比对中最常用的比对工具了 , 它不仅支持核酸和蛋白的双序列比对 , 而且可以在蛋白质数据库或DNA数据库中进行相似性比较 , 找到与查询序列相似的序列 。
NCBI上的在线BLAST具有四种功能模块:NucleotideBLAST(核酸序列比对到核酸库)、ProteinBLAST(蛋白序列比对到蛋白库)、BLASTX(核酸序列比对到蛋白库)、TBLASTN(蛋白序列比对到核酸库) 。
干货时间|序列比对,科研必备的几款软件!
文章图片
使用方法:
干货时间|序列比对,科研必备的几款软件!
文章图片
B可以选择不同的比对选项 , 对应于我们前面介绍的五种功能
D可以接受各种格式的查询序列 , 可以一个序列号(NM_000249)或者是FASTA序列
E可以限定查询序列中的某个片段 , 比如“from200to600”就是查询200-600bp位置的序列
G可以选择进行多序列比对 , 并且可以更改序列输入方式
干货时间|序列比对,科研必备的几款软件!
文章图片
干货时间|序列比对,科研必备的几款软件!】A可以选择所要查询的数据库
B可以输入物种名称 , 它会显示下拉条目可以进行选择
C可以用来排除一些不想要的信息
D对于特定数据库可以进行一些搜索限制 , 比如输入“biomol_mrna[prop]AND500:1000[slen]”可以限制搜索500-1000bp长度的序列
E可以根据需要选择不同的速度或者灵敏度
F按钮执行BLAST搜索
G可以打开一个折叠页面 , 可以进行更为详细的参数设置(如下图)
干货时间|序列比对,科研必备的几款软件!
文章图片
H可以设定数据库中最大的匹配目标数
I允许BLAST自动优化30个碱基/残基或更短的查询设置
J是一个期望阈值的设置 , 可以过滤掉不太重要的匹配
K设置初始序列匹配的大小 , 设置越小越敏感
L限制了最大匹配数 , 默认设置“0”表示无限制
F和G是得分参数 , 对BLAST的敏感度也会有影响 , 不过一般情况下可以设为默认值 。
比对结果:
干货时间|序列比对,科研必备的几款软件!
文章图片
左边图中显示一些关于比对的信息
JobTitile默认情况下显示第一个查询的序列id,也可以提交前对其进行自定义 。
RID显示分配给此搜索的唯一标识符,DownlodALL可以将完整的搜索结果保存为所需的格式XML(XML2)、JSON和CSV
Program列出进行的搜索 , 在本例中为BLASTN提供参考文献
Database是搜索的数据库 , 可以查看详细信息
QueryID显示结果的查询序列id
右图中的可以选项参数用于过滤结果
Organism允许设置物种名
PercentIdentity允许设置同一性程度进行过滤 , 比如94.74%到94.76%
EValue允许通过期望值进行过滤 , 比如设置0.0001到5e-120(5x10-120).
Description是BLAST结果默认显示选项 , 可以通过旁边的按钮切换
干货时间|序列比对,科研必备的几款软件!
文章图片
以上结果是默认按E值由高到低进行排序的 , 单击后面的每条accession号可以直接跳转到对应的核酸库或蛋白库中 。