生信分析必藏!NCBI-Blast 序列比对 3 步速成,小白也能轻松拿捏!

  • 生信分析
  • NCBI-Blast
唯思派 03/27

NCBI的BLAST(Basic Local Alignment Search Tool)是一种广泛用于序列比对的工具,可以帮助用户将目标序列与数据库中的序列进行比对,找到相似或者一致的序列。通过序列比对,还可以进一步研究该序列是否有已知的蛋白质序列和结构信息,了解其行使的功能,也能对相似序列进行系统发生树(phylogenetic tree)的构建。

此前,已经为大家介绍过BLAST的下载及使用教程,序列相似性搜索必备神器——BLAST,下载及使用教程!今天主要为大家带来BLAST的保姆级操作教程,包含操作步骤、结果解读、结果导出三部分内容!

一、访问NCBI BLAST

打开NCBI BLAST官网:https://blast.ncbi.nlm.nih.gov/Blast.cgi

根据序列类型选择对应的BLAST程序:

● blastn:核苷酸序列比对核苷酸数据库(DNA vs DNA)。

● blastp:蛋白质序列比对蛋白质数据库(Protein vs Protein)。

● blastx:核苷酸序列(翻译为蛋白质)比对蛋白质数据库。

● tblastn:蛋白质序列比对核苷酸数据库(翻译为蛋白质)。

● tblastx:核苷酸序列(翻译为蛋白质)比对核苷酸数据库(翻译为蛋白质)。

此处选择的是 “Nucleotide BLAST”,即blastn比对。跳转到新的页面,如下

二、操作步骤

1.输入查询序列

可以直接输入序列或者序列访问号(ncbi核酸序列编号)在输入框中粘贴FASTA格式的序列(例如:>SequenceName后换行输入序列)。此处以PDCD1为例。

右侧的 “Query subrange”可以更具输入的序列选择子序列范围,一般不作操作。也可以点击“选择文件”按钮上传包含序列的文本文件。“Job Title”可以自命名运行的任务名称

2.选择数据库

进行比对的数据库默认情况下是选择标准的数据库,通过下拉选择需要选择比对数据集。

● nr:非冗余蛋白质数据库(blastp常用)。

● refseq_rna:参考RNA序列数据库(blastn常用)。

● Others:如16S rRNA、基因组数据库等。

如果你清楚比对序列的物种,可以在“Organism”中选择相应的物种,使比对结果更精确。

3.比对程序选择

根据序列相似性高低来进行搜索,默认选择的是高相似性序列检索。

当前下面的“Algorithm parameters”高级比对参数一般情况不做修改。

部分参数说明

● Expect threshold (E值):默认值10,值越小比对越严格(推荐根据需求调整)。

● Word size:匹配的短序列长度(默认值因程序而异,如blastn默认为28)。

● Max target sequences:显示的最大结果数(默认100)。

● Filter:屏蔽低复杂度区域。

● Mask:Mask for lookup table only。

4.提交任务并等待结果

在选择好基本的参数后,就可以点击“BLAST”进行序列比对。等待结果生成(时间取决于数据库大小和服务器负载,通常几秒到几分钟)。

三、结果解读

1.序列信息页

2.比对结果关键指标说明

(1)description:比对到的相似序列的基本信息,包含匹配序列的名称、来源物种及E值。

● scientific name:是这条相似序列所在的物种。

● query cover:是指我搜索的序列与这条序列的匹配程度(覆盖度)、E值是反应序列比对的可信度,E值越小,可信度越高。

● Total Score:比对得分,越高越好。

● E-value:期望值,越小表示匹配越显著(通常E<0.05认为有意义)。

● Per.ident:是序列比对的一致度。

● Accession:是这条相似序列在数据库的编号(登录号),直接着NCBI上用这个编号搜索就能找到这条序列的注释信息。

(2)graphic summary:用图的形式表现出与相似序列的比对结果

● 彩色条形图显示比对区域,颜色代表匹配相似度(红色最高,蓝色最低)。

(3) alignment:序列比对的结果/情况。包括一致度、相似度、序列长度等

● 查看具体比对区域,匹配的碱基或氨基酸用竖线|标出。

● 查询序列(Query)与数据库序列(Sbjct)的比对细节。

(4)taxonomy:是看这些相似序列在物种上的分类

四、结果导出

下载结果

● 点击“Select columns”,选择需要的列进行下载。

点击“Download”按钮,选择需要的下载格式。

参考:
https://blast.ncbi.nlm.nih.gov/doc/blast-help/
https://blast.ncbi.nlm.nih.gov/doc/blast-quick-start-guide/chooseblastprogram.html
https://ftp.ncbi.nlm.nih.gov/pub/factsheets/HowTo_BLASTGuide.pdf

【免责声明】发布内容来源于互联网、业内人士投稿以及微信公众号等公开资源,我们对文中观点持中立态度,文中观点不代表本平台的立场。所有文章仅供读者参考和交流使用。转载的文章版权归原作者所有,如有侵权行为,请及时与我们联系以便删除。

<END>