生物信息学技术 之 如何进行物种间同源序列分析

admin 2 2025-02-05 编辑

随着生命科学的发展,人们越来越关注基因或调控元件的物种间保守性,如何获取这些同源序列则成为生物信息学分析的常见内容。现将这方面的经验总结如下,希望对大家有所帮助!

>gi|341926217|ref|NR_040616.1| Musmusculus RIKEN cDNA A130077B15 gene (A130077B15Rik), long non-codingRNA

第一步:根据NR_040616找到该基因在小鼠(mm9)中的基因组位置:

RefSeq Gene A130077B15Rik

RefSeq: NR_040616.1 Status: Predicted

Description: Mus musculus RIKEN cDNA A130077B15 gene (A130077B15Rik), long non-coding RNA.

Entrez Gene: 319272

PubMed on Gene: A130077B15Rik

mRNA/Genomic Alignments

BROWSER | SIZEIDENTITY CHROMOSOME STRAND START END QUERY START END TOTAL

-----------------------------------------------------------------------------------------------------

browser | 2547 100.0% 10 - 122002079 122006947 NR_040616 1 2547 2547

View details of parts of alignment within browser window.

Position: chr10:122002079-122006947

Band: 10qD2

Genomic Size: 4869

Strand: -

Gene Symbol: A130077B15Rik

第二步:利用该位置(chr10:122002079-122006947)在人的基因组中寻找同源序列

网站:http://genome.ucsc.edu/cgi-bin/hgLiftOver

点击Submit?

点击View conversions

会下载一个后缀为bed的文件,用文本打开,后有一个位置,即该基因在人类基因组中的同源序列的位置:chr12 63451868 63452768

第三步:根据位置查看其在人类基因组的情况:

网址:

http://genome.ucsc.edu/cgi-bin/hgGateway?hgsid=455296151_ME72VQ0aUTgj9KJwsRJWQSKaQ6fF&clade=mammal&org=Human&db=hg19

点击submit,结果发现该区域在人类中并无基因

把当前窗口放大十倍后,会在附近找到一个Ensemble基因:

EnsemblGenes (ENST00000553036 - Ensembl 75)

Ensembl Gene Link: ENSG00000257664

Ensembl Transcript: ENST00000553036

Ensembl Protein:

Gene Name: RSL24D1P5

Ensembl Type: processed_pseudogene

Position: chr12:63449055-63449545

Band: 12q14.2

Genomic Size: 491

Strand: -

Gene Symbol: ENSG00000257664

CDS Start: none (non-coding)

CDS End: none (non-coding)

Links to sequence:

Non-protein coding gene or gene fragment, no protein prediction available.

Predicted mRNA from genomic sequences

Genomic Sequence from assembly

提示是一个假基因。

第四步:获取人类同源的序列:

位置:chr12 63451868 63452768

网站:https://usegalaxy.org/

首先提交位置:

将以上位置粘贴到上面的框中,物种选择hg19

点击Start

在窗口右侧会出现刚刚输入的位置:

获取同源序列:点击左侧的工具条:

默认输入了最新导入的位置:

点击Execute,结果在右侧结果框展示:

点击保存按钮下载序列即可:

>hg19_chr12_63451868_63452768_+ 63452768

GACTTATGGTGAAAGCTGAGTGTAGGCAAATCCTGGCTTGGGGCATGATG

GTGAGAGCAGGGGTGATTGGGGACTGGAGAAGAAACTTTGAGcatgtatt

ctcaactagggcaatcttgcccccagtggggcgaaacttggttgatgaaa

ctaggaggcaaaaatacctcattctttatgcataggcacagatatacagt

atatctattgtattaaaatattatgagagtgatgattagtaaaaaatgtc

taaaaggctggtgggaggtggaggccgtaatgaagaaaggttaagaGGTA

GTGACTGAGAGGAAAAGTAGTTCTTCACAAGGCACTCAGCTGCCTAGAAA

TGACCCAATTTAAGAACCTCTGTTCTTAAAAAGGGAAATATTCATTTTTA

AAGGATATTTCCAATGATAGTCCTTTGGAGTGGAGGTTATAGAATAAGTT

TCTCTCATTTTCTTTTCTACATCTACCTTTCTAGGATTTCCAGCACAGAG

TACAGCACAGGATAAAGGTCTGAATCAGAAATGACAGCCTGCTTATATTT

GTGAAAAGTTAAATTAGGCTTTGAAATGATGACCAGCATCATTGTTGATG

AGACGACAATGTAGattcattggcatctattacatgttaggtactttgtc

tatggttaccaccttagttaacataaccaccctgcagaataggtatatta

tccccagctaagcagcaattatgtgccgaaccagaatgtgaacccaggtc

tgtgtgactctcaaggagatacactttccactggaccacaccattcctcA

TGAAGCAAACAGTTCAGATGAAGGGTCCCTGGAAAGCCCTCTTGTTCCTT

ACAGAAGGTTTTTGCTTCTCTGGAGTTTTGACCTTGGATGCTCCTTTAGG

至此就对小鼠基因组的一个lncRNA在人类基因组中的同源性进行了分析,可以利用这些信息研究其在人类同源序列上的调控等等。

欢迎关注

生物信息学技术 之 如何进行物种间同源序列分析

上一篇: 质粒构建工具推荐,实验室必备的分子克隆利器
下一篇: 猪基因组文章解读
相关文章