那些年你错过的TF-lncRNA分析

admin 20 2025-01-26 编辑

lncRNA作为广受关注的一类非编码RNA,在新一代测序技术发展的支持下,其相关研究领域已经覆盖从识别到定量,从结构到功能的全过程。原来被称为基因组“垃圾产物”的lncRNA已经成为神秘的“bright star”。现有的研究已经表明lncRNA与转录调控蛋白联合作用,提高基因表达调控的灵活性和复杂性。今天介绍的这篇文章Structural accessibility contributes to the cooperative relationship of TF-lncRNA in myopia,今年4月发表在Briefings in Bioinformatics(IF:8.99)从转录协同调控的角度,通过模拟lncRNA转录本上候选绑定区域的核酸突变对结构的影响,进而识别重要的分子元件功能失调,解析疾病的发生发展进程。

一、数据来源

GENCODE(V30):人类lncRNA转录本

UCSC:人类转录因子结合位点(TFBS)片段

综合文献挖掘:提取近视相关基因

NPInter(V4.0):经实验验证的TF-lncRNA关系

dbGap数据库:与近视相关的单核苷酸多态性(SNPs)

二、方法

TFBS在lncRNA转录本上的重定位

通过UCSC数据库中的TFBSs LOCater方法获得了TFs的保守结合位置,保留分数符合标准的TFBS。然后根据潜在的结合位置,从Refseq和染色体位置中提取出可能的TFBS基序。根据短序列比对,通过Bowtie 2 将TFBS片段定位到lncRNA转录本上,以完成调控元件的基因组规模重定位并筛选出候选靶区域。

lncRNA二级结构的预测

RNAstructure可预测具有热力学构象的lncRNA二级结构(LRSS)。使用VARNA和RNApuzzler创建了RNA二级结构的最终可视化。

提取LRSSs特征

RNSsmc提取了全局lncRNA转录本的基本序列,通过在lncRNA转录物上截取TFBS上游和下游200 nt的序列片段来定义相邻的调控区(ARR)。共检测到18种不同水平的ARR:(i)茎环,凸起环,内部环,外部环,发夹环和多分支环的数量;(ii)每种motif的最大长度;(iii)每种motif的最小长度。

基于机器学习的特征重要性评估

为了比较和确认评估效果的稳定性,构建了四个评估模型,包括基于决策树(CART)的回归模型,CART的分类模型,基于随机森林(RF)的回归模型,以及RF的分类模型。功能评估是通过Python中的Sklearn软件包完成的。

基因组突变模型的构建

从dbSNP数据库下载了SNP的上游和下游侧翼序列。对Bowtie2的短序列比对应用了参数的最佳组合。重新定位的SNP-lncRNA关系被定义为潜在的突变模型。一次具有一个碱基突变的整个转录本会被随机扰动,以建立另一个全局突变模型。

lncRNA结构异质性的鉴定

根据RNAsmc中的结构比对算法,对WT和MT的构象变化进行了定量评估,计算出任两个RNA二级结构的相似性得分(SS)。使用了HDOCK固有的评分功能,从三维角度评估lncRNA和TF的结合亲和力。对每个配对分子执行了100次对接过程,以提取出更稳定的结合。使用3dRNA以构建三维结构。

识别连锁不平衡

提取了与近视有关的SNP(LD SNP)的LD blocks。实施了严格的质量控制程序,以进一步确保LD模块的准确性。使用PLINK 来识别显著性阈值为P <0.01的LD blocks。

三、结果

TF-lncRNA协同作用特征

122个TF的259696个TFBS序列被映射到30276个lncRNA转录本上,其中有833555个TF-lncRNA相互作用。A和B说明了每种类型的lncRNA比例和定位的TFBS分布。

 

近视相关TF-lncRNA二元相互作用的研究

通过文献资料挖掘,获得13例参与了常见、高度和病理性近视发生和发展的TFs,如表1所示。

 

TF-lncRNA二元组中的lncRNA结构

利用RNAsmc预测了lncRNA二级结构与近视相关的TF-lncRNA二元相互作用。RNA二级结构的六个基本结构单元如C所示,相邻调节区ARR如D。茎的数量在累积分布图中占很大的比例,其次是内部环(E)。从图案的长度分布可以看出,许多多分支环的长度超过了其他环的中位水平(F)。

LRSS motifs特征重要性评价

共18个特征与实施生物调节的过程相关,包括每种环的数目、最大长度和最小长度,如所示。结果表明,具有近视和其他疾病的单链结构和较低结构区域的ARRs片段对TF-lncRNA的共调节作用具有相对较低的风险。相反,带有复杂结构特征的motifs诱导分子相互作用并参与生物调节,这可能在近视的发生和发展中起关键作用。

 

 

识别协同调节的结构干扰效应

显示随机扰动的核酸序列表现出很强的鲁棒性,所有18个特征都略有变化。此外,MALAT1(enst0000544868.2)的剪接位点位于特征变化区域,但变化曲线的幅度很小。这可能表明改变转录本的结构参与了剪接调控的复杂过程。

 

显示了WT和MT的折叠RNA结构。结果表明,折叠RNA可以作为多种分子过程,特别是调节蛋白功能的结合点。

 

近视相关SNPs诱导的变构效应

提取SNP-lncRNA-TF中的三重单元(表2)以评估TF-lncRNA之间的协同相互作用以及lncRNA转录物中单核苷酸突变引起的干扰作用。

 

所获得的三重相互作用仅有微小差异(A)。在同时改变ARR上的多个等位基因后,构象发生了明显变化(B)。这些发现说明,在正常的生理条件下,RNA结构达到了一定的稳定性,可以抵抗外部刺激,从而维持正常的细胞活性。但是,一旦发生严重的分子攻击事件,该结构的平衡状态就会破坏,从而影响RNA分子的基本活性并进一步诱发疾病的发生。接下来从三维角度重点研究了TF和lncRNA之间的分子相互作用。预测的交互模型如C所示。lncRNA转录本中的序列突变导致二级结构折叠状态的改变,影响三级结构的构象,并进一步改变了lncRNA与TF的结合区域,角度和范围。这表明当lncRNA和TF协同作用来调节生物过程时,核苷酸突变可能导致结构功能障碍并诱导重要的分子事件,例如人类疾病的发作。

 

小结

这篇研究来源于结构组学和相互作用组学,为系统研究结构介导的lncRNA-TF协同调控在转录调控中的作用机制,进一步了解分子变构效应在细胞生理和病理过程中的关键调控作用创造了条件。并且从近视角度出发,相对于主流的维生器官疾病研究可谓是比较新颖了,工作量适中,前期文献挖掘可能会费时,但是整体思路很值得借鉴。

那些年你错过的TF-lncRNA分析

上一篇: 质粒构建工具推荐,实验室必备的分子克隆利器
下一篇: 深度学习预测泛癌种转移状态发7+SCI
相关文章