缺血性心肌病致病基因的生物信息学探究

3.0 闻远设计 2024-04-20 20 4 20.15KB 6 页 免费
侵权投诉
缺血性心肌病致病基因的生物信息学探究
 摘要: 目的 · 应用生物信息学方法探讨缺血性心肌病(ischemic cardiomyopathy, ICM)中差
异表达的相关基因,构建竞争性内源 RNAcompeting endogenous RNA, ceRNA)调控网络。
方法 · 从基因表达数据库中下载数据集,筛选出 ICM 样本与正常样本差异表达的 mRNA 和长
链非编码 RNAlncRNA),并进行 GOGene Ontology)功能分析和 KEGGKyoto
Encyclopedia of Genes and Genomes)通路分析。分析差异表达的 m RNA lncRNA,运用生物
信息学方法进行 miRNA 预测分析,构建 ceRNA 调控网络。结果· GO 功能分析和 KEGG 通路
分析结果表明,差异表达基因在代谢途径、氧化磷酸化、细胞外基质受体相互作用等通路显着
富集,并与内质网应激、纤维化、胶原的分解代谢过程、炎症反应功能密切相关。构建了 ICM
lncRNA 相关的 ceRNA 调控网络,包含 26 mRNA2lncRNA 15 miRNA 。结论 ·
用生物信息学方法能够有效分析 ICM 差异表达的基因,并成功构建了缺血性心肌病 ceRNA
控网络。
关键词:缺血性心肌病; 差异表达基因; 长链非编码 RNA; 生物信息学; 竞争性内源 RNA;
Bioinformatics analysis of differentially expressed genes in ischemic cardiomyopathy
ZHANG Peng CHANG Zheng-yan YANG Lei XUE Song LIAN Feng
Department of Cardiovascular Surgery, Renji Hospital, Shanghai Jiao Tong University School of
Medicine Department of Pathology, Shanghai Tenth People's Hospital of Tongji University
  AbstractObjective · To screen differentially expressed genes in ischemic cardiomyopathy (ICM)
by bioinformatics analysis and construct the regulatory network of competing endogenous RNA
(ceRNA) . Methods · Data sets were downloaded from Gene Expression Omnibus (GEO) database to
screen the differentially expressed mRNAs and lncRNAs between normal samples and ICM ones.
Then, GO (Gene Ontology) analysis and KEGG (Kyoto Encyclopedia of Genes and Genomes)
pathway analysis were performed. The differentially expressed mRNAs and lncRNAs were analyzed
to predict related miRNAs by bioinformatics methods, and then to construct ceRNA regulatory
network. Results · GO analysis and KEGG pathways analysis results showed that the differentially
expressed genes were enriched in the pathways such as metabolic pathway, oxidative phosphorylation,
and extracellular matrix receptor interaction, and they were closely related to the functions such as
endoplasmic reticulum stress, fibrosis, collagen catabolic process, and inflammatory response. A
ceRNA regulatory network containing 26 mRNAs, 2 lncRNAs and 15 miRNAs was constructed.
Conclusion · The bioinformatics method can be used to analyze the differentially expressed genes of
ICM, and the regulatory network of ceRNA of ICM has been successfully constructed.
缺血性心肌病(ischemic cardiomyopathy, ICM)是诱发心力衰竭的重要原因。根据美国国立卫
生研究院的数据[1,2]ICM 是由遗传和环境因素的相互作用引起的。目前,已有多项研究从不
同方面对 ICM 进行了探索。
长链非编码 RNA (long non-coding RNA, lncRNA)是一类长度大于 200 nt 的非编码 RNA,是所
有非编码转录本的重要组成部分[2]lncRNA 参与机体多个重要的生物学过程[3],也与多个疾
病的发生相关[4]。最近研究[5]表明,lncRNA 在心血管疾病中发挥重要作用,包括缺血性心肌
病;且有研究[6]发现,lncRNA 能够扮演竞争性内源 RNA (competing endogenous RNA,
ceRNA)的角色,通过与 mRNA 竞争 miRNA 来调节 mRNA 的表达。本次研究从基因表达数据
库(Gene Expression Omnibus, GEO)中筛选出样本,通过生物信息学方法,分析 ICM 致病的
相关基因,并构建差异表达 lncRNA 相关的 ceRNA 调控网络,为 ICM 治疗探索潜在的靶点。
    1 材料和方法
1.1 数据获取
表达谱数据来自美国国立生物技术信息中心(National Center for Biotechnology Information,
NCBI) GEO (http://www.ncbi.nlm.nih.gov/geo/[7],使用数据集系列号为 GSE42955(物种:
Homo sapiens)。从中筛选 ICM 样本 12 “例,正常样本( Normal heart”) 5 例。所有样本均采用
GPL6244[HuGene-1_0-st]Affymetrix Human Gene 1.0 ST Array[transcript (gene) version]平台检
测。
1.2 数据预处理和 lncRNA 重注释
GEO 数据库下载得到 cel 格式基因表达谱数据,数据利用 R软件包 oligo[8]采用 RMA (robust
multiarray average)算法进行背景校正、标准化和汇总。运用芯片平台注释文件,进行重注
释。最终得到 lnc RNA m RNA 的探针集。通过探针号和 m RNA/lnc RNA (gene symbol)的
一一匹配,去除没有匹配到的探针;对于不同探针映射到同一基因,取不同探针的均值作为这
m RNA/lnc RNA 最终的表达值。
1.3 差异 mRNA 和差异 lncRNA 筛选
运用 R语言包的 limma 包,采用经典贝叶斯方法,对 ICM 样本和正常样本进行 m RNA lnc
RNA 差异分析,所有 m RNA/lnc RNA 经过检验后得到相应的 P值,将 P<0.05 m RNA/lnc
RNA 视为差异 m RNA/lnc RNA
1.4 差异表达 m RNA 的功能富集及通路分析
运用富集分析工具 DAVID (The Database for Annotation, Visualization and Integrated Discovery,
https://david-d.ncifcrf.gov/[9]上述差异 m RNA 进行生物学过程(GO:Gene Ontology,
http://geneontology.org/[10]和通路(KEGG:Kyoto Encyclopedia of Genes and Genomes,
https://www.kegg.jp/[11]分析。显着性P<0.05 且富集个数(count至少3个的视为显
着富集结。
1.5 lncRNA m RNA 同表达关系预测
运用一一匹配的 mRNA lncRNA 数据,个差异 mRNA 和差异 lncRNA Pearson 相关
系数,并进行相关性检验,筛选 r>0.6 P<0.05 mRNA lncRNA 关系对,为这mRNA
lncRNA 同表达关系。
1.6 lncRNA 功能预测
对预测到的lncRNA 的靶基因,利用 RclusterProfiler 进行 GO 生物学过程和 KEGG 通路
富集分析,通过富集分析结果来间接预测 lncRNA 的功能。采用 Benjamini-Hochberg 方法进行
P正,校正后 P<0.05 且富集个数至少5 个的视为显着富集结果。
1.7 miRNA 预测及 ceRNA 网络构建
同表达的差异 mRNA 使用 miRWalk2.0[12]工具综合
miRWalkmiRanDamiRDBmiRMapRNA22Targetscan 6个数据库中的 miRNA 预测
结果,为在 6个数据库的预测结果中均出现的 miRNA 为调控靶基因的 miRNA。对于与差异
mRNA 同表达的 lncRNA,通过 2工具进行靶miRNA 预测:利用 miRanDa (v3.3a)软
件,采用默认参数进行预测,筛选 Score≥140Energy≤-20 miRNA-lncRNA 关系对;利用
线数据库 starBase v2.0,预测得到 miRNA-lncRNA 关系对,取 2次预测结果的集,作为最
终的 miRNA-lncRNA 关系对。综合差异 mRNA-miRNA 和差异 lncRNA-miRNA 关系对,首先
选受到同一个 miRNA 调控的 miRNA-lncRNA-mRNA 关系对,结mRNA lncRNA 表达
关系(相关系数>0.6),进一筛选 miRNA-lncRNA-mRNA 关系对,使用 Cytoscape 软件进行
网络构建,ce RNA 网络。我们认ceRNA 网络中受同一个 miRNA 调控的表达关系
lncRNA mRNA 互为 ceRNA
    2 结果
2.1 差异表达基因的基本信息统计
运用芯片平台注释文件注释了 18 392 mRNA 1 384 lncRNA,使用 limma 包对 ICM
本和正常样本分进行 mRNA lncRNA 差异分析,结果1。基于筛选得到的差异
摘要:

缺血性心肌病致病基因的生物信息学探究 摘要:目的·应用生物信息学方法探讨缺血性心肌病(ischemiccardiomyopathy,ICM)中差异表达的相关基因,构建竞争性内源RNA(competingendogenousRNA,ceRNA)调控网络。方法·从基因表达数据库中下载数据集,筛选出ICM样本与正常样本差异表达的mRNA和长链非编码RNA(lncRNA),并进行GO(GeneOntology)功能分析和KEGG(KyotoEncyclopediaofGenesandGenomes)通路分析。分析差异表达的mRNA和lncRNA,运用生物信息学方法进行miRNA预测分析,构建ceRNA...

展开>> 收起<<
缺血性心肌病致病基因的生物信息学探究.docx

共6页,预览2页

还剩页未读, 继续阅读

作者:闻远设计 分类:社科文学类资料 价格:免费 属性:6 页 大小:20.15KB 格式:DOCX 时间:2024-04-20

开通VIP享超值会员特权

  • 多端同步记录
  • 高速下载文档
  • 免费文档工具
  • 分享文档赚钱
  • 每日登录抽奖
  • 优质衍生服务
/ 6
客服
关注