缺血性心肌病致病基因的生物信息学探究
缺血性心肌病致病基因的生物信息学探究
摘要: 目的 · 应用生物信息学方法探讨缺血性心肌病(ischemic cardiomyopathy, ICM)中差
异表达的相关基因,构建竞争性内源 RNA(competing endogenous RNA, ceRNA)调控网络。
方法 · 从基因表达数据库中下载数据集,筛选出 ICM 样本与正常样本差异表达的 mRNA 和长
链非编码 RNA(lncRNA),并进行 GO(Gene Ontology)功能分析和 KEGG(Kyoto
Encyclopedia of Genes and Genomes)通路分析。分析差异表达的 m RNA 和lncRNA,运用生物
信息学方法进行 miRNA 预测分析,构建 ceRNA 调控网络。结果· GO 功能分析和 KEGG 通路
分析结果表明,差异表达基因在代谢途径、氧化磷酸化、细胞外基质受体相互作用等通路显着
富集,并与内质网应激、纤维化、胶原的分解代谢过程、炎症反应功能密切相关。构建了 ICM
lncRNA 相关的 ceRNA 调控网络,包含 26 个mRNA、2个lncRNA 和15 个miRNA 。结论 · 采
用生物信息学方法能够有效分析 ICM 差异表达的基因,并成功构建了缺血性心肌病 ceRNA 调
控网络。
关键词:缺血性心肌病; 差异表达基因; 长链非编码 RNA; 生物信息学; 竞争性内源 RNA;
Bioinformatics analysis of differentially expressed genes in ischemic cardiomyopathy
ZHANG Peng CHANG Zheng-yan YANG Lei XUE Song LIAN Feng
Department of Cardiovascular Surgery, Renji Hospital, Shanghai Jiao Tong University School of
Medicine Department of Pathology, Shanghai Tenth People's Hospital of Tongji University
Abstract:Objective · To screen differentially expressed genes in ischemic cardiomyopathy (ICM)
by bioinformatics analysis and construct the regulatory network of competing endogenous RNA
(ceRNA) . Methods · Data sets were downloaded from Gene Expression Omnibus (GEO) database to
screen the differentially expressed mRNAs and lncRNAs between normal samples and ICM ones.
Then, GO (Gene Ontology) analysis and KEGG (Kyoto Encyclopedia of Genes and Genomes)
pathway analysis were performed. The differentially expressed mRNAs and lncRNAs were analyzed
to predict related miRNAs by bioinformatics methods, and then to construct ceRNA regulatory
network. Results · GO analysis and KEGG pathways analysis results showed that the differentially
expressed genes were enriched in the pathways such as metabolic pathway, oxidative phosphorylation,
and extracellular matrix receptor interaction, and they were closely related to the functions such as
endoplasmic reticulum stress, fibrosis, collagen catabolic process, and inflammatory response. A
ceRNA regulatory network containing 26 mRNAs, 2 lncRNAs and 15 miRNAs was constructed.
Conclusion · The bioinformatics method can be used to analyze the differentially expressed genes of
ICM, and the regulatory network of ceRNA of ICM has been successfully constructed.
缺血性心肌病(ischemic cardiomyopathy, ICM)是诱发心力衰竭的重要原因。根据美国国立卫
生研究院的数据[1,2],ICM 是由遗传和环境因素的相互作用引起的。目前,已有多项研究从不
同方面对 ICM 进行了探索。
长链非编码 RNA (long non-coding RNA, lncRNA)是一类长度大于 200 nt 的非编码 RNA,是所
有非编码转录本的重要组成部分[2]。lncRNA 参与机体多个重要的生物学过程[3],也与多个疾
病的发生相关[4]。最近研究[5]表明,lncRNA 在心血管疾病中发挥重要作用,包括缺血性心肌
病;且有研究[6]发现,lncRNA 能够扮演竞争性内源 RNA (competing endogenous RNA,
ceRNA)的角色,通过与 mRNA 竞争 miRNA 来调节 mRNA 的表达。本次研究从基因表达数据
库(Gene Expression Omnibus, GEO)中筛选出样本,通过生物信息学方法,分析 ICM 致病的
相关基因,并构建差异表达 lncRNA 相关的 ceRNA 调控网络,为 ICM 治疗探索潜在的靶点。
1 材料和方法
1.1 数据获取
表达谱数据来自美国国立生物技术信息中心(National Center for Biotechnology Information,
NCBI) GEO (http://www.ncbi.nlm.nih.gov/geo/)[7],使用数据集系列号为 GSE42955(物种:
Homo sapiens)。从中筛选 ICM 样本 12 “例,正常样本( Normal heart”) 5 例。所有样本均采用
GPL6244[HuGene-1_0-st]Affymetrix Human Gene 1.0 ST Array[transcript (gene) version]平台检
测。
1.2 数据预处理和 lncRNA 重注释
GEO 数据库下载得到 cel 格式基因表达谱数据,数据利用 R软件包 oligo[8]采用 RMA (robust
multiarray average)算法进行背景校正、标准化和汇总。运用芯片平台注释文件,进行重注
释。最终得到 lnc RNA 和m RNA 的探针集。通过探针号和 m RNA/lnc RNA (gene symbol)的
一一匹配,去除没有匹配到的探针;对于不同探针映射到同一基因,取不同探针的均值作为这
个m RNA/lnc RNA 最终的表达值。
1.3 差异 mRNA 和差异 lncRNA 筛选
运用 R语言包的 limma 包,采用经典贝叶斯方法,对 ICM 样本和正常样本进行 m RNA 和lnc
RNA 差异分析,所有 m RNA/lnc RNA 经过检验后得到相应的 P值,将 P<0.05 的m RNA/lnc
RNA 视为差异 m RNA/lnc RNA 。
1.4 差异表达 m RNA 的功能富集及通路分析
运用富集分析工具 DAVID (The Database for Annotation, Visualization and Integrated Discovery,
https://david-d.ncifcrf.gov/)[9]对上述差异 m RNA 进行生物学过程(GO:Gene Ontology,
http://geneontology.org/)[10]和通路(KEGG:Kyoto Encyclopedia of Genes and Genomes,
https://www.kegg.jp/)[11]分析。显着性阈值P<0.05 且富集个数(count)至少为3个的视为显
着富集结。
1.5 lncRNA 和m RNA 协同表达关系预测
运用一一匹配的 mRNA 和lncRNA 数据,计算每个差异 mRNA 和差异 lncRNA 的Pearson 相关
系数,并进行相关性检验,筛选 r>0.6 且P<0.05 的mRNA 和lncRNA 关系对,认为这些mRNA
与lncRNA 具有协同表达关系。
1.6 lncRNA 功能预测
对预测到的每个lncRNA 的靶基因,利用 R包clusterProfiler 进行 GO 生物学过程和 KEGG 通路
富集分析,通过富集分析结果来间接预测 lncRNA 的功能。采用 Benjamini-Hochberg 方法进行
P值矫正,校正后 P<0.05 且富集个数至少为5 个的视为显着富集结果。
1.7 miRNA 预测及 ceRNA 网络构建
对协同表达的差异 mRNA 使用 miRWalk2.0[12]工具,综合
miRWalk、miRanDa、miRDB、miRMap、RNA22、Targetscan 这6个数据库中的 miRNA 预测
结果,认为在 6个数据库的预测结果中均出现的 miRNA 为调控靶基因的 miRNA。对于与差异
mRNA 协同表达的 lncRNA,通过 2个工具进行靶向miRNA 预测:先利用 miRanDa (v3.3a)软
件,采用默认参数进行预测,筛选 Score≥140、Energy≤-20 的miRNA-lncRNA 关系对;再利用
在线数据库 starBase v2.0,预测得到 miRNA-lncRNA 关系对,取 2次预测结果的交集,作为最
终的 miRNA-lncRNA 关系对。综合差异 mRNA-miRNA 和差异 lncRNA-miRNA 关系对,首先筛
选受到同一个 miRNA 调控的 miRNA-lncRNA-mRNA 关系对,结合mRNA 与lncRNA 的共表达
关系(相关系数>0.6),进一步筛选 miRNA-lncRNA-mRNA 关系对,使用 Cytoscape 软件进行
网络构建,即ce RNA 网络。我们认为ceRNA 网络中受同一个 miRNA 调控的具有共表达关系
的lncRNA 和mRNA 互为 ceRNA 。
2 结果
2.1 差异表达基因的基本信息统计
运用芯片平台注释文件共注释了 18 392 个mRNA 和1 384 个lncRNA,使用 limma 包对 ICM 样
本和正常样本分别进行 mRNA 和lncRNA 差异分析,结果如表1所示。基于筛选得到的差异
摘要:
展开>>
收起<<
缺血性心肌病致病基因的生物信息学探究 摘要:目的·应用生物信息学方法探讨缺血性心肌病(ischemiccardiomyopathy,ICM)中差异表达的相关基因,构建竞争性内源RNA(competingendogenousRNA,ceRNA)调控网络。方法·从基因表达数据库中下载数据集,筛选出ICM样本与正常样本差异表达的mRNA和长链非编码RNA(lncRNA),并进行GO(GeneOntology)功能分析和KEGG(KyotoEncyclopediaofGenesandGenomes)通路分析。分析差异表达的mRNA和lncRNA,运用生物信息学方法进行miRNA预测分析,构建ceRNA...
相关推荐
-
中华人民共和国气象法
2024-12-30 57 -
中国气象局关于修改《气象行政许可实施办法》的决定
2024-12-30 53 -
中国气象局关于修改《气象行政处罚办法》的决定
2024-12-30 97 -
中国气象局关于修改《防雷减灾管理办法》的决定
2024-12-30 163 -
中国气象局关于废止部分部门规章的决定
2024-12-30 45 -
通用航空飞行管制条例
2024-12-30 78 -
施放气球管理办法
2024-12-30 115 -
人工影响天气管理条例
2024-12-30 48 -
气象资料共享管理办法
2024-12-30 45 -
气象专用技术装备使用许可管理办法
2024-12-30 70
作者:闻远设计
分类:社科文学类资料
价格:免费
属性:6 页
大小:20.15KB
格式:DOCX
时间:2024-04-20

