2019年度高等学校科学研究优秀成果奖(科学技术) 推荐项目公示


一、项目名称

microRNA 结构与功能的智能预测方法

二、推荐单位(专家)

北京建筑大学

三、项目简介

miRNA 是一类重要的小分子,可以调控基因的表达,与多种癌症相关,有望成为癌症制药新靶点。相关成果获得了2006 年的诺贝尔奖,引发了以计算机算法与软件为主要特征的生物信息学研究热潮。我们在miRNA 的生物信息学分析方面做了一系列基础性的重要工作,包括miRNA 的识别、miRNA 的靶标预测、以及miRNA 与疾病的关联分析,突破了多项计算预测瓶颈。这些计算分析工作为miRNA 的功能研究和应用起了奠基作用。

1.识别新miRNA 的难度是随着研究深入而增加的。目前挖掘miRNA 的方法存在假阳性高、无法跨物种应用的缺点。本项目发现是由于反例选取的质量不高导致预测模型泛化能力差,尽管在benchmark 数据中取得了较好的效果,但是应用于真实数据时假阳性高,导致后期生物实验确认时花销大。因此,团队提出了循环优化反例的方法,配合开发了新的miRNA 挖掘软件mirnaDetect

2.MicroRNA 的靶标识别存在预测精度差、训练数据不平衡的特点。针对该问题,申请人团队首次引入了深度学习方法对miRNA 的靶标进行预测,其中使用的卷积神经网络和分割训练集的策略提高了预测精度。

3.关于疾病miRNA 的预测,目前主要有两种思路,一种是对比正常组织和患病组织的表达差异,另一种是根据已有文献报道、疾病之间的相似性和miRNA 之间的相似性,利用网络传递进行推断。申请团队首先综合了两种方法,讨论了表达差异中统计检验方法的选择。对于网络推断的方法,申请人还分别提出了融合长非编码RNA 信息和随机游走策略,可以提高miRNA 与疾病关系预测的准确率。

4.RNA 结构分析方面,给出了表征茎区位置的RNA 二级结构表示方法;提出了植物miRNA前体分类和成熟体位置预测算法,结合miRNA 生源论,提取更多的序列和结构特征,解决了正反例样本不平衡问题,能够为生物学家发现新miRNA 提供高可靠的候选。

5.在进化关系分析方面,提出了迭代多对物种的进化树构建算法,速度较快;在进化网络研究方面,在多项式时间内,定义了扩充空间的度量;提出的进化网络构建算法降低了网络对数据输入顺序的敏感性。

依据本项目的方法学研究,后期合作者在大豆、家蚕、甲藻等生物中发现了多条新的miRNA 基因,相关成果被Nature 子刊引用。

 


四、代表性论文专著目录

序号

论文、专著

名称/刊名/作者

影响因子

年卷页码

():页码

发表年月

通讯作者/第一作者

SCI他引次数

他引总次数

是否国内完成

1

Improved and Promising Identification of Human MicroRNAs by Incorporating a High-quality Negative Set.IEEE/ACM Transactions on Computational Biology and Bioinformatics. Leyi Wei, Minghong Liao, Yue Gao, Rongrong Ji, Zengyou He, Quan Zou

2.428

2014, 11:192-201

2014-01

何增有,邹权/魏乐义

101


2

Survey of MapReduce Frame Operation in Bioinformatics.Briefings in Bioinformatics. Quan Zou, Xubin Li, Wenrui Jiang, Ziyu Lin, Guilin Li, Ke Chen

6.302

2014,15: 637-647

2014-04

邹权/邹权

113


3

Simple sequence-based kernels do not predict protein-protein interactions. Bioinformatics. Jiantao Yu, Maozu Guo,Needham, C. J., Yangchao Huang, Lu Cai,Westhead, D. R.

5.481

2010, 26: 2610-2614

2010-09

郭茂祖,David R. Westhead /于建涛

63


4

PlantMiRNAPred: efficient classification of real and pseudo plant pre-miRNAs. Bioinformatics. Ping Xuan,Maozu Guo,Xiaoyan Liu,Yangchao Huang,Wenbin Li, Yufei Huang

5.481

2011, 27: 1368-1376

2011-05

郭茂祖,黄宇飞/玄萍

47


5

HAlign: Fast multiple similar DNA/RNA sequence alignment based on the centre star strategy. Bioinformatics. Quan Zou, Qinghua Hu,Maozu Guo, Guohua Wang.

5.481

2015, 31: 2475-2481

2015-08

邹权,汪国华/邹权

77


6

Measuring gene functional similarity based on group-wise comparison of GO terms. Bioinformatics. Zhixia Teng, Maozu Guo, Xiaoyan Liu, Qiguo Dai, Chunyun Wang, Ping Xuan

5.481

2013, 29: 1424-1432

2013-06

郭茂祖/滕志霞

48


7

Inferring the soybean (Glycine max) microRNA functional network based on target gene network. Bioinformatics. Yungang Xu, MaozuGuo,Xiaoyan Liu, Chunyu Wang, Yang Liu

5.481

2014, 30: 94-103

2014-01

郭茂祖/徐云刚

20


8

Cross-Platform Identification of Anonymous Identical Users in Multiple Social Media Networks. IEEE Transactions on Knowledge and Data Engineering. Xiaoping Zhou, Xun Liang, Haiyan Zhang, Yuefeng Ma

2.775

2016,28:411-424

2016-02

周小平,梁循,张海燕,马跃峰/周小平

25



五、主要完成人情况表

姓名

排名

技术职称

工作单位

完成单位

对项目技术创造性贡献

曾获科技奖励情况

郭茂祖

1

教授

北京建筑大学

北京建筑大学

领导本项目的整体完成,是代表作3467 的通讯作者,是代表作5 的主要作者

邹权

2

教授

电子科技大学

北京建筑大学

microRNA 的数据收集、生物解释做出了贡献,是代表作125 的通讯作者

周小平

3

教授

北京建筑大学

北京建筑大学

为本项目的大数据和人工智能算法做出贡献,是代表作8 的第一作者

王春宇

4

教授

哈尔滨工业大学

哈尔滨工业大学

对本项目的系统实现和开发做出了贡献。是代表作6 7 的作者

刘扬

5

副教授

哈尔滨工业大学

哈尔滨工业大学

对本项目中提出的机器学习和智能算法做出了贡献,是代表作7 的作

汪国华

6

教授

哈尔滨工业大学

哈尔滨工业大学

对本项目中microRNA 的功能解析提供了建议,是代表作5 的通讯作者