NucleicAcidsResearch陈润生—何顺民—曾筱茜合作发布piRBasexooo
近日,四川大学华西医院生物医学大数据中心陈润生院士工作站团队、曾筱茜副教授团队和中国科学院生物物理研究所健康大数据研究中心何顺民研究员团队共同在Nucleic Acids Research杂志上,发表文章piRBase: integrating piRNA annotation in all aspects。研究团队从多个方面对piRNA数据资源进行了整合分析和注释,为piRNA的功能研究提供了重要支撑。
piRNA (PIWI-interacting RNAs) 是一类主要在生殖细胞中表达并与PIWI蛋白结合的非编码小RNA。piRNA的发现为非编码小RNA的研究开辟了一个新领域,因其数量众多,一经发现就引起了众多科研人员的广泛关注,并被Science评为2006年十大科技进展之一。已有研究发现,piRNA在抑制转座子转录和基因转录后调控中扮演重要角色,此外在生殖干细胞分化、胚胎发育、维持基因组完整性、表观遗传学调控、异染色质的形成和物种的性别决定等方面也起着重要作用,并且越来越多的研究表明在癌症组织中piRNA的表达发生异常。
piRBase是一个整合了不同类型piRNA数据及其相关信息的数据资源平台,主要用于更有效地解读海量piRNA数据来辅助其功能的研究。piRBase数据资源平台是国际RNA联盟RNAcentral收录的piRNA领域唯一的专业数据资源库,并于2020年被评为2020年度中国科学院信息化应用优秀案例。本次更新,内容方面除了对piRBase第二版涉及到的相关内容进行扩充外,还增加了新的内容模块,进一步扩展了piRNA的注释维度,为piRNA引发的功能异常提供更多候选解读。piRBase数据资源平台现收录非冗余piRNA序列1.8亿多条,覆盖了44个物种的440个数据集,是目前数据量最大的piRNA数据资源库。在已有内容模块中增加了可变剪切piRNA注释、piRNA表达谱注释、更多疾病中piRNA表达情况等内容,旨在从更多方面推动piRNA功能相关的研究。由于获得piRNA的方法众多,且piRNA种类多达千万,为了获得更有代表性的piRNA集合,本次更新中根据piRNA的特征引入了piRNA黄金集合概念,以期帮助用户能更有效的研究piRNA。此外,最新版piRBase中还收集整理了高质量的piRNA簇(piRNA cluster)相关的信息和piRNA序列位点变异信息为不同层次piRNA的研究提供数据基础。
图:piRBase v3.0 版中piRNA 数据的统计。
除了对信息内容方面的更新扩充,本次更新对网站也进行了全面升级。
第一, 对piRBase数据资源平台 的界面进行了重新设计,为用户提供更好的体验 。
第二, 在网站首页提供搜索功能,用户可以根据需求输入piRBase ID查询piRBase收集的相关信息。
第三,对piRNA的调控网络进行了可视化,使piRNA与靶基因间的调控关系更加直观。
第四,对在线工具进行了优化,ID转换工具支持多数据库来源piRNA ID转换成piRBase ID以实现数据的标准化、规范化。
piRBase数据资源平台相关数据信息可以通过http://bigdata.ibp.ac.cn/piRBase进行访问、浏览、搜索和下载。
综上,piRBase数据资源平台为piRNA功能的研究提供了重要的支撑,必将为piRNA领域的发展做出有价值的贡献。
四川大学华西医院生物医学大数据中心陈润生院士、曾筱茜副教授和中国科学院生物物理研究所健康大数据研究中心何顺民研究员为本文共同通讯作者。四川大学华西医院和中国科学院大学联合培养的王佳佳博士研究生、中国科学院生物物理所的史忆戎硕士研究生、周红红副研究员为本文并列第一作者。四川大学华西医院生物医学大数据中心的赵屹教授也参与指导了该项工作。该文章获得国家自然科学基金、中国科学院战略性先导专项、四川大学华西医院1·3·5交叉学科创新工程等项目资助。