上海交大医学院方海团队自主开发蛋白结构域语义注解在线数据库--dcGO

2023
06/21

+
分享
评论
生物世界
A-
A+

dcGO数据库的在线网站集多种计算机编程语言的优势联合开发,支持快速、便捷的数据库内容检索,并提供在线分析功能与动态展示结果。

随着AI工具AlphaFold2的问世,已快速解析了约2亿个蛋白质的结构,几乎覆盖了地球上已知的蛋白质。现如今,蛋白结构解析已变得可行,但大多数可用的蛋白序列缺乏相应的生物学注解。相比于全长的蛋白,其结构域在语义注解方面所受关注却较少。

近日,上海交通大学医学院附属瑞金医院方海研究员课题组发表了题为:The dcGO domain-centric ontology database in 2023: new website and extended annotations for protein structural domains 的最新研究论文。

该论文刊登在分子生物学领域老牌期刊 Journal of Molecular Biology 的年度计算资源(Computational Resources)专刊。论文详细介绍了最新版本的“蛋白结构域语义注解在线数据库dcGO(2023年版)”。

77711687302566160

dcGO是一个基于关系数据库的蛋白结构语义注解在线数据库。它提供了对不同定义的蛋白结构域(包括SCOP超家族及家族,Pfam家族和InterPro家族)的注解功能,并且还包括了通路、转录调控因子、分子标志物、表型、疾病和药物等语义注释和分析功能。用户可以通过多样化的在线数据挖掘工作。

dcGO数据库的访问网址是:http://www.protdomainonto.pro/dcGO

蛋白结构域作为蛋白质的功能与进化单元,其语义注释dcGO资源可用于蛋白功能预测(详见“连续3次蛋白功能预测CAFA国际性竞赛成果,Nature Methods 2013; Genome Biology 2016 & 2019”【1、2、3】),甚至表型预测

作为首个蛋白结构域语义注解数据库,dcGO资源最初发表于 Nucleic Acids Research(2011 & 2013)以及 PLoS Computational Biology(2014),并已收录于维基百科全书条目。

dcGO(2023年版)收录了7种不同的语义注解,以Ontology(本体化知识)为代表,涵盖功能、通路、转录调控因子、分子标志物、表型、疾病和药物。如图1总结所示,每个框代表一类语义注解,颜色深浅表示注释总数,内部数字描述了其注解的蛋白结构域数目(即SCOP、Pfam和InterPro)。

94511687302566328

图1: dcGO数据库组成

dcGO数据库的在线网站集多种计算机编程语言的优势联合开发,支持快速、便捷的数据库内容检索,并提供在线分析功能与动态展示结果。如图2所示,dcGO在线网站主页包括以下内容:浏览本体化知识树状结构的注解信息和注释的蛋白结构域、基于结构域的本体化知识注解富集分析、数据库访问帮助文档说明以及分页面搜索功能。

3271687302566555

图2: dcGO在线数据库网站

转化医学国家重大科技基础设施(上海)瑞金基地——生信大数据平台方海研究员为论文通讯作者,包超慧博士后为论文第一作者。此外,剑桥大学MRC分子生物学实验室和帝国理工大学的路畅博士对该工作做出了重要贡献。剑桥大学MRC分子生物学实验室的Julian Gough教授提供了宝贵的意见和帮助,上海交通大学网络信息中心的林新华主任提供了强有力的技术支持。该工作得到了国家自然科学基金、国家及上海高层次人才项目、上海高水平地方高校创新团队等支持。

参考文献

1. A large-scale evaluation of computational protein function prediction. Nature Methods 2013. DOI: 10.1038/nmeth.2340

2. An expanded evaluation of protein function prediction methods shows an improvement in accuracy. Genome biology 2016. DOI: 10.1186/s13059-016-1037-6

3. The CAFA challenge reports improved protein function prediction and new functional annotations for hundreds of genes through experimental screens. Genome biology 2019. DOI: 10.1186/s13059-019-1835-8

不感兴趣

看过了

取消

本文由“健康号”用户上传、授权发布,以上内容(含文字、图片、视频)不代表健康界立场。“健康号”系信息发布平台,仅提供信息存储服务,如有转载、侵权等任何问题,请联系健康界(jkh@hmkx.cn)处理。
关键词:
dcGO,数据库,生物学,蛋白

人点赞

收藏

人收藏

打赏

打赏

不感兴趣

看过了

取消

我有话说

0条评论

0/500

评论字数超出限制

表情
评论

为你推荐

推荐课程


社群

  • “健康为民 体验提升”案例征集 加入
  • 第九季管理奖官方群 加入
  • 全院血糖管理交流群 加入
  • 医院运营管理官方群 加入
  • 手术室精益管理联盟 加入
  • 医院SPD创新管理交流群 加入

精彩视频

您的申请提交成功

确定 取消
×

打赏金额

认可我就打赏我~

1元 5元 10元 20元 50元 其它

打赏

打赏作者

认可我就打赏我~

×

扫描二维码

立即打赏给Ta吧!

温馨提示:仅支持微信支付!

已收到您的咨询诉求 我们会尽快联系您

添加微信客服 快速领取解决方案 您还可以去留言您想解决的问题
去留言
立即提交