专访燧坤智能CEO曾亥年:AI能否重塑新药研发流程?

2021
09/29

+
分享
评论
亿欧健谈
A-
A+

导语


 

曾亥年认为,要想让创新药物研发变得更高效,一定不是单纯的大力出奇迹,团队必须要对生物医药的本质有深刻认知。


 


文丨肖伞伞

编辑丨刘聪

“作为一家AI公司,如果不明白生物医药到底在做什么,也就只能人云亦云,从而陷入无尽的同质化竞争。那么,企业的竞争壁垒在哪里?”在AI制药的热潮中,燧坤智能CEO曾亥年点出了企业发展的“冷思考”。他向亿欧大健康解释道,要想让生物医药的研发变得更高效,一定不是单纯的大力出奇迹,企业一定要理解生物医药的核心本质,才能做出真正有价值的东西。

在曾亥年的履历里,有一大串堪称亮眼的名单:毕业于复旦大学生命科学学院,是约翰霍普金斯大学生物科学法规监管/药事管理硕士,北卡罗来纳州立大学植物生学物硕士,以及执业药师,国药控股BD和平安创投投资总监。

于平安担任创投投资总监时,曾年参与投资和管理的项目包括Tmunity、NextCure、华领、KBP、XGENE、Rani、Prenetics等超过十个项目,涉及多个技术和治疗领域。独特的从业经历,使他历练成为一个具备生物医药研发、管理、投资经验的复合型人才。

与光鲜履历相辅是谦逊而幽默的处事风格。初秋略有凉意的北京,他会贴心询问来访者是否需要热水,以一两句家常迅速拉开话题。在讲述晦涩难懂的学术知识时,会以生动的比喻引发听者思考。在可以望见苍苍西山的会议室中,他娓娓道来了中国AI制药风云际会的这几年。

2018年,香港科创板引入港股18A规则,对未盈利的生物药企开大闸,中国生物医药资本市场东风循声而来。随着国内医药创新需求加速,License in的研发模式一度盛行,大量生物医药公司因此顺利获得融资。传统药物研发的困难有目共睹,加之周期长、同质化竞争激烈,如何用新工具突围成了曾亥年的思考。

同年电影《我不是药神》上映,直接映射出创新药的价格高昂与患者无力购买的困境。他在此后的多个场合里提到这部电影,阐述他的愿景——让药神被AI取代。

随后一年,AI制药赛道的研发企业已经初露头角。曾亥年在做了大量调研之后,将赛道入局者粗略分为三类:第一类公司是创始人的教育背景为物理学或计算机科学,这些公司的切入点多为CADD、计算化学或者量子力学;第二类公司是从早先的CADD延伸到AI的CRO企业;第三类公司则是由高校和科研院所的老师所创建。

“如果我真的想自己创业,或者做一些研发的工作也好,我应该去创造药物资产”。在36岁那年,曾亥年遇到燧坤智能创始人曾坚阳。两人一拍即合,曾亥年毅然决然选择加入燧坤智能。

曾坚阳是清华大学交叉信息研究院教授,他带领研究组聚焦生物医药领域的重要科学问题分子间识别模式,利用人工智能开发相应的新型深度学习模型。“他颠覆了我对一个计算机科学教授的印象,他懂生物学、化学,还懂医学,我后来才知道他是清华三个学院的博导。”曾亥年感叹道。二人躬身入局,用AI改变药物研发流程。

燧坤智能成立于2018年9月,在图灵人工智能研究院帮助下孵化,是一家利用人工智能算法发掘疾病作用靶点、发现已知药物新适应症、提升first-in-class及fast follow新药筛选效率、类药性成药性预测、MHC表位预测、RNA优化、提高大分子产量等的AI+创新生物医药研发平台公司。

01

从CADD到AI,新药发现需要什么样的工具?

 

“我更看好的是AI,而非CADD。所以我一定要选个以机器学习见长的公司,而不是以CADD或物理学为主。”曾亥年说出加入燧坤的初衷,一定程度上来讲,AI与CADD相比,能解决CADD解决不了的一些问题。

CADD以物理学和计算化学为基础,通过模拟来预测和计算配体与受体之间的作用特点,从而进行先导化合物的发现和优化。自1894年“锁钥模型”首次被提出,CADD逐渐为大众所熟知。三十年时间,CADD发展到现在已有很大突破和飞跃,但曾亥年认为其没有达到当时整个行业对它的预期,“CADD第二个D是design,不是discovery,是computer aided drug design。”

他解释道,通量整体较高、每一个工具和流程目标比较明确的CADD,即使底层有物理化学规则支持,也难以解决生物化学的问题。目前CADD多用于药物小分子和靶点的互相作用或者蛋白质跟蛋白质的互相作用中,主要应用于已有苗头化合物后的分子设计及优化,即先导化合物及其优化从而获得候选化合物。

“要知道,生物化学分子之间的交互作用不是单纯的一个分子和另一个分子的互相作用,而是分子和无数个分子的相互作用以及分子作用完之后的变化。在庞大且繁复的体内生物学过程和反应中,CADD力不从心。”曾亥年介绍,在数据充足的情况下,AI可以应用于生物医药全链条——从早期药物靶点发现,高通量筛选、预测药物结构与活性的关系、药物设计一直到最后的临床数据真实世界研究。

曾亥年还指出,AI和CADD在迭代优化方面也有关键差异。AI可以随着计算数据量不断提高,甚至这些数据不需要同一个靶点,只要随着数据不断增加,模型精度就会得到不断提升,一定程度上避免了化合物设计过程中的试错路径。而CADD基于物理推导,可以不受靶点类别限制。

此外,AI与生物信息学分析亦有所区别。他认为,生物信息学分析是基于既有规则和已知信息,利用软件分析做劳动密集型的注释,从而找到药物标志物。但是哪些新标志物是真正意义上有贡献的要素,生物技术学家并不知道。而机器学习可以通过建模,对数据进行提取和学习,找出研发中关键要素,并计算权重。

“如果大家在药企待过,其实也知道做CADD的人其实往往依附于药化部门、生信部门或者数据科学部门,这很尴尬。”曾亥年一语道出CADD目前的窘境,尽管其已经广泛使用,但并未被视为药物发现过程的核心部门。可预见的是,在CADD和AI深度融合之后,随着IT+BT整个发展方向和趋势,两个技术结合会带来更好的东西。

在AI领域,开源同样是算法迭代与创新的主要驱动力。但是目前的人工智能算法即便开源化,也难以在制药领域里做大范围的应用。“开源的算法更像是一个加密的武功秘籍,他只给了你这本秘籍却没有给你密码。所以,你拿到了武功秘籍还要苦苦琢磨,但没办法100%完全复原这个功夫。”曾亥年目光炯炯地望着,仿若一瞬间回到刀光剑影的武侠江湖。

02

让AI代替药神


与江湖一样,燧坤智能也有自己的独门剑法,那就是算法。

自融资伊始,燧坤智能将众多算法模块进行了集约化整合,形成了Silexon®AI4D™和AI4Pat™两大技术平台赋能first-in-class和best-in-class创新药研发,目前在北京、上海、南京均设有办公室及实验室。据了解,AI4D™平台不仅能够针对靶点的定向分子进行生成与筛选,还能对分子的类药性及成药性进一步预测,从而聚焦真正的药物分子,对缩减药物研发的后期投入、提高临床及上市成功率提供助力。

得益于团队优秀的人工智能与生命科学、化学、药学及医学的交叉学科背景,公司的核心技术研发团队不仅在国际顶级期刊中发表数十篇高引用文章,拥有软件著作权及模型专利14项,撰写及递交5项NCE系列专利,AI模型全覆盖。

曾亥年透露,成立三年来,燧坤智能已经成功与约 20 家合作伙伴达成共同开发协议,包括但不限于跨国公司、上市制药公司、生物技术公司和监管机构,一些国外大型制药公司也在积极与燧坤智能接洽当中。深厚的技术积累,也促使燧坤与两家全球领先的 CRO(即保诺-桑迪亚和维亚生物)在 AI 建模以及共同提升彼此能力方面建立战略合作关系。

能取得这些进展,这受益于创始人曾坚阳在从头开发算法模型方面的深厚积累。“燧坤智能的算法模型是原创性的。”曾亥年介绍道,从0-1开发算法模型的能力非常重要。如果企业没有开发代码能力,拿到了没有具体参数的裸代码,在没有再做二次预训练的情况下,这个代码的表现会非常糟糕。“就像是我给了你一个菜谱,但是把菜谱上面的用量全删掉,你能按照这样的菜谱复原出米其林大厨的菜吗?”即使拿到了开源代码,在他看来,学术文章的代码和商业代码是完全不一样的,通常开源的一般都是学术文章,它离商业应用场景还很远。

除却超强算法与原创性,生物学更是刻在燧坤智能骨子里的基因。曾亥年指出,燧坤这名字拆开来的意思就是机器与生命,他们关注生命科学,更是把新药研发作为生物医药问题。他提到,人工智能三个技术壁垒,包括数据、算法和算力。其中,数据和算法都需要交叉学科。

人工智能技术本身更像一个“黑箱”,其基于数据做的特征提取和模式识别很有可能不符合生物特征。一般而言,用于 AI 制药的深度神经网络通常含有输入层、隐含层和输出层三层结构。

一个令从业者困扰的问题是,数据输入层训练数据集有问题是常态,甚至有些公开数据集带隐藏标签。如何剔除不好的数据、对数据做合理的清洗与补足,这些都对操作人员提出了生物医药知识储备的要求。在输出层,亦需要操作人员是站在生物医药的角度去判断提取模式否符合生物学逻辑。“在输入层输出层中间,提取出embedding,观察其学习到的特征,有些可能具备生物学意义。此时,从某种程度上来说,model就变成了一个docking station,可外延拓展,也能单独做预测。”上述受访人士说道。

如何能够让生物学者跟机器学习的人真正的结合到一起来解决一个问题?在曾亥年看来,无他,就是反复沟通而已。让生物学家或是药物化学家互相了解对方的想法,明确解决问题的办法。如果团队不理解生物医药的核心本质,很难做出真正有意义有价值的工具,也很难能够获得传统生物医药从业人员的认可。

但是AI制药领域本身是一个极为复杂的交叉行业,相关人才也成为一行业的隐藏挑战。随着赛道“升温”,考验的是企业能否在人数不多的情况下找到突破点,与应用场景实际结合,做完测试有数据——反馈模型优化——再与运营场景结合。

曾亥年预设AI制药第一步是降本增效,第二步则重塑流程。在未来3-5年中,也许真的会有重塑药物开发流程的AI模型被开发出来。其愿景也在加速推进。就在前不久,燧坤智能宣布完成超亿元人民币A轮融资,下一步将进一步完善现有AI+创新生物医药研发平台的优化和部署,持续降本增效赋能内外部新药研发项目,并在更多应用场景打造高效的颠覆式的全新AI模型,重塑新药研发流程。

或许,在未来,让药神被AI取代,并不只是曾亥年和燧坤智能的愿景,而是一个正在发生的事实……

本文由“健康号”用户上传、授权发布,以上内容(含文字、图片、视频)不代表健康界立场。“健康号”系信息发布平台,仅提供信息存储服务,如有转载、侵权等任何问题,请联系健康界(jkh@hmkx.cn)处理。
关键词:
CADD,人工智能,CEO,AI,新药,分子,模型

人点赞

收藏

人收藏

打赏

打赏

我有话说

0条评论

0/500

评论字数超出限制

表情
评论

为你推荐

推荐课程


社群

精彩视频

您的申请提交成功

确定 取消
剩余5
×

打赏金额

认可我就打赏我~

1元 5元 10元 20元 50元 其它

打赏

打赏作者

认可我就打赏我~

×

扫描二维码

立即打赏给Ta吧!

温馨提示:仅支持微信支付!