没有数据AI怎么学习?这是一个痛点。
论坛嘉宾
靳照宇 | 明济生物创始人兼首席执行官
孙沛琪 | 硅康医药创始人
我们都知道,从认识疾病到发现可用药的靶点/机制、发现并优化药物、临床前研究、临床实验,再到最后上市后用药跟踪研究和扩大适应症,其实要经历多个环节和一个非常长的周期。
这其中的每一个环节都可以用到计算,人工智能辅助的计算可以帮助我们在整个研发过程中达到提效提速,降低成本和提高成功率,这是目前能够做到也是正在发生的事,但后续如何更加集成化、工业化是关键。
目前,我们对疾病的认知、靶点、机制的发现还存在瓶颈,相信未来随着人工智能、大数据和知识图谱不断的技术革新可以解决这些痛点,尤其是知识图谱的建立。
我们原先怎么去发现新的靶点和新的机制?除了原始的发现工作,还有很多是基于假设的验证工作;提出假设通常是基于已知去构建一个逻辑,做知识链接。
在海量的知识点中,如何全面的寻找和评价决定性的关系和链接,如何建立相互作用,或者是推测关键待发现的知识点?从这个角度来看,人为学习的效率显然是很低的,也不能够放大。
而AI从底层上来讲,如果它做到了整个知识图谱逻辑性的建立,它去搜寻答案的时候肯定比人为要强很多,毕竟它可以搜寻地更全面和深入,并且这个能力可持续跟踪以及放大。
清华大学药学院院长
全球健康药物研发中心(GHDDI)主任 丁胜
靳照宇:药物开发的各阶段中,前期的基于疾病机理的靶点发现、生物标志物的发现、后期的临床试验设计、疗效预测,现在都还还基本处于数据收集分析,或者说大数据的时代。
因为缺乏足够的经过验证的结果,以及相对应前期相对应的关联数据,所以深度学习在缺乏足够的数据和前期的成功的经过验证的逻辑关系等限制条件下,还需要更多试验数据和人本身认知的进步才有机会逐渐成熟。
但AI在某些临床实践中,诸如病理分析判断等环节上应用的比较成功,也是因为积累了足够多的数据和病理医生的实践经验。但是从药物开发的临床设计和试验数据收集环节来看,AI还没到那个真正能突破的阶段。我相信未来随着更多的临床数据、大数据共享的普及,AI算法确实能够脱颖而出。
就目前来看,人工智能在药物设计上,尤其是小分子,甚至大分子药物设计上是有一些机会的。蛋白药物开发也有一些机会,比如前一段时间AlphaFold出来之后,有可能为蛋白序列、结构、蛋白质间的相互作用的研究提供了海量数据,随着它们相关内在逻辑的理解逐渐深入,就为AI驱动的深度学习提供了机会,有可能真正实现突破。
孙沛琪:各位目前的研究方向是什么?
硅康医药创始人 孙沛琪
丁胜:清华药学院的每一个实验室都在研究不同的疾病、机制,或开发新的技术。我想从人工智能的角度来聊聊早期药物研发的需求。现在一个主流的方向就是通过human genetics(人类遗传学)把每一个人的各种分子(例如基因突变,表达)、细胞、组织变化,包括健康人群、患者人群,进行更深入的分析,建立疾病发生和发展的原因,寻找机制的相互作用轨迹。
国内外在做大型的队列研究,就是从健康人群和患者人群做大规模的组学研究(甚至精准到单细胞),建立疾病causal(因果)相关性,这都会对未来大数据、人工智能的应用产生非常多的突破性可能。
靳照宇:从靶点选择验证角度,我们现在比较关注生命组学及从临床到基础研究的转化医学,以前的模式是从分子机制,到动物模型,再到临床应用的转化医学模式,现在一个值得关注的点是从临床的科学研究指导基础研究及药物开发的方向。
比如大家都在通过临床病人大量的单分子测序,还有蛋白组学测序需求疾病发病机制及治疗的突破点,这是特别好的研究方向。
无论基因组学,还是蛋白组学数据的解读,目前都还在依靠数据科学家的分析,仅靠人力很快就会碰到瓶颈,而AI如果可以帮助我们突破瓶颈,将会给我们的药物开发带来很大的好处。
比如,利用AI对现有的海量数据进行分析,找到肿瘤免疫微环境里的主要矛盾。从而一定程度上帮助科学家找到最具潜力的靶点或靶点组合来逆转疾病的进程,这其中如果AI能够起到助力的话,对于未来靶点的发现会有很好的帮助。
明济生物创始人兼首席执行官 靳照宇
刘晓林:我们是做传统抗体药的,目前我们还没有发现仅靠一个单药就能真正的治好癌症。现在多数做双抗多抗的,只是把几个功能药放在一起而已。我希望能有一套AI系统可以真正分析出来,哪些药放在一起才能真正有效。这个靠人工分析很难,AI或许能起到非常大的作用。
邬征:我们公司是做呼吸道和肺部疾病新药研发的,在做的过程中实际上会发现很多问题,包括口服药吃进去之后,有多少药能够到达肺部?而且不光是到肺部,还要到呼吸道表面药物才会起作用。所以在这种情况下,AI可以帮助我们采集更多的数据,比如什么样的分子能抵达肺部并产生作用。
、
爱科百发创始人兼首席执行官 邬征
孙沛琪:在各位所关注的领域或疾病中,应该如何去选择对应AI有效的靶点?
丁胜:我想这可能是做新药领域最难的一个问题。因为说白了,选择靶点或者选择机制,相当于你选定了一个方向,方向如果错了,后面哪怕效率再高也都是无用功。这也是为什么创新药领域一直以来整体速度和成功率偏低的原因——起点错了。
疾病到底是由于什么原因导致的,从一个角度上看,大致上有两种可能:一种是,假设疾病有唯一或者单一主要因素导致,那我们怎么才能有效准确的找到这个主因?
现在工业界的重要做法是在人体上做发现,这样不存在动物和人以及体外实验(in vitro)和体内实验(in vivo)的区别,寻找病因相应的靶点机制是核心;另一种情况是,很多疾病不一定有唯一或者主要的靶点,需要组合性疗法才能体现主要的疾病改变,组合性疗法怎么去寻找?包括未来怎么组合性做临床实验?这一块大数据会带来很多新的机遇。
靳照宇:AI能为靶点研究提供很多帮助和助力,但我想提醒大家,AI是算法,算力和数据。前期从疾病机制和分子角度来讲,通过AI能够提供一定的帮助,但很难得到最终确定的数据。AI肯定会有帮助,但是在靶点选择上,眼下还是要靠科学家对机理机制对靶点的理解。
刘晓林:如果是单个靶点判断,AI不一定能比人强,但是一个不能忽视的问题是,很多疾病多数情况下不是由一个靶点造成的,可能很多个,所以在这种情况下,AI的优势就凸显出来了。
普米斯生物创始人、董事长兼首席执行官 刘晓林
邬征:一个好的靶点需要在四个层面上跟疾病有相关性,蛋白质或者酶跟疾病要有相关性、细胞水平也要有相关性,再上一步是在动物模型上要有相关性,最后一步要在临床上有相关性。只有这四层都建立了相关性,我们说这个靶点才能真正有效。
孙沛琪:在医疗领域里,AI技术最受限的地方是什么?
丁胜:最大的限制还是认知的局限和数据的质量。突破认知局限是更有挑战的,高质量的数据是可以通过聚焦的投入去生成。
靳照宇:大的限制还是人们对AI应用的理解。首先人需要理解规则,输入输出端一定的内在逻辑联系,才能创造出好的AI应用。就像下棋,要打很多经典的棋谱才能做出AlphaGo。
目前医疗领域前期的开发和后期的临床数据解读,都还不完善。但是在小分子和大分子结构及性质的数据上已经有了一定的积累,对分子序列,结构与一些分子特征,比如:亲和力,成药性等之间相互如何关联的,有了一定的认识所以我始终认为这一块AI应用大有可为。
刘晓林:我认为AI算法算力会有偏差。首先,大公司很难释放临床数据,除非是和你有合作的项目,所以AI只是用现有的数据进行测算,这个数据大小和量会有限制。
邬征:数据样本少实际上是AI做新药研发的痛点。我们做临床并没有太多的数据,做临床一期也就是60位病人,二期200位病人,数据是非常有限的。怎么用有限的数据得到正确答案,这是比较困难的事情。没有数据AI怎么学习?这是一个痛点。
主编|赵清
排版|Mia
不感兴趣
看过了
取消
人点赞
人收藏
打赏
不感兴趣
看过了
取消
打赏金额
认可我就打赏我~
1元 5元 10元 20元 50元 其它打赏作者
认可我就打赏我~
扫描二维码
立即打赏给Ta吧!
温馨提示:仅支持微信支付!