
发现是什么?在数学领域,存在着一个古老的问题,即究竟该说发现了新的数学方法、还是发明了新的数学方法。同样的问题对于现代药物发现也同样适用。在使用人工智能来识别候选药物时,这些新的候选药物到底是被开发出来的,还是通过数学及科学方法在排查过滤之后自然遗留下来的?这些新的候选药物,究竟是被发现的、还是被设计的?这也许是种没有区别的区别。
2020年8月13日,保存在佛罗里达州好莱坞美国研究中心的生物科技公司Moderna COVID-19疫苗接种规程。
在本轮发现COVID-19疫苗的竞赛中,人类已经取得一系列进展,也由此产生了使用AI技术推动药物发现的新路径。例如,包括Benevolent AI在内的众多制药企业已经开始应用AI从现有药物中寻找候选药物。在治疗方面,Benevolent AI还公布了进入临床验证阶段的6种分子。除了发现新药之外,Innoplexus, Deargen, Gero, Cyclica, Healx, VantAI等公司也在利用AI技术为现有药物发现新的用途。Insilico Medicine、Exscientia、SRI International、Iktos等公司正在全面使用AI发明新药。世界各地的生物制药公司都在采用AI策略以整合药物发现过程。例如,Atomwise通过深度学习算法与弹性超级计算平台预测潜在药物,借此加快了小儿癌症的分子发现过程,借此缩短可行疗法的发现与开发周期。另外,MELLODY项目则是一套基于区块链的解决方案,旨在开发出一套机器学习平台,能够从药物发现流程中生成的数千种专用数据集开展学习。此项目一旦得到全面开发,研究人员将能够更轻松地确定哪些小分子对未来的研究最有帮助。而这一切,只是人们动用机器学习寻找新药物以及推动医药领域新一轮变革的几个侧面。既然算法完全有能力进行药物发现,我们不禁要问,“药物发现的真正含义是什么?”
结论就隐藏在我们的视线之下吗?
要回答这个问题,我们需要更深入地研究人工智能在药物发现及相关领域中的应用情况,以了解这种新兴技术的实际与商业意义。人工智能在药物发现层面确实有着广泛应用,研究实验室基于这些技术的早期工作成果,将其转化为商业阶段,并据此探索药物开发与可学习算法之间的交集。在此过程中,英伟达公司甚至也参与其中。二者对接的重要载体之一就是计算,即在计算机中“测试”多种分子组合。另一种方法则是从潜在信息中发现洞见,这种方式在药物发现之外的领域已经比较普遍。大数据分析发展出一整套令人兴奋的新技术,能够从现有数据中提取新的洞见。例如,《自然》杂志近期提出的一种方法,就能够评估大型研究论文集中所提及的不同材料及其化学性质之间的关系。在加州大学伯克利分校以及劳伦斯伯克利国家实验室的研究当中,研究人员不再直接查看这些材料的分子数据,而是直接使用无监督学习总结其中的材料学知识,借此发现与功能需求相匹配的材料选择。在新药发现方面,这种新知识就隐藏在视线之下的思路其实非常有趣。2017年,东京中央大学的一位研究人员在《自然》杂志上发表了另一项引人注目的技术,其确定了能够与基因及药物相互作用且显著重叠的一组基因与化合物。使用此项技术,研究人员最终确定了两种有希望的治疗靶标基因,并将其蛋白质产物确定为颇具希望的肝硬化候选药物(一种常见疾病,但却几乎没有好的治疗方法)。
Big Data大数据
根据德勤最近发布的一份报告,药物发现领域的人工智能应用案例确实可以加快药物发现周期并降低药物发现成本。以往,从药物研发阶段到临床前测试阶段,整个周期往往需要五到六年。而再到实际上市则平均需要十到二十年时间,且每种药物的发现及生产成本约为20亿美元。但根据德勤公司的说法,在将新药投放市场之后,预期的投资回报率还不足2%。如果能够将药物发现的自动化程度提高,则制药行业将拥有更加丰厚的利润空间,从而降低新药的上市成本。人工智能无疑是最具前景的新药早期开发解决方案。根据德勤的报告,人工智能解决方案可以显著缩短药物发现阶段的时间需求,将从研发到临床前阶段的周期降低至以往的十五分之一。这类项目需要挖掘大量数据,而且必然涉及大量微调,因此整个过程表现得更像是科学与发现——而非工程与设计。但也许真相实际上处于这两者之间。
发现还是设计?
软件要在人类基因组计划等大规模项目中得到广泛采用,企业全面使用AI技术进行药物发现与研究,甚至说整体药物发现流程都开始由AI软件来驱动,这一切的实现时间可能并不太遥远——大约是在2030年左右。届时,从筛查到临床前测试的周期将大大缩短,而能够治疗极端特定病理的新药也将不再是“罕见的恩赐”。
那么让我们回到主题——人工智能方法究竟是在真正发现新药,还是通过优化流程进行设计?也许答案应该是发现,而非设计。毕竟使用人工智能来发现药物本身就是在“拼运气”,虽然方法本身一直在不断优化,但要想获得“正确”的解决方案仍然需要上佳的运气。这就像不断从工具箱里掏出螺丝起子进行尝试,直到发现一只能够与螺丝对得上。这很有效,但仍然跟发明前所未有的新螺丝起子不是一码事。接下来,我们再问个问题:这是发明还是发现?可以看到,产生新的候选药物的机器模型内部仍然在从数据中学习、做出优化并选择适合的模式。所以,答案仍然是发现。但无论如何,这是个刚刚起步的领域,前景一片大好。我们期待着AI的力量在医药领域得以全面展现!
好文章,需要你的鼓励
Adobe研究院与UCLA合作开发的Sparse-LaViDa技术通过创新的"稀疏表示"方法,成功将AI图像生成速度提升一倍。该技术巧妙地让AI只处理必要的图像区域,使用特殊"寄存器令牌"管理其余部分,在文本到图像生成、图像编辑和数学推理等任务中实现显著加速,同时完全保持了输出质量。
香港科技大学团队开发出A4-Agent智能系统,无需训练即可让AI理解物品的可操作性。该系统通过"想象-思考-定位"三步法模仿人类认知过程,在多个测试中超越了需要专门训练的传统方法。这项技术为智能机器人发展提供了新思路,使其能够像人类一样举一反三地处理未见过的新物品和任务。
韩国KAIST开发的Vector Prism系统通过多视角观察和统计推理,解决了AI无法理解SVG图形语义结构的难题。该系统能将用户的自然语言描述自动转换为精美的矢量动画,生成的动画文件比传统视频小54倍,在多项评估中超越顶级竞争对手,为数字创意产业带来重大突破。
华为诺亚方舟实验室提出VersatileFFN创新架构,通过模仿人类双重思维模式,设计了宽度和深度两条并行通道,在不增加参数的情况下显著提升大语言模型性能。该方法将单一神经网络分割为虚拟专家并支持循环计算,实现了参数重用和自适应计算分配,为解决AI模型内存成本高、部署难的问题提供了全新思路。