智能技术与生物技术,正在碰撞中萌生出激情的火花。
2020年,全球人民都再盼星星盼月亮,盼着早日出现一支好疫苗。在这个过程中,AI前所未有地参与到基因测序、疫苗研发、生物医药等活动中来。而从英国变异病毒,到印度、南非等国出现变异毒株愈发严重,越来越多的人开始意识到,疫苗研发速度如果跟不上病毒变异的脚步,全球防疫成果会直接受影响。以此为契机,支撑高效研发的生物计算,也就各国重点关注并投入的科技赛道之一。
AI对生物科学的影响,也获得了学界的普遍认可与应用。在 “首届中国生物计算大会” 上,著名结构生物学家施一公就从生命科学的角度,提出计算决定未来。
那么,到底什么是生物计算,为什么说它会对国计民生至关重要?中国的生物计算发展究竟如何,未来又需要哪些产业要素?
一首智能计算与生物技术相结合的产业协奏曲,已经在神州大地奏响,今天我们就化身一群最先“闻弦歌而知雅意”的人。
邂逅的偶然与必然:AI给生物计算带来了什么?
简单来说,生物计算指的是以生物大分子作为“数据”的计算模型。智能计算与生物技术的邂逅,似乎是疫情推动下的偶然事件,但如果我们将目光放得更长远,从生物研发的历史进程出发,会发现二者的结合其实是一场必然。
有一个少有人知道的故事是,25年前,当时还在华尔街做程序员的李彦宏,就对生物信息倍感兴趣,还收到了默克公司一个Bioinformatics(生物信息学)研究小组的offer。但受限于当时的生物数据量、成本、速度,计算的优势很难发挥出来。
而随着时间的推移,基因组学研究带来了人体数据增长、新药研发过程当中积累的知识增长、各类机器学习算法的喷涌。这三个关键指标的变化,决定了当今的生物研发要考虑的不是该不该用AI的问题,而是用得上、用得好的问题。
具体来说,生物计算能够在三个领域里面释放价值:
1.新药研发。
对于病患来说,药物就是生命。但长期以来,创新药的研发普遍存在流程复杂、投入产出比低、传统方法昂贵、耗时长等问题。传统制药研发平均周期都要10年左右,在当下生命科学信息指数级增加的背景下,更使得药物研发的复杂度不断攀升。
这种情况下,依靠机器学习来识别新颖药物、分析药物结构等,能够快速且低成本地完成蛋白质结构预测、药物筛选、分子生成、ADMET预测等工作,从而大大提升新药发现的效率,缩短新药研发周期,直接降低研究成本。不仅能够更快更广泛地造福患者群体,而且能够以技术为引擎,推动中国医药产业加速拥抱创新药的发展机遇。
2.疫苗设计。
新冠疫苗的研发让大家被科普了mRNA疫苗的强大。由于可在人体自身内生产抗原蛋白,制备速度快、无感染风险,mRNA疫苗也被MIT Technology Review评选为2021年“全球十大突破性技术”之一。
但是,一个蛋白质所对应的mRNA序列有多种可能,随着序列长度的增加,mRNA序列数量也会指数级增长,要设计出最稳定、蛋白质表达水平最高的mRNA序列并不容易。其中,AI的加入就至关重要了。
比如百度在疫情期间相继开源的LinearRNA系列算法,就利用AI算法和AI算力,在十数分钟内就能够计算设计出理论上的mRNA序列,让缓慢高成本的疫苗设计流程大大加速。
3.精准医疗。
新兴生物技术带来越来越细颗粒度的数据,也使得精准药物设计、个性化临床诊疗及用药等成为可能。试想一下,未来医疗服务可以精细到针对个体开发出个性化的靶向药物,在疾病极早期就能够进行综合分析诊断和精准治疗,真正实现“上医治未病”的理想,毫无疑问会大大提升人们的健康生活质量。
而要达到这一愿景的前提,或许就要将每个人的基因信息都提取出来,并进行分析挖掘处理计算,从而让数据能够有效应用到诊断当中,提供更适配的药物选择和治疗方案。在这个过程中,利用AI算法读懂数据必不可少。
说到这里,大家想必能够理解,为什么智能技术在今天必须与生物技术相结合,共同奏响生物计算的时代奏鸣曲,开启全人类的健康新篇章。
在这个领域当中,我们也看到了一批具有技术实力和社会责任感的科技巨头们,扮演起了扛旗者的角色。比如谷歌DeepMind团队研发的 AlphaFold 2算法,就曾震惊世人;中国AI公司百度,也在过去几年里成立了生物实验室、推出LinearRNA系列算法等。
站在生物计算兴起的关键节点,百度是如何思考与行动的,无疑是一次深入了解中国生物计算探索的契机。