2. 中科计算技术西部研究院
“计算”在医药健康领域的作用越来越重要。以经验为驱动的药物研发正逐渐向以“计算”为驱动的模式转变。通常来说,底座技术是为上层应用和服务提供可靠、灵活、安全的支撑性技术,是整个技术体系的基石。例如为各种软件和应用程序提供运行环境的操作系统,为软件开发提供简化和规范化方法的开发框架就是典型的底层技术。本文提到的底座技术是指在药物研发领域最为基础和关键的技术,它能够提供标准化、稳定性和效率,并通过技术堆栈的更新实现更高级别的创新。目前“计算技术”正在成为药物研发的新底座技术。随着对生命数据的解读日益完整和深入,系统性的范式变更即将发生。
一、数据驱动下医药领域的新变局随着信息技术和高端精密仪器的发展,人类已经有能力获得生命的全方位数据(大到人体系统状态,小到分子结构信息),用数据刻画生命活动成为可能,生命科学已经进入数字化时代。构造、理解和推理大型复杂系统的解释模型,挖掘大数据的深度关联,发现隐藏在大数据中的因果规律,从而构建一个能源源不断产生新见解的新科学体系。这是足以改变当前医药领域格局的重大时代机遇。
1. 中国医药健康需要变道超车的科技驱动力中美医药产业差距巨大。国内研究机构根据公开数据对中美两国医药行业进行了比较,中国医疗保健类上市公司数量是美国的1/3,市值是美国的1/10,人均医疗费用是美国的1/19 (见表1)。医疗保健市场总量与世界第一的中国人口数量不匹配,人均支出与人民对健康的追求不匹配。
![]() |
表 1 2019年中美医疗保健产业关键指标比较 |
中国医药产业升级需要突破多重压力。现代中国医药研发起步于仿制药,之后逐渐向“Me-too/better”转变。这两种方式都是跟随策略:跟随国际药企的靶点和机制、跟随临床适应症的选择,技术壁垒不高,也难以支撑差异化商业策略,市场集中度过低,企业间过度竞争,“微创新”进入了“低风险低收益”模式,造成了资源的巨大浪费。随着医疗保险的支付端改革,进一步倒逼药企加速向“高风险、高收益”的创新药模式(First-in-Class,FIC)发展,“创新不一定活,但不创新一定会死”已经成为行业共识。
以美欧日引领的药物创新的底层技术红利已经消退,中国医药产业难以从原有赛道取得突破。当前全球的药物研发投入和收益比已经拉到了一个难以为继的高度。德勤公司发布年度医药创新报告显示,2022年药物研发的平均预期投资回报率(ROI)首次降至1.2%[1],这是德勤公司从2010年起持续追踪全球大型药企研发投资回报率以来观察到的最低值。无独有偶,2012年美国学者杰克·斯坎内尔(Jack W. Scannell)观察到新药研发效率下降趋势一直没有发生改变,研发效率(即每10亿美元研发费用产出FDA批准新药的数量)自1950年后持续下降,速度是大约每9年下降一半,被称为药物研发的“反摩尔定律”[2]。
简而言之,如果中国药企按照经典技术路线做创新药会面临巨大挑战:10—20年的研发周期、26亿美元的资金投入、以及超过92%的失败率
药物研发流程包括四大环节:靶点发现、药物发现、临床前研究、临床试验。其中靶点发现是行业的珠穆朗玛峰,一个靶点甚至就代表一个产业。临床试验是药物的死亡之谷,现阶段临床试验环节占近80%的时间和费用,失败率超过90%。科学家一直致力于应用各类技术手段增加药物研发所有环节的确定性。其中以CADD (计算机辅助药物设计包括分子对接、分子动力学模拟)、AIDD (人工智能辅助药物设计)为代表的计算技术主要聚焦在分子发现和临床前研究的环节。目前这些算法已经成为药物研发的常规性辅助工具,同时算法还在快速迭代[4],最终实现药物分子发现按图索骥。
然而,CADD和AIDD并没有解决当前药物创新的核心挑战。在测算药物研发各环节的改进对整体研发效率影响的效果后发现,临床前阶段的药物筛选成本降低或提速带来的好处,远不及对临床试验失败率的改进(见图1)。长期从事药物研发的美国化学家德里克·洛(Derek Lowe)在此基础上进一步提出观点,解决问题的最好方法是挑选更好的靶点。只有从疾病出发寻找靶点、以靶点机制为指导进行药物适应症选择,才能从根本上提高药物创新效率、提高药物临床价值、实现药物差异化竞争。
![]() |
图 1 提高速度、降低失败率、降低成本对项目价值的影响 数据来源:Bender A, Isidro Cortés-Ciriano. Artificial intelligence in drug discovery: what is realistic, what are illusions? Part 1: Ways to make an impact, and why we are not there yet, https://doi.org/10.1016/j.drudis [2020-12-09]. |
计算医学提出的目标是用AI解决疾病和药物机理认知不清的系统性问题——利用超级计算,解读多组学跨尺度数据,专注于构建疾病模型、产生靶点机制、精准临床方案设计三个环节给行业赋能。历史上扛鼎的药物无一例外都是在靶点和适应症上有独到之处,以认知疾病为目标的计算医学构建了药物创新的底座技术。罗氏、诺华等关注研发的大型药企提出:新技术的目标是从根本上改变药物研发的传统方式,新方式将是以数据驱动的,走向精准医学(正确的时间、正确的剂量、为正确的患者提供正确的药物)[5]。人工智能开始触及药物研发的第一性原理问题,表明计算技术在药物研发中的地位从辅助工具正在向决策驱动工具转变。
3. 计算医学引领的研发变革“计算技术”与“医学数据”两大领域高速发展。医学作为基础学科,涉及众多长期尚未解释的基本理论问题,也面临大数据、创新技术、转化应用、个体化医疗和迈向精准医学等亟待解决的新挑战。医学研究在定量医学,系统医学和医学信息化的基础上,进入到大数据和精准化并行融合时代,对数学模型的依赖大幅提升,需要相关学科的密切交叉和高度融合才能取得实质进展。
生物医学大数据的规模和产生速度远远超出了普通规模计算机的处理能力,亟需超算助力科学家从多维、立体、融合的数据中摸索出规律,从而更精确地辅助疾病的诊断和治疗。过去单一零散的数据,只需要在普通服务器上用简单程序处理和统计就可以。现在为了解决复杂生物医学问题,需要更加智能的算法从多维海量的PB级(1 PB=106 GB)数据中挖掘生命规律和疾病机制。算法的复杂度和待处理的数据量远远超过了普通服务器所能处理的规模,亟需高性能的算力资源支撑,由此就产生了一门新型交叉学科——计算医学。
计算医学是一门面向高维海量生物医学大数据,致力于发展定量方法,通过应用数学,工程学和计算科学来智能化理解人类疾病机理的新兴学科,其功能是基于工业化的数据、智能化的算法、设施化的算力、公开化的知识以及生物医学技术体系为医学服务提供新洞见。
计算医学的四个维度特征:
一是以系统性思维为指导思想。计算医学利用复杂性系统科学的整体论作为思维方式,去理解生物分子、细胞、组织器官、种群等多个生物层级结构之间相互作用,从系统的角度去捕捉疾病发生的机理。
二是以数据密集型科学发现为范式。人类基因组计划的发起人之一、系统生物学创始人之一莱诺伊·胡德(Leroy Hood)为我们提供了一个理解生命特质的新视角:生命可被视为信息的载体。分子、影像、病理、表型、环境数据所共同构成的生物医学大数据成为了观测生命系统各个层级结构之间相互作用的宝贵数据资源。生命活动的规律绝大多数不能用形式化的数学语言描述,也难以用简单的指标进行表征,计算医学采用密集数据驱动的科学范式,挖掘隐藏于高维、高通量、多维融合的生物医学大数据中的新洞见。
三是以人工智能为方法。计算医学将生物医学领域的知识模型转换为数学模型,以生物医学大数据作为输入参数,以人工智能算法对模型进行迭代、训练,输出逼近于真实的生命系统结构与功能特征,从而理解疾病发生的本质。
四是以高性能计算为支撑。具备处理数据洪流的能力,满足数据存储、模型迭代的要求,甚至突破计算速度的限制是计算医学能否实现新科学发现的关键因素。计算医学以高性能计算为新一代计算基础设施,为新科学发现提供数据存储、计算精度和计算速度上的支撑。
二、计算医学的全球进展支持计算医学赋能行业的资源和工具基础已经就绪。
首先,数据生产已经达到工业化水平。医疗行业的信息化为深度数据挖掘提供了基础。生物医学领域的文章已累积达到4000万篇,并仍以每年百万篇的数量在增长。随着高通量生命观测技术的快速发展以及医疗信息化水平的不断提高,生物医学数据已经从PB量级的基因组时代进入到EB量级多组学数据融合的时代。其次,计算技术足够成熟。算力是最快的生产工具,70年提升近4亿倍。用计算技术解读数据、刻画生命活动,正在加速改变整个医疗领域。“医疗数据化”和“计算技术进步”两种因素叠加并相互促进,不断推进产生新的学科知识和应用场景。
在此背景下,计算医学全球在行动。主要国家和地区出现了国家级的政策引导,国家级的项目部署。美国食品药品监督管理局(Food and Drug Administration,FDA)、国立卫生研究院(National Institutes of Health,NIH)、国防部高等研究计划署(Defense Advanced Research Project,DARPA)都在深度布局。大型国际药企(辉瑞、赛诺菲等)与新锐人工智能企业携手试点计算医学技术工具融入药物研发流程中,提供决策依据。
1. 欧盟:部署计算医学的顶层路线图与协同网络欧盟是部署计算医学系统性运作机制相对最早的地区,期望为计算医学成为促进药物研发的关键技术、关键创新要素提供战略性、系统性指引与保障。
第一,出台阿维森纳路线图,为欧盟利用计算医学相关技术促进药物创新提供了面向未来十年的战略性、前瞻性地规划指引。
早在2013年,欧盟委员会下属的通信网络、内容和技术总司(DG Connect)牵头,启动了计算机临床试验路线图——阿维森纳行动规划工作[6],目的是制定计算机临床试验的研究和技术发展路线图,确定需要解决的研究和技术发展挑战,以确保更广泛,更有效地采用计算机模拟临床试验。该路线图系统性阐明利用计算机模拟临床试验面临的包括基础设施建设、政策法规、文化认知、技术等全方位驱动因素和障碍清单,提出了共计36条建议行动。
第二,以阿维森纳联盟为抓手,促进阿维森纳路线图落地。
欧盟于2016年通过“欧洲地平线计划”资助成立了阿维森纳联盟。阿维森纳联盟倡导计算机建模和模拟技术的监管和部署,旨在补充传统方法(细胞实验、动物实验、临床试验),为患者提供更快、更安全、更实惠的医疗保健产品。
组织成员从机构性质上覆盖了监管机构、学术界、工业界。阿维森纳联盟不仅为各方对话创造空间,而且将提倡、推进计算机模拟方法和计算机模拟临床试验相关的项目基金支持、创新监管政策,推进数字化证据纳入监管审评标准等作为重点工作事项。
2. 美国:构建复杂多尺度疾病的计算医学技术平台2017年,美国能源部(United States Department of Energy,DOE)和美国国家癌症研究所(National Cancer Institute,NCI)提出癌症计算解决方案的联合设计(Joint Design of Advanced Computing Solutions for Cancer,JDACS4C)[7],推动百亿亿级计算的深度学习在肿瘤新药研发与肿瘤精准医学方面的应用。该项目以高性能计算(HPC)、深度学习和大数据分析等计算技术,结合肿瘤学、遗传学、基因组学等生命科学学科,以及生物医药大数据:利用不断增长的癌症相关数据量和多样性来发现未被了解的肿瘤疾病的生物学机制,特别是耐药性机制;建立肿瘤药物发现模型与药物响应预测模型;并最终为患者提供有效治疗方案的决策支持。
从2020年起,在上述JDACS4C计划(见图2)的支持下,美国NCI、DOE等部门陆续启动跨学科合作项目,利用人工智能、智能超算等先进计算技术探索癌症患者数字孪生的开发和实施,模拟疾病进展、治疗干预和结果。
![]() |
图 2 JDACS4C项目示意图 |
中国医疗资源丰富,计算医学所需要的数据体系完备。医疗信息化程度高、测序服务能力强,华大公司和诺禾致源公司的测序服务遍及全球,与此同时,全国建立多个超算中心,算力设施化已成定局。国家工业和信息化部、国家发展和改革委员会、科学技术部、商务部、国家卫生健康委员会、应急管理部、医疗保障局、国家药品监督管理局、国家中医药管理局等9个部门联合印发《“十四五”医药工业发展规划》明确提出,以新一代信息技术赋能医药研发。探索人工智能、云计算、大数据等技术在研发领域的应用,通过对生物学数据挖掘分析、模拟计算,提升新靶点和新药物的发现效率。人工智能以医药作为现象级应用方向,政府先后出台了人工智能产业的相关规划,鼓励将人工智能技术应用于医疗领域。2017年7月,国务院办公厅出台《关于印发新一代人工智能发展规划的通知》,提出基于人工智能开展大规模基因组识别、蛋白组学、代谢组学等研究和新药研发,推进医药监管智能化。2022年1月国务院发布《“十四五”数字经济发展规划》提出促进数字技术向经济社会和产业发展各领域广泛深入渗透。IT+BT交叉融合在行动:科学技术部“十四五”规划发布了IT+BT交叉专项,国家自然科学基金委员会于2021年设立交叉学部,北京市发布了AI+健康协同创新项目群。这些工作为我国利用计算医学技术完成医药健康领域“补短板、创未来”赢来了极佳的时间窗口。
我国在“AI+疾病”领域已经出现令人兴奋的突破。目前中国科学院计算技术研究所计算医学团队已经探索出一种新的理解疾病和疾病对药物响应的模式,利用人工智能技术基于大数据分析建立大知识和大数据联合驱动的模型。该方法打破了现有研究的局限性,从全部人类基因组数据出发,将疾病模型数字化,将功能信息、细胞特征等数字化形成数字孪生患者(见图3),建立虚拟临床试验方法,可以进行各种机制探索、药物临床试验疗效预判等,从而解决了药物创新的核心难题。
![]() |
图 3 患者数字孪生 |
2021年《柳叶刀》旗下的综合性子刊EBioMedicine刊发了一项由中国科学院计算技术研究所的计算医学团队联合广东省人民医院共同完成的关于乳腺癌病因规律探索以及评分系统的研究成果[8]。该文章提出的胚系基因组病因学新框架,以女性乳腺癌为具体研究对象,开发一种名为“胚系基因组霰弹枪的损伤评估”系统(DAGM),为药物耐药研究和临床实验有效筛选患者提供了全新的策略,大幅提高了我国乳腺癌病因研究水平。基于该平台,已经在乳腺癌、肺癌、肝癌、脊索瘤等多实体肿瘤的临床研究中产生了高等级证据。
4. 大型药企与人工智能新型独角兽共生共赢,加速计算医学融入药物研发价值链。随着计算医学的深入发展,在药物创新链条中出现了全新的人工智能企业要素,他们以“AI+疾病”为企业技术特色,来研发能够更好地理解生命、理解疾病,进而驱动新靶点、新作用机制(MOA)、新生物标志物的技术工具。而大型药物研发企业与创新型研发主体在创新技术要素的生成、流动过程中进行共同演化、共生共赢,有利于释放计算医学对药物研发成功率的促进作用。目前已经出现了新型企业与大型药企协同研发的案例,开启了新技术融入药物研发价值链的步伐。
(1)利用计算疾病模型预测适应症。辉瑞公司与以色列Cytoreason公司合作,利用Cytoreason的数字化疾病模型(基于机器学习、遗传学、基因组学、蛋白质组学、医学文献)分析CCR6蛋白的生物学特性,基于其分析结果,辉瑞公司确定靶向CCR6蛋白的最佳方法以及受CCR6抑制剂影响最大的疾病,即炎症性肠病(IBD),并作为了Ⅱ期临床试验的适应症[9]。
(2)利用虚拟患者预测候选药物疗效。赛诺菲与德国海德堡的研究机构BioMed X启动了专注于开发一个能够准确预测虚拟患者群体中潜在FIC候选药物疗效的多功能计算平台项目[10]。
(3)大量的国际资本催生以计算医学为核心技术的“AI+药”的独角企业。Insitro是斯坦福大学计算机教授创立,2018年成立至今获得8亿美元的融资[11]。Recursion Pharmaceuticals也获得7亿美元融资,最近英伟达公司的CEO黄仁勋以5000万美元投资Recursionon[12]。春江水暖鸭先知,国际资本强势介入计算医学,足以说明计算医学会给医药健康产业带来巨大价值。
三、以战略思维构筑中国计算医学新高地AI要抓准解决医药产业遭遇瓶颈的重大科学问题,才能根本性实现医药研发的原始创新,形成高质量新增长极,抓住我国变道超车的新机遇。
1. 优化评价体系,加速新技术产出2022年美国国会宣布成立“高级健康研究计划局”(The Advanced Research Projects Agency for Health,ARPA-H),利用联邦资金来加快研究和开发高度创新的治疗方法以解决未被满足的医疗需求[13]。在ARPA-H的方案中提出,卫生领域现有的研究支持体系并不适合产生重大突破的创新项目,借鉴美国国防部高级研究计划署(DARPA)后,成立新机构重点资助高风险、能够推动医疗技术突破的创新项目落地,为患者提供变革性的解决方案。
参考ARPA-H机制,优化评价体系,关注生物医药产业的底层技术和有巨大前景技术,侧重肿瘤等复杂疾病,重点引导利用AI研究人类疾病的病因、病理、药物MOA(药物作用机制),鼓励AI制药公司关注致病机制研究,为临床研发提供重要依据和研发方向,真正促成我国医药工业创新驱动转型。
2. 建立计算医学联盟,推进产业升级建立一个由研发、产业内多元主体构成的“研发-转化-应用”一体化产业创新联盟,为新技术在产业链中扩散加速。联盟平台应聚焦医药产业关键共性问题(如对药物敏感人群的分析,精准预测药物临床效果,对患者的精准化治疗等),吸引具有功能互补性的企业和机构,深度合作创新,有效激发知识溢出效应,加快技术成果走向市场的步伐,为医药产业高质量发展提供科技支撑体系。
除了推动新技术扩散外,欧盟阿维森纳联盟还致力于改变相关政策,“如果不能作为产品有效性或安全性的证据提交,即使是最先进的预测模型对行业也没有什么价值”[14]。因此中国计算医学联盟成员还需要建立评估建模和模拟数据的有效机制,推动药物审批制度可以接受数字化证据。
3. 导入资源加速计算医学产业落地计算医学需要学科深度交叉,需要和真实应用场景快速迭代,科研和产业的边界非常模糊,对于计算医学为核心技术的企业需要长时间才能完成技术验证、产品研发和商业收入,需要巨大风险资本的投入。美国的风险资本在加速相关企业孵化。计算医学的企业需要拥有真实患者的数据,中国计算医学企业对国际资本的投资还是抱有谨慎的态度,而国内资本对于新技术认识和风险承受能力有待提高,与国外计算医学的新锐相比,资本成为了产业竞争的阻碍。亟需国家和行业的科创基金以创新的机制和评价体系加以支持。
当前,我们正站在新技术大门的入口处。以欧美主导用理想生物学模型建立生命功能的技术红利将尽,用计算医学平台建立生命功能的技术将有机会释放新技术红利。在新技术重构国家竞争力的关键时期,需要充分吸收全球其他国家和地区在计算医学战略中的已有做法,建立“中国方案”,加快医药产业的新旧技术体系转化。
① 2016年塔夫茨药物开发研究中心 (CSDD)对药物上市成本的估计为 26 亿美元。
[1] |
Deloitte. Seize the digital momentum: Measuring the return from pharmaceutical innovation 2022. https://www.deloitte.com/content/dam/assets-shared/legacy/docs/gx-deloitte-global-seize-digital-momentum-rd-roi-2022.pdf. [2023-04-23]
|
[2] |
Scannell J W, Blanckley A, Helen Boldon, et al. Diagnosing the decline in pharmaceutical R&D efficiency.
Nature Reviews Drug Discovery, 2012, 11(3): 191-200.
DOI: 10.1038/nrd3681. |
[3] |
DiMasi J A, Grabowski H G, Hansen R W. Innovation in the pharmaceutical industry: New estimates of R&D costs.
Journal of Health Economics, 2016, 47(5): 20-33.
|
[4] |
Bender A, Isidro Cortés-Ciriano. Artificial intelligence in drug discovery: what is realistic, what are illusions? Part 1: Ways to make an impact, and why we are not there yet.
Drug Discovery Today, 2021, 26(2): 511-524.
DOI: 10.1016/j.drudis.2020.12.009. |
[5] |
Hartl, Luca D D, Kostikova V, et al. Translational precision medicine: an industry perspective.
Journal of Translational Medicine, 2021, 19(1): 245.
DOI: 10.1186/s12967-021-02910-6. |
[6] |
Viceconti M, Henney A, Morley-Fletcher E. In silico clinical trials: how computer simulation will transform the biomedical industry.
International Journal of Clinical Trials, 2016, 3(2): 37-46.
DOI: 10.18203/2349-3259.ijct20161408. |
[7] |
Wu X, Taylor V, Wozniak J M, et al. Performance, energy, and scalability analysis and improvement of parallel cancer deep learning candle benchmarks. Proceedings of the 48th International Conference on Parallel Processing. 2019: 1–11.
|
[8] |
Yang M, Fan Y, Wu Z Y, et al. DAGM: A novel modelling framework to assess the risk of HER2-negative breast cancer based on germline rare coding mutations.
EBioMedicine, 2021, 69: 103446.
DOI: 10.1016/j.ebiom.2021.103446. |
[9] |
Pfizer. An Immune System “GPS” Uncovers Pathways to Treat Diseases. https://www.pfizer.com/news/articles/an_immune_system_gps_uncovers_pathways_to_treat_diseases. [2023-08-20]
|
[10] |
Next Generation Virtual Patient Engine for Clinical Translation of Drug Candidates. https://career.bio.mx/call/2022-BMX-C01.[2023-05-01]
|
[11] |
Brian Bunt. 30 biotech startups making waves. https://www.drugdiscoverytrends.com/30-biotech-startups-making-waves/. [2023-08-30]
|
[12] |
Recursion Pharmaceuticals. Recursion Announces Collaboration and $50 Million Investment from NVIDIA to Accelerate Groundbreaking Foundation Models in AI-Enabled Drug Discovery. https://ir.recursion.com/news-releases/news-release-details/recursion-announces-collaboration-and-50-million-investment. [2023-07-30]
|
[13] |
U. S. Government Publishing Office. H. R. 5585, 117th Congress: to establish the Advanced Research Projects Agency-Health, and for other purposes. https://www.govinfo.gov/content/pkg/BILLS-117hr5585rfs/html/BILLS-117hr5585rfs.htm. [2023-05-22]
|
[14] |
Avicenna Alliance. WHY DO WE NEED A POLICY CHANGE?. https://avicenna-alliance.com/value-story/why-do-we-need-a-policy-change/. [2023-04-31].
|
2. Western Institute of Computing Technology