亚马逊云科技引领生命科学专属大模型浪潮,助力加速企业全球化步伐

2023年的医药寒冬里,AI制药成了美国生物医药公司融资最多的板块。

作为生命科学行业的云计算引领者,亚马逊云科技将与企业们一道迈上数字化转型之路,获得长远、健康、可持续的发展。

2023年的医药寒冬里,AI制药成了美国生物医药公司融资最多的板块。

进入2024年,这一趋势仍未有丝毫衰减,纵观今年上半年生物医药行业的融资情况,唯一一笔斩获超10亿美元大额融资的Xaira Therapeutics,又是一家AI制药企业。

其实,无论是新成立的AI制药企业,还是希望借助AI加强效率的传统药企,抑或是想要寻求AI赋能的CRO,背后都离不开提供基础设施范式的“卖水人”支持,一直坚持“基础模型”定位的亚马逊云科技正处于这个超然的位置上。

与许多巨头的理念不同,亚马逊的大语言模型Amazon Titan不直接面向终端用户,而是致力于帮助企业训练和应用好属于自己的专属定制化模型。随着AI制药蓬勃发展,加入的企业越来越多,行业结合点与应用范围也越来越广,几乎每个月都会有新的技术和服务涌现。

近日,亚马逊云科技举办了一场会议《AI与医药临床研发前沿探讨》在北京顺利举行。本次会议围绕临床试验设计创新转型、AI前沿技术在药物研发环节的应用、AI+RPA在药物警戒领域创新探索等方面展开深度探讨。会上,数十家10家领先的CRO、生物医药、软件服务企业的高管分享了通过亚马逊云科技构建的生成式人工智能技术服务,加速创新的经验。

01

大模型赋能医药,发展到了什么程度?

亚马逊云科技有多强?

目前,全球十大制药企业中有9家已经是亚马逊生成式AI的客户。以辉瑞为例,其不仅进行了大量从内部数据中心迁移到云端的工作,还借助亚马逊云平台的技术构建了自身的生成式AI平台Vox。

顶级的大Pharma之所以不约而同选择亚马逊,并不只是为了尝试新技术,某种程度上,也是面对研发瓶颈时的必须。

数年前,业界对新药研发的理解普遍是“双十”,即10年10亿美元。如今,两个数字几乎都奔着翻倍去了。这一背景下,AI几乎成了唯一的破局选择:研究显示,AI技术能将临床新药研发的成功率从12%提高到约14%,生成式AI可以将制药和医疗的生产率提高2.6%至4.5%。

看似提升的百分点不多,却意味着全产业数百甚至数千亿美元的开支节省;更何况随着技术不断飞跃,AI的效能越来越高,布局越早,将来节省下来的成本就越多。

亚马逊云科技很早就预见到了这一天的到来,早在2013年就在全球范围内组建了医疗和生命科学专业团队,并联合数百家合作伙伴,服务于数千家行业客户。在积累了大量的成功经验之后,去年年底,亚马逊大中华区面向客户进行了组织调整,按行业进行了业务的重新划分,从而能更好地贴近行业客户的业务需求。

会议上,亚马逊云科技资深解决方案架构师张强介绍,在经过了前期的积累后,2023年亚马逊加大了对医疗行业的发力,在与客户的沟通反馈以及项目实践中,发现生成式人工智能在三个方面为企业带来了显著的生产力提升。

第一,目前药企在研发中流程中会涉及到大量数据处理工作,这些数据大多非结构化且不规范,有文本、图像、表格等多种格式。如果用人工的方式去一个个查询筛选对齐,不仅效率低下还浪费了宝贵的专家资源。以处理药品说明书为例,不同来源的说明书格式和规范不一,难以通过统一的代码处理,但大语言模型可以很好的处理这项工作,在准确性提升的同时极大的提高处理效率。

第二,大语言模型是一个很好的智能中枢,通过与数据库、工具、业务系统的结合,可以帮助企业实现更加灵活的自动化。医疗是知识密集型行业,涵盖药物学、病理学、基因组、蛋白质组学等各种不同领域知识,在业务中往往还需要依赖内外部的工具,如Pubmed、ClinicalTrials,通过对应用架构的设计,大语言模型可以根据业务人员的自然语言描述的需求,精准理解并帮助完成一系列数据检索工作,在此基础上还可以实现专业问答、文档编写、内容总结等场景功能,简化人工工作流。

第三,不光是输入端,在输出端,随着大模型多模态能力,以及在行业知识理解能力的迭代,生成式人工智能在提升洞察力方面正在给企业带来更大的价值。张强举例,筹备一项试验可能需要阅读数以万计的临床记录,阅读单个患者所有相关记录的费用为150~1000美元,研究人员需要阅读数10份临床记录,才能找到一个符合条件的患者。无论是招募了不符合条件的患者还是遗漏符合条件的患者,都会增加成本,后者还可能会导致招募的患者数量减少,进而耽误试验的开展,根据权威机构的统计,临床试验每往后推一个月,会给药企带来60~800万美元的损失。如果使用大语言模型负责浏览整个电子健康记录,则可以将试验周期缩短数月,节省大量人力和时间成本。

艾滋病领域研究代表生物制药公司吉利德与亚马逊云科技在AI领域已有深入合作。早在2015年前后,吉利德就开始逐渐采用云服务去替代传统的数据存储和平台搭建流程。2021年,吉利德选择了亚马逊作为首选云服务供应商,从生物标记物的发现到制造和临床试验招募,完善药物研发流程都用到了亚马逊云科技的技术,并且还将50%以上的数据中心基础设施迁移到了亚马逊云科技上。

而对AI层面的集中发力,则是从2023年开始。得益于此前的铺垫,吉利德已经在内部成功构建起了一套数据积累和调用机制,实现了与大模型之间的相互赋能。在亚马逊云科技专家的帮助下,吉利德研发团队目前正在探寻在云端创新的方式,试图采取一种敏捷的产品开发方法,从员工层面鼓励创新。

不过张强也表示,企业想要真正将大模型落实到生产过程中,第一需要有足够多的高质量数据,数据是产生差异化以及发挥生成式AI能力的核心,第二需要将自身的业务流程梳理得足够清晰,它能够指导企业设计出合理的应用架构和工作流,并开发出有效的提示词。这也需要业务人员了解大模型的能力及限制,最好的方法是企业提前布局,通过与大模型的长期互动积累经验。

布局越早,收获越大。“整个制药的生命周期里,我们将不同环节提升后的效率累加起来,最终会给我们的整个研发流程带来质的变化。”张强总结。

02

迎头追赶的中国药企

在中国,药企对AI的接受还没有国际制药公司那么快,那么坚决,但也已经有了不少先行者,具体到每个机构或企业,因为业务场景不同,衍生出来的应用方式也不同。

张强举例,目前中科院也在利用亚马逊云科技的技术赋能合成生物学领域的研究,通过基于文献库构建RAG应用,能够在菌株挑选、寻找最优合成路径等方面上为科研工作者提供专业的知识问答,大模型做到了以往只有资深专家才能做到的工作。“以前关于菌株的调研报告,需要一个专家用1-2个月时间来完成,现在有了生成式AI的辅助,只需要1周的时间就可以完成;此外在问答准确率方面,能够达到92%以上。”

百济神州与亚马逊云科技构建了基于大语言模型的问答知识库,让研究者能轻松查阅海量的医学文献,大幅度提高研发效能;近日,百济神州计划与亚马逊云科技及其合作伙伴脉络洞察在数据标签和智能化领域进行更深入的合作,利用云上的先进 AI 能力进一步提高数据利用效率,挖掘更多业务价值。

专注于肠道微生态治疗的AI制药公司未知君则通过亚马逊科技提供的自动化数据生命周期管理服务实现对不同数据的分级存储和归档。随着基因测序和分析项目的增多,每个研究样本都会生成海量数据,在应用亚马逊科技提供的服务后,未知君实现了TB级基因数据的存储,还为未来的扩大留足了空间。

前不久港交所上市的晶泰科技也将药物研发业务的计算调度平台构建在亚马逊云科技之上,以随时调取大规模的超算资源,达到极佳的计算性价比,每年可以节省大量的运营成本。

以上的合作案例都有一个共同点,那就是先从局部出发,有的构建问答平台,有的用云存储,有的调取算力。在成功优化了某一个单点的效率,发现了“确实好用”,并且员工能力培训逐步到位之后,再寻求做更大范围的迁移。

而在国内企业中,步伐最快的之一是流通企业瑞康医药。早在2020年,瑞康就确立了“云优先”的数字化转型战略,将亚马逊云科技作为首选云服务商,成功将超过50套企业应用系统、200余台服务器迁移至亚马逊云科技,成为了国内医药流通领域首家“全面上云”的企业。

2022年9月,瑞康医药又与亚马逊云科技宣布签署战略合作协议,双方的合作进入了第二阶段,针对业务场景和需求实施企业应用现代化改造、微服务与云原生服务开发,积极拓展和探索医疗健康产业新方案和新机遇。

趋势已经来临,不少领域的领军企业也在跃跃欲试。

本次会议上,凯莱英临床(凯诺)执行总监刘喆鑫也到了场。分享中,刘喆鑫提到了对AI在药物警戒中的展望。在药物警戒领域,许多工作内容,如不良反应报告统计等都属于重复性工作,经过凯莱英团队的统计,如果引入AI技术,能够减少40%-70%的人工需求,倘若进一步推广到财务部门、行政部门等,效率优化的累积会更加明显。

除此之外,药物警戒的一个重要信息来源就是淘宝、京东、美团等电商平台的用户评价,但用户评论量之大,绝无可能全靠人工检索。倘若这部分数据到期后被平台归档,就再也无法调用出来,“相当于全部浪费了”,必须用大模型来进行数据挖掘和清洗,将结论反哺医药研发。而随着近日越来越多的城市开放线上购药医保支付,这一领域的意义会更加凸显出来。

刘喆鑫告诉E药经理人,这几年,凯莱英也在积极探索利用AI及相关算力来为企业提供更多价值的方案。未来在相关AI方案落地及算力支持方面,会考虑与AWS进行更加深度的合作。

国际上,AI在药物警戒领域也已有应用案例。例如创新生命科学SaaS软件提供商ArisGlobal就基于Amazon Bedrock开发了最新一代药物警戒软件Navax,其通过AI能力,在自动化数据处理、智能信号检测、自然语言处理(NLP)、预测分析、自动报告生成、自适应学习等全链条环节增强了药物警戒和安全性数据管理的各个方面。基于AWS Bedrock的AI能力,Navax不仅提高了药物安全性管理的效率和准确性,还增强了对潜在风险的预判和应对能力,从而帮助制药公司更好地保护患者安全和满足监管要求。

医疗器械CRO公司愿景临床副总裁赵鸿雁告诉E药经理人,目前AI技术也被越来越多地用到了CRO公司早期药物发现领域,借助AI药物研发平台和自动化实验室技术,CRO从头设计并交付候选化合物的效率得以大大提升。

此外,赵鸿雁还着重提到了出海方面的考量。目前中国企业出海是大趋势,CRO出海尤其需要大量的数据存储空间,“上云”是必选项。尽管阿里云、腾讯云也能提供一些类似服务,但一来亚马逊在医药领域深耕时间更长,二来作为跨国公司,能够带来更多的潜在合作机会。

03

大幕刚刚拉开

观察目前AI大模型的发展,尤其是在垂直领域的应用方面,还处在爆发的前夜。

自1950年代开始,人类几乎每十年就会迎来一次科技浪潮,Mainframe(大型机)、PC、Networking、Web1.0、Web2.0、Cloud与SaaS……最近的一次,是正是生成式AI。

乐观者的预期是,人类社会正处于从以CPU为基础的计算单元转变为以GPU为基础的阶段。过去70年间,人们在构筑基于CPU的架构上花了数万亿美元用于,未来同样的过程大概率还会再走一遍。

如今的美股,AI已成为增长的绝对性力量,贡献了标普500三分之二的回报,也因此产生了“泡沫”的质疑。然而知名对冲基金Coatue的一则报告分析,AI与2000年时代的互联网泡沫完全不同。以思科为例,其在某五年平均PE为37倍,但巅峰高达132倍PE,同样的计算方式对应到英伟达,英伟达在过去五年平均PE为40倍,而今天仅有39倍PE。估值泡沫远远没有出现。

市场空间却以肉眼可见的速度在扩充。据IDC预测,2024年全球将有45%的重复性工作通过AI及RPA(流程自动化)提供支持的数字化劳动力实现增强;截至2024 年底,全球RPA市场将以16%的复合年增长率增长至300亿美元。

医疗服务、医药研发等垂直领域,生成式AI带来的价值,更是难以统计。

而在这一最新浪潮中,亚马逊成了最前沿的领军者之一。在致力于让每一家企业都能以自己的方式用大模型提升效率方面,花费了最大的力气。

2023年,亚马逊云科技推出了开箱即用的生成式AI的企业助手Amazon Q,专门用于满足办公场景需要,可以根据客户业务进行定制,后者可以快速获得复杂问题的相关答案并采取行动,进而提升业务效率。

AI技术爆发的同时,对算力资源的需求也在井喷。对此,亚马逊云科技与英伟达在全球范围内建立了长期深度合作,推出了云AI超级计算机。另外亚马逊云科技也有自研的训练和推理芯片,全面满足用户的多样化算力需求。

所有的这一切工作都体现了亚马逊云科技的使命:致力于推动生成式AI的专业化、普惠化,助力更多企业与个人开发者优化效率,加速创新。

随着越来越多的企业落地了亚马逊云科技的服务,对生成式AI的应用与认知不断提升,2024年和2025年,将是生成式AI在生命科学企业落地应用的关键时间节点。

作为生命科学行业的云计算引领者,亚马逊云科技将与企业们一道迈上数字化转型之路,获得长远、健康、可持续的发展。


参考资料:

《吉利德携手亚马逊云科技加速新药研发交付》. 亚马逊云科技. 2021/11/30

《全面上“云”!瑞康医药牵手亚马逊云科技 打造医药流通行业数字化转型标杆》. 中国山东网. 2022/9/8

《科技对谈:AI X RPA如何把人从系统中解放出来?》. 亿邦动力. 2023/4/20

《超越想象的GPT医疗》. 彼得·李、凯丽·戈德伯格、伊萨克·科恩. 浙江科学技术出版社 2023/5

《当云计算遇见医疗生命科学行业 会擦出什么样的火花?》. 中关村在线. 2023/5/8

《生成式人工智能的经济潜力:下一波生产力浪潮》.麦肯锡. 2023/6

《Coatue答2024:AI没有泡沫,美国VC退出也难》. 暗涌Waves. 2024/7/24


格隆汇声明:文中观点均来自原作者,不代表格隆汇观点及立场。特别提醒,投资决策需建立在独立思考之上,本文内容仅供参考,不作为实际操作建议,交易风险自担。

相关阅读

评论