继AI绘画、AI聊天后,没学过生物的「门外汉」也能「一键生成」蛋白质


当前第2页 返回上一页

早在去年年底,国外就有三家公司竞相发布了蛋白质设计的新模型。

如前文所述,2022年12月初,华盛顿大学David Baker团队发布了RFDiffusion,用扩散模型设计出多种与天然蛋白质截然不同的全新单链蛋白质及复合体,目前已制造出一种可以与甲状旁腺激素结合的全新蛋白质。

据悉,RFDiffusion也可向多个方向扩展应用,比如该技术最近已扩展到核酸和蛋白质-核酸复合体,后续也将也扩展到设计小分子结合蛋白。

同日,由生命科学顶级风投Flagship Pioneering孵化的蛋白质设计公司Generate Biomedicines,发布扩散蛋白生成模型Chroma,可根据预设要求设计蛋白质序列和结构。

2022年1月,该公司曾一举拿下自Amgen(安进)的5个订单,预付款约5千万美元,潜在合约价值超19亿美元。公开资料显示,5个靶标全部用于开发蛋白疗法,预计生产达百万量级,并透露安进将参与Generate的新一轮融资。

更为重要的是,波士顿拥有全球闻名的医疗机构,从综合性医院、肿瘤专科医院到儿童医院,以及世界Top20制药公司,在医疗集聚方面有着巨大成就。而这层背景,或将助推Generate抢占市场先机。

在蛋白质设计领域,也不乏众多后起之秀。

其中Meta公司的ESM2、加州伯克利的一家初创公司Profluent的ProGen,则是仿造“ChatGPT”背后的大型语言模型(LLM),相继推出了蛋白质序列预训练大模型,实现可编程的蛋白质从头设计。对此,业内众说纷纭,乐观派称,“这项新技术可能会‘超越诺奖’--比2018年的定向进化蛋白设计技术更加强大。”

继AI绘画、AI聊天后,没学过生物的「门外汉」也能「一键生成」蛋白质

天壤创始人,CEO薛贵荣对此颇有感触,“尽管这些公司的技术路径不尽相同,但这些模型和算法的集中爆发,意味着我们已经迈入了一个可编程的生物学新时代,最快年底会有一大波蛋白质设计被验证。”

同时他也认为,如今蛋白质设计浪潮兴起,至少指出了三个可能:

一、沿用天然蛋白质设计的老路已经没有太大兴奋感,从头生成人工蛋白的AI系统已将蛋白质设计变得“可控化”、“批量化”、“广泛化”; 二、以蛋白质设计来讲,不管是在医疗应用、食品生产、工业应用、环境保护、可再生资源还是其他领域,都具备有非常广阔的应用场景,背后的商业价值正在被更多人看到; 三、ChatGPT作为第一个消费级AI爆款,是公众第一次亲身体验现代人工智能的强大功能,随着ChatGPT应用的增长、甚至“BioGPT”、“ProtGPT”的出现,人们会对AI产生越来越多的信任。

以上观点不难看出,对于国内从业者而言,借助风口深扎技术,为迎接未来工业需求做准备,显然已经成为自身发展过程中的重要命题。

与此同时,生成式AI技术的科研和工程实施还处于发展初期,除基座模型的角逐外,能否有更多公司参与到应用级创新,同样是决定生态繁荣的重要因素。

实际上,天壤并非初涉生命科学领域。早在2019年,旗下天壤XLab成立,专注于IT+BT融合发展,旨在将蛋白质开发从“机会性游戏”,转变为高确定性的、可预测的“工业化流程”,满足医疗、材料、能源和食品等领域对功能蛋白质的需求。

2022年,公司技术数项成果并出,陆续建成TRFold(单链结构预测,有MSA)、TRFold-Single(单链结构预测,无MSA)、TRComplex(复合体结构预测)、TRDesign(蛋白质设计)四大核心能力,并在去年9月推出国内首个蛋白质设计工作台xCREATOR。

至此,一条兼具“蛋白质结构预测+设计+开放平台”技术闭环搭建完成。

一定程度上说,在天壤此次技术升级之后,国内蛋白质设计市场的红利将进一步放大,后续将涌现出更多的“鲶鱼”,引发全社会对生命科学产业的关注。 

产学研合作已是大势所趋,大规模设计成为时代主流

人类发现蛋白质的时间不过两百年,大自然却花了上亿年形成蛋白质进化规律。直到今天,人们不能完全翻译这些规律,但仍然期待有一天可以通过发明强大AI工具,并对它发出设计蛋白质的指令。

这种期待是美好的,蛋白质设计前景也是广阔的,但当前,这一赛道尚处于孕育探索阶段。

就技术研发和应用角度考量,如何从模型生成的大量符合需求的蛋白质中筛选出最优的结构、如何评价这些蛋白质的功能和性质、是否有可能从模型的角度自动化进行筛选,仍然值得进一步讨论。

正如苗洪江所说,“和AI绘画、AI聊天不同,蛋白质设计的本质是科学创新,比如要对设计蛋白的稳定性、亲和力、寡聚性等特性进行预测及优化,否则就是‘伪蛋白’。”

实际上,针对这一问题,天壤的一大解决思路是与高校合作,“在实际项目过程中发现模型和平台存在的问题”。

去年9月,天壤公布蛋白质设计工作台——xCREATOR,其设计初衷,即解决跨领域技术门槛高、工作流程碎片化的问题,目标是在同个工作台上一站式地完成全部蛋白质设计项目。

目前,xCREATOR工作台已集成了市面上优秀的算法,包括天壤XLab自研的算法与所有外部开源和合作伙伴的算法。尤为重要的是,这款平台供高国内外高校师生免费使用,一方面能够提供更开放的学术环境,为前沿项目提供技术支撑;另一方面,对于尚未建设湿实验室的天壤来说,来自各大高校的真实实验数据反馈,也成为天壤升级蛋白质设计算法的重要基础。

薛贵荣举了个例子,“过去博士生做蛋白质设计,需要一段一段敲掉某些片段,再人工设计拼补上去,等到毕业了还没有见过蛋白质设计出来的样子。相比较而言,现在学生可以一次性提交几十个蛋白质设计需求,几个小时后马上收到一份蛋白质设计结果和分析报告。”

站在平台的角度上,天壤越来越明确提供工具的角色定位,追求开放化的思路。

薛贵荣提到,未来天壤要两条腿走路,重点打造干湿一体化实验室,从计算平台走进实验平台,真正从产业端的角度推动前端的蛋白质设计工作。

据悉,目前天壤XLab团队从头设计了适用于多种疾病的人工蛋白质候选药物,如新冠刺突蛋白结合剂,能够有效阻止刺突蛋白和人体ACE2蛋白结合;以及IL-2类似物,能够激活特定淋巴细胞,同时避免当前IL-2类药物毒性;可用于捕捉和封存二氧化碳的碳酸酐酶,相比于天然碳酸酐酶,其长度仅为天然碳酸酐酶的1/3左右,稳定性更高,成本低廉便于工业应用。目前,这些蛋白的计算设计工作都已完成,正在推进实验检验。

这似乎又开始了让人熟悉的剧情。场景的吸引力、模式的吸引力,本质上,都是内容和技术的原始创新。

“当实现蛋白质设计日吞吐量达到上千上万,甚至更多时,蛋白质设计将彻底告别‘束手束脚’的日子,一个真正的生命科学时代才算到来。”

| 生物计算“奥赛”冠军论道:当生命科学遇上史诗级AI,何去何从?

日前结束的第41届JP摩根医疗健康大会上,科技公司Nvidia的报告指出,“或许很快,基于AlphaFold2精准解析蛋白质三维结构,再加上能从头生成人工蛋白质设计技术,就会给生物学领域带来一场新的变革。”

为了更加深入、系统地讨论生命科学技术的落地,2月23日(本周四20:00),我们邀请了CASP15四支冠军团队,论道:《当生命科学遇上史诗级AI,何去何从?》

智峪生科董事长,CEO王晟担任主持、密歇根大学计算医学及生物信息学系郑伟、浙江工业大学信息工程学院张贵军教授、江苏理工学院生物信息与医药工程研究所常珊教授、智峪生科CTO熊鹏共同参与讨论。

读者可扫描文章底部海报的二维码,添加策划人吴彤微信(微信号:icedagunaing),备注“姓名+职位”,后续我们会邀请您进入专家社群,并将您的问题收集、汇总,反馈给参会嘉宾,在讨论环节进行解答。

继AI绘画、AI聊天后,没学过生物的「门外汉」也能「一键生成」蛋白质

“全球人工智能与机器人大会”(GAIR)始于2016年雷峰网(公众号:雷峰网)与中国计算机学会(CCF)合作创立的CCF-GAIR大会,旨在打造人工智能浪潮下,连接学术界、产业界、投资界的新平台,而雷峰网“连接三界”的全新定位也在此大会上得以确立。

经过几年发展,GAIR大会已成为行业标杆,是目前为止粤港澳大湾区人工智能领域规模最大、规格最高、跨界最广的学术、工业和投资领域盛会。

GAIR Live作为雷峰网旗下视频直播品牌,旨在输出新鲜、深度、原创的大咖访谈与对话内容,打造辐射产、学、研、投的特色线上平台。

返回前面的内容

相关阅读 >>

华晨东亚汽车金融客服电话大全已更新2023(实时/更新中)钟薛高发布sa'saa系列冰棍新品,称由AI打造,定

致力AI硬件设计:astera labs再获5000万美元c轮融资

安徽电信与科大讯飞签署深化战略合作协议并揭牌5g+AI联合创新实验室

openAI ceo:马斯克教会我投资科技领域 但对移

openAI 研究员:数据不足时,如何实现监督学习

首位大陆学者!西工大教授李学龙当选 aaAI 执委

微软豪赌AI,能让chatgpt等AIgc工具普及给大众

开启商业化模式?微软必应计划在AI搜索中引入广

openAI新发现:gpt-3做小学数学题能得55分,验证胜过微调!

cAIct:1-4月国内市场手机总体出货量累计8742.5万部

更多相关阅读请进入《AI》频道 >>



打赏

取消

感谢您的支持,我会继续努力的!

扫码支持
扫码打赏,您说多少就多少

打开支付宝扫一扫,即可进行扫码打赏哦

分享从这里开始,精彩与您同在

评论

管理员已关闭评论功能...