GAIR Live｜五位学者大论道：ChatGPT，能否重构中国生命科学界的底层逻辑？

本文摘自雷锋网，原文链接：https://www.leiphone.com/category/healthai/LE3LwCBNm8OgGfnP.html，侵删。

前不久，腾讯研究院发布《AIGC发展趋势报告2023：迎接人工智能的下一个时代》指出，AIGC的商业化应用将快速成熟，市场规模会迅速壮大，预测将率先在传媒、电商、医疗等数字化程度高、内容需求丰富的行业取得重大发展。

与此同时，诸多国外商业咨询机构更是直接给出数据：未来五年10%-30%的图片内容由AI参与生成，2030年AIGC市场规模将达到1100亿美元。

星星之火，可以燎原。早在五年前，AIGC还籍籍无名。它有一个相当拗口的名字--AI生成虚拟内容。以2018年的视频换脸技术Deepfake为代表，“AI伪原创”一词，便从那时传开。

随着深度学习的发展，AIGC逐渐渗透在图像、视频、CG、AI训练数据等各类领域，人们对于这一技术的期望也逐渐丰满。

时至今日，AIGC技术能否用于计算生物领域的新引擎，医疗健康赛道何时迎来新型基础驱动力，成为时下产学研各界的共同关切。

近日，由雷峰网(公众号：雷峰网)GAIR Live&《医健AI掘金志》举办的《ChatGPT的一把火，能否烧到AI生命科学界？》线上圆桌论坛落幕。

本次论坛，由中国人民大学数学学院龚新奇担任主持，中国科学院深圳理工大学（筹）计算机科学与控制工程学院院长潘毅、百图生科首席AI科学家宋乐、深圳湾实验室系统与物理生物学研究所资深研究员周耀旗、分子之心创始人许锦波，天壤创始人薛贵荣参与讨论。近期ChatGPT爆火，欢迎添加作者微信（微信号：icedaguniang），互通有无。

在上篇中，几位嘉宾共同辨析“AIGC”这一概念，探讨生命科学界中的哪些成果属于AIGC，以及ChatGPT在生命科学领域中可能实现的任务。

在下篇中，将分别探讨AIGC为生命科学带来的可能性与其自身局限，以及中国能否在应用场景上快人一步，实现技术落地与产业转化。

“全球人工智能与机器人大会”（GAIR）始于2016年雷峰网与中国计算机学会（CCF）合作创立的CCF-GAIR大会，旨在打造人工智能浪潮下，连接学术界、产业界、投资界的新平台，而雷峰网“连接三界”的全新定位也在此大会上得以确立。

经过几年发展，GAIR大会已成为行业标杆，是目前为止粤港澳大湾区人工智能领域规模最大、规格最高、跨界最广的学术、工业和投资领域盛会。GAIR Live作为雷峰网旗下视频直播品牌，旨在输出新鲜、深度、原创的大咖访谈与对话内容，打造辐射产、学、研、投的特色线上平台。

以下是主题论坛的现场内容，雷峰网《医健AI掘金志》做了不改变原意的编辑和整理：

ChatGPT，是否会成为生命科学跨越式发展的契机？

龚新奇：目前来看，ChatGPT的文本生成功能确实挺强，第一次让我们感觉它像个人一样，能够自然地聊天，读懂你的感情、还可以体会到一些细微的褒贬。而且你可以正反提问，甚至还可以夸奖它、批评它。因此，ChatGPT的出现，能否比肩AlphaGo或是AlphaFold2的出现，是否会成为生命科学跨越式发展的契机？

周耀旗：我不认为ChatGPT可以比肩AlphaGo或是AlphaFold2。AlphaGo当年战胜了人类最好的棋手，而AlphaFold2在高精度蛋白质结构预测上取得了革命性进展，但ChatGPT对生命科学来讲，错误率太高、准确度不够，还不能算作一个跨越性的成果。

但我对它的未来版本充满了信心，特别是当ChatGPT跟搜索引擎结合，会大幅度提高它的精确度。因为它可以出具文献出处，还可以帮我们提供各个领域的综述、问题解决思路、促进不同领域沟通，甚至帮助学者撰写文章初稿。那么未来跨专业、跨语言的交叉研究就变得容易一些。

所以我认为，未来升级版本的ChatGPT完全可以成为一个创新枢纽。科学家把更多精力放在提出问题上，并根据AI的建议来优化、验证解决问题的方法和思路。所以ChatGPT的出现还是有一定的意义，它推动了一个有想象力时代的到来。

潘毅：我认为今后ChatGPT很有可能成为生命科学领域跨越式的发展契机。至于它的影响力，我跟周教授有不同看法，我认为ChatGPT的影响力会大于AlphaGo和AlphaFold2。

AlphaGo为专为围棋而设计，AlphaFold是专为蛋白质结构预测而设计，所以它们是一个为专业而生的AI平台。相比而言，ChatGPT是一款通用型AI平台，既可以交流，又可以撰写邮件、视频脚本、文案、翻译、代码，写论文等等，普罗大众都可以试一试，所以ChatGPT的影响力要远比AlphaGo和AlphaFold更广泛、更深刻。因此，虽然ChatGPT在生命科学领域里比不上AlphaFold，AlphaFold在围棋上比不上AlphaGo，本质是术业有专攻。

最近我和老同学黄学东聊天，发现他对ChatGPT的评价很高，“微软如今加码ChatGPT，是因为ChatGPT之于AI，相当于芯片之于计算机这么重要。”

要知道，黄学东多年担任微软Azure AI技术研究员和首席技术官，前不久刚刚当选2023年美国工程院院士，此前他并未将Alphago和AlphaFold定义为一个“里程碑式”的技术突破。

当然，周教授说得很对，ChatGPT在生物领域的影响力也许还没达到，目前ChatGPT无法处理复杂冗长或者特别专业的语言结构。但随着AI技术的改进，几年以后它一定会赶上，甚至会超过AlphaGo和AlphaFold。

从另一方面考虑，如今ChatGPT作为一个通用平台，应该如何推动生命科学发展？

一、生命科学领域的学者为其注入专业性更强的生物知识，只有进行足够的语料“喂食”，ChatGPT才有可能生成适当的回答。那时候，它或将用于蛋白质结构预测，蛋白质设计、蛋白质相互作用分析等各类任务。

二、指挥ChatGPT编写程序，比如Java程序、HTML程序，以及各种API（应用程序编程接口）。那么未来生物学家只需要发出指令，ChatGPT就能完成从代码编写、接口耦合到程序测试的一系列工作。这也意味着，尽管很多人不能完全精通各种计算机语言，但我们只需要会做一些策划性工作，就能快速搞定项目。

宋乐：从通用人工智能的角度来说，ChatGPT确实是一个非常大的进步。因为在A I领域，过去的对话机器人很难媲美ChatGPT。因为ChatGPT除了逻辑严密的创造能力之外，还具有记忆能力，在连续的对话中不用大家提供重复信息，其语言组织和表达能力也更接近人类水平，使对话更自然流畅。

但实际上，ChatGPT的创造性、流畅度，多轮对话能力，依赖于多种AI技术的结合，包括它的训练方式都和过去的AI模型不太一样。

OpenAI使用了RLHF（Reinforcement Learning from Human Feedback，人类反馈强化学习）技术对ChatGPT进行了训练，且加入了更多人工监督进行微调。因此，ChatGPT进一步提高了AI模型与人类的交互能力，对信息含义的理解能力，以及自我判断能力。

所以，ChatGPT的本质是对人类语言（自然语言、程序指令）反应能力的数学逼近。相比较而言，过去我们和计算机交互，要么自己打字，要么输入非常结构化、死板的程序语言。但现在就可以直接以用自然语言和计算机交互，把它视为人类助手。

最近斯坦福一位教授发现，GPT-3.5的智力已经和9岁的小孩相当，这是以前任何AI 程序都不可能达到的高度。总体而言，我认为ChatGPT是可以被视为里程碑式的AI成果，而且它确实会带来一系列的工业级应用，甚至未来基于ChatGPT衍生出更高级的AI模型。

说到这里，ChatGPT也有一些局限性，比如因为知识缺失，产生一些不正确或者荒谬的答案。

比如你问它“红烧蚊子腿怎么做”，它会给你一个正了八经的回答：先把蚊子腿洗干净，再熬制糖浆，然后放入葱姜蒜煮熟。”它只是把“红烧猪肉”的做法重复了一遍，把“猪肉”换成了“蚊子腿”。

还有一些有趣的例子，比如你叫它做一些算数运算。如果只是简单的单位数运算还好，但如果数字比较长，或者比较复杂，它就做不了。实际上，这体现了ChatGPT当前的训练模式的局限性，更加偏向于基于序列的拟合，或者表征生成序列的形式去训练。

所以ChatGPT还能朝什么方向优化？

一、未来需要向ChatGPT注入一些知识图谱，比如数学运算能力、生物识别能力，补齐它在这些维度的智慧；

二、对于蛋白质设计、药物设计等细分领域而言，就可以直接“外挂”一些专业模块，比如复合物结构模块、亲和力模块、蛋白质稳定性模块，当“外挂”越多，它的智力更高，也会输出更更贴合需求的结果；

三、我们也可以学习ChatGPT的算法思路和模型训练方式，“投喂”十亿级、百亿级的蛋白质序列数据，训练出一个专用于蛋白质设计的模型。

薛贵荣：我们比较有幸，2018年做过AlphaGo的复现，2021年我们做过AlphaFold2的复现。但总体来说，这些领域我们有胆量尝试，但从来没有尝试过的就是语言类AI模型。

众所周知，自然语言处理（NLP）、机器学习（ML）发展了很多年，但人机交互仍然不能做到问答自如，逻辑流畅。根本原因是建立自然语言处理模型的实用系统，需要不同层面的知识，比如汇学、句法学、语义学和语用学等知识。

而且NLP是一个交叉学科，涉及了方方面面的知识领域，包括计算机科学（给NLP提供模型表示、算法设计、计算机实现的技术）、数学（给NLP提供形式化的数学模型和形式化的数学算法）、电子工程：（给NLP提供信息论的理论基础和语言信号处理技术），以及心理学、哲学、统计学等等。所以从开发难度上看，ChatGPT都是当之无愧的AI界“天花板”。

阅读剩余部分

GAIR Live｜五位学者大论道：ChatGPT，能否重构中国生命科学界的底层逻辑？｜（下篇）

相关推荐

评论