GAIR Live|五位学者大论道:ChatGPT,能否重构中国生命科学界的底层逻辑?|(下篇)


本文摘自雷锋网,原文链接:https://www.leiphone.com/category/healthai/LE3LwCBNm8OgGfnP.html,侵删。

前不久,腾讯研究院发布《AIGC发展趋势报告2023:迎接人工智能的下一个时代》指出,AIGC的商业化应用将快速成熟,市场规模会迅速壮大,预测将率先在传媒、电商、医疗等数字化程度高、内容需求丰富的行业取得重大发展。

与此同时,诸多国外商业咨询机构更是直接给出数据:未来五年10%-30%的图片内容由AI参与生成,2030年AIGC市场规模将达到1100亿美元。

星星之火,可以燎原。早在五年前,AIGC还籍籍无名。它有一个相当拗口的名字--AI生成虚拟内容。以2018年的视频换脸技术Deepfake为代表,“AI伪原创”一词,便从那时传开。

随着深度学习的发展,AIGC逐渐渗透在图像、视频、CG、AI训练数据等各类领域,人们对于这一技术的期望也逐渐丰满。

时至今日,AIGC技术能否用于计算生物领域的新引擎,医疗健康赛道何时迎来新型基础驱动力,成为时下产学研各界的共同关切。

近日,由雷峰网(公众号:雷峰网)GAIR Live&《医健AI掘金志》举办的《ChatGPT的一把火,能否烧到AI生命科学界?》线上圆桌论坛落幕。

本次论坛,由中国人民大学数学学院龚新奇担任主持,中国科学院深圳理工大学(筹)计算机科学与控制工程学院院长潘毅、百图生科首席AI科学家宋乐、深圳湾实验室系统与物理生物学研究所资深研究员周耀旗、分子之心创始人许锦波,天壤创始人薛贵荣参与讨论。近期ChatGPT爆火,欢迎添加作者微信(微信号:icedaguniang),互通有无。

在上篇中,几位嘉宾共同辨析“AIGC”这一概念,探讨生命科学界中的哪些成果属于AIGC,以及ChatGPT在生命科学领域中可能实现的任务。

在下篇中,将分别探讨AIGC为生命科学带来的可能性与其自身局限,以及中国能否在应用场景上快人一步,实现技术落地与产业转化。

“全球人工智能与机器人大会”(GAIR)始于2016年雷峰网与中国计算机学会(CCF)合作创立的CCF-GAIR大会,旨在打造人工智能浪潮下,连接学术界、产业界、投资界的新平台,而雷峰网“连接三界”的全新定位也在此大会上得以确立。

经过几年发展,GAIR大会已成为行业标杆,是目前为止粤港澳大湾区人工智能领域规模最大、规格最高、跨界最广的学术、工业和投资领域盛会。GAIR Live作为雷峰网旗下视频直播品牌,旨在输出新鲜、深度、原创的大咖访谈与对话内容,打造辐射产、学、研、投的特色线上平台。

以下是主题论坛的现场内容,雷峰网《医健AI掘金志》做了不改变原意的编辑和整理:

ChatGPT,是否会成为生命科学跨越式发展的契机?

龚新奇:目前来看,ChatGPT的文本生成功能确实挺强,第一次让我们感觉它像个人一样,能够自然地聊天,读懂你的感情、还可以体会到一些细微的褒贬。而且你可以正反提问,甚至还可以夸奖它、批评它。因此,ChatGPT的出现,能否比肩AlphaGo或是AlphaFold2的出现,是否会成为生命科学跨越式发展的契机?

周耀旗:我不认为ChatGPT可以比肩AlphaGo或是AlphaFold2。AlphaGo当年战胜了人类最好的棋手,而AlphaFold2在高精度蛋白质结构预测上取得了革命性进展,但ChatGPT对生命科学来讲,错误率太高、准确度不够,还不能算作一个跨越性的成果。

但我对它的未来版本充满了信心,特别是当ChatGPT跟搜索引擎结合,会大幅度提高它的精确度。因为它可以出具文献出处,还可以帮我们提供各个领域的综述、问题解决思路、促进不同领域沟通,甚至帮助学者撰写文章初稿。那么未来跨专业、跨语言的交叉研究就变得容易一些。

所以我认为,未来升级版本的ChatGPT完全可以成为一个创新枢纽。科学家把更多精力放在提出问题上,并根据AI的建议来优化、验证解决问题的方法和思路。所以ChatGPT的出现还是有一定的意义,它推动了一个有想象力时代的到来。

潘毅:我认为今后ChatGPT很有可能成为生命科学领域跨越式的发展契机。至于它的影响力,我跟周教授有不同看法,我认为ChatGPT的影响力会大于AlphaGo和AlphaFold2。

AlphaGo为专为围棋而设计,AlphaFold是专为蛋白质结构预测而设计,所以它们是一个为专业而生的AI平台。相比而言,ChatGPT是一款通用型AI平台,既可以交流,又可以撰写邮件、视频脚本、文案、翻译、代码,写论文等等,普罗大众都可以试一试,所以ChatGPT的影响力要远比AlphaGo和AlphaFold更广泛、更深刻。因此,虽然ChatGPT在生命科学领域里比不上AlphaFold,AlphaFold在围棋上比不上AlphaGo,本质是术业有专攻。

最近我和老同学黄学东聊天,发现他对ChatGPT的评价很高,“微软如今加码ChatGPT,是因为ChatGPT之于AI,相当于芯片之于计算机这么重要。”

要知道,黄学东多年担任微软Azure AI技术研究员和首席技术官,前不久刚刚当选2023年美国工程院院士,此前他并未将Alphago和AlphaFold定义为一个“里程碑式”的技术突破。

当然,周教授说得很对,ChatGPT在生物领域的影响力也许还没达到,目前ChatGPT无法处理复杂冗长或者特别专业的语言结构。但随着AI技术的改进,几年以后它一定会赶上,甚至会超过AlphaGo和AlphaFold。

从另一方面考虑,如今ChatGPT作为一个通用平台,应该如何推动生命科学发展?

一、生命科学领域的学者为其注入专业性更强的生物知识,只有进行足够的语料“喂食”,ChatGPT才有可能生成适当的回答。那时候,它或将用于蛋白质结构预测,蛋白质设计、蛋白质相互作用分析等各类任务。

二、指挥ChatGPT编写程序,比如Java程序、HTML程序,以及各种API( 应用程序编程接口)。那么未来生物学家只需要发出指令,ChatGPT就能完成从代码编写、接口耦合到程序测试的一系列工作。这也意味着,尽管很多人不能完全精通各种计算机语言,但我们只需要会做一些策划性工作,就能快速搞定项目。

宋乐:从通用人工智能的角度来说,ChatGPT确实是一个非常大的进步。因为在A I领域,过去的对话机器人很难媲美ChatGPT。因为ChatGPT除了逻辑严密的创造能力之外,还具有记忆能力,在连续的对话中不用大家提供重复信息,其语言组织和表达能力也更接近人类水平,使对话更自然流畅。

但实际上,ChatGPT的创造性、流畅度,多轮对话能力,依赖于多种AI技术的结合,包括它的训练方式都和过去的AI模型不太一样。

OpenAI使用了RLHF(Reinforcement Learning from Human Feedback,人类反馈强化学习) 技术对ChatGPT进行了训练,且加入了更多人工监督进行微调。因此,ChatGPT进一步提高了AI模型与人类的交互能力,对信息含义的理解能力,以及自我判断能力。

所以,ChatGPT的本质是对人类语言(自然语言、程序指令)反应能力的数学逼近。相比较而言,过去我们和计算机交互,要么自己打字,要么输入非常结构化、死板的程序语言。但现在就可以直接以用自然语言和计算机交互,把它视为人类助手。

最近斯坦福一位教授发现,GPT-3.5的智力已经和9岁的小孩相当,这是以前任何AI 程序都不可能达到的高度。总体而言,我认为ChatGPT是可以被视为里程碑式的AI成果,而且它确实会带来一系列的工业级应用,甚至未来基于ChatGPT衍生出更高级的AI模型。

说到这里,ChatGPT也有一些局限性,比如因为知识缺失,产生一些不正确或者荒谬的答案。

比如你问它“红烧蚊子腿怎么做”,它会给你一个正了八经的回答:先把蚊子腿洗干净,再熬制糖浆,然后放入葱姜蒜煮熟。”它只是把“红烧猪肉”的做法重复了一遍,把“猪肉”换成了“蚊子腿”。

还有一些有趣的例子,比如你叫它做一些算数运算。如果只是简单的单位数运算还好,但如果数字比较长,或者比较复杂,它就做不了。实际上,这体现了ChatGPT当前的训练模式的局限性,更加偏向于基于序列的拟合,或者表征生成序列的形式去训练。

所以ChatGPT还能朝什么方向优化?

一、未来需要向ChatGPT注入一些知识图谱,比如数学运算能力、生物识别能力,补齐它在这些维度的智慧;

二、对于蛋白质设计、药物设计等细分领域而言,就可以直接“外挂”一些专业模块,比如复合物结构模块、亲和力模块、蛋白质稳定性模块,当“外挂”越多,它的智力更高,也会输出更更贴合需求的结果;

三、我们也可以学习ChatGPT的算法思路和模型训练方式,“投喂”十亿级、百亿级的蛋白质序列数据,训练出一个专用于蛋白质设计的模型。

薛贵荣:我们比较有幸,2018年做过AlphaGo的复现,2021年我们做过AlphaFold2的复现。但总体来说,这些领域我们有胆量尝试,但从来没有尝试过的就是语言类AI模型。

众所周知,自然语言处理(NLP)、机器学习(ML)发展了很多年,但人机交互仍然不能做到问答自如,逻辑流畅。根本原因是建立自然语言处理模型的实用系统,需要不同层面的知识,比如汇学、句法学、语义学和语用学等知识。

而且NLP是一个交叉学科,涉及了方方面面的知识领域,包括计算机科学(给NLP提供模型表示、算法设计、计算机实现的技术)、数学(给NLP提供形式化的数学模型和形式化的数学算法)、电子工程:(给NLP提供信息论的理论基础和语言信号处理技术),以及心理学、哲学、统计学等等。所以从开发难度上看,ChatGPT都是当之无愧的AI界“天花板”。

阅读剩余部分

相关阅读 >>

马斯克:openAI和我创建它时的初衷背道而驰

moka发布首个AI原生hr saas产品 “moka eva”

上海工业智能中心在马桥AI试验区开工,总投资14.4亿元

美媒:马斯克等人呼吁暂停AI训练是对的 为了安

AI写旅游攻略出大笑话,微软下撤文章,但归咎于

科技大公司上万人研究AI,为何比不上openAI小团

google正在借助AI技术重新设计搜索体验并引入新功能

手机摄像头越多越好吗?旷视技术大牛解析AI多摄技术

AI和人类玩《龙与地下城》,还没走出新手酒馆就失败了

机器学习泰斗迈克尔·乔丹:AI不会替代人

更多相关阅读请进入《AI》频道 >>



打赏

取消

感谢您的支持,我会继续努力的!

扫码支持
扫码打赏,您说多少就多少

打开支付宝扫一扫,即可进行扫码打赏哦

分享从这里开始,精彩与您同在

评论

管理员已关闭评论功能...