本文摘自雷锋网,原文链接:https://www.leiphone.com/category/healthai/FuPQQOSpxEHDccoO.html,侵删。
一个不争的事实是,在医学影像分析领域,华人学者的影响力越来越大。
近三年(2019、2020、2021),先后有六位该领域的华人学者当选IEEE Fellow(一年IEEE约有250名左右的Fellow产生,相当于会员总数的0.1%)。
IEEE全称是电气与电子工程师协会,医学影像作为其中相对“小众”的一个类别,获此殊荣殊为不易。
论文的接受数量,也进一步佐证了这一现象。
2019年,华人学者沈定刚教授成为MICCAI大会主席,他曾以MICCAI为例,向雷峰网(公众号:雷峰网)分享过一组数据:
在相当长的一段时间里,国内(包括香港)每年有十篇左右的文章会被(MICCAI)接收,比例只有3%-4%。
但这个现象在2019年完全不同——亚洲的录取文章比例已经达到37%(美洲为36%,欧洲为26%),超过了美洲。在亚洲的录取文章里,绝大多数(150篇左右)来自于中国。
在两年后的今天,这种学术趋势越来越明显。对学者而言,如何做出有水平的研究成果,实现高效的产研转化进而造福人类,是毕生的追求。
近日,由雷峰网与图像计算与数字医学国际研讨会(ISICDM)联合主办的"IEEE Fellow圆桌对话",邀请了近三年来当选IEEE Fellow的五位学者,围绕医学影像产学研融合的话题进行了深入探讨。
中国科学院自动化所研究员蒋田仔
中国科学技术大学讲席教授暨生物医学工程学院创始执行院长周少华
电子科技大学电子工程学院教授李纯明
东南大学脑科学与智能技术研究院创院院长彭汉川
腾讯天衍实验室主任郑冶枫
圆桌由南方医科大学生物医学工程学院的冯前进院长担任主持;MICCAI 2019大会主席、上海科技大学生物医学工程学院创始院长沈定刚教授进行致辞,对青年AI学术人的治学提出了诸多建议。(文后附致辞详细内容)
以下是圆桌论坛的现场内容,雷峰网《医健AI掘金志》做了不改变原意的编辑和整理:
南方医科大学生物医学工程学院院长 冯前进
冯前进:近年来,越来越多华人在医学影像分析领域做出了杰出成就而当选IEEE Fellow,包括在座各位专家。请大家谈谈科研的经验与感想,如何做高水平、有影响力的学术研究?
蒋田仔:每个人对高水平定义肯定不一样,我觉得对这个领域或社会有意义的事,才是高水平。
我原来搞数学,从本科、博士都是学数学,后来做脑科学,从2000-2010年这十年基本上以写论文为主,发表了很多论文,却不能解决现实问题。
我们申请科技部“973项目”的时候,分析了以前的问题。
发现脑科学研究缺乏一个靠谱的脑图谱,所以,我们的项目设计了有三个主题:脑图谱、脑连接、疾病的脑网络表征。
该项目绘制的“脑网络组图谱”临床影响就很深远,因为有很多临床应用场景,包括精准诊疗的生物标志、治疗和调控靶区等等。
周少华:我非常同意蒋田仔教授观点。我博士做人脸识别,后来“误打误撞”加入西门子医疗开始医学影像的研究,研究了很多来自临床实践的问题。
我觉得临床实践才是医学影像研究比较好的途径,因为实际临床问题是重要的问题来源。
真的能解决某个临床问题、做出有影响力的工作才是高水平。
李纯明:我结合个人背景谈一下我的看法,我本硕都是数学,虽然博士读的是电子工程,后来一直在工科领域工作,但还是受数学影响比较深一点。所以我的研究偏数学一些,看法可能有些偏颇。
针对做算法的文章来讲,我认为一篇有长久影响力的论文应该具备以下四个特征:
第一,创新性。首先是文章的创新性,所提出的方法要新颖独特,这样才能成为作者的一张名片。
第二,有效性。文章里的实验结果首先要可复现,而且要有优势,至少在某些方面要优于其它方法。
第三,理论性。文章要有很好的理论支持,在理论层面或数学模型上就能够清晰地解释方法的工作机制,这样才能让人知其然,还知其所以然,让人心服口服,产生更深远的影响力。
第四,简洁性。文章的数学模型、公式和算法的表达都要尽可能简洁。
因为简洁可以让很多人在此基础做进一步研究,用起来更方便,容易让别人在你工作的基础上做进一步的研究,也更容易被记住。一篇经典的论文或一个fundamental的贡献往往具有简洁性。
现在很多深度学习论文的同质化比较严重,就是创新性不高,即不满足第一条特征,而且大部分论文也不具备第三条和第四条特征,往往只靠第二条。
即只依靠在某个数据集上的实验结果取胜,就是人们常说的“刷分数”,但因为缺乏理论性而不能让人心服口服,也许换一个数据集结果就分数很差。
而且,一个方法在某个数据集的挑战赛上得了第一名,也许第二天就被别的方法比下去了,很难维持长久的影响力。
彭汉川:蒋田仔教授他们一直都是体量比较大的项目,比较容易看到临床的巨大需求。但许多研究相对比较小众,项目曝光不大。
这种情况下怎么才能做出被大家关注的工作?
我曾经长期研究人工智能项目,博士后阶段后才开始做放射科学、医学影像技术、从事临床相关的数据挖掘。
后来,在2002年接触了新兴的基因组、基因表达研究,还有单细胞影像数据等等,逐步意识到,生命科学影像数据可以比传统医学影像数量级大很多,迫切需要新方法新系统。
2005年左右,这些研究的数据集进一步扩大,于是我尝试了很多方法学创新,其中也借鉴医学影像方法改进,但大量创新研究导致了全新的多维影像大数据平台并得到越来越广泛应用,现在也开始对医学影像数据处理产生了一些促进作用。
所以个人体会是,若想做出重要工作,需要经常跳出自己的视野,经常做一些跨界性研究,这个过程中会做很多不一样的工作,产生不一样的成果。
因此,我并不特别关注怎么做出高水平、有影响工作,而是如何在不同领域中使工作更有趣,同时把这些信息传递给合作伙伴,让大家慢慢把研究做起来,这样很多所谓的高水平工作就会自然产生。
郑冶枫:我在工业界工作了十几年,和周少华老师在西门子美国研究院共事十几年,工业界和学术界研究不太一样。
学术界比较自由,瞄准有意义的方向就容易出成果。但工业界没有太多自由,但好处是课题都是临床实际问题,都是医生迫切需要解决的好问题。
研究目标就是解决这些需求,所以我们被逼着死磕这些问题,确实有些问题很重要,但解决起来非常难,一旦解决就能推进技术发展。
例如,我曾用五六年研究如何从CT抽取冠状动脉,冠状动脉非常细,只有CT分辨率才能看清楚血管是否被堵住,想要解决非常难。
当时,我们参考了学术界方法,引入机器学习和深度学习,得到比较好的结果。
冯前进:深度学习兴起后,医学影像AI领域涌现一大波论文,这些论文与前深度学习时代论文相比有哪些不同?传统方法该何去何从?
郑冶枫:深度学习出来之后,最近5、6年所有方法都被深度学习覆盖,已经很难看到传统方法,我不希望某种方法一统江湖,压抑其他方法改进。
例如,现在模型越来越大,达到千亿、万亿级别参数的模型。搞得许多研究机构根本跟不上,像GPT那种需要几百、几千个GPU训练的模型,大部分实验室都没有这样的条件。
而且这种数据堆砌的方法不适用所有领域,例如医学影像没有那么多优质数据,几千个数据就是很大的数据集,这种情况下我会更聚焦算法创新。
除此之外,深度学习时代还有很多同质化现象,许多研究只是在神经网络结构上做微调,这不是一个好的现象,研究方式手段还要丰富多彩。
在深度学习如此火热的当下,之前旧的方法还是有很多可以探索的地方。之前我们更依赖于先验知识,而不是数据,用先验经验设计模型,现在靠数据、靠模型,这不太一样。
我最近就在研究把传统方法和深度学习结合,在数据量比较少的情况下提高准确率。
比如,传统的字典学习是生成模型,一般优化重建图像的损失,而在测试阶段是作为分类模型使用的,训练目标和测试目标不一致。
将字典学习和深度学习结合,我们可以做到端到端学习,训练和测试的设置一致,可以提高准确率。我们将这个方法用于CT图像去金属伪影,取得不错的效果。
最近几篇论文都是这个方向,因此我还是希望传统方法能和机器学习有机结合起来,发挥两者优点。
中国科学院自动化所研究员 蒋田仔
蒋田仔:深度学习只是一种方法,很多人把深度学习当作人工智能,认为人工智能就是深度学习。我觉得这值得思考,甚至要泼一些冷水。
2006年深度学习出来的时候,我就叫学生看了,但用处不明显。因为深度学习需要大量高质量、有标签的数据,对数据和人工要求都非常大,当时还不满足条件。
后来的深度学习越来越热是因为许多主要领域都有了数据积累。
即便如此,我还是要持不同的看法,很多问题是深度学习无法解决的,例如脑疾病问题需要最后追溯到哪个脑区和网络的损伤形成的,一般深度学习做不到,需要传统方法给临床提供一些帮助。
所以,未来也许有会出现深度学习更好的方法,但每个方法都有其优缺点。
彭汉川:我是1994年开始学习和使用人工智能包括很多人工神经元网络模型等,用了8年时间在早期先驱的原始代码上做各种实验也提出了一些新方法。
后来有幸又和做Bayesian Networks的首个学习算法提出者合作两年,做了医学图像数据挖掘的研究,之后大约进行了近20年的生物影像信息学大数据新领域的开拓和研究。
针对主持人的问题,我现在认为当今脑科学、生命科学研究和深度学习有很大关系。
现在,许多研究都已经可以用Deep learning解决方案,确实在很多工作中取得很好效果。对此,还是应该保持欢迎趋势而不是抗拒。
学术圈一种观点认为,这虽然叫深度学习,但不一定有“深度”。但深度学习好不好,还需要看应用场景。
例如,通过数据集成,在单个显卡训练或运算就能达到前所未有的效果,对学术研究是利好的,没必要拒绝。
另一方面,我们也注意到医学影像等现实需求中有大量问题,并不适用于深度学习方法。
例如,数据传输问题就不能被简单使用分类策略解决,数据可视化和标注也需要使用特定策略,不能简单套用所谓深度学习的框架。
实际上,一套医学影像AI系统不只是有深度学习模块,还有结果验证、校验、可视化、再编辑等等问题,需要一整套系统,而不是只是中间某个特定分类问题。
根据应用场景,我们可能不会只使用深度学习这一类方法;能解决问题同时又较少带来新问题的方法是最好的方法。
电子科技大学电子工程学院教授 李纯明
李纯明:我想说的有两点。
第一,现在的深度学习文章或方法同质化比较严重,大家可能觉得每个文章都能提出创新点,但方法上都大同小异,同质化比较严重,大批文章都比较类似。
同质化也造成一个很严重的审稿问题:要拒就全部拒,要接受就全部接受,许多文章貌似有道理,就被成批成批录用。
这样会出现一个恶性循环,文章一多,审稿的需求就增加,带来素质较差的审稿人。
第二,审稿人的不专业,许多本科生都来发顶刊文章,进入学术界,这些人进来之后就导致很多不好,水平比较差或没创新的文章被录用进来,产生恶性循环。
这和十几年前的学术界很不一样,当时的文章都比较注重理论创新,要有所突破。当然,其中也有人刻意加很多数学公式,把文章搞得很复杂,导致审稿非常困难,和现在正好相反。
周少华:我再补充一点,过去研究的很多都是临床问题,这些问题从更大层面角度都是刻划数据的分布问题。
我认为,深度学习是目前发现的一个最好的方法,过去的先验知识,或其它传统方法也都是数据分布的刻划,这一点上深度学习或许是一个最完美的手段。
当然,我也不喜欢模型变得越大越深,这让很多研究人员的工作越来越困难,所以深度学习还有很多问题,例如无法解决数据少的问题。
例如医学影像即使使用分布迁移的手段,也可能面临鲁棒性问题,让之前的努力都前功尽弃。
冯前进:在产学研融合方面,医学影像分析是一个交叉性质十分鲜明的学科,需要与医生进行广泛、深入的交流,要将一个好的模型转化为医生使用顺手的工具有很长的路要走,能否分享你们与医生合作印象较深的案例?
彭汉川:医生本身也需要很多科研需求,希望借助新方法在临床样本上看到不太一样的东西。
相关阅读 >>
meta开启长期AI研究项目 欲让人工智能像大脑一样处理语音和文本
长城播报 直通冬奥|AI+监控:北京启动人工智能技术巡查文物
lg u+ 无线优化技术部总监kim min gu:5g AI+系统节能降耗成效显著
gAIr live|五位学者大论道:chatgpt,能否重构中国生命科学界的底层逻辑?|(下篇)
更多相关阅读请进入《AI》频道 >>