90年代「最好基因测序算法」发明人徐鹰:AI生命科学的30年快意人生


本文摘自雷锋网,原文链接:https://www.leiphone.com/category/shengwuyiyao/uzRGbRN8yor2ycp9.html,侵删。

“我父母都是化学家,在学校教了一辈子书。父亲今年已经90岁了,照片上还挺健康的。这些年的研究,我从一个计算机科学老师,慢慢成了生物化学老师,终归是和父亲越来越像了。”

7月17日7点50分,上海还没出梅,温度徘徊在35度,闷热阴沉。

徐鹰透过舷窗看着机场入口处,因为24小时核酸报告折腾了自己两个小时的安保还站在原地,但自己却仿佛去了一趟魔幻现实主义世界。

他没想到的是,自己研究了一辈子的生物学,几乎每天都和蛋白质、核酸打交道,如今却要被一份有时效性的核酸报告急得团团转。

徐鹰坐在航班座位上,这是他在国内隔离14天后,第一次放松下来看看外面的世界,“谢天谢地,现在没人能再拦住我了。”

两个半小时后,他将和父亲一起在家乡长春见面。

从1993年起,过去的30年里,徐鹰每年这个时候都会回国住上一个多月,期间主持生物信息学领域的研讨会,开展青年学生的暑期课程。

但在2022年隔离期结束后,徐鹰的时间被压缩到只剩下22天。相比于去年夏天“14+7+7”的隔离政策,徐鹰反倒觉得时间还有很多,有足够时间开展今年的安排。

第二天,徐鹰发了一条朋友圈,把在上海隔离的半个月仔细整理出来,像是一篇纪实小记,最后一句话是“希望疫情能快点结束,大家都少遭点罪”。

90年代「最好基因测序算法」发明人徐鹰:AI生命科学的30年快意人生

配图是他和父亲站在长春的家中,蓝天白云,天气清爽。

梳理过去的工作,是徐鹰多年来一直保留的习惯。这个习惯也让徐鹰做成很多开辟性的工作,比如在橡树岭国家实验室和田纳西大学,共同建立美国最早的生物信息学博士点、创建佐治亚大学生物信息学研究所、发起国内两项生物信息学领域的国际研讨会——IBW与ICSB。

去年,徐鹰当选IEEE Fellow。在学术科技界,它被认定为权威的荣誉和重要的职业成就,每年由同行专家在做出突出贡献的会员中评选出,当选人数不超过IEEE会员总人数的0.1%。

这是徐鹰继2007年当选AAAS Fellow(美国科学促进学会院士)后的又一个重要荣誉。

多年的研究和奔波,让徐鹰亲历了生物信息学发展的三十年。很多人来了又走、走了又来,但徐鹰却逐渐从一个计算学者,蜕变一个生物化学学者,始终透着一股不知疲倦的兴奋。

一个25岁青年转行的故事

1985年,25岁的徐鹰刚到美国,人类基因组计划在美国被正式提出。

“生物信息学”在这一计划的推动下,成为一门新学科,迅速吸引到从生物学、化学、物理,以及数学和计算机科学领域而来的年轻人。

徐鹰从未想过,有一天会与生物信息学结缘。

从本科到博士,徐鹰一直读的是计算机系。1978年进入吉林大学计算机科学系(7年本硕课程),随后进入了美国科罗拉多大学博尔德分校,继续攻读博士学位。

其中一个重要的小插曲是,因为一直对数学感兴趣,当时徐鹰想要报考的是吉林大学数学系。但身为计算机学者的叔叔徐如镜建议,“(学数学)不如学计算机软件”。

徐鹰连这个专业名称都没有听说过。但听到能用计算机研究数学问题,决定改报计算机科学系。他的父母是该校的化学系教授,在学什么这个问题上,他们秉持“放养”模式,从未干涉过儿子的个人选择。

当时,吉林大学计算机科学系刚刚建系第三年,是国内最早从事人工智能研究的单位之一。

1976年,在王湘浩院士的带动下,一批有着深厚数学背景的吉林大学教授,如管纪文、刘叙华、姜云飞等教授,纷纷从拓扑学、数学转向了代数和计算机。七八十年代,吉林大学的计算机学者群星璀璨,扛起了国内人工智能研究的大旗,也为徐鹰等后辈们从事计算机研究,打下了极好的数学底子。

尤其是本科阶段,徐鹰深受教过他一年半《离散数学》的刘叙华教授影响,第一次发现了“数学的美”。这也让他坚定了,自己更擅长数学理论研究。

让徐鹰没想到的是,数学和计算机背景的他会在来到美国的八年后,成为人类基因组计划的亲历者,并在接下来的三十年里,一直扎根在生物信息学领域,成为一名(计算)生物化学学者。

1993年,是徐鹰在科罗拉多矿业学院任教的第二年。在这所工科见长的学校,他正苦恼自己的理论研究与学校有分歧,思考自己究竟擅长什么。

那段时间,徐鹰看到了橡树岭国家实验室(下称“橡树岭”)计算与数学部招人的消息。

凭借着数学背景,徐鹰顺利进入该实验室。

橡树岭,几乎可以用“科研圣地”来形容。这家成立于二战期间的实验室,曾参与到美国陆军部研制原子弹计划中,与新墨西哥州的一所实验室共同制造出两颗原子弹,其中投放到日本长崎的这颗,就是橡树岭所研制。二战结束后,原来橡树岭的管理部门——美国原子能委员会改名美国能源部,橡树岭的使命也变为能源研究。

90年代「最好基因测序算法」发明人徐鹰:AI生命科学的30年快意人生

位于田纳西州以西30公里处的克林顿小镇,坐落在山沟里

徐鹰参与的项目,正是当时大火的“人类基因组计划的测序工作”。

徐鹰回忆,实验室想找一个做统计的人,帮着他们在DNA测序序列中寻找蛋白编码基因,从而弄清楚每种基因制造的蛋白质及其作用。

那时候,徐鹰从并没有正经学过统计,但在研究员Ed Uberbacher的指导下,开始第一次尝试用统计方法写程序。

这也是徐鹰第一次将计算机、数学、生物这三门学科联系起来。

90年代「最好基因测序算法」发明人徐鹰:AI生命科学的30年快意人生

由于这一次的尝试,徐鹰似乎找到了门路和感觉。

1993年到1995年期间,徐鹰所研发的计算机程序GRAIL,成为那个时代最好用的基因测序工具。直到2000年代中期,这一程序依旧是该领域的研究“标配”,文章引用次数超1000篇。

此后,徐鹰在橡树岭的工作更加顺利。

1995年,徐鹰有了独立实验室,开始独立培养学生及博士后学者,也将基因组测序的工作逐渐交到学生手中。

1997年,徐鹰看到了新的机会——蛋白结构折叠——一个编码基因蛋白折叠成的三维形状将决定这个蛋白的功能。他要研究的是使用生物统计及计算方法,预测出蛋白质的三维结构。

徐鹰觉得,这项工作会涉及到更多的数学,也会涉及到一些物理,“或许可以做得很长久”。

1997年,徐鹰换到蛋白质折叠的项目也从原来的数学与计算机科学部,转到了生命科学部担任这一课题的组长,一点点从生物信息学的边缘走向中心。

一年后,徐鹰和许东(现任密苏里大学校董事会教授)第一次见面。

徐鹰说到,自己想找一个有生物物理背景的人,正好许东申请了橡树岭。

90年代「最好基因测序算法」发明人徐鹰:AI生命科学的30年快意人生

许东教授1998年,许东从美国国家癌症研究所读完博士,拒绝了一个工资翻了几倍的生物制药公司。

当时这个专业有多吃香?

据说,只要候选人会用特别简单的BLAST工具(生物大分子序列比对搜索工具),就是最抢手的人才。

许东称,1995年测序工作大火后,他看到一个制药公司一口气招了80多个生物信息学背景的人——全职。

“那真是一段泡沫期,很多人都挺动心,我当时也想去工业界,后来还是放弃了,我更喜欢做学术。”

此后的三十年里,许东与徐鹰轨迹几乎一致。如今他们都已卸任行政职务,成为各自学校的董事会教授。

时间回到1998年。许东的加入,让徐鹰的团队多了生物物理学(Biophysics)的背景。

他们一起做了一个蛋白结构预测程序Prospect,在蛋白三维结构预测上反响不错,二人也在生物信息学领域里小有名气。

2001年,人类基因组测序的工作草图完成,成为人类基因组计划中的重大里程碑,徐鹰和许东就是其中功不可没的两个人。两人共同获得了R&D100奖——《R&D杂志》颁发给世界上每年度最重要的100项发明创造奖项。

当时的李明(现任加拿大滑铁卢大学计算机科学系教授),已经是领域内人尽皆知的“大学者”。

他和堵丁柱教授在1995年在中国创办的COCOON会议(计算与组合学会议),如今已成为世界知名的理论计算机会议。

1997年,他曾运用信息距离理论以及自然语言理解,开发出新一代的搜索引擎,论文成果也在世界顶级会议KDD-07上发表。

90年代「最好基因测序算法」发明人徐鹰:AI生命科学的30年快意人生

李明教授机缘巧合之下,李明与徐鹰、许东两位成了好朋友,还拉着两人到自己公司Bioinformatics Solutions Inc(BSI)担任技术顾问。

被业界誉为“AI预测蛋白质结构全球第一人”的许锦波,那时候还在滑铁卢大学,跟着李明念博士。

经由李明的介绍,许锦波也参与到蛋白三维结构预测项目中。后来,徐鹰和许东将所有的源代码交给了李明和许锦波。在此基础上,许锦波也将这一程序发展得更好,打造出端到端模型及计算程序 Raptor。

90年代「最好基因测序算法」发明人徐鹰:AI生命科学的30年快意人生

许锦波教授时间来到21世纪。2002年年底,已经在橡树岭待了十年的徐鹰萌生出新的想法,动心再回学校。

一则橡树岭改为能源研究后,80%的经费都来自美国能源部。尽管不用愁钱的问题,但是研究方向成为了能源。

另外,从寻找蛋白编码基因到蛋白结构折叠,徐鹰也发现,自己对生物学具有极大的兴趣。

“或许,我不用再为别人做计算工具,完全可以用别人的工具,解决自己关心的生物学问题。”

2003年4月14日,人类基因组计划的测序工作全部完成,徐鹰的这一想法也更加坚定。

徐鹰和许东一同离开橡树岭,分别去了佐治亚大学和密苏里大学,一个成为学校首个生物信息所所长,一个成为最年轻的系主任。

2003年,李明也计划换个环境。因为不喜欢美国教学系统的条框束缚,他正准备离开加利福尼亚大学圣塔芭芭拉分校(UCSB,离洛杉矶1.5小时车程,号称全美最美大学)。

李明从朋友那里辗转听说了徐鹰的消息,主动联系后者。他表示,只要徐鹰想去UCSB,他就给系里写推荐信,接替自己的位置。

多年后徐鹰回忆,那时候,生物信息学领域中的华人学者会有一种“抱团”意识:不管是自己的“老大哥”李明、和自己“同窗”六年的许东,还是后辈许锦波,大家时不时聚在一块,互相扶持,一起钻研学科里的新问题。

不过,徐鹰并没有去UCSB。

当时,还有两所学校向徐鹰抛来了橄榄枝。

一所是纽约州立大学石溪分校(位于长岛),核物理学家、诺贝尔物理奖获得者杨振宁,曾在该校执教37年。

另一所就是徐鹰最终的决定——佐治亚大学。

徐鹰是东北人,东北人疼媳妇也是全国出名。当时,徐鹰的夫人在考察了三所学校后觉得,长岛和圣塔芭芭拉两地的生活费用太高,最后选择了位于雅典市的佐治亚大学。

就这样,徐鹰开始了在佐治亚大学的教学之路。

“来佐治亚吧,就是你了”

2000年初,生物信息学科红极一时。佐利亚大学的一批教授向学校联合提议,希望学校建立一个生物信息研究所。

囿于没有合适的所长人选,这件事一直拖了两年。

2002年年底,佐治亚大学的一位华人学者汪必成(现任生物化学与分子生物学系教授),听闻了徐鹰回归学校的想法,主动联系徐鹰到佐治亚大学做了一场报告。

报告结束后,两个人一起吃晚饭。推杯换盏中,汪必成提了一句,“这两年我们一直在物色一个生物信息研究所的所长,你有没有兴趣?”

见徐鹰还在犹豫,汪又称,“我们可以帮你拿到佐治亚州的科学协会(Georgia Research Alliance, GRA)著名学者讲习教授 (Eminent Scholar Chair)的位置,GRA是一个以招收世界级杰出学者的州政府项目。”

这份“就职礼”特别贵重。

具体来说,就是佐治亚州政府每年拿出3000万美元的启动资金,帮助州里的6所主要的公立大学面向全世界招生。美国《时代周刊》还为此做过报道。

徐鹰听闻,汪当初就是以这种形式,被从匹斯堡大学引入佐治亚大学。

2002年左右,佐治亚州里共有大概有三、四十个杰出学者,那些人起码都比徐鹰大20岁。徐鹰才40出头,自觉这份新工作“诚惶诚恐”。

相关阅读 >>

百度集团签约入驻 琶洲算法中心揭牌

华晨东亚汽车金融客服电话大全已更新2023(实时/更新中)马斯克称盖茨对AI的理解太有限 多年来依然如此

抵制AI绘图最简单的方式:用AI画米老鼠

智行旅行客服电话大全已更新2023(已更新中/更新)云收入翻番 AI打开增量空间

科技大公司上万人研究AI,为何比不上openAI小团

《赛博朋克2077》新AI过于强大 上世代主机无法享受

算法技术不可被用歪

马斯克称盖茨对AI的理解太有限 多年来依然如此

同盾科技李晓林:可信AI生态系统,将成为下一代AI医疗的「基础设施」

《人工智能产业担当宣言》发布 致力推动AI企业共举科技担当

更多相关阅读请进入《AI》频道 >>



打赏

取消

感谢您的支持,我会继续努力的!

扫码支持
扫码打赏,您说多少就多少

打开支付宝扫一扫,即可进行扫码打赏哦

分享从这里开始,精彩与您同在

评论

管理员已关闭评论功能...