河狸生存记:90后女博士与AI开发者们


本文摘自雷锋网,原文链接:https://www.leiphone.com/category/ai/kdRPmEuXMwtl9K0k.html,侵删。

初雯雯从小就知道,有一天,无论她走得多远,她都会回到新疆。

后来出去上大学,在北京,本科四年结束,她的许多同学都选择留了下来、成为一名北漂,但初雯雯几乎没有犹豫,就收拾行李回了新疆。

河狸生存记:90后女博士与AI开发者们

图注:初雯雯在阿勒泰

从北京到新疆阿勒泰市的路程大约3952.49公里,这个距离与她父亲在上世纪九十年代从山东到新疆的长度(3841公里)差不多,都是接近四千公里。

她记得,当年她的父亲初红军也是硕士一毕业就来到了新疆,因为硕士时研究河狸,所以一毕业就被分派到了阿勒泰地区的野外河狸保护站从事科研工作,是新中国有了《野生动物保护法》之后的第一批基层野生动物保护研究员。

阿勒泰位于新疆北部,在阿尔泰山南麓,南邻准葛尔盆地,是我国国家一级重点保护动物「蒙新河狸」在中国的唯一分布地。1990年,中国的河狸数量只有500只左右,比大熊猫还稀有,而在自然界中,当一个种族的数量低于400只,就会不可逆地走向近亲结婚、种族消退、退化直至消亡。如果人类不介入,那么河狸在中国领土上的消失就会成为一个无可挽回的结局。所以,初红军的到来对河狸有着泰山般的意义。

两岁那年,初雯雯也随母亲来到了阿勒泰,支持父亲的野生动物保护工作。

因为人手紧缺,所以初雯雯的父亲在她很小的时候就带着她一起工作:在她七岁的时候,初红军就教她骑马,用样线法调查野生动物,在电脑中作表格数据的输入。外出巡视时,他也会把初雯雯带在身边,无论高山与草原,无论寒风与酷暑,初雯雯也从小就开始用望远镜眺望远处出没的动物,并用相机将见到的野生动物拍摄下来,记录存档。

令初雯雯印象更深刻的是父亲往家里救助受伤的野生动物。在她很小的时候,初红军曾往家里带过一只出了车祸的小黄羊,小羊的身上流着血,呜咽着,生命奄奄一息。这给初雯雯幼小的心灵里带来了很大的震撼:

「因为我从小在阿勒泰长大,阿勒泰的野生动物有很多,我心里面会默认,它们都在跟我一起长大。」

但大自然的残酷面却也释放了它的杀伤力。除了车祸事故,一只野生动物还可能在恶劣的野外环境中遭遇到许多无法预知、难以避免的伤害。比如,一只野生狐狸仅仅在觅食的过程中,就可能误食中毒的老鼠而死亡,更别提栖息地的退化和其他更不可抵抗的外力因素。

救,还是不救?怎么救?这是初雯雯从小就开始思考的问题。

几乎每一年的冬天,她的父亲就会带着她去给因为雪层太厚而无法进食的、虚弱不堪的鹅喉羚、野马、野驴补饲。阿勒泰的冬天在最冷时温度可以低至零下四十度,出去一趟往往要在野外呆上七八个小时。

河狸生存记:90后女博士与AI开发者们

当伤亡发生在一个庞大的种群中,生命的消逝往往被归结为自然规律的推进,但对一些濒危物种来说,一条生命的死亡就事关一个种群能在人类历史的长河中走多远。比如河狸,中国只有500只左右,若它们整体的繁殖数在一段时间内低于死亡数,就意味着中国河狸愈发接近彻底消亡。

对河狸来说,「受伤」是一件太过奢侈的事情。

所以,初雯雯从小就立志,要像她的父亲一样,当一名野生动物科学家。本科时,她在中国农业大学修读英语与传媒双学位,为阅读研究野生动物所需的大量外国文献作准备,本科毕业后又考到了北京林业大学的野生动物专业读研、读博。

2017年夏天本科一毕业,初雯雯就回到新疆。野生动物专业的课堂教学比例极少,更多是野外科研和实践,而阿勒泰有超过四百种野生动物,被列为国家级保护动物的就有74种,对她来说是一个得天独厚的实验室。第二年,她就发起成立了阿勒泰地区自然保护协会(以下简称「协会」,致力于野生动物的实践保护,其中河狸更是她继承父志的重点目标保护对象。

如何保护河狸?这是一个庞大的问题。

在从小跟着父亲做调研的过程中,初雯雯知道,位于我国的蒙新河狸现存197窝,主要分布在阿勒泰乌伦古河流域。乌伦古河长达725公里,大约是北京到新疆的五分之一路程,无论是支援还是救助,开展工作的难度都不小。

河狸生存记:90后女博士与AI开发者们

初雯雯与团队在前期做了许多工作,其中工程最浩大的一项工作就是沿着725公里长的乌伦古河架设了超过500台红外摄像机,这主要是为了实时获取有利于河狸保护的生存数据,包括:

不同季节、上下游河道、河水旱涝、人为活动等方面对河狸的生存情况所造成的影响;

河狸对周围生态环境的影响,如是否有更多的物种在河狸制造的小生境内聚集,被河狸制造的小生境聚集来的物种在数量上是否每年有增长;

河狸的繁衍数据,如生育情况和幼崽存活率,当相机能够全面覆盖每一窝河狸,通过对周围的生态环境因子拍摄和分析就能发现更多可以帮助河狸提升种群数量的地方。

这些图像数据扮演了十分重要的角色。协会成员王大鹏与晋博琛都感叹:「图像数据的获取与分析虽然是前期工作,但至少占到了 50% 的重要程度。如果没有这些数据的支持,我们有力气也不知道往哪里使劲。」

换言之,要打保护河狸这一场仗,人员已经到岗、力气与信仰也已经鼓起来,那么目标是什么?就需要这500台红外相机所拍摄的图像数据的指引。这不能光靠想象,也不能单凭经验。比如,2019年,初雯雯与团队在前期对科研数据与影像资料的分析中就发现,河狸最迫切需要解决的事是如何拥有新的食物资源充足且能为河狸种群提供栖息、遮蔽条件的生存栖息地。在科研数据的基础上,协会决定发起一个叫做「河狸食堂」的公益项目,在更多自然生境因子与河狸栖息地接近的区域来种植灌木柳,人工为河狸修复栖息地环境,从而解决河狸的吃饭问题和繁衍环境问题。

但问题是:总共有500台红外相机!可想而知,一年所录制与拍摄的影像数据有多庞大,如何高效处理这些数据成为保护河狸工作中的首要难题。

「数据来源有监控视频/红外相机采集及野外观测拍摄等一系列方式,我们测算过,我们一年的数据产生量超过400 Tb,如果想要完全把这些数据消化,需要数千小时的人工工作量,往往是去年的数据还没有消化完,新的一年又攒了一大堆数据。面对这种情况,我们都很无奈。」晋博琛介绍。

而且,他们发现,靠人眼在海量的影像数据中甄别河狸的活动频率、河狸窝周围的其他生物数量与种类等等,无异于大海捞针,不仅速度慢、时间长、难度大,而且准确率极低。

河狸生存记:90后女博士与AI开发者们

图注:中国第一张河狸在野外修水坝的照片,由初雯雯所摄

有什么办法可以解决这个问题?

2020年,一次偶然的机会,初雯雯与协会成员在新闻中看到我国的科学家用 AI 技术识别不同的大熊猫个体,效果很好,心中灵机一动:AI 或许也可以帮助解决河狸识别与图像数据处理的问题。有了这个想法,他们就开始寻找能够提供「X脸」识别技术的团队。

刚好这时,远在四千公里之外的北京 Baller-Tech 团队也正在寻找一个将 AI 算法在野生动物保护中落地的场景。

Baller-Tech 团队有5位年轻人:1名数据工程师,2名算法工程师,1名软件开发工程师以及1名产品经理。他们都是刚刚从企业辞职出来,准备自己创业。

其中,算法工程师曹骥原先是某人工智能大厂的首席技术官(CTO),在视觉算法领域耕耘二十多年,有深厚的落地研究经验,同时,他又是一位野生动物爱好者、环保主义者,一直希望用人工智能帮助改善自然生态环境。

河狸生存记:90后女博士与AI开发者们

在阿勒泰地区自然保护协会「找人」的同时,Baller-Tech 也在找场景。

最后,通过一位同样热心自然环保的朋友,初雯雯找到了 Baller-Tech。当时,Baller-Tech 因为本就对生态保护领域感兴趣,而且已经开展了尝试性的研究,所以他们双方仅通过一次远程的腾讯会议,就一拍即合。

Baller-Tech 懂 AI,初雯雯深谙野生动物保护知识,双方优势互补,显然是一次双赢的合作。

3、平行线交集的难点

「这绝对不是河狸!」

晋博琛回忆,无奈笑道:在整个产品的研发过程中,这是他们听到最多的两句话。

通常来说,大熊猫的个体庞大、活动简单,对大熊猫的图像采集往往能够得到清晰、准确的图片,但生活在野外水域的河狸出现在摄像头里的姿态与行为却要复杂得多。比如,有时候河狸在水中只露出面积很小的一部分身体,而这部分身体的特征并不那么明显,即使是专业人士也难以判断,更别提对河狸本就了解不多的技术人员。

「我们经常争得面红耳赤。关键是在河狸生存的区域,还经常有一种跟它看起来很像的动物叫麝鼠出没。这个事情应该让我们的数据工程师的发际线又上移了一公分……」Baller-Tech团队笑道。

河狸被称为「生态指向性物种」。它们会自己修水坝,围成一个小池塘,粪便养活一些水草和藻类。有了水生植物,就会吸引到鱼类聚集,鱼类又会吸引水鸟、狐狸、金雕、獾类等等,但凡有河狸巢穴所在的地方,都会变得生机勃勃。

此外,河狸的生活环境比较复杂,它的活动范围内会有草、灌木、树木,活动时会被遮挡。同时河狸是一种夜行动物,采集到的图像会比较昏暗、模糊,许多时候河狸的颜色也与周围的环境混为一体,难以区分。这些都对观测与前期对数据标注造成不小的挑战,不利于 AI 算法的优化。

河狸生存记:90后女博士与AI开发者们

图注:红外摄像机采集回来的河狸照片

人工智能与野生动物保护,看起来似乎是完全没有交集的两条平行线,但在河狸保护这个目标上,阿勒泰地区自然保护协会与Baller-Tech却奇妙地相遇了,且达成一致:就是要在河狸保护的庞大工程中引入 AI 来帮助解决一些问题。

但在前期的沟通中,双方也不可避免地遇到了一个典型的跨学科合作问题:一方真正想要的是什么,另一方能够给到的又有什么?

「我们的环保工作者需要明白,AI技术并不是给它一张照片,它就能准确找到照片中的河狸。而科技工作者也需要明白为什么河狸不能像大熊猫一样,可以迅速做到精准的个体识别。」协会成员向我们解释。

为了达成科研路径的统一,Baller-Tech团队与协会每个月开两次会,也从北京前往新疆三次,实地视察,去了解真实的应用场景,进行环境分析。

河狸生存记:90后女博士与AI开发者们

图注:Baller-Tech代表与初雯雯在新疆会面

最后,他们把路线定了下来,路线分为三步:

一是专门为协会提供过来的海量图像数据开发专门的标注工具;二是将海量图像中拍摄到内容与没拍摄到内容的图片分开,因为红外相机采集回来的数据中有高达90%的图像是没有采集到实用内容的;第三步就是将收集到的内容进行精确标注,再训练模型,做河狸与其他物种的识别。

在合作的过程中,Baller-Tech就发现,虽然当前许多 AI 算法都有开源的模型可以参考,且大多数开源工具本就具备普适性,可以用来做想法验证与解决部分问题,但对于生态保护这种严肃且专业的领域,从「跑通」到「可用」往往隔着层层壁垒,需要大量的调整和优化,甚至是推倒重来。开发了专门的标注工具后,他们的效率就提高了很多。

但除了数据的标注与模型优化,他们的工作也面临一个亟待解决的问题:算力。

一方面,算力对Baller-Tech与协会来说都是一笔高成本的投入。环保不是八百米疾跑,而是马拉松徒步,除了图像数据的处理,还有许多支线工作,如初雯雯与协会成员在腾讯公益上发起「河狸食堂」、「河狸守护者」、「河狸方舟」三个项目,分别是种植河狸食用所需的獾木柳、给予阿勒泰当地参与河狸巡视的牧民金钱津贴、建造救助受伤的河狸与其他野生动物的救助中心,对于一个公益项目来说,这些都是一笔不小的开支。

另一方面,解决算力需要部署服务器。Baller-Tech团队主要驻扎在北京,阿勒泰地区自然保护协会则位于新疆,服务器放在哪座城市又成了问题。若放在新疆,Baller-Tech远程部署与维护的精力要加大,且新疆野外的网络不够稳定,通过网络将数据从新疆传到北京的过程也会非常缓慢。

由于算力的限制,他们在过去三年虽然取得了许多不错的成果,但进度仍然较缓慢。

他们一边寻找解决技术瓶颈的方法,协会与腾讯公益发起的三个项目也陆续取得了不错的成果。这给他们带来了很大的鼓舞,因为公益在本质上就是一件靠纯粹的热爱来维持的事情。

从2018年至今,四年多的时间里,「河狸食堂」项目成功在乌伦古河流域种下60余万棵獾木柳,解决了河狸的食物问题。这并不是一件容易的事情:

「因为乌伦古河的河畔是沙质化土壤,这就相当于在沙地上种树,含水性本身很低,且新疆夏天戈壁滩上的太阳又很大。河道长达750公里,我们是徒步走着提水桶浇树。把树种下去,经常是早上浇完水、中午就干了,下午树都蔫了。大家都很辛苦,浑身晒得漆黑,但树苗的成活率还是非常低。」初雯雯回忆第一年的场景。

河狸生存记:90后女博士与AI开发者们

图注:初雯雯与协会成员在乌伦古河流域附近视察獾木柳的生长情况

后来,初雯雯回到了母校,找到了北京林业大学的教授们,请教他们种树的方案,在第二年尝试了好几种种植方法,才在第二年攻破了种树的难关,把成活率提高到50%、60%,再到第三年的70%、80%。

光有食物还不够,他们还沿着750公里的乌伦古河流域召集了500个牧民充当巡护员。当地的哈萨克族牧民讲哈萨克语,初雯雯与团队成员又从头开始学哈萨克语,不仅要会说,还要会写,他们就一家一家地科普河狸的生活习性,对牧民做野生动物学、植物学、昆虫学、生态学的基础课程培训。

经过他们的努力,四年间,濒危动物河狸的数量从500只左右增加到了610只,增长了20%,被联合国称为「奇迹」,入选了联合国COP15全球100个生物多样性经典保护案例。初雯雯在今年也获得了中国青年的最高荣誉——「青年五四奖章」。

这些成果对阿勒泰地区自然保护协会与Baller-Tech团队来说都是一种极大的鼓舞,既肯定了他们的努力,又推动他们想要继续往前冲,与时间赛跑,在有限的时间内为保护野生动物做更多的事情。

今年年初,协会的成员注意到了腾讯联合中国儿童中心发起,由腾讯企鹅伴成长、腾讯可持续社会价值事业部创新办学实验室、腾讯企鹅爱地球、腾讯优图实验室、腾讯云AI、腾讯云微搭低代码、腾源会联合承办的第二届「腾讯Light·公益创新挑战赛」(以下简称为「Light挑战赛」)。

Baller-Tech团队原本在烦恼算力的问题,一直希望找到更强大的人工智能团队支持,了解到腾讯云依托腾讯优图实验室等顶级AI研究团队,在云上 AI 技术发展一块取得了非常不错的成绩,当下就拍手决定:

「我们一定要参加。我们不为了别的,但如果技术研发能够得到腾讯云的技术支持,我们这个项目就可以快马加鞭地往前走。」

据了解,腾讯云AI通过公有云日处理图像超50亿张,日处理语音超250万小时,日处理自然语言超千亿句,服务全球用户数超过12亿。在今年的腾讯Light挑战赛中,腾讯云AI联合腾讯优图实验室、腾讯云微搭,给参赛者提供了多样化的 AI 技术与微搭低代码平台,吸引了超过 1438 支参赛团队。

由于上云就意味着数据的公开,此前中国还没有公益组织尝试过将数据上云。

从技术效果的角度看,云服务有着天然的优势,就是高效、便捷。晋博琛告诉AI科技评论,他们这次参加腾讯Light挑战赛也是一次大胆的尝试,但参赛的好处也是明摆着的:一是解决了算力的瓶颈,二是上云后,Baller-Tech可以在腾讯云上部署模型、并通过腾讯云提供服务,阿勒泰地区自然保护协会也可以直接从腾讯云上调用分析数据。

腾讯云提供了便于开发者的部署、扩容、监控、展示一站式服务,使 Baller-Tech 的团队成员可以将更多的精力放在河狸的 AI 核心研究与开发上。

相关阅读 >>

openAI ceo:将发布工具让用户定制AIgc系统

罗德推出AI-micro新品

夸克举办“AIgc与场景化应用创新”主题研讨会 探讨大模型应用新趋势

3d建模AI的背后,可能只是一群人类临时工

马斯克谈AI监管:监管确实会令人讨厌,但有一个

毅能达pos机全国24h客服电话大全已更新2023/2/28(实时/更新)钟薛高发布sa'saa系列冰棍新品,称由AI打造,定

一点车贷全国官方客服电话热线大全已更新2023(实时/更新中)chatgpt火了!微软谷歌等科技巨头裁减AI伦理员工引发业界担忧

用api接入更安全,openAI称不会用付费客户数据

deepmind 首席科学家 oriol vinyals 最新访谈:通用 AI 的未来是强交互式元学习

openAI、微软、谷歌等科技巨头本周将讨论制定AI

更多相关阅读请进入《AI》频道 >>



打赏

取消

感谢您的支持,我会继续努力的!

扫码支持
扫码打赏,您说多少就多少

打开支付宝扫一扫,即可进行扫码打赏哦

分享从这里开始,精彩与您同在

评论

管理员已关闭评论功能...