让听得见炮火的人来做 AI


当前第2页 返回上一页

以数据处理为例。吴恩达在“二八定律”中对数据之于AI的重要性有非常直观的描述:80%的数据+20%的模型=更好的AI。

充足的数据是算法模型成功的前提,但数据处理环节极为庞杂,即使是最成熟的人脸识别,训练一个模型也大概需要千万的样本量,整个数据处理工作则要占项目总成本的近60%,占项目开发周期的80%。

如今,随着产业分工的加速和技术的提升,专业数据处理机构和AI算法辅助标注平台,可以通过预识别模型的方式,先将数据处理一遍,尽可能识别物体,再交由标注员操作,就可以将效率提升近一倍。

除了处理效率外,数据处理质量也在提升。在传统数据处理过程中,主要通过人工抽查的方式对数据标注质量进行查漏补缺,但通过AI辅助质检,不仅可以变“抽查”为“遍查”,还可以将平均数据准确率提升5%以上。

除了数据之外,走向成熟和标准化的还有算力产业。

根据方舟评估委员会的研究,虽然过去十年,人工智能计算的复杂度每年飙升10倍(每秒千万亿次运算),但与此同时成本却每年下降10倍。比如, 2017年在公共云上训练像 ResNet-50这样的图像分类器,成本约为1000美元,到了2019年只需大约10美元。

究其原因,一方面是AI架构的升级,另一方面则是专用芯片的出现及其性能的提升,比如 Nvidia于2017年发布的 V100显卡,比三年前发布的 K80 快1800% ,还有一方面则是智能算力建设取得的成就。

据工信部数据,截至2021年底,全国在用智算中心超过20个;算力产业规模近五年平均增速超过30%,排名全球第二。预计到2023年,智能算力在总算力中的比重将超过70%,发挥核心拉动作用。

风云万变一瞬息,在短短几年间,智能算力从新生事物成为新基础设施。这让AI训练和落地更有底气了。

最直观的表现是,2012年前罕见使用GPU进行计算,2015年以后,大规模使用上百个GPU进行训练成为常事。而作为AI落地最常见的载体,智能摄像头的价格单位也早已从万元降至千元甚至百元。

市场需求催生专业分工,专业分工促进技术升级,技术升级导致性能迭代,性能迭代孕育成本降低,成本降低成就广袤的市场需求。

数据端和算力端大致走完了这样的闭环,这在行业层面让算法研发的类型更多元、周期更短、成本更低。但这依旧不足以实现“智赋百景”背后的期望,整个产业对算法生产能力的期待呼之欲出。

3、AI 落地的新支点

如果说,变人力为机器,变复杂为标准,是数据和算力一日千里的秘诀。那么,算法有没有可能标准化?

2012 年,加拿大不列颠哥伦比亚大学的 Frank Hutter 教授等人提出自动选择模型与优化参数的 Auto-WEKA,是第一个 AutoML 点工具。之后,除了调参,也有针对网络结构、函数选择自动化的 AutoML 陆陆续续出现。

AutoML,即自动机器学习,是一种用AI训练AI的工具。

但单点上的突破,并不能真正改变产业模式。AI 算法的生产特性决定了,但凡还有一个环节需要算法工程师操作,包括算法在终边端的部署,就又回到了 AI 落地难的原点:离开算法工程师,算法开发就转不动了。

基于此,更多算法公司将AutoML当做专业算法工程师的提效工具。但只要AI的生产和应用还掌握在少数专业算法工程师手里,AI就像是一种奢侈品;其背后的巨大需求潜力,也就没法释放出来。

如果想让整个AI产业链的齿轮咬合紧密衔接丝滑,必须实现端到端的算法全链条自动化——这是新十年AI创业者的重要方向,「共达地」就是其中之一。

和单点自动化的AutoML不同,共达地要做的是AI算法生产全链路自动化的AutoML,是要将深度学习视觉算法开发的链条细细拆分,分成 13 个环节,从「数据分析」开始,一直到芯片适配,在算法开发的每个环节都设计不同的算法来代替 AI 工程师的工作。最终实现的效果是,数据上传后就能自动训练模型,训练好的模型可以像安装 APP 一样下载。

让听得见炮火的人来做 AI

这个过程相当于把数据、算法与算力进行了拆分,分别自动化,每一个模块都用 AutoML 的算法来实现。例如,数据分析一环,AutoML 可以自动分析上传数据中的场景丰富度、物体类别、目标尺寸、有无遮挡、光照强弱等等。在芯片适配,用户自主选择模型想要适配的芯片,平台同样会通过算法来自动匹配和计算。

用户只需做两件事:一是定义好需求,二是数据迭代。而这两个环节可以由离业务场景最近的人来完成,如上述所说的产线工人、物业经理等等。

让听得见炮火的人来做 AI

图注:共达地自动化训练开发平台流程

原本训练算法是个「黑盒子」,但这个过程被流水线化了。反复调参的前提不存在了,成本和周期自然也就消失了。想要什么样的算法,就喂什么样的数据。

这种能力对集成商来说,很有吸引力。

自建 AI 团队的成本太高,但产品经理与项目经理的人数永远是最多的。所以,如果他们仅仅需要上传数据,就能像安装 APP 一样得到解决自己问题的 AI 算法,那么 AI 的足迹就会迅速布满全国各地,真正促进数字化的转型。

不过,算法生产出的算法,精度能否与人类生产的算法相媲美;

没有专业算法团队的集成商,是否能熟练使用这项能力;

这两大前提,是验证 AutoML 平台是否行得通的试金石。

创立第二年,共达地得到了肯定的答案。一家视觉算法公司想用 AI 识别火焰烟雾。此前,该公司内部的算法团队花了半年左右的时间才做出一个算法。接触到共达地后,在试用他们的算法自动化生产平台时,他们将同一套数据上传到该平台,结果只用了 10 个小时就训练出一个模型,而且算法的精度更胜一筹。

这种震撼是难以名状的:回顾深度学习的历史,深度学习第一次引起人们的震撼,就是 2011 年 Hinton 与邓力在微软语音识别中应用深度神经网络,只用了几天时间就完成了整个团队花半年才做完的事情。而现在,AutoML 生产的算法也能实实在在地匹配人类工程师的工作——算法环节,终于也和数据、算力一样,走上了工业化道路。

4、生产力解放想象力

只有解决长尾匹配,才能完成技术的价值闭环。而在实际业务中,越来越多碎片化的场景证实了 AutoML 平台算法生产的意义。

今年年中,刘先生接到一个来自某地政府的智慧城市项目,需要用无人机+AI巡检的方式,对辖区内的车辆、人员、河道、商贩等进行管理,是刘先生从业以来遇到的覆盖面积最大、算法类型最复杂的项目。

项目试点初期,以河道漂浮物识别为切入点,对比多家供应商的技术实力。刘先生在某专业算法大厂的算法商城中购买了河道漂浮物识别算法,但测试时92%的精度,到应用到业务场景后竟然低于10%。主要原因在于:一是实际河网环境复杂,二是河面反光造成了极大的影响。

后来,刘先生在共达地的 AutoML 平台上通过采集到的视频流自主动手训练了河道漂浮物识别算法,应用到业务场景后,同样由于远距离、夜间识别的问题,精度只达到70%左右,但通过不断巡检,前端回传现场数据进行迭代,5 天迭代 3 个版本后,精度达到了95%。

速度带来质变。如果是之前靠人力迭代,相当于每次都要重新定制算法、重新走一遍上述十几个环节的流程,耗时往往以月计,成本也高。但 AutoML 平台自动生产、无需人力,机器 24 小时云运转,以天为单位迭代,效率更高,得到高精度的时间也更短,对实际落地带来了巨变。

AI 的生产力,解放了行业人士对「AI 能做什么」的想象力。

「过去不敢接的项目需求,现在敢接了;过去要倒腾半年的项目,现在一个月就可以交付妥当了。」这是刘先生最直观的感受。雷峰网(公众号:雷峰网)

这就好比汽车的发展:汽车最开始出现时,只有少数的富贵人家能拥有汽车,会开车的司机也很少;随着生产力的发展,越来越多中产阶级也能买上汽车;到乘车共享平台诞生时,普通老百姓即使没有汽车,也已经能通过平台享受到汽车出行的服务。

通过 AutoML 平台,AI不再是昂贵的产品,而是触手可及的服务。传统企业也能实现这样的梦想:没有 AI 团队,也能交付靠谱的 AI 产品。

但更具想象力的是,工具升级以后,产业链也有了重塑的可能性。

AI产业链中,绕不开的无非“算法,算力,数据“三大要素。而项目落地,则又包括需求分析、系统集成、API对接联调、部署运维等细碎工作。

传统AI公司自己下场做总包项目,左手采数据,右手建算力,又用昂贵的人力和组织成本,去做系统集成商的工作。雷峰网

返回前面的内容

相关阅读 >>

AI手势识别,vlog隔空换镜……荣耀60系列正式发布

传谷歌同意向openAI竞争对手anthropic至多投资2

毅能达pos机全国24h客服电话大全已更新2023/2/28(实时/更新)钟薛高发布sa'saa系列冰棍新品,称由AI打造,定

AI加速落地,助力元宇宙起飞

宝马金融客服电话大全已更新2023(实时/更新中)美媒:马斯克等人呼吁暂停AI训练是对的 为了安

虚拟数字人火爆出圈 能否推动AI企业摆脱亏损局面

硅谷银行倒闭后 openAI ceo向多家初创公司提供

deepmind又放大招:用AI控制核聚变反应登上《自然》

苹果、amd、英伟达争抢台积电AI芯片订单,相关芯片将在4月后产出

AI和人类玩《龙与地下城》,还没走出新手酒馆就失败了

更多相关阅读请进入《AI》频道 >>



打赏

取消

感谢您的支持,我会继续努力的!

扫码支持
扫码打赏,您说多少就多少

打开支付宝扫一扫,即可进行扫码打赏哦

分享从这里开始,精彩与您同在

评论

管理员已关闭评论功能...