AIGC:我不是元宇宙的附庸品


当前第2页 返回上一页

此前阶段一、二的代表应用分别有短视频平台上的 AI 生成电影解说、智能对话机器人,而到第三阶段,机器系统则必须理解人类语言与常识、物理世界运行法则等,否则无法进行由人控制的跨模态创作。但 DALL·E、Midjourney 与盗梦师等产品都已经体现出理解人类与世界的突破。

大量的研究实验都表明,当模型足够大,训练的数据足够多,AI 能够逐步理解人类语言的抽象概念(如常识与规则)。王超岳在读博时师从陶大程,他们团队就从深度学习理论出发,不止一次通过模型的容量分析证明,大模型在学习通用知识和理解泛化上有更好的表现。这是之前的生成模型没有体现出来的能力。

这也决定了AIGC 不光是生成,而是建立在认知与理解上的模型的应用生态。当 AI 具备基础认知与理解,机器像人一样思考与创作,就不再是海市蜃楼的传说,而是一个正在发生的现实。

03 商业化:在沉默中爆发

现代社会的活动构成,本质是一串串的数字内容:语音、文本、图像、视频…而 AIGC 可以为创造这些内容提供了一个个基础元素。

实际上,AIGC(人工智能生成内容)一直存在,但直到今年才被国内的资本热捧,一是技术的成熟,二是原先专注于视觉 AI 商业化的资本扭头才发现,类似 Jasper.ai 这样的海外 NLP 公司开始大幅盈利了。

由于创造数字内容的优势,AIGC 技术在备受瞩目后也被过去一年追随元宇宙的狂热者们列为打造未来元宇宙的工具。但噱头背后,更多 AIGC 的从业者相信,AIGC 能比元宇宙更快打造出下一代数字世界,一个完全属于 AIGC 的新赛道。

这背后的原因,是 AIGC 与当前元宇宙所倚技术的本质差异:以图形学(打造数字人的关键技术)为例,图形学在内容生成上侧重仿真、复刻,而 AIGC 侧重原创、创造。从图形学出发打造数字人是需要有一个真人作参考的,但 AIGC 在语音、文字与图像的生成上是从 0 到 1、前所未有。

以电影《无双》为例。AIGC 是张静初,图形学则是郭富城。

由于 AIGC 在写作与画画上,每个字、每个像素都是精心计算出来的,所以用户基于 AIGC 模型创作的图像与文章全都是世上独一无二的,绝对的原创选手。

数字内容的本质+独一无二的原创特性,决定了 AIGC 的赛道容量足够大,前者暗示它可以被打造成像互联网内容平台或产品这样的标准品,后者意味着它能获得与人类创作者相媲美的市场认可度。

以文本生成为例。类似 Jasper.ai 这样的 NLP 公司在海外孵化了一种新职业,叫“ AI 灵魂写手”:

人类用户在 AI 文字生成平台上输入标题与关键字,AI 就会生成一篇很长的文章,然后人们再在写好的文章上进行修改,将修改后的文章卖给需要大量高质量的文章来做搜索引擎优化的公司,赚取作品出售与订阅 AI 产品的会员费之间的差价。

图像生成的盈利模式也如此:比如在海外,用户订阅了 Midjourney 的会员,用 AI 生成精美的图像后再将图片卖给类似 iStock 这样的图库,从中赚取差价。

由于谷歌搜索向原创文倾斜,而 AI 写的文章又是全网绝无仅有的原创文章、非信息拼凑,所以谷歌会给这类文章更多流量,提高搜索排名。

这也使 Jasper.ai 等公司能够迅速获得市场份额。据 Jasper.ai 宣称,截至今年 9 月,他们去年的收入超过了 4000 万美金,今年预计会翻一倍,目前付费用户也达到了 7 万,估值 15 亿美元。而距离 Jasper ai 成立,才不过 18 个月。

高速的增长也出现在图像生成领域。数据显示,海外 AI 作画产品 Midjourney 推出不过三个月,注册用户已经超过 300 万。而据雷峰网独家了解,盗梦师推出不到两个月,生成的图像数量已经达到 1 千万张。

多位行业人士谈道:“说白了,互联网的核心是流量,流量的核心是内容。而 AIGC 的本质,就是一项生产内容的技术。”

这也意味着,相比上一代要与终端硬件相结合的视觉 AI,或世界观庞大的元宇宙,AIGC 的商业化落地更具体,投入成本更低、盈利更快。甚至一个更激进的观点是:AIGC 能够跑出背靠流量的、与现有互联网内容平台(如小红书、抖音)的体量相媲美甚至超越的“内容生成平台”。

AIGC:我不是元宇宙的附庸品

“盗梦师”根据用户描述生成的图像作品

在内容需求旺盛的当下,AIGC 所带来的内容生产方式变革也开始引起了内容消费模式的变化。尊重原创的市场,开始敬畏 AIGC。

最新作出反应的是图库类企业:

10月底,海外知名图库 Shutterstock 就公布了他们与 OpenAI 建立了合作,让用户可以输入文字即时生成满足需求的原创图片。(实际上,许多行业人士也认为,在 AIGC 的浪潮中,素材库与P图软件是最先被淘汰或替代掉的行业。)

这项合作不仅是一个传统行业的及时反映,实际上还意味着AIGC 商业化变现的一个想象似乎开始落地:打造一个基于生成的全新内容平台。

许多人并不知道这意味着什么,但在一些人的眼中,AIGC 的影响力已经开始从服务个人用户到服务实际行业——当前的内容平台主要是基于关键词搜索、推荐,而引入 AIGC 后,用户所消费的内容就来源于 AI 对用户的理解。基于推荐的内容是来源于有限的素材库,而基于生成的内容是源源不断的……

AIGC 的当局者们,虽然他们是这个赛道的缔造者,但在见证 AIGC 的一次次魔力中,他们还是被机器堪比人类、甚至超越人类的创造速度与创造能力给吓到。

ZMO.AI 的创始人张诗莹说:“例如现在的短视频平台。推荐是将创作者创造出来的有限内容推荐给你,但生成是每一个消费内容的人都是创作者。消费者对内容的反馈可以让 AI 更了解你要什么,你喜欢什么、AI 就生成什么,这将是实时更新并且无限的。”

ZMO.AI 是国内最早成立的 AIGC 公司之一。与 Stable Diffusion 等擅长艺术像生成的产品不同,ZMO.AI 选择的赛道是真实世界的图像生成,如设计。他们最开始专注于出海,在海外推出的 imgcreator.ai 达到了 32 万月活的高速增长。

他们认为,AIGC 不仅是数字娱乐内容的生产工具,对许多实际行业也有非常大的帮助影响。这个赛道足够大,研究者与创业者能够做的事情也足够多。(Stability.AI 的创始人 Emad Mostaque 也说过类似的话,认为 AIGC 的赛道比新能源还大。)

单就图像而言,当前的素材主要靠拍摄,既低效又昂贵。比如电商平台的服装上新,目前的模式是线下拍摄,需要化妆师、服装师、摄影师、模特等等,而在未来的 AIGC 世界中,他们希望用 AI 直接生成能展示服装的模特图像。现在,他们的 AIGC 产品“ YUAN 初”小程序已经在图像编辑上取得惊人的效果。

AIGC:我不是元宇宙的附庸品

ZMO.AI 的图像生成器所生成的图片

相比艺术类的风格生成来说,真实的、摄影风格的图像生成难度更高,但对实际的生产与生活有巨大影响。比如设计行业,小到海报、PPT、网页,大到所有商品的外包装、插画等对原创素材要求高的应用,都有 AIGC 的用武之地。

先不谈取代,目前就有大量的设计师会使用 AIGC 产品来简化设计前草稿阶段的工作。张诗莹讲了一个建筑设计的例子:他们与一个建筑师合作设计了一座层高大约 25 米的交响音乐厅——

AIGC:我不是元宇宙的附庸品

在没有 AIGC 之前,建筑设计师是先用铅笔画草图,画完之后觉得好看再弄成彩铅,彩铅版本满意后再做一个 3D 的视觉效果图给甲方客户看,甲方满意再设计建筑里面的工程结构等等。而有了 AIGC 之后,他们从第一步就极大地节省了时间,快速将设计师脑海中的方案用 AI 生成出来,发给甲方看。

“在 AI 写几句话、P 个图时,你可能觉得没什么。但如果有一天,AI 开始设计建筑,你就要重新思考它的价值了。”

04 一切只是时间问题

刘慈欣在小说《朝闻道》里借用外星人“排险者”之口道出了技术发展的真理:

“人类获得宇宙终极奥秘的起点,始于第一只猿猴对星空的仰望。”

如同人对宇宙的探索,AI 也在不断探索人类。如今的 AI 类人猿(AIGC)已看到广阔的星空。当下越来越多研究者参与到 AIGC 的探索中,AIGC 距离更高层级的思维创作也越来越近。征服,似乎只是时间问题。

过去的十年,是 AI 腾飞的十年。十年的风起云涌中,有趣的技术点层出不穷,有的成为一个新的赛道(如识别之于安防),有的则在商业化落地的过程中“胎死腹中”、昙花一现。

大浪淘沙中,人们对于AIGC既期待,也谨慎。

返回前面的内容

相关阅读 >>

中国联通网络AI平台获中国信通院人工智能开发平台全能力​域​“四级”认证

axiomtek发布紧凑型AIe900-xnx无风扇主机 采用jetson edge AI平台

微软中国cto韦青:“元宇宙”或将涉及衣食住行每一方面

AI绘画、AI聊天后,没学过生物的「门外汉」也能「一键生成」蛋白质

openAI:我们正努力减少chatgpt偏见和不良行为

google正使用AI在google maps上保持最新的营业时间更新

nasa开发chatgpt风格AI,想让宇航员与飞船自由

造访22个国家,openAI ceo回来后要改进AI工具

英伟达发布h200!巩固AI芯片霸主地位

腾讯新闻前负责人王诗沐将加入百度,担任百度AI

更多相关阅读请进入《AI》频道 >>



打赏

取消

感谢您的支持,我会继续努力的!

扫码支持
扫码打赏,您说多少就多少

打开支付宝扫一扫,即可进行扫码打赏哦

分享从这里开始,精彩与您同在

评论

管理员已关闭评论功能...