本文摘自太平洋电脑网,原文链接:https://news.pconline.com.cn/1467/14677809.html,侵删。
11月8日,阿里巴巴达摩院公布了多模态大模型“M6”的最新进展,其参数已从万亿跃迁至10万亿,成为全球最大的AI预训练模型。
作为通用性AI大模型,M6拥有多模态、多任务能力,尤其擅长设计、写作、问答,在电商、制造业、文学艺术、科学研究等领域有广泛应用前景。
10月,M6再次突破业界极限, 使用512颗GPU,在10天内就训练出了具有可用水平的10万亿模型,相比去年发布的大模型GPT-3,M6实现了同等参数规模,能耗却只有1%。
另一方面,AI大模型扩展到千亿及以上参数的超大规模时,很难放在一台机器上,为此达摩院 在阿里云PAI自研Whale框架上搭建了MoE模型,并通过更细粒度的CPU offload技术,最终实现将10万亿参数放进512张GPU:
目前,达摩院联合阿里云已推出 M6服务化平台 ,为大模型训练及应用提供完备工具,首次让大模型实现“开箱即用”,算法人员及普通用户均可方便地使用平台。
相关阅读 >>
阿里发布2022q4财报:优酷日均付费用户同比增长14% 亏损收窄
阿里性侵案女员工称公司无权开除她,律师:“传播未经证实的消息”基本坐实
终结者2游戏客服电话大全已更新2023(在实时/更新中)美股周一:三大股指涨跌不一,阿里巴巴跌近1%,
不到半年,字节跳动火速对微念启动撤资;网爆阿里校招成都ic岗开出50万「天价」薪资;段永平否认牵头造车|雷锋早报
阿里cto程立:2021双11峰值计算成本相比去年下降50%
阿里案张某妻子再发声:周某所说的“侮辱罪”简直是侮辱大众智商
更多相关阅读请进入《阿里》频道 >>