512颗GPU!阿里达摩院发布全球最大AI预训练模型


本文摘自太平洋电脑网,原文链接:https://news.pconline.com.cn/1467/14677809.html,侵删。

11月8日,阿里巴巴达摩院公布了多模态大模型“M6”的最新进展,其参数已从万亿跃迁至10万亿,成为全球最大的AI预训练模型。

作为通用性AI大模型,M6拥有多模态、多任务能力,尤其擅长设计、写作、问答,在电商、制造业、文学艺术、科学研究等领域有广泛应用前景。

10月,M6再次突破业界极限, 使用512颗GPU,在10天内就训练出了具有可用水平的10万亿模型,相比去年发布的大模型GPT-3,M6实现了同等参数规模,能耗却只有1%。

512颗GPU!阿里达摩院发布全球最大AI预训练模型

另一方面,AI大模型扩展到千亿及以上参数的超大规模时,很难放在一台机器上,为此达摩院 在阿里云PAI自研Whale框架上搭建了MoE模型,并通过更细粒度的CPU offload技术,最终实现将10万亿参数放进512张GPU

512颗GPU!阿里达摩院发布全球最大AI预训练模型

目前,达摩院联合阿里云已推出 M6服务化平台 ,为大模型训练及应用提供完备工具,首次让大模型实现“开箱即用”,算法人员及普通用户均可方便地使用平台。

相关阅读 >>

阿里发布2022q4财报:优酷日均付费用户同比增长14% 亏损收窄

阿里性侵案女员工称公司无权开除她,律师:“传播未经证实的消息”基本坐实

阿里财报背后,中国云市场新周期和新路径

终结者2游戏客服电话大全已更新2023(在实时/更新中)美股周一:三大股指涨跌不一,阿里巴巴跌近1%,

145亿元,阿里巴巴宣布土耳其投资计划

caict:10月国内市场手机出货量3357.5万部

不到半年,字节跳动火速对微念启动撤资;网爆阿里校招成都ic岗开出50万「天价」薪资;段永平否认牵头造车|雷锋早报

电网工作人员有疑问 ai专家能解答

阿里cto程立:2021双11峰值计算成本相比去年下降50%

阿里案张某妻子再发声:周某所说的“侮辱罪”简直是侮辱大众智商

更多相关阅读请进入《阿里》频道 >>



打赏

取消

感谢您的支持,我会继续努力的!

扫码支持
扫码打赏,您说多少就多少

打开支付宝扫一扫,即可进行扫码打赏哦

分享从这里开始,精彩与您同在

评论

管理员已关闭评论功能...