本文摘自太平洋电脑网,原文链接:https://news.pconline.com.cn/1467/14677809.html,侵删。
11月8日,阿里巴巴达摩院公布了多模态大模型“M6”的最新进展,其参数已从万亿跃迁至10万亿,成为全球最大的AI预训练模型。
作为通用性AI大模型,M6拥有多模态、多任务能力,尤其擅长设计、写作、问答,在电商、制造业、文学艺术、科学研究等领域有广泛应用前景。
10月,M6再次突破业界极限, 使用512颗GPU,在10天内就训练出了具有可用水平的10万亿模型,相比去年发布的大模型GPT-3,M6实现了同等参数规模,能耗却只有1%。
另一方面,AI大模型扩展到千亿及以上参数的超大规模时,很难放在一台机器上,为此达摩院 在阿里云PAI自研Whale框架上搭建了MoE模型,并通过更细粒度的CPU offload技术,最终实现将10万亿参数放进512张GPU:
目前,达摩院联合阿里云已推出 M6服务化平台 ,为大模型训练及应用提供完备工具,首次让大模型实现“开箱即用”,算法人员及普通用户均可方便地使用平台。
相关阅读 >>
openai ceo回应chatgpt作弊担忧:将协助开发检
clearview ai有望为其面部识别技术获得一项美国专利
连续参与五届waic,高通多样化呈现5g、ai、xr技术融合创新成果
大地时贷客服电话大全已更新2023(实时/更新中)美股周二:热门中概股普涨,阿里涨超14%
阿里:“小蛮驴”已落地全国22个省份 累计配送订单超100万
美团被曝24小时疯狂获取定位信息,5分钟一次;王思聪怒怼美团点评,质疑安全系统;腾讯阿里字节等捐赠5000万驰援山西|雷锋早报
更多相关阅读请进入《阿里》频道 >>