资讯 更多 >>
天天热推荐:22路公交司机贺军平拾...
白斩鸡怎样制作?
青海湖水域面积达到近十年来最大值...
发“验证码”赠礼品靠谱吗?别贪了...
具有延长保修和烧屏覆盖功能的 77...
国机精工(002046.SZ):目前公司风电...
大都市如何“生”出万亩粮田?
高人气传奇手游推荐合集 十大变态...
世界观天下!俄罗斯卢布对美元汇率...
新资讯:cos54等于sin多少_cos45是多少
业界更多 >>
当前要闻:调查|超六成受访者对“...
环球简讯:(268)“帽”美如花
焦点速看:第五人格2023IVL夏季赛常...
“僵尸之地”折射“美国毒病”——...
印度小伙:没想到中国发展这么好
结对互助促提升,学习交流共成长—...
热点!内蒙古自治区东胜区发布雷电...
今日聚焦!海南自贸港建“土地超市”...
全球播报:三方联动促成长,踏水学校...
全球微速讯:天津市静海区志愿服务...
dnf师徒地图怎么进_dnf师徒活动怎么...
每日聚焦:诸葛科技关荣雪:关于扬...
天天头条:圆锥体的体积公式计算公...
天天信息:360电视剧排行榜(360电视剧)
超级耐看的仙侠小说,锦书上的家兄...
诚信经营需要更多“公平秤”-观天下
实时焦点:这个端午 我们看到了什么?
78名农民工拿回了26万余元被拖欠的工资
甘肃平凉出现风雹灾害导致1390人受...
27日河南局地气温将达40℃!中考考...
专题报道 
当前位置: 快讯 > >> 正文
 
天天观速讯丨微软推ZeRO++新系统:减少大模型训练时间和成本
来源:站长之家     时间:2023-06-26 18:19:44


(资料图)

站长之家(ChinaZ.com)6月26日 消息:微软研究人员推出了名为ZeRO++的新系统,用于优化训练大型AI模型,以应对高数据传输开销和有限带宽的难题。

ZeRO++ 建立在现有的 ZeRO 优化的基础上,并提供增强的通信策略,以提高训练效率,减少训练时间和成本。

像Turing-NLG、ChatGPT和GPT-4这样的大型模型的训练需要跨多个GPU设备占用大量内存和计算资源。DeepSpeed开发的ZeRO++引入了通信优化策略,以克服在每个GPU上批量大小较小时或在低带宽集群上进行训练时ZeRO的限制。

ZeRO优化系列包括ZeRO-Inference,它使用GPU的集体内存和计算能力,将模型状态分割在多个GPU之间。然而,在训练过程中,ZeRO可能会产生较高的通信开销。ZeRO++通过整合三组通信优化来解决这个问题:量化权重通信(qwZ)、分层权重分割(hpZ)和量化梯度通信(qgZ)。

为了减少参数通信量,ZeRO++对权重进行量化,利用基于块的量化方法来保持训练精度。这种优化的量化过程比基本量化更快更准确。为了在反向传播过程中尽量减少通信开销,ZeRO++通过在每台机器上保持完整的模型副本,以 GPU 内存换取通信。梯度通信方面,ZeRO++引入了一种新的量化梯度通信范式 qgZ,可以减少跨节点的流量和延迟。

这些通信优化大大减少了通信量。与ZeRO相比,ZeRO++实现了减少高达4倍的通信量,提高了训练吞吐量和效率。当在每个GPU上使用小批量大小时,在高带宽集群中,ZeRO++相比ZeRO-3的吞吐量提高了28%至36%。在低带宽集群中,与ZeRO-3相比,ZeRO++实现了平均2倍的加速,使得大模型训练在更多种类的集群上更为可行。

ZeRO++不仅限于训练场景,还可应用于对话模型中使用的人类反馈强化学习(RLHF)训练。通过将ZeRO++与DeepSpeed-Chat集成,RLHF训练可以获得更好的生成和训练吞吐量,生成吞吐量提高了高达2.25倍,训练吞吐量提高了1.26倍,超过了ZeRO。

DeepSpeed已经发布了ZeRO++,以使大型模型的训练在AI社区更加高效和可访问。该系统旨在加快训练速度,减少通信开销,并实现更大的批量大小,从而节省时间和资源。研究人员和实践者可以利用ZeRO++更有效地训练像ChatGPT这样的模型,并在AI领域探索新的可能性。

(举报)

关键词:

上一条:每日热门:实测视觉中国AIGC新功能,图库商对AI的态度正悄悄改变 下一条:最后一页