<th id="6mqwi"></th>
<ul id="6mqwi"></ul>
<th id="6mqwi"></th>
  • <strike id="6mqwi"></strike>
  • 微軟推出ZeRO++技術 可顯著減少大模型訓練時間和成本-新動態
    發布日期: 2023-06-27 16:54:45 來源: IT之家

    6 月 27 日消息,微軟研究人員日前推出了名為 ZeRO++ 的新技術,用于優化在訓練大型 AI 模型時,容易遇到的數據傳輸成本和帶寬限制的難題,可顯著減少大模型訓練時間和成本。

    據悉,ZeRO++ 建立在現有的 ZeRO 傳輸技術基礎上,并提供增強的通信策略,可提高訓練效率,同時減少訓練時間和成本。

    為了減少參數通信量,ZeRO++ 可對權重進行量化,其利用基于塊的量化方法來保持訓練精度,這種優化的量化過程相對原始 Zero 傳輸技術更快更準確。為了能夠盡量減少通信開銷,ZeRO++ 通過在每臺機器上保持完整的模型副本,以向 GPU 顯存換取通信帶寬。而在梯度通信方面,ZeRO++ 引入了一種名為 qgZ 的新的量化梯度通信方式,可以減少跨節點的流量和延遲。

    這些改進的通信技術大大減少了通信量,微軟研究人員表示,與 ZeRO 相比,ZeRO++ 減少了高達 4 倍的通信量,提高了訓練吞吐量和效率。當在每個 GPU 上使用小批量大小時,在高帶寬集群中,ZeRO++ 相比 ZeRO-3 的吞吐量提高了 28% 至 36%。在低帶寬集群中,與 ZeRO-3 相比,ZeRO++ 實現了均 2 倍的加速,使得大模型訓練在更多種類的集群上更為可行。

    IT之家注:IT之家注意到,例如 Turing-NLG、ChatGPT 和 GPT-4 這樣的大型模型,其訓練需要跨多個 GPU 設備占用大量顯存和計算資源,而 ZeRO++ 引入了通信優化策略,以克服在低帶寬集群上進行訓練時原有 ZeRO 傳輸技術的帶寬限制。目前微軟已經放出了相關技術文檔,研究人員可以利用 ZeRO++ 更有效地訓練模型,在 AI 領域探索新的可能。

    關鍵詞:

    推薦內容

    ?
    主站蜘蛛池模板: 中文字幕亚洲综合久久| 国产小呦泬泬99精品| 五月天婷婷精品视频| 精品综合一区二区三区| 国产大学生系列| 中文字幕日韩精品麻豆系列| 国内精品一区二区三区在线观看| 久久午夜夜伦鲁鲁片无码免费| 狠狠色综合TV久久久久久| 国产成人综合日韩精品无码| 538prom在线| 怡红院亚洲怡红院首页| 亚洲va久久久噜噜噜久久狠狠| 毛色毛片免费观看| 国产18禁黄网站免费观看| 91av视频免费在线观看| 成人精品一区二区电影| 亚洲国产成人久久一区二区三区| 爱豆传媒在线视频观看网站入口 | 国产精品色午夜免费视频| 中文字幕日韩哦哦哦| 欧美丰满白嫩bbw激情| 又污又爽又黄的网站| 亚洲精品中文字幕无乱码麻豆| 客厅餐桌椅子上波多野结衣| 中文字幕热久久久久久久| 日本在线视频www色| 亚洲欧洲精品成人久久曰影片| 狠狠色噜噜狠狠狠狠7777米奇| 午夜三级限制福利电影在线看| 色94色欧美一区| 国产熟睡乱子伦视频在线播放| sao虎新版高清视频在线网址| 日韩亚洲av无码一区二区不卡 | 青青草97国产精品免费观看| 国产女18片毛片水真多| 国产激情视频在线播放| 在公车上忘穿内裤嗯啊色h文| 中文字幕日韩wm二在线看| 日本人六九视频jⅰzzz| 久久久婷婷五月亚洲97号色|