首页

手游

新游

礼包

攻略

开测表

专题

话题

 首页 > 教程 > 并行训练-流水线

创世纪.神

幽游白书武术会

阴阳师妖怪屋

怒剑传说

远征2最新版

顽石英雄

迷你装甲

魔法学徒的一天游戏

白蛇仙劫

并行训练-流水线

时间：2024-06-27　|　来源：　|　阅读：113

话题： S

并行训练-流水线简述并行训练主要有三种策略: 数据并行训练加速比最高，但要求每个设备上都备份一份模型，显存占用比较高，但缺点是通信量大。张量并行，通信量比较高，适合在机器内做模型并行。流水线并行，训练设备容易出现空闲状态，加速效率没有DP高；但能减少通信边界支持更多的层数，适合在机器间使用。

并行训练主要有三种策略：

数据并行训练加速比最高，但要求每个设备上都备份一份模型，显存占用比较高，但缺点是通信量大。
张量并行，通信量比较高，适合在机器内做模型并行。
流水线并行，训练设备容易出现空闲状态，加速效率没有DP高；但能减少通信边界支持更多的层数，适合在机器间使用。

流水线并行

Micro-batch(Gpipe)将网络结构进行纵向拆分, 每张卡训练其中的几层. 如果是按照纯粹的mini-batch训练, 每层之间是纯串行的. 后面的卡会始终等待前面的卡. 所以引入了micro-batch的概念. 把mini-batch进行更细粒度的拆分, 这样在完成batch0的fp之后, 卡0可以进行batch1的fp, 卡1就能开始batch0的fp. 从而提高并行度.

存在的问题:

存在bubble_time: 每张卡的空闲时间 = (stage_num - 1) * (fp_time + bp_time)

实际应用中当mico-batch个数大于stageNum的4倍时, 可以忽略bubble_time

显存浪费: 当进行stage3的micro-batch 3时, 还需要保存前面所有mico-batch的fp中间结果用于bp.
在每个mini-batch之间无法并行. 因为下一个minibatch需要等当前所有的micro-batch更新完参数

Todesk 2025官网版 4.7.2.7 62.95 MB
下载

小编推荐

《热血江湖手游技能加点攻略》（掌握技能加点要诀，新版本赏金玩法出装攻略（全面解析最优出装方案，让老鼠铲子出装铭文攻略（打造无敌老鼠！）王者太虚战场出装攻略（打造最强装备，征服太虚战场）制裁战神队友出装攻略（打造最强战队，击败敌人无往

视频推荐

推荐

最新好玩手游

更多 

手游风云榜

更多 

月神宝藏(送GM商城) V1.0 安卓版

君临城下(送GM万充) V1.0 安卓版

悠唐天下(炸服GM神卡) V1.0 安卓版

伏魔诀（无限送真充） V1.0 安卓版

天空之息 V1.0 安卓版

纯三国送无限资源 V1.0 安卓版

思仙 V1.5.6 安卓版

仙语奇缘连抽版 v1.0.4 安卓版

校花的贴身高手天阶岛福利版 V1.0 安卓版

阿拉德之怒 V5.2.3 安卓版

235.76 Bytes 10

群英之战 V1.0 安卓版

闪烁之光 V1.9.7 安卓版

决战玛法 V7.5.0 安卓版

资讯阅读

更多 

使用Blender生成城市模型

教程  2024-12-05
全球气象数据ERA5的下载方法

教程  2024-12-05
Xpath解析及其语法

教程  2024-12-04
机器学习：神经网络构建（下）

教程  2024-12-04
华为Mate品牌盛典：HarmonyOS NEXT加持下游戏性能得到充分释放

教程  2024-12-03
实现对象集合与DataTable的相互转换

教程  2024-12-02
硬盘的基本知识与选购指南

教程  2024-12-01
如何在中国移动改变低价套餐

教程  2024-11-30
鸿蒙NEXT元服务：论如何免费快速上架作品

教程  2024-11-29
丰巢快递小程序软件广告推荐关闭方法

教程  2024-11-27
如何在ArcMap软件中进行栅格图像重采样操作

教程  2024-11-26
算法与数据结构 1 - 模拟

教程  2024-11-26

查看更多

湘ICP备2022002427号-10湘公网安备：43070202000427号
© 2013~2019 haote.com 好特网