使用容器做多机深度学习任务训练

6¥19.90

 

主讲人:薛磊

 

  Momenta资深研发工程师

 

前Sun中国工程研究院工程师。分布式系统、存储系统、容器技术专家,关注深度学习训练平台的基础架构研发。目前在Momenta从事深度学习训练平台的基础架构研发工作。

Momenta,世界顶尖的自动驾驶公司,基于深度学习的环境感知、高精度地图、驾驶决策技术,打造自动驾驶大脑、让无人驾驶成为可能。

 

 

 

▣ 主题:使用容器做多机深度学习任务训练

 

▣ 时间:7月10日 20:00

 

▣ 形式:视频直播

 

 

▣ 讲座概要:

 

在无人驾驶领域,深度学习框架(诸如 TensorFlow、caffe、caffe2、mxnet等)已经被重度使用,在计算集群中如何合理的、高效的使用这些框架来完成深度学习任务的训练,已然成为一个备受关注的热点。我们结合kubernetes的优秀的容器调度特性,为caffe2 训练框架开发了一个operator,以及一个RDMA device plugin(支持RDMA以及非RDMA的网络),简化集群环境下使用caffe2作任务的管理以及训练。

 

▣ 讲座提纲:

 

1. caffe2

2. 容器、docker、kubernetes

3. Kueflow(caffe2-operator)

授课教师

资深研发工程师,前Sun中国工程研究院工程师,关注分布式系统、存储系统、容器技术等,目前在Momenta从事深度学习训练平台的基础架构研发工...