当前位置:网站首页>OneFlow v0.8.0正式发布
OneFlow v0.8.0正式发布
2022-07-19 10:03:00 【InfoQ】
- 除原本的 ZeRO-DP 以外,ZeRO 零冗余优化器可以与 MP,2-D,3-D 并行搭配使用,进一步节省显存开销。
- Graph 提出了新的流水并行 API,在简化流水并行配置的同时加速流水并行与 3-D 并行的性能。
- 为了进一步提升 Graph.debug 调试效率,新增关于逻辑图、light plan 物理图、内存分析、Python 栈信息等多维度的调试功能。


- 支持分层存储,动态扩容的 Embedding,用户可以以较低成本扩展 Embedding 容量
- 混合并行策略,能够轻松地将模型横向拓展到多机多卡的场景
- 通信量化压缩功能,在并行场景下,对通信的数据进行量化压缩,以减少通信量,提升训练速度
- 高效的数据流水线,将模型中没有数据依赖的部分提前执行,在时间上进行重叠
- 支持自动混合精度训练,模型训练过程中将部分计算转换为 FP16 数据类型计算,在减少显存占用的同时提升训练速度,并能保证模型收敛精度
- 针对推荐系统模型的常用操作提供一系列高性能 CUDA 算子
- 支持灵活的模型构建

- OneFlow源码一览:GDB编译调试
- 解读Pathways:向前一步是OneFlow
- OneFlow源码解析:算子签名的自动推断
- Hinton:我的五十年深度学习生涯与研究心法
- LLVM之父:为什么我们要重建AI基础设施软件
- 并行计算的量化模型及其在深度学习引擎的应用
- 大模型训练难?效率超群、易用的“李白”模型库来了
边栏推荐
- oracle rac rman备份报错ora-19501 ora-15081
- Dotnet reading WPF source code notes how to trigger rendering collection
- 关于部署ogg 微服务的一些疑问
- Cloud Native (36) | Introduction et installation de Harbor à kubernets
- 系统架构设计师备考经验分享:由点到面
- Panda3D 获取鼠标位置、Panda3D任务管理器
- 学习黑客需要先了解哪些知识,零基础怎样掌握网络安全知识体系
- 手写分布式配置中心(1)
- Introduction to gateway
- h5实现一个刮刮卡的动画效果
猜你喜欢
STM3(cubeIDE)点灯实验
What is the CRM selection standard more suitable for Chinese enterprises?
JVM内存模型和结构详解(五大模型图解)
Mongodb security authentication
聊一聊 C# 后台GC 到底是怎么回事?
研究:超过70%的医生仍在开具不安全的抗生素药物
"Unable to download the installation file, please check your Internet connection and try again" appears when installing visual studio2019 in win11
CNN结构设计技巧:兼顾速度精度与工程实现
Pytorch3d reference tutorial
实验4 MGRE环境下的OSPF实验
随机推荐
固定页脚
shell中的特殊符号
Write "Hello, china." for domestic smart watches with C #
RK3399平台开发系列讲解(中断篇)13.16、request_irq的实现
Experiment 4 OSPF experiment in mGRE environment
Apache Shenyu Admin 身份验证绕过漏洞(CVE-2021-37580)分析与防护手段
什么是更适合中国企业的CRM选型标准?
如何用PHP解决高并发与大流量问题
C leetcode notes 5-dynamic sum of one-dimensional array
Simple implementation of date class
Upgrading thinking from engineer to technical leader
在 IDEA 里下个五子棋不过分吧?
strcpy()
0055 PHP语言简介和HelloWorld
12. 谈谈项目中单点登录的实现原理?
Rk3399 platform development series explanation (interprocess communication) 14.10. How to view process scheduling information
Rk3399 platform development series explanation (interruption) 13.16, request_ Implementation of IRQ
【深入理解C】动态内存管理
Dynamic memory management
Yum -y install MySQL in Linux why is MariaDB by default? And MySQL Yum source configuration