快讯|蚂蚁GMLake技术成果入选ASPLOS 24,能提高33%可用显存
2024-01-16 17:50:47 已围观 58 次来源:互联网编辑:凯旋生活网
1月16日消息,近日,从蚂蚁集团获悉,蚂蚁集团和上海交通大学合作的技术成果GMLake被计算机体系结构四大顶级会议之一的ASPLOS 24接收。
据悉,这篇名为《GMLake: Efficient and Transparent GPU Memory Defragmentation for Large-scale DNN Training with Virtual Memory Stitching》的研究成果,针对业界普遍存在的大模型训练显存效率问题,提出了一种高效的动态显存组合技术VMS(Virtual Memory Stitching),最高提高33%的GPU可用显存,使显存使用更为高效,进而缓解了“内存墙”问题。
蚂蚁集团和上海交通大学提出了一种高效的动态显存组合技术框架,称为GMLake。该框架采用虚拟、物理两层指针,将碎片化的显存灵活地拼接起来,从而实现了聚零为整。GMLake对典型大模型如GPT、GLM、Vicuna等进行了详细评测,最高扩大了约33%的可用显存,即在80GB的A100 GPU上节省约25GB的显存,训练吞吐提高最多4倍。
据了解,GMLake前已在PyTorch框架上完成集成,对上层模型代码和框架代码完全透明,也就是说模型不需要修改任何代码即可使用。
目前,GMLake的代码已经开源到了GLake项目中。GLake是蚂蚁集团自研的GPU显存+传输优化开源项目,在训练、推理框架底层以及系统层对显存和传输进行一体优化,更好应对“内存墙”和“传输墙”挑战。(一橙)
- 1以赛促旅推动经济发展,四川各地谋新求变争当“显眼包”
- 2库克的60条商业思考:苹果公司一直在遵照“北极星”的指引
- 3新经济观察|体育消费产业环节众多,折射消费升级新活力
- 4新经济观点 | “未成年人模式”来了,给网络防沉迷带来哪些新变量?听听专家怎么说
- 5安华农险股权变阵:三股东同步退出,第一大股东融捷集团接盘
- 6行走成都丨夜晚蜂拥而出的成都年轻人,都打车去了哪里?
- 7斗鱼Q2财报:利润增至6140万元,连续三个季度实现增长
- 8实现多种细胞的图案化共培养,浙大团队发展细胞排布新方法,为细胞的生物制造带来替代策略
- 9攀登AI for Science新高峰,《2023科学智能全球发展观察与展望》看到未来 |元璟科技分享
- 10iOS 17.3 已修复,“快捷指令”高危漏洞被披露:可发送敏感数据