当前位置: 主页 > 长沙 > 正文

京东云推出vGPU池化方案可令“大模型推理大幅降本”

2023-08-18 07:16来源:互联网 点击:

  该方案可提供一站式 GPU 算力池化能力,令 GPU 利用率最高提升 70%,大幅降低大模型推理成本

  京东云表示,凭借其“自主研发的混合多云操作系统云舰”,京东云在原有支持混合多云 CPU 算力池化能力基础上,针对大模型训练所需的泛算力池化能力,进一步增加了针对 AI 应用所需的调度管理能力,包括卡管理、节点管理、异构资源调度管理等,为包括大模型训练在内的多种 AI 应用,提供一站式算力池化解决方案,从而全面提升资源利用率。

  算力切分灵活:支持任意比例切分和动态调整机制,可实现按显卡算力、显存做细粒度切分,一张物理卡可供多个容器使用,与整卡算力相比,性能衰减在 2% 以内。

  精细化配额管理:支持灵活的配额管理,按显卡型号 / label 配额,有效保障资源按需分配,提升推理稳定性和训练性能。

  京东云表示,在使用场景中,开发者可以根据卡型号申请资源,按算力和显存切分,统一由控制器根据用户指定的调度策略调整。仅在训练、微调和推理任务启动时进行动态分配,在任务结束即可以释放,支持多任务算力隔离和任务冷启动。

  从实践效果看,通过 GPU 异构资源池化,AI 运行效率显着提高,整体 GPU 利用率提升 70%。结合任意切分和按需分配,在同等 GPU 数量的前提下,实现了数倍业务量扩展和资源共享,降低了硬件采购成本,使用更少的 AI 芯片支撑了更多的训练和推理任务。

  广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

编辑:admin 作者:admin
  • Tag:
------分隔线----------------------------
推广信息
推荐内容
热门文章