- 国网电商获分布式图处理专利预示着技术革新的新篇章
- 重磅!浙江云融创新科技获分布式系统日志数据处理专利
- 腾讯分布式数据库专利背后的科技力量:你的数据安全吗?
- 贵州电网最新专利:提高分布式储能聚合效率助力电力系统可持续发展!
- 李东荣:建立完善的风险管理框架和技术治理机制 推动大模型健康发展为金融行业的智能化注入新动能
联系人:王经理
手机:13928851055
电话:13928851055
邮箱:sgbwre@163.com
地址:广州市天河南一街14-16号华信大夏四楼
全面适配!京东云将DeepSeek推理场景性能提升50%
京东云率先宣布完成对这五项技术的全栈适配,在模型推理效率、算力资源利用率及数据管理等领域实现突破性优化,综合Flash MLA、DeepEP、FP8 GEMM、DualPipe四方面的调优,在DeepSeek推理场景下性能提升50%。
作为DeepSeek开源首日的重磅技术,Flash MLA通过动态调度GPU的显存与算力资源,解决了传统方法处理变长序列时的资源浪费问题。
京东vGPU AI算力平台通过支持Flash MLA的FP8格式来提升推理性能,使单Token的 KV Cache显存占用相比Multi-head Attention降低57倍,配合最新的投机推理技术,以极低的显存需求,在高并发请求场景下保证了推理的吞吐量和延迟表现。
此外,针对用于DeepSeek开源的通信库DeepEP,京东云vGPU AI算力平台已全面支持EP模式下的分布式推理,显著提高推理吞吐。通过整合DeepEP作为通信后端,针对机内通信使用NVLink传输数据,机间通信使用NVSHMEM接口走RDMA网络,同时通过灵活的GPU SM数量利用控制,增大GPU算力资源利用率以及减少对计算算子的性能串。
针对客户大模型的使用需求,京东云vGPU AI算力平台,为用户提供更高推理性能、更多国产芯片适配、更多高数据安全的大模型服务,让大模型真正用起来。
在推理性能方面,针对DeepSeek大模型技术特点,京东云通过推理加速与内核驱动级优化,提升单台服务器推理性能50%。
在国产芯片适配方面,京东云已完成从底层算力到大模型和业务应用的全面国产化适配,包括十余家国产化AI算力,确保自主可控。
在数据安全方面,通过机密容器AI全场景密态计算和先进的容器隔离技术,确保模型数据的机密性与完整性,为用户提供金融级安全防护。
目前,在河Kaiyun开云南鹤壁、江苏宿迁、山东滨州、广西北海、山西大同,京东云已经助力多地政府基于现有基础设施本地化部署DeepSeek,既满足本地政务业务,又让当地企业不用投入资源,即可通过政务云调用DeepSeek。
京东云率先宣布完成对这五项技术的全栈适配,在模型推理效率、算力资源利用率及数据管理等领域实现突破性优化,综合Flash MLA、DeeKaiyun开云pEP、FP8 GEMM、DualPipe四方面的调优,在DeepSeek推理场景下性能提升50%。
-
2025-03-19网易又一业务淡出历史舞台
-
2025-03-16C在云计算时代的角色转变:从传统开发到云原生应用的跨越之旅
-
2025-03-15联想与微软合作 开启软件定义数据中心新篇章
-
2025-03-15Docker 容器化技术深度解析与实践
-
2025-03-15中国联通获Kubernetes存储技术专利:助力数字经济时代
-
2025-03-14云原生与传统架构的对比:企业如何实现无缝迁移?
-
2025-03-14腾讯云推出云原生构建(CNB)多项免费算力资源助力开源协作
-
2025-03-14创维数字(000810)周评:本周跌295%主力资金合计净流出115亿元