技术应用NEWS

当前位置: 首页 > 信息动态  > 技术应用

新华三灵犀智算解决方案已完成DeepSeek-V4-Pro 、DeepSeek-V4-Flash版大模型深度适配

来源:www.jzlight-years.com    |   发布时间:2026年04月30日

4月24日,DeepSeek-V4预览版正式开源,凭借百万Token超长上下文核心能力重构行业标准,新华三灵犀智算解决方案已完成全新系列模型包括DeepSeek-V4-Pro 、DeepSeek-V4-Flash版深度适配,精准匹配百万Token场景下的算力调度、传输、存储与安全需求,为DeepSeek-V4的使用打造高 效、稳定、可扩展的智算基座,加速百万Token能力规模化落地。


新华三灵犀智算解决方案以极 致Token生产效率为核心,针对性适配DeepSeek-V4架构:

• 算力层:通过KV Cache/GDS加速、算子融合,优化百万Token显存调度,算力利用率MFU达82%,大幅提升单卡Token吞吐速度。

• 网络层:搭载支持NPO光互连技术的800G/1.6T高速智算网络,并结合全局路径导航技术进行调度优化,可实现卡间通信零拥塞,保障百万Token数据的高速、低时延传输,集合通信带宽利用率高达95.7%。

• 安全方面:构建算、网、安协同的安全防护能力,实现算力、模型、智能体全栈安全可信。秒级感知安全风险、分钟级自愈,训练时间比ETTR 99%,杜绝百万Token长时训推中断风险。Token生成、流转、使用全流程合规管控,保障百行百业场景Token数据安全。


在模型部署与算力调度层面,依托AI智能云的多维拓扑感知调度系统,可以实现异构算力的池化管理与弹性伸缩,分钟级完成模型部署与扩缩容,单集群推理并发承载能力提升3倍;集成vLLM/SGLang等主流推理引擎,结合KV Cache动态优化、权重预加载、训推一体混部能力,实现算力资源利用率至大化,推理成本较传统部署模式降低50%以上,彻底破解 “长上下文算力成本高、高并发部署难” 的行业痛点,既能释放DeepSeek V4-Pro在模型推理、代码生成场景的性能,也能支撑DeepSeek V4-Flash在高并发、低时延场景的规模化落地。



版权声明:本网站所刊内容未经本网站及作者本人许可,不得下载、转载或建立镜像等,违者本网站将追究其法律责任。浙ICP备2026020139号  | XML