浪潮云率先发布671B DeepSeek大模型一体机解决方案

发布时间

2025-02-07

分享

 产品发布



近日,DeepSeek凭借其低成本、高性能的大模型研发成果,迅速引发了全球科技界的关注。浪潮云联合沐曦股份、铨兴科技等生态伙伴,发布预置DeepSeek-R1和DeepSeek-V3模型的海若一体机,率先实现671B DeepSeek大模型国产GPU单机推理服务为行业客户提供大模型智能应用落地的一体化解决方案。




一站式大模型交付,开启行业智能新篇

为解决行业大模型落地面临的算力多样适配难、数据不出域、模型微调效率低、推理服务性能差、模型服务交付慢等问题,海若一体机通过优化算法框架和加速库、软硬全栈调优等方式,提供模型微调、模型推理、智能体编排、智能体应用等服务,以完备的方案为行业客户提供大模型场景化应用一站式交付。

图片

海若一体机产品能力全景图
开箱即用:海若一体机提供从算力、平台、大模型到应用的一体化交付方案,能够实现1-3天完成整体交付,开箱即用。
推理优化:海若一体机量身定制了极致优化的推理加速方案,基于软硬件融合调优,大模型的推理性能可大幅提升,解码生成速度提升185.7%,平均首字时延降低55.9%。
安全增强:具备知识库细粒度权限管控能力,提供私有化部署方案,防止数据泄露,支持模型输入输出安全检测,保证内容合法合规。
开放兼容:支持浪潮海若、DeepSeek、GPT-4、通义千问等主流大模型;支持EmBedding、ReRanker、ASR、TTS多类型;内置模型池适配沐曦、昇腾等多种芯片,根据场景、性能、预算灵活选择。
规格多样:启航版、进阶版、旗舰版等多种规格,可根据模型参数和应用规模灵活选择。



全栈产品矩阵,精准匹配算力需求

面向行业客户的多样场景需求,海若一体机推出三种规格,提供DeepSeek从671B到1.5B多种参数的预置大模型,用户可根据业务场景灵活选型,实现精度与效率的最佳平衡。浪潮云联合铨兴科技研发高显存的海若一体机,支持单机部署DeepSeek 671B参数大模型,释放极致性能。

图片




接入DeepSeek系列模型,赋能智能体开发

目前,海若AgentOS已正式上架DeepSeek-R1和DeepSeek-V3模型。此次接入的模型已全面融合海若推理链路,集成海若独家内容安全模块,实现模型安全增强与企业级高可用保障,同时支持完善的日志分析和告警,助力用户安全稳定地构建智能体应用。AgentOS平台致力于为用户提供全流程、一站式的智能体开发服务,平台支持接入各类大语言模型,支持模型的一键部署,并具备模型管理和监控能力,大大降低了用户在模型管理上的技术门槛和时间成本。同时,平台提供知识库管理、可视化工作流编排和丰富的工具组件,结合模型实现生产级智能体开发,简化模型开发流程,将为开发者和行业用户带来更快、更高效、更便捷的智能体开发和应用体验。
当前,智能体已成为新型应用生态的关键入口。海若一体机作为大模型生产力平台,将助力客户管理模型、智能体、私域知识库等大模型资产,推动行业智能化升级,重塑大模型落地行业格局,引领智能经济新时代。