新闻中心

新闻中心  >  AI开始深度思考后,我们该如何在企业级场景中“建好用好”?
AI开始深度思考后,我们该如何在企业级场景中“建好用好”?
背景图 2025-02-28 11:19:35

领跑AI品牌banner

当DeepSeek以“开箱即用”的姿态和创新技术降低企业级AI部署门槛时,规模化部署大模型似乎已经成为了唾手可得的事情。但根据国际知名分析机构IDC的最新报告显示,到2025年,全球企业在生成式AI领域的投资将突破1500亿美元,却仅有35%的企业能实现规模化应用落地。

为何理想很丰满,现实却很骨感?

因为相对于个人部署AI模型,政企单位的规模化落地需要考虑更多因素:对接的数据量来源复杂且量大、对延迟和并发的要求更高、落地于业务侧需要完善的运营管理机制.........简而言之,技术虽然变得更易用,但支撑其落地的体系化能力却没有跟上。

承载之上,还需要高性能和高稳定的双重加持

目前的常规应用,比如在个人和AI交流的场景下,对性能的要求并不高,通常可以忍受和AI智能问答的过程有长达数十秒的延迟,甚至是面对频繁的“服务器繁忙”依旧充满耐心。毕竟个人使用的过程中可以灵活地切换不同平台的大模型来达成目的。

deepseek界面

但当我们将大模型部署到企业级的使用场景中,产生5秒钟的延迟就已经远远低于使用者的预期。当每日成百上千的人同时访问大模型时,响应快速、回答准确、高稳定性更是缺一不可。相比于个人使用,大模型的性能和稳定性在企业级的部署应用中都有了更高的标准。

不仅如此,当下的大部分数字化用户都处在单个模型的试点应用中,但随着时间推移和AI应用的深入,单个模型的部署将会逐渐演进到多模型、大小模型、终端和云端模型混合部署的形态。

“根据相关机构预测,到2026年,单个企业平均需管理11.7个AI模型,混合架构(大小模型协同)将成为标配。”

在混合部署的形态下,传统的云基础设施平台变得捉襟见肘:既需要能同时承载传统业务系统与AI工作负载,也需要动态实现CPU/GPU/NPU异构算力的智能调度,确保算力资源在不同业务场景、不同时段的合理调配,减少算力资源浪费.......显然,传统的业务承载平台,必须转型迈向大模型时代的“AI智算承载和管理“平台了——

但让数字化用户们为难的是,转型也并非一件易事。

数字化转型已经进入深水区,大部分业务都由传统的云基础设施平台承载,业务无法长时间中断以供改造。但完全重建AI专用集群,却很可能会导致新旧系统数据不通、大模型无法与原有业务很好融合等问题。

面对AI落地中的关关难题,业界已有一个更为理想和便捷的答案:无需重构原有基础框架,也许只需在原集群基础上增加一台GPU节点,就能承载诸如DeepSeek等企业级大模型。在并发度更高、吞吐量更大的情况下,以极低的资源投入享受更低的推理响应延时、更稳定的使用体验。

模拟64并发场景,做问答测试

4卡4090运行DeepSeek-32B模型,模拟64并发场景,做问答测试。左边为上述方案的测试效果,右边为个人部署的测试效果。

在此基础上,只需要再利用GPU切分等技术,就能在避免GPU空闲浪费的前提下,支持按算力/显存做细粒度切分、大模型和小模型混合部署。通过智能大模型调度和智能Cache技术,也能实现资源的自动化调度,更大程度优化算力资源的利用率。

一个创新的平台,让AI在业务场景中越来越好用

对于所有数字化用户来说,接入大模型底座只是迈出了成功的第一步:如何选择合适的大模型底座,并根据自身的业务情况和需求去开发匹配的AI应用?开发AI应用所需要的人才、技术如何在短时间获得?使用过程中,AI应用的持续运营评估又该如何开展........

“IDC洞察到,DeepSeek引领基础大模型开启另一开发新范式——以一系列降低成本/复杂性的创新优化技术/手段,降低门槛,软件及硬件供应商应提供多模型选择、高效且可靠地部署方式的大模型开发平台或应用开发工具,并进行软硬件协同创新。”

正如IDC的洞察,政企单位想要越过AI人才和AI技术的空白,唯有采用高效且可靠的大模型开发平台或应用开发工具,来统一开发和管理AI,让AI越用聪明、越用越懂业务。这绝不只是一种畅想,纵观整个行业,让AI应用开发和运营更简单的AI应用创新平台已经初见峥嵘:

用简单操作,轻松开发专属大模型

AI应用创新平台内置RAG最佳实践流程,支持智能分片与直连企业自有知识库。用户仅需通过简单操作,即可构建高质量的RAG应用。在生成阶段,用户可自主选择切换如DeepSeek等主流模型。这一功能相当于为用户打造了一个“懂业务知识”的专属AI应用——既深度结合企业内部知识沉淀,又无缝调用DeepSeek等先进模型能力,实现从数据到业务场景的精准匹配。

自动化评估模型,实现每日效果提升

AI应用创新平台能支持基于业务评测数据集的应用效果评估,并自动生成优化建议,用户无需理解复杂技术细节,即可完成配置优化,实现效果提升。

一键微调,让AI更懂业务

应用发布后,平台通过AI智能识别用户反馈中的高频问题,并结合业务场景推荐优化策略。用户可通过“运营→评估→调优”的闭环,实现AI应用的「越用越聪明」,将传统开发中依赖技术团队的“黑盒”过程,转化为业务人员可自主驱动的数据运营。通过这一平台,AI应用的开发流程被简化为「数据运营」。用户只需聚焦业务需求、数据质量与应用效果,无需依赖AI技术专家即可完成迭代,助力用户以更低成本、更高效率挖掘AI在业务场景中的潜力。

正如前面所描述,目前已有不少领先的创新厂商有所实践,深信服正是这条道路上的领跑者之一。近期,深信服一朵云面向AI进行全新升级,现已经推出的「HCI+AICP新一代超融合」解决方案,只需在原集群基础上增加一台GPU节点,就能基于本地集群快速部署并承载DeepSeek在内的企业级大模型,在多实例、并发推理场景中可实现5-10倍的性能提升。同时,深信服还全新推出了AI应用创新平台,助力用户更简单地完成AI应用的开发和运营。

分割线

Forrester预测,到2027年,成功实现AI转型的企业将把决策速度提升10倍。这意味着,企业的竞争维度正在发生根本性转变——当硬件异构性、模型多样性、知识专有性这些桎梏被逐步破除,真正的产业革命即将到来:

“不是少数行业巨头的军备竞赛,而是每个政企组织都能将自己的核心能力通过AI转化为智能优势。这种转变,或许才是大模型真正落地后带给千行百业的终极想象。”