扫码关注官方微信公众号

安筱鹏:大模型应用走向“深水区”的四个风向标

2025-07-31



编者按

当前,人工智能浪潮已从通用能力展示转向产业纵深。一个核心问题浮现:如何衡量 AI 是否真正进入了高价值的“深水区”?纵观行业先行者——从 Genspark 45 天 ARR 冲至 3600 万美元、Cursor 两年 ARR 突破 5 亿美元,到 Palantir 三年市值飙升 27 倍——背后均指向四大风向标:其一,高价值领域数据 Token 化;其二,完成以强化学习为主的后训练;其三,构建多 Agent 协同网络并形成数据飞轮;其四,功能实现从“工具”到“决策”的跃升。完成这一闭环,企业可沿 L1‑L4 渐进性阶梯,从 Copilot 跨越至 Autopilot,最终驶入高价值场景的“深水区”,获得确定的高增长红利。

7 月 27 日,世界人工智能大会成功举办,本文根据阿里云智能副总裁、中国信息化百人会执委安筱鹏的主题演讲内容精要整理。


23C55

安筱鹏发表主题演讲


企业高增长的背后,

在于 AI 带来了确定性的高价值


我们思考一个问题,当讨论大模型的应用进入高价值场景、走向深水区的时候,我们的判断标准是什么?

放眼全球,在过去的几个月,我们看到了这样的现象:

一家中国创业者在海外创立的公司 Genspark,2024 年成立时只有 20 个人,但产品上线 45 天之后年化收入达到了 3600 万美元;

美国 AI 代码生成赛道明星企业 Anysphere,其旗下编程产品 Cursor 备受开发者青睐。Cursor 成立于 2022 年,团队不到 100 人,但年化收入已经超过了 5 亿美元,增长速度远超过去二十年间所有同类 SaaS 软件产品。

美国大数据分析公司帕兰蒂尔(Palantir)加速 AI 转型,在 ChatGPT 发布后的两、三年里,公司市值涨了 27 倍,今天接近 3500 亿美元。

12575

三家企业的快速增长,背后是 AI 带来了确定性的高价值


为什么这三家公司能够实现快速的增长?背后的原因在于 AI 带来了确定性的高价值。

当讨论 AI 进入高价值场景的时候,有两个观察的视角,一个是甲方需求侧的视角,每个行业及企业都有自己定义的高价值场景,就是能够定义企业核心竞争力的场景,这不在我们的讨论范围内。另外一个是技术的供给侧角度,即我们从技术供给侧的视角看,判断大模型进入高价值场景、走向深水区,有四个风向标。

大模型应用进入高价值场景、

走向深水区的四个方向标


第一,是否完成了高价值领域数据的 token 化?核心是企业是不是构建了一个 AI 时代的知识中心。

这个知识中心有行业和领域独有的数据,包括三个核心的特征:第一,数据对于业务来说是有价值的;第二,多模态数据——多模态的含义是不仅有结构化数据,还有非结构化数据,包括视频、图片、声音等多模态的数据,结果数据和过程数据,静态数据和动态数据;第三,数据覆盖了企业的多个场景。

接下来更重要的是,把数据清洗、加工、标注、处理之后实现 token 化,token 化的本质是让数据可以被 AI 处理。

第二,是否基于高价值领域数据,基于基础模型(base model)完成了强化学习?打造了一个面向企业业务场景的企业模型因为强化学习重塑大模型推理能力,面对特定的业务场景和任务大幅增强了泛化能力,提升了创造性解决问题能力。

第三,是否基于企业模型,搭建了 Agent 智能体协作网络?真正重要的不是搭建一个 Agent,而是要搭建多个 Agent 的协作网络,让智能体能自我进化,形成数据飞轮。

第四,更重要的是,AI 大模型的功能是否实现了从工具到决策的跨越协作网络带来的价值是从工具到决策的跃升,我们将其定义为智能决策(Token-based decision-making)。只有基于大模型产生的 token 辅助做决策,才是真正意义上的大模型时代的智能决策。

今天去看一个企业的 AI 大模型应用是不是进入了高价值场景、走向了深水区,可以从供给侧的视角,拿这四个“尺子”去量一量。

12302

从供给侧视角看,大模型应用进入高价值场景、走向深水区的四个风向标


大模型应用迈向深水区、

迈向高价值场景的四个阶段


今天 AI 大模型不仅仅是作为一个工具,更要进入到决策领域。一个人从上海到北方旅游,选择北京是决策,坐飞机或坐车是工具;工具是 Copilot,决策是 Autopilot;工具是正确地做事,而决策是做正确的事。

根据大模型是用作工具还是辅助决策、是否引入强化学习做模型训练,我们划分了大模型应用迈向高价值场景的四个阶段。

L1 阶段:基于基础模型的工具助理,比如办公助手、政务助理、企业知识问答等等。

L2 阶段:基于基础模型的智能决策。比如在物流领域,货主跟货车司机之间的交易,过去需要两个人打电话,现在则不需要了。每一个人派一个自己的 Agent,让两个 Agent 去完成一次交易,这就是帮助人做决策。如营销领域智能陪练,金融领域的智能催缴等。

L3 阶段:基于基础模型+强化学习的工具助理。企业基于领域和专属数据,通过强化学习训练企业专属模型,并开发出面向各类场景的 Agent,实现企业复杂工艺的知识问答等工具,实现研发工具 CAD、CAE、EDA 等管理软件的 AI 升级,提升飞机、汽车、智能终端的辅助设计能力,实现地震波探测解析、集成电路 EDA 工具智能化升级。

L4 阶段:基于基础模型+强化学习的智能决策。AI 时代的智能决策,其本质是基于 Token 的决策:Token-based decision-making,如复杂设备的故障诊断、智能差异化的价格定价机制、银行信贷的风控审核、个性药物的开发、人形机器人控制、自动驾驶、蛋白质结构预测等等。

111E7

大模型应用迈向高价值场景的四个阶段


AI 大模型应用走向深水区的实践


案例1:


Palantir——构建智能时代的实时决策系统


美国 Palantir 公司,过去三年它市值涨了 27 倍、目前达到约 3500 亿美元,而整个公司只有 4000 人。Palantir 能实现这些价值背后,是因为它构建了一个新的平台,从早期的数据咨询服务公司,已经转型为了 AI 驱动的大数据分析公司。

2024 年 Q3 财报电话会议上,Palantir 管理层表示:其营收预计在未来几年内以 20% 以上的速度增长。得益于 AIP 平台和 AI 市场的巨大机遇,预计到 2028 年,该业务的年增速将接近 41%。

Palantir 是大模型时代企业智能化转型的一个标杆,它背后有三大核心价值:第一,提供了多源数据整合。雷达、卫星、无人机、业务系统(ERP等),第二,在数据整合之后,进行实时分析决策即态势感知+预测分析+实时决策;第三,自主任务执行。复杂场景中,多方案生成对比与执行。

前段时间美国有飓风“海伦”,Palantir 的大模型解决方案是这样支持政府救灾的:第一,在救灾过程中有来自卫星遥感的数据、无人机航拍的数据、地面传感器的数据、再加上原有的结构化数据,Palantir 把这些结构化和非结构化的数据基于 AI 大模型进行整合,如果没有大模型的话将没法实现。

第二,有了数据之后,Palantir 可以实时分析决策,进行态势感知、预测分析、实时决策,在比较短的时间内对 1200 多平方公里的灾情进行全面的、实时的评估,确定救灾的重点。

第三,它可以自主任务执行,在复杂场景中,多方案生成对比与执行,以至于它可以近乎实时地将食物、水、医用物品配置到最佳的地点。如果没有完成强化学习的训练,这项工作难以实现。

864BA

Palantir 构建智能时代的实时决策系统


Palantir 构建的这套智能化解决方案,跟传统的数字化信息化解决方案有所不同。

传统软件的底层逻辑是事后记录系统,Palantir 构建了以决策为中心的软件架构,即从经验决策到数据驱动的智能决策(token-based decision making)。数据驱动的决策,对数据的基本要求是,实时+端到端+多维(非结构性化)+精准,但今天的技术供给体系没有为此做好准备。具体来讲 Palantir 构建了智能化解决方案,它与传统数字化的区别体现在四个方面:  

在核心目标上,传统的方案是提升流程效率、标准化管理。而智能化解决方案的目标是驱动智能决策、动态优化业务。它已经从管理的工具升级为智能决策的引擎。

在技术架构上,传统的方案主要是结构化数据库和预设模块,而智能化解决方案是基于大模型的实时语义推理、自主智能体组成的分布式系统。

在数据处理上,传统的方案只能处理结构化数据,大量的非结构化数据游离在系统之外。而智能化解决方案能把非结构化异构多源数据进行融合,将决策闭环时间从小时级别压缩至分钟级。

在应用场景上,由于上述的特点,传统的方案适用于标准化场景,如财务、基础供应链等。而智能化解决方案更加适配高敏感动态的行业,如军事、金融、风控、医疗应急等。

111E7


案例2:


夸克——基于 AI 为“志愿选择”提供参考


高考结束了,数千万的考生们要报考志愿。阿里的夸克构建了一个自动帮填报志愿的 Agent 模型,考生输入地区、参考学科、分数、个人喜好等基本信息,夸克就可以生成一份针对性志愿报告,包括考生情况分析、核心填报策略、志愿表明细、学校和专业介绍明细等等。

今年夸克生成了 1200 万高考志愿,服务了 1.2 亿考生和家长用户。它到底是怎么了解几千所院校的众多专业,得以提供了每一份适合每个人的报告?这背后有三个核心的要素:

第一,可信知识的 TOKEN 化,高考知识库具有权威性、准确性、时效性化。

第二,基于强化学习等构建专业模型。基于这些数据,做了SFT和强化学习的后训练,构建了专业模型。

第三,构建智能决策(token-based decision-making)的 Agent。这些构成了 1200 万份高质量的志愿报告。

17B05

夸克高考基于 AI 为“人生决策”提供参考



案例3:


电力负载的智能化调度


基于 AI 大模型实现电力负载的智能化调度也是一个例子。

大模型能实现多专业领域的问答,比如电网调度(电力负荷、运行方式等)、电网运维(设备台账、技改大修等)、营销管理(电量计量、业扩报装等)等。这看起来好像很简单,但它背后有几个核心的 Agent。

一是多维研判分析 Agent,它能根据用户提问作重过载成因分析,拆解分析目标,并逐步推理分析,如特征分析、运行方式分析、主变负载分析等。

二是多因素方案智选 Agent,它能针对重过载问题智能提出解决方案,详细拆解优化目标,并设计多个方案,进行横向比较。

三是多元素重过载报告生成 Agent,能生成迎峰度夏总结报告,生成报告的目录大纲,引用数据、检索知识并完成详细的报告撰写。

这样的“电力老师傅“是如何练成的呢?这背后离不开后训练和数据飞轮驱动的多智能体协作网络。首先它基于一个推理模型,通过使用小规模高质量专业知识数据进行 SFT(监督微调),构建出了一个 SFT 版的垂直领域模型。接着使用这个模型批量生成电力领域内的合成数据,再基于这些合成数据对模型进行了强化学习后训练,并以完成强化学习后的垂直领域模型为基础构建了若干个智能体。智能体在上线服务的过程中就会源源不断的产生线上真实的推理数据,这些真实世界的数据就又可以反哺用于下一轮的强化学习,垂直领域的模型就可以不断的程序迭代,智能体应用的表现也会随之提升,由此形成的数据飞轮使得 token-based decision 的质量能不断得到提升,越来越懂企业、懂应用场景。

5CDA1

基于 AI 大模型实现电力负载的智能化调度


案例4:


Cursor:基于后训练+基础模型,追求极致的编程体验


最后一个案例是 Cursor。全球 53% 的财富 1000 强企业中的工程师在使用 Cursor,5 万+企业将 Cursor 作为首选 IDE(集成开发环境),每月有 1 亿+行企业级代码在 Cursor 中编写。

Cursor 能取得这么好的效果,背后不仅仅是因为调用在代码领域处于全球最佳水平的 Claude 模型用于复杂的任务拆解、代码框架生成等,也得益于 Cursor 使用大量私有数据,强化学习后训练的小模型进一步提升了用户体验。

在 AI coding 中有一个典型的场景是代码搜索,从而精准定位出需要修改的下一处代码的位置。代码搜索场景的特性是超长输入+超短输出,这种情况下使用 Claude 等大模型对整个代码库的扫描成本过高,以及上下文长度也不支持,因此 Cursor 基于自身语料库后训练了一个代码搜索模型,实现了海量代码库检索能力。

并不是所有的需求都是高度复杂,需要 Claude 等模型来拆解意图,并生成复杂代码框架的。因此在简单的代码任务场景下,Cursor 也训练了简单意图理解模型,能够精准理解开发者需求和实现方式,替换 Claude 等大参数模型,从而降低成本和提升速度。

同时在大段的简单代码生成的场景。Cursor 也基于 Llama 70B 后训练了一个专有模型,能实现大约每秒 1000 tokens 的代码生成速度,是原版 Llama 70B 的 13 倍、同时期 GPT-4o 的 5 倍。Cursor 背后看起来是一个模型、一个应用,但背后实际上是多个模型的支持

13EDB

若干后训练模型使得 Cursor 具备更智能的优质体验

从这四个案例中可以看出,将企业的私有数据进行 Token 化、完成以强化学习为核心的后训练、形成多智能体协同网络,并形成智能决策深度嵌入业务场景,企业应用才能驶入高价值场景的“深水区”。这四个风向标,或将引领接下来大模型产业格局的走向。


内容来源|阿里研究院

编辑|段文秀
审核|朱栩葶
责编|杨帆