|
1 | | -# 4.企业智能体的落地公式 |
2 | | -当前智能体的价值越来越明确,再配合持续增强且成本快速下降的大模型供给、日益成熟的智能体构建生态,越来越多企业已经坚定了在这方面的投入和转型。但过去一年时间的实践经历又让很多企业对此充满困惑,甚至失望。所以,当前企业比之前任何时候都期待有个更加清晰的方法论来指导企业这方面的工作。在这里,我们结合行业发展趋势以及项目组过去的实践经验,提出一个指导企业智能体建设的落地公式。具体如下: |
| 1 | +# 6.企业智能体的角色定位 |
| 2 | +当发掘出来合适的智能体场景后,智能体建设方和业务方经常产生分歧的一个点就是这个即将建设的智能体未来承担什么样的角色。从业务方出发,他们天然希望智能体的智能程度越高越好,最好能像真实的员工一样全天候在岗,高质量完成委托任务。但建设方则天然容易陷入从技术角度论证当前智能体能做到的智能程度,而论证结果常常不容易达到业务方的预期。这样分歧就会产生并有可能导致业务部门得出智能体不好用、不成熟的判断。要避免这个风险,首先就需要在业务方与建设方对于智能体的智能程度形成统一认知。 |
| 3 | +## 6.1.智能体的智能程度 |
| 4 | +结合前文对于智能体的定义,我们可以理解智能体的智能程度是要表达它能多大程度上完成人类委托给它的任务。这种委托程度可以从两个维度去评估: |
| 5 | +- **可靠程度**:智能体能否准确理解任务需求、严格遵循规则执行任务,最终给出可靠结果; |
| 6 | +- **自主程度**:智能体能否在执行过程中自主完成任务分解、执行、评估和反思,不需要(或者只需要少量)人类参与就能完成整个任务并给出结果; |
3 | 7 |
|
4 | | -**智能体建设 = 场景选择 + 角色定位 + 范式实现** |
| 8 | +智能体这两个方面的能力不仅受当前大模型能力的影响,还有很多其他相关因素,甚至部分还强依赖业务方的配合和其业务场景的数字化程度。具体来说,决定一个智能体在真实场景落地的智能程度包括如下几个方面: |
5 | 9 |
|
6 | | -以上公式明确表达一个观念,即对于企业内任何一个智能体的建设,都需要认真规划三个事情:找到正确的场景以体现业务价值,定位正确的角色以控制预期,基于范式的实现以高效投产。具体来说: |
7 | | -- **场景选择**:智能体建设的第一要务是要坚持聚焦业务价值,而业务价值都是隐含在具体的业务场景里面,所以场景选择就成为这个公式的第一要素。实践过程中,场景选择要遵循几个原则展开。首先,需要在企业内全面筛查可能的业务场景,而不仅仅是停留在局部领域,尤其是智能体建设负责人熟悉的领域。只有全面筛查,才能找到公司内最应该被智能体赋能也最能直接产生业务价值的场景;其次,要遵循增效大于降本的逻辑去看待业务价值。增效是企业对于业务价值的第一优先追求,这样选择可以更加直接和高效地释放智能体业务价值;关于场景选择的具体方法和思路可以参考本白皮书第五章的内容。 |
8 | | -- **角色定位**:智能体建设落地经常面临的一个陷阱是没有为智能体在对应场景中定位合理角色。尤其是智能体自身的定义也容易让大家误会智能体在任何场景都能够“独立上岗”。一旦角色定位出现差错就容易形成预期落差,进而导致智能体落地推广举步维艰。智能体的角色定位是一个非常复杂的问题,它不仅仅关系到当前大模型的能力建设,还和企业内智能体运行的上下文环境、智能体执行成本、用户的交互习惯都相关。本白皮书第六章内容将就这方面展开论述。 |
9 | | -- **范式实现**:有了正确场景和合理角色后,智能体的落地就变成一个实现问题。但是,由于智能体建设仍然是一个比较新的领域,企业普遍缺乏建设经验和相关人才。所以,有比较标准的范式参考是一个非常有用的落地实践。智能体的实现范式与智能体的技术架构以及业务逻辑都密切相关。本白皮书第七章会介绍六个常见智能体实现范式,包括每个范式的业务逻辑编排,上下文规划以及关键技术点。 |
10 | | -总结来说,这个公式是为了直面企业智能体落地过程中最常见的几个挑战。其中,场景选择是面对“智能体无用论”的判断,而角色定位则是要面对“智能体不好用”的问题。最后,范式实现是要缓解“智能体不会建设”的挑战。如果智能体有用、好用而且企业还能建设投产,那智能体在企业内一定能够落地并不断成长。 |
| 10 | +- **大模型的能力**。业务场景的复杂度越高、专业领域越强,对大模型的知识要求和分析推理能力要求就越高。尤其是对于长流程的复杂场景,非常考验大模型对其复杂问题推理和指令遵循的能力;当大模型能力不足以支持更高程度的智能时,适当降低智能预期就成为一个理性的选择; |
| 11 | +- **上下文环境**。企业内的投产智能体对于业务场景上下文要求会比简单的 AI 对话高很多。这主要体现在对业务场景专业性知识的储备,企业内关键数据与特殊流程规则的了解以及企业内各种工具的适配。在这个方面,业务方的数字化程度越高,配合 AI 做改造的积极性越好,就越能够提升智能体运行的上下文环境。 |
| 12 | +- **用户交互习惯**。用户与智能体的交互习惯也是影响智能体智能程度的关键因素。这包括两个方面,用户是否擅长用 AI 友好的方式与智能体交互(例如,提供高质量的用户提示词),另外一个方面是用户对于智能体的交互期待。在某些情况下,用户或许并不希望智能体全自主执行,或者从合规角度看用户仅希望参考智能体的输出结果而不是直接使用。所以,用户交互习惯很多时候也会影响智能体对智能程度的期待。 |
| 13 | +- **执行成本因素**。任何智能体投产都需要考虑投入产出比,何况现在智能体执行消耗的Token 成本还比较高。在某些场景下,用户是愿意通过降低一定的智能程度来换取更好的成本效益。 |
| 14 | + |
| 15 | +基于以上几个因素的深入分析,业务方与建设方对于智能体的智能期待就能够具体化,而不是笼统得定义智能体够智能或者不够智能。同时,这种深入分析也更容易帮助双方建立对于智能体的预期,这样到投产阶段有助于形成使用-反馈-迭代循环的信任基础。 |
| 16 | +6.2.智能体的角色定位 |
| 17 | +有了对智能程度的清晰分析和合理预期。业务方就可以对智能体在场景中的运行角色建立准确的定位。总结来说,智能体的角色定位可以参考如下象限图: |
| 18 | + |
| 19 | + |
| 20 | + |
| 21 | +图 4 :智能体角色定位象限图 |
| 22 | + |
| 23 | +- **委托角色**:这是智能程度比较高的智能体。在具体业务场景中可以考虑将相关任务委托给智能体完成。当然,委托程度可以是一个逐步提升的过程。 |
| 24 | +- **辅助角色**:这类智能体擅长给出准确结果,但是因为模型能力或者上下文环境等原因还无法做到自主交付结果。所以,由它辅助人来完成任务是最合适的。这种角色有一个典型的交互模式,即人把任务交给智能体,由智能体给出准确决策和执行建议,但是最后需要人来手动按照智能体的建议完成执行。 |
| 25 | +- **调研角色**:这类智能体自主化执行能力强,但对于给出的结果由于缺乏校验机制,缺少高质量数据来源、进行总结推理形成可执行建议困难等原因无法直接使用。所以,这类角色智能体特别适合帮助人去广泛收集信息,做问题初步调研,并最终由人基于智能体输出结果做二次加工和确认,形成行动方案和结论。 |
| 26 | +- **无效角色**:落入这个区域的智能程度说明当前业务场景的智能体构建条件还不具备,不应该纳入当前构建范围之内。 |
| 27 | +当然,智能体角色定位是一个持续迭代的过程。由于各自内部或者外部条件的持续变化,业务方和建设方需要经常共同重新检视当前智能体的角色定位是否仍然有效,是否可以进一步提升角色定位。尤其是在当前大模型能力在快速成长,各种智能体生态技术持续成熟的当下,这种检视工作需要较高频率进行。 |
0 commit comments