Hello-Agents第一章习题 #195
Unanswered
Lucy-cao
asked this question in
💬 Exercises & Q&A
Replies: 2 comments 7 replies
-
|
我感觉caseA 不是智能体哈 |
Beta Was this translation helpful? Give feedback.
7 replies
-
|
智能体通过理解用户意图去自主选择工具,那如果这个工具没有,比如查询天气的这个函数没有提供给他,他就不能自己写一个函数去查天气吗?如果是这样,就是提前提供一大堆工具,如果是开发通用性智能体。 |
Beta Was this translation helpful? Give feedback.
0 replies
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
Uh oh!
There was an error while loading. Please reload this page.
-
caseA属于反应式智能体,它是基于工程师已经设计到的条件-行动进行决策的,没有自主规划的能力。
caseB属于基于模型的反应式智能体,它能够检测到外部世界的状态,理解并构建外部世界的模型,基于环境做出决策。
caseC属于规划式智能体,也是基于效用的智能体,具备一定的思考能力和长远规划的能力,会考虑未来如何走是最优策略。
caseD属于混合式智能体,查询订单信息、分析问题原因是思考的过程,提供解决方案是思考的结果,并能够安抚用户情绪是通过观察做出安抚的反应,所以属于混合式智能体。
Performance性能度量:①用户能够达到既定的健身目标。②训练计划是适合不同健身基础的用户的。③动作指导标准,降低运动损伤率。④饮食建议合理,能够为用户的目标服务。
Environment环境:①物理环境:用户所处的运动场所。②用户身体:生理状态(心率、血氧、动作形态等)和心理状态(动力、疲劳感)。③用户设备:可穿戴设备等。④数据平台:保存用户运动、饮食等数据的云端服务器。
Actuators执行器:①生成训练计划给用户查看。②监测用户的生理数据和健身过程的运动形态,展示给用户。③提供语音指导,如果不标准则给出纠正动作的提示。④展示训练效果和饮食建议。
Sensors传感器:①可穿戴设备监测用户心率、血氧等数据。②视觉传感器捕获用户的运动形态,并进行计算机视觉分析。③用户输入数据:健身目标、心理状态、疼痛反馈等。④周围的环境:地理位置、海拔信息等。
部分可观察:用户的健身目标、通过可穿戴设备监测到的身体数据、训练动作的形态都是可以观察的。
随机性和动态性:①用户的生理数据指标是随机性和动态变化的,当心率过高或者血氧过低,需要及时提醒用户休息。②用户的运动形态也会在过程中不断变化,智能体需要根据变化去判断动作是否标准,如果不标准,需要及时的纠正。
①方案A:优点:按照既定的目标条件执行,不会出错,能够快速响应结果;缺点:缺乏一定的灵活性。
方案B:优点:自动根据用户的历史行为判断是否可以退款,对于优质客户而言,不再需要等审批,体验较好,具备很强的灵活性。缺点:对于一些需要严格把关退款的特殊商品或者金额较高的商品,可能出现机器误判的情况,对公司造成一定的损失。
②
Workflow适用场景:商品价值较高或者特殊商品之类的退款需要人工审核。Agent适用场景:普通商品且商品价值不高,客户历史购买行为较好时,可以使用Agent。我倾向于两者结合起来使用。
③可以将两者结合。首先通过智能体判断商品的情况和用户的情况,如果涉及到特殊商品或者商品金额较大,则交由工作流让人工介入做出判断。
①在每一次给出推荐的结果时,提醒用户做出反馈对此结果是满意还是不满意,将用户的反馈记录下来,加入到下一次对话时的输入词中,这就相当于智能体有了记忆的功能。
②这需要联网调用API查询景点门票的余额情况,如果查询到售罄,那么通知智能体生成备选方案。
③在提示词中可以加入提示语:如果用户连续拒绝3个推荐,那么一方面可以总结用户拒绝的景点类型,尽量避免此类,推荐其他类型的景点,同时也可以询问客户对哪类景点更感兴趣,后续以此作为着重推荐类型。
以医疗诊断助手为例,当接收到一个患者时,需要获取到患者的不适描述,之前做的各种检查报告,由系统1快速初筛,判断大致是哪种类型的疾病,如果是普通的病例,那么就直接输出诊断结果;
如果是碰到复杂的或罕见的疾病,那么需要启动系统2,对检查报告中更详细的指标做出分析,也有可能需要调用最新的研究报告,判断是否是罕见疾病,慢慢推理出所患疾病,并给出针对性的解决方案。
①智能体是基于上下文根据概率去判断后续可能输出的内容的,只要是概率问题,就会存在误判;另一方面,互联网上信息繁杂,不一定所有的信息都是真实的,如果用于训练的数据源不准确,那么模型产出的结果也会是不正确的。
②智能体可能会陷入死循环中,如果没有得到应有的答案,可能会一直循环,无法停止。
③仅仅使用准确率是不够的,准确率只能够对已有数据集进行验证准确率,但是无法确保对于未知的内容适用成都,需要更加完整的框架去评估智能程度。
效能与可靠性: 准确率只是一个起点。需要更关心它的召回率和在不同场景中的鲁棒性。
效率: 计算需要多少时间和内存,目标结果与计算耗用资源之间是否平衡。
泛化性: 是不是可以对其他未被纳入训练集的数据也能够有较好的结果。
推理能力: 能否体现了其因果推理能力,让用户可视化推理的过程。
交互性: 它给出的建议是否被用户接纳,用户所输入的内容,是否可以作为后续提供建议的基础。
Beta Was this translation helpful? Give feedback.
All reactions