跳到主要内容

模型与上下文

本章说明如何在对话中用好模型选择与上下文管理,使同一套智能体在不同任务上既稳又省。界面位置以当前控制台为准,常见入口包括主对话区底部的模型下拉与发送区,详见 主界面一览

自主选择底层大模型

不同大模型在推理深度、输出风格、速度与计费上往往不同。AgenticHub 支持在对话发送前切换模型,使你在探索阶段与正式跑批阶段可以用不同档位平衡体验与成本。

选型时可对照的维度

  • 任务难度:规则清晰、输入结构化时,可用响应更快、成本更低的模型做初筛;需要复杂推理、长链推导或弱格式输入时,再换更强模型。
  • 延迟与并发:面向人工实时阅读的场景优先低延迟;离线批处理可更关注质量与单价。
  • 输出形态:表格、代码、长文摘要等对模型习惯不同,切换后应用同一批样例回归一次再推广。

切换模型后的习惯动作

  • 用固定的一组测试输入跑一遍,对比输出结构、拒答边界与幻觉倾向是否变化。
  • 若实例或工作流里已绑定默认模型,确认对话里临时切换是否仅影响本会话,还是会影响保存配置,以产品实际行为为准。

对话与上下文

对话上下文是模型记住本轮已说内容的范围。写得好、管得好,多轮协作会明显省力;管理不好则容易出现指代混乱或旧结论干扰新任务。

多轮协作的写法

  • 后文引用前文结论时,尽量用简短复述或编号,少用「这条、上面」那种模糊指代。
  • 同一会话里若并行讨论多个子主题,先用标题式短句分段,再分别展开,降低模型串题概率。

长任务拆分

  • 把一次超大需求拆成确认范围、设计结构、生成初稿、对照验收等若干步,每步结束后再进入下一步。
  • 对 HR 简历筛选等场景,可先在一轮里对齐 JD 硬性条款与输出列,再进入逐份简历分析,避免模型在口径未定时就开始打分。

与 Agentic 小助手及实例的关系

  • Agentic 小助手是内置的通用对话智能体,同一会话里既可以完成日常问答、写作、检索、分析等多数通用工作,也可以在你需要时引导创建或改配专用智能体与相关资源,因此上下文往往同时承载业务讨论与配置演进,并不局限于专用智能体的创建与改配这一种用途。与具体实例对话时,上下文通常更贴近该实例的固定人设与工具链,多用于线上执行与重复任务。两类入口的模型选择可分别调整,团队内可约定何时在 Agentic 小助手侧做探索与泛化工作、何时在实例侧做定型执行,减少口径漂移。

开启新对话与历史对话

何时适合开启新对话

  • 任务目标从 A 完全切换到 B,或试验一套与当前线程冲突的新规则时,用开启新对话清空上下文,避免旧结论混入新实验。
  • 发现模型反复抓住已作废的假设时,新开一轮往往比在长线程里打补丁更快。

历史对话能做什么

  • 回看自己与 Agentic 小助手或实例的过往提问与答复,用于复盘话术、截取可复用片段或排查误配置来源。
  • 导出或对内分享前,对含隐私的字段做脱敏或截断,避免二次传播风险。

与长期记忆的边界

  • 需要跨会话长期延续的偏好或结论,应依赖产品提供的长期记忆或资源中的稳定文本,而不是假设历史列表里的每一句话都会被自动继承。

提示词管理

提示词是把任务口径写死的低成本手段。除在对话里临时粘贴外,产品侧通常还支持将提示词沉淀为可检索、可复用的仓库或片段,与左侧资源中的提示词库能力配合,详见 资源与资源广场知识库与 RAG 中相关小节。

日常习惯

  • 把高频开场、评分口径、输出表头、禁答范围等写成短段,在需要时一键插入或从库中选择,减少每次手打差异。
  • 重大口径变更时记录变更原因与生效日期,便于 HR 或管理员之间对齐。

与团队协作

  • 共用同一实例或模板时,提示词变更会影响所有人输出,修改前应小范围试用并在团队频道公示。
  • 若存在多套口径,用命名区分环境,例如试用版与生产版,避免误用。

与模型切换的配合

  • 同一提示词在不同模型下表现可能不同,切换模型后应重新用标准样例验证一遍再固化为默认。