模型与上下文

本章说明如何在对话中用好模型选择与上下文管理，使同一套智能体在不同任务上既稳又省。界面位置以当前控制台为准，常见入口包括主对话区底部的模型下拉与发送区，详见主界面一览。

语音输入提示

除键盘输入外，主对话区 底部输入条右侧（当前模型标签旁）可使用 麦克风 进行语音输入：点击后开始采集，界面会显示 正在聆听… 等状态；识别结果会以 文字填入输入框，你可修改后再选择模型并发送，与纯文字输入共用同一套发送与快捷键习惯（如 Enter 发送、Shift+Enter 换行）。使用前请允许浏览器访问麦克风；环境嘈杂或识别不准时，建议核对文案后再发送。

底部输入条：模型选择旁的语音（麦克风）入口

聆听中状态示意

识别结果填入输入框后可编辑再发送

自主选择底层大模型

不同大模型在推理深度、输出风格、速度与计费上往往不同。AgenticHub 支持在对话发送前切换模型，使你在探索阶段与正式跑批阶段可以用不同档位平衡体验与成本。

选型时可对照的维度

任务难度：规则清晰、输入结构化时，可用响应更快、成本更低的模型做初筛；需要复杂推理、长链推导或弱格式输入时，再换更强模型。
延迟与并发：面向人工实时阅读的场景优先低延迟；离线批处理可更关注质量与单价。
输出形态：表格、代码、长文摘要等对模型习惯不同，切换后应用同一批样例回归一次再推广。

切换模型后的习惯动作

用固定的一组测试输入跑一遍，对比输出结构、拒答边界与幻觉倾向是否变化。
若实例或工作流里已绑定默认模型，确认对话里临时切换是否仅影响本会话，还是会影响保存配置，以产品实际行为为准。

对话与上下文

对话上下文是模型记住本轮已说内容的范围。写得好、管得好，多轮协作会明显省力；管理不好则容易出现指代混乱或旧结论干扰新任务。

多轮协作的写法

后文引用前文结论时，尽量用简短复述或编号，少用「这条、上面」那种模糊指代。
同一会话里若并行讨论多个子主题，先用标题式短句分段，再分别展开，降低模型串题概率。

长任务拆分

把一次超大需求拆成确认范围、设计结构、生成初稿、对照验收等若干步，每步结束后再进入下一步。
对 HR 简历筛选等场景，可先在一轮里对齐 JD 硬性条款与输出列，再进入逐份简历分析，避免模型在口径未定时就开始打分。

与 Agentic 小助手及实例的关系

Agentic 小助手是内置的通用对话智能体，同一会话里既可以完成日常问答、写作、检索、分析等多数通用工作，也可以在你需要时引导创建或改配专用智能体与相关资源，因此上下文往往同时承载业务讨论与配置演进，并不局限于专用智能体的创建与改配这一种用途。与具体实例对话时，上下文通常更贴近该实例的固定人设与工具链，多用于线上执行与重复任务。两类入口的模型选择可分别调整，团队内可约定何时在 Agentic 小助手侧做探索与泛化工作、何时在实例侧做定型执行，减少口径漂移。

开启新对话与历史对话

何时适合开启新对话

任务目标从 A 完全切换到 B，或试验一套与当前线程冲突的新规则时，用开启新对话清空上下文，避免旧结论混入新实验。
发现模型反复抓住已作废的假设时，新开一轮往往比在长线程里打补丁更快。

历史对话能做什么

回看自己与 Agentic 小助手或实例的过往提问与答复，用于复盘话术、截取可复用片段或排查误配置来源。
导出或对内分享前，对含隐私的字段做脱敏或截断，避免二次传播风险。

与长期记忆的边界

需要跨会话长期延续的偏好或结论，应依赖产品提供的长期记忆或资源中的稳定文本，而不是假设历史列表里的每一句话都会被自动继承。

提示词管理

提示词是把任务口径写死的低成本手段。除在对话里临时粘贴外，产品侧通常还支持将提示词沉淀为可检索、可复用的仓库或片段，与左侧资源中的提示词库能力配合，详见资源与资源广场与知识库与 RAG 中相关小节。

日常习惯

把高频开场、评分口径、输出表头、禁答范围等写成短段，在需要时一键插入或从库中选择，减少每次手打差异。
重大口径变更时记录变更原因与生效日期，便于 HR 或管理员之间对齐。

与团队协作

共用同一实例或模板时，提示词变更会影响所有人输出，修改前应小范围试用并在团队频道公示。
若存在多套口径，用命名区分环境，例如试用版与生产版，避免误用。

与模型切换的配合

同一提示词在不同模型下表现可能不同，切换模型后应重新用标准样例验证一遍再固化为默认。

语音输入提示​

自主选择底层大模型​

对话与上下文​

开启新对话与历史对话​

提示词管理​

语音输入提示

自主选择底层大模型

对话与上下文

开启新对话与历史对话

提示词管理