LLM应用开发——对话系统设计模式

从“槽位填充”到“语义理解”：范式演进

传统的对话系统（如基于 Rasa 或 Dialogflow）依赖于槽位填充 (Slot-filling) 和有限状态机 (FSM)。这种方式在处理预定义流程时非常稳定，但在面对用户的自然语言多样性、话题跳跃和指代消解时显得捉襟见肘。

现代 LLM 对话系统将 LLM 作为“中枢神经”，通过对话状态追踪 (DST) 和动态规划，实现了从“死板流程”到“灵活交互”的跨越。

核心架构：对话系统的“记忆宫殿”

对话系统的核心挑战在于如何管理海量的上下文。

1. 短期记忆：滑动窗口 (Sliding Window)

策略：仅保留最近的 $N$ 轮对话。
优点：计算成本低，响应速度快。
缺点：容易丢失早期重要的上下文（如用户在第一句提到的姓名）。

2. 压缩记忆：摘要化 (Summarization)

策略：当对话超过 Token 限制时，利用 LLM 对历史记录进行摘要提取。
优点：保留了长程信息。
缺点：摘要过程可能丢失细节，且增加了额外的 LLM 调用成本。

3. 长期记忆：向量化检索 (Vector-based Long-term Memory)

策略：将历史对话存入向量数据库，根据当前 Query 检索相关的历史片段。
优点：理论上支持无限长的记忆。
缺点：检索到的片段可能缺乏时序逻辑，导致 LLM 产生幻觉。

4. 混合记忆架构 (Hybrid Memory)

工业级最佳实践：

[当前输入] + [最近 3 轮原始对话] + [历史对话摘要] + [检索到的相关事实] = [最终 Prompt]

对话状态追踪 (DST) 的 LLM 实现

在任务导向型对话中，我们需要准确记录用户的需求。

# 使用 Pydantic 定义对话状态
from pydantic import BaseModel, Field
from typing import Optional

class BookingState(BaseModel):
    destination: Optional[str] = Field(None, description="目的地")
    date: Optional[str] = Field(None, description="出发日期")
    budget: Optional[int] = Field(None, description="预算范围")
    confirmed: bool = Field(False, description="用户是否已确认订单")

# Prompt 示例
DST_PROMPT = """
你是一个对话状态追踪器。根据以下对话历史，更新当前的预订状态。
当前状态: {current_state}
最新对话: {user_input}
仅输出更新后的 JSON 格式状态。
"""

复杂流控制：基于 LangGraph 的状态机

对于复杂的业务逻辑（如退货流程、多步审批），简单的线性 Prompt 无法胜任。我们需要将对话建模为有向图。

场景：带纠错机制的订票系统

from typing import Annotated, TypedDict, Union
from langgraph.graph import StateGraph, END
from langgraph.prebuilt import ToolNode

class State(TypedDict):
    # 使用 Annotated 标记如何合并状态更新
    messages: Annotated[list, add_messages]
    ask_human: bool

def chatbot(state: State):
    # LLM 判断是否需要调用工具或询问用户
    response = llm.invoke(state["messages"])
    return {"messages": [response]}

def human_node(state: State):
    # 模拟人工干预或等待用户确认
    pass

# 构建工作流
workflow = StateGraph(State)

workflow.add_node("chatbot", chatbot)
workflow.add_node("human", human_node)

# 条件边：判断是否需要人工确认
workflow.add_conditional_edges(
    "chatbot",
    lambda x: "human" if x["ask_human"] else END
)

workflow.add_edge("human", "chatbot")
workflow.set_entry_point("chatbot")

app = workflow.compile()

处理中断与话题切换 (Context Switching)

用户在对话中经常会突然改变主意（”算了，我不去北京了，改去上海”）或询问无关问题（”顺便问下，上海明天天气怎么样？”）。

1. 意图路由 (Intent Routing)

在对话入口处设置一个轻量级分类器，判断用户输入属于哪个子任务。

2. 任务堆栈 (Task Stack)

当用户切换话题时，将当前任务上下文压入堆栈。

Push：保存当前状态，进入新话题。
Pop：新话题结束后，询问用户是否回到原任务：”刚才我们聊到订票，还要继续吗？”

3. 全局指令 (Global Commands)

预留特定的关键词或意图（如 “退出”、”重置”、”帮助”），无论处于哪个状态都能立即响应。

评估与优化：如何衡量对话质量？

对话系统的评估不能仅看单次回答的准确率，更要看会话级 (Session-level) 的表现。

任务完成率 (Task Completion Rate)：用户是否最终达成了目标？
平均对话轮数 (Average Turns)：达成目标所需的轮数越少，效率越高。
状态追踪准确率 (DST Accuracy)：模型是否准确提取了所有必要的槽位？
用户满意度 (CSAT)：通过显式反馈（点赞/点踩）或隐式反馈（是否中途退出）衡量。

进阶：情感计算与共情 (Empathy in Dialogue)

优秀的对话系统不仅要“聪明”，还要有“温度”。

情感分析 (Sentiment Analysis)：在处理用户输入时，同步运行一个轻量级的情感识别模型（或利用 LLM 的 Few-shot 能力）。
动态语气调整：
- 如果用户表现出焦虑，系统应使用更简洁、确定性的语言。
- 如果用户表现出愤怒，系统应优先进行情感安抚，并提供转人工选项。
多模态交互：结合语音（TTS 的语调变化）、表情包或卡片式 UI，增强交互的丰富度。

总结

构建一个优秀的对话系统是技术与艺术的结合。技术上，我们需要利用 LangGraph 等工具构建稳健的状态机，并设计精巧的记忆管理策略；艺术上，我们需要通过 Prompt Engineering 赋予系统共情能力和灵活的应变能力。

未来的对话系统将不再是简单的“你问我答”，而是能够主动感知用户意图、管理复杂任务流、并具备长期记忆的智能助理 (AI Agent)。

参考资源

（采用 CC BY-NC-SA 4.0 许可协议进行授权）

本文标题：《 LLM应用开发——对话系统设计模式》

本文链接：http://localhost:3015/ai/%E5%AF%B9%E8%AF%9D%E7%B3%BB%E7%BB%9F%E8%AE%BE%E8%AE%A1.html

本文最后一次更新为天前，文章中的某些内容可能已过时！