多智能体

图4展示了多智能体系统优化的两种方法。

文章

图4：多智能体系统优化示意图。

文章

如何以多智能体协作的视角重新审视和优化RAG整个流程，是当前RAG研究的核心挑战。

文章

提出多智能体联合优化框架，包括共享奖励优化（SharedRewardOptimization）和差异化数据奖励优化（DifferentialDataRewardOptimization），将RAG建模为多智能体协作的序贯决策过程，实现端到端的系统优化。

文章

然而，现有研究大多侧重于优化单一组件（检索或生成），忽视了将LLM视为自主智能体的角度——即能够主动获取知识并策略性地利用知识的智能体（Agent）视角。

文章