多智能体
分类
系统优化
协作
如何以多智能体协作的视角重新审视和优化RAG整个流程,是当前RAG研究的核心挑战。
文章
提出多智能体联合优化框架,包括共享奖励优化(SharedRewardOptimization)和差异化数据奖励优化(DifferentialDataRewardOptimization),将RAG建模为多智能体协作的序贯决策过程,实现端到端的系统优化。
文章
然而,现有研究大多侧重于优化单一组件(检索或生成),忽视了将LLM视为自主智能体的角度——即能够主动获取知识并策略性地利用知识的智能体(Agent)视角。
文章