
LLM 기반 에이전트의 지속적 학습을 평가하는 벤치마크인 LifelongAgentBench
현재 LLM 기반 에이전트는 기억력이 부족하고 모든 작업을 처음부터 다시 시작하는 문제가 있다. LifelongAgentBench는 지속적 학습을 평가하기 위한 벤치마크로, 지난 경험을 통해 학습할 수 없는 상태인 LLM 기반 에이전트들의 한계를 보완하고 일반 지능으로 나아가는 진정한 발전을 목표로 한다.