Salesforce AI, CRMArena-Pro 소개: LLM 에이전트를 위한 최초의 멀티턴 및 기업급 벤치마크

Salesforce AI가 CRMArena-Pro를 소개했다. 이는 LLM 에이전트를 위한 최초의 멀티턴 및 기업급 벤치마크로, AI 에이전트는 LLM(대형 언어 모델)에 의해 구동되며 CRM과 같은 복잡한 비즈니스 업무를 처리하는 데 큰 잠재력을 보여준다. 그러나 이러한 에이전트의 실제 세계에서의 효과를 평가하는 것은 공개적이고 현실적인 비즈니스 데이터의 부족으로 어렵다. 기존의 벤치마크는 종종 간단한 일회성 상호작용이나 고객 서비스와 같은 좁은 응용에 초점을 맞추어 실제 업무를 놓치고 있다. 이러한 상황에서 Salesforce AI가 새로운 벤치마크 CRMArena-Pro를 선보이게 되었다. 이 벤치마크는 멀티턴 대화를 포함하고 있으며, 기업급 시나리오를 다루어 실제 비즈니스 업무에 더욱 적합한 평가를 제공한다. 이러한 발전은 AI 기술이 기업 환경에서 더 널리 채택되고 효율적으로 활용될 수 있도록 도와줄 것으로 기대된다.
출처: Mark Tech Post
요약번역: 미주투데이 김지호 기자