2025년 4월 29일 화요일
오늘의 신문
2025년 4월 29일 화요일 오늘의 신문
바이트댄스, 강력한 비전-언어 모델을 기반으로 한 오픈소스 다중모달 AI 에이전트 UI-TARS-1.5 공개
발행일: 2025년 4월 21일 오전 3시 09분

바이트댄스가 GUI 상호작용 및 게임 환경에 초점을 맞춘 최신 다중모달 에이전트 프레임워크인 UI-TARS-1.5를 공개했다. 이 비전-언어 모델은 화면 콘텐츠를 인식하고 대화형 작업을 수행할 수 있는 능력을 갖추고 있다. UI-TARS-1.5는 GUI 자동화 및 게임 추론 벤치마크 영역에서 일관된 개선을 선보이며 여러 선도적인 모델들을 능가하고 있다. UI-TARS-1.5는 오픈소스로 제공되며, AI 에이전트 및 다중모달 모델 개발자들에게 강력한 도구로서 활용될 수 있다. UI-TARS-1.5의 성능은 다양한 환경과 작업에 대해 효과적으로 측정되었으며, 다중모달 인공지능 분야에서의 기술적 진보를 대표하는 중요한 발전이라고 평가받고 있다. 바이트댄스의 UI-TARS-1.5는 다중모달 에이전트 및 인공지능 모델 개발에 있어서 혁신적인 도구로 활용될 전망이며, GUI 자동화 및 게임 추론 분야에서의 성능 향상을 통해 기술적 우위를 확보하고 있다.

<Mark Tech Post 뉴스 본문 전체읽기>

출처: Mark Tech Post
요약번역: 미주투데이 김지호 기자