LLMs는 여전히 의학 자료를 신뢰할 수 없을 정도로 언급하는 데 어려움을 겪고 있음: 스탠포드 연구진이 AI 생성 응답에서 사실적인 지원을 감사하기 위한 SourceCheckup을 소개
LLM(Large Language Model)은 건강 관리 분야에서 점점 더 중요해지고 있지만, 그들의 결과물을 뒷받침하는 데 신뢰할 수 있는 소스가 필요하다. 아직 FDA가 임상 의사 결정에 승인한 LLM은 없지만, GPT-4o, Claude, MedPaLM과 같은 최고 모델은 USMLE과 같은 표준 시험에서 의사를 능가했다. 이러한 모델들은 이미 정신 건강과 같은 현실적 상황에서 활용되고 있다. 이러한 상황에서 스탠포드 대학 연구진은 SourceCheckup이라는 도구를 소개하여 AI가 생성한 응답에서 사실적인 지원을 감사할 수 있게 했다.
출처: Mark Tech Post
요약번역: 미주투데이 김지호 기자