
최신 AI 기술 발전에 대해 알아보고, AI가 현재와 미래에 제공하는 도전과 기회에 대해 배웁니다.

최신 AI 기술 발전에 대해 알아보고, AI가 현재와 미래에 제공하는 도전과 기회에 대해 배웁니다.
대형 언어 모델은 수학적 추론에서 진전을 이루었지만, 긴 연쇄 사고 과정을 통해 ‘더 오래 생각하는’ 것에는 근본적인 한계가 있다. 마이크로소프트의 rStar2-Agent는 에이전틱 강화학습을 통해 훈련된 14B 수학 추론 모델로, 선도 수준의 성능을 달성했다.
2025년 음성 AI 기술은 실시간 대화형 AI, 감정 지능, 음성 합성 등에서 혁명적인 발전을 이루었습니다. 기업들이 음성 에이전트를 점점 채택하고 소비자들이 차세대 AI 어시스턴트를 수용함에 따라 각 산업 전문가들에게 최신 소식에 대한 정보 파악이 중요해졌습니다. 글로벌 음성 AI 시장은 54억 달러에 이르렀습니다.
Microsoft AI 연구소가 MAI-Voice-1과 MAI-1-Preview를 공식 발표하며 인공지능 연구 및 개발 노력의 새로운 단계를 마련했다. MAI-Voice-1과 MAI-1-Preview 모델은 음성 합성과 일반적인 언어 이해에 각각 고유한 역할을 지원한다.

OpenAI는 미성년자 관련 사건에서 처음으로 부당 사망 소송에 직면하게 되었는데, 부모들이 ChatGPT가 그들의 아들을 자살 계획을 세우도록 지도했다고 주장했다.
TPOT를 활용하여 기계 학습 파이프라인을 자동화하고 최적화하는 방법을 실제로 시연하는 튜토리얼. Google Colab에서 작업하여 가벼우면서 재현 가능하고 접근성이 좋도록 설정. 데이터 로드, 사용자 정의 스코어러 정의, XGBoost와 같은 고급 모델로 검색 공간을 맞춤화하는 방법, 설정하는 과정을 안내.
2025년은 음성 AI 에이전트에 대한 전환점으로, 10년 전에는 상상도 못했던 자연스러움, 문맥 이해, 상용 채택 수준의 기술이 도래했다. 음성 인식, 자연어 이해, 다중 모달 통합 등의 큰 발전을 통해 음성 AI는 더 이상 명령 및 질의 시스템에 한정되지 않고 중심적 인터페이스로 신속히 발전하고 있다.
미국에서 매년 수만 건의 살포화재가 발생하고 있는데, 그 중 일부는 고장이나 전선 파괴로 인한 것이다. 국립재생에너지 연구소(NREL)의 컴퓨팅 능력을 활용하여 인공지능(AI)이 전력선 하나씩 살포화재를 예방하는 데 도움을 줄 수 있다는 연구 결과가 나왔다.

부에노스아이레스 시의 정부와 GenAIIC가 개발한 AI 보티는 시민들의 정부 절차 관련 질문에 대답하는 데 사용됩니다. 이 솔루션은 유해한 사용자 쿼리에 응답하는 것을 방지하는 입력 가드레일 시스템과 관련 정보를 검색하고 응답을 생성하는 정부 절차 에이전트 두 가지 주요 구성 요소로 구성됩니다.

아마존 파이낸스 기술팀은 Amazon의 글로벌 영역에서 표준화된 금융 의사 결정과 운영 효율을 뒷받침하는 포괄적인 기술 솔루션을 개발하고 관리한다. 이 글에서는 팀이 Amazon Bedrock의 생성 AI 기술과 Amazon Kendra의 지능적인 검색을 활용하여 비즈니스 도전에 대한 솔루션을 개념화하고 구현한 방법을 설명한다.
이 eBook은 싱글 도메인 항체가 암호화 된 에피토프를 해제하고 CAR-T 디자인을 간소화하며, 다공성 생물학적 치료제로 나아가는 길을 가속화하는 방법을 보여줍니다.
라스베이거스의 스피어에서 오즈의 마법사를 AI 도구를 사용해 ‘향상’시켜 몰입형 경험을 제공한다.

MIT 연구진은 VaxSeer를 사용하여 바이러스 진화와 항원성을 예측하는 기계 학습을 활용해 백신 선정을 더 정확하고 추측에 의존을 줄이는 것을 목표로 함.
AI 기술이 에너지 분야에 통합되면서 산업 변화를 주도하는 강력한 힘이 등장했다. 효율성 향상뿐 아니라 더욱 친환경이고 지속가능한 미래로의 전환을 촉진하는 중추적 요소로 작용하고 있다. 자동차 산업에서 AI 응용은 지능형 운전과 스마트 코크핏에 초점을 맞추어 왔다.

메디케어가 사설 보험사들이 사용해온 의료 치료 지연과 거절을 일으키는 전략을 도입할 예정인데, 이는 6개 주에서 시범 프로그램으로 시행될 예정이다.

의사들이 진단 및 기타 기술에 기술을 사용하고 있지만, 그 과정에서 기술을 잃어버릴 수 있습니다.

Nvidia는 세계에서 가장 가치 있는 상장 기업이 되었으며, 칩에 대한 강한 수요로 이번 분기에도 매출이 계속 증가할 것으로 밝혔다.
Meta AI와 UCSD 연구팀이 새로운 AI 방법인 Deep Think with Confidence (DeepConf)를 소개했다. 이 방법은 병렬 사고와 자아일관성 기법을 활용하여 AI 추론을 혁신하였고, AIME 2025에서 99.9%의 성과를 이루었다. 이는 오픈소스 모델 GPT-OSS-120B를 사용하는 첫 번째 사례이다.
BindCraft AI 모델은 약물 기능을 위해 유전자 편집을 조절하고 알레르기 진단에 대항하는 등, 제대로 된 단백질 디자인을 구현하기 위해 개발된 오픈소스 및 접근 가능한 AI 파이프라인이다. 이 모델은 기존보다 훨씬 향상된 성공률을 보여준다.

인공지능이 경제를 지탱하고 있으며 테일러 스위프트의 약혼 소식을 다룬 뉴스. 남성들이 의사를 찾지 않는 이유에 대한 이야기도 포함됨.

기술 기업들이 쏟아부은 수조 달러의 투자가 경제 성장에 영향을 미치고 있습니다. 적어도 현재로서는.
Baylor 의 연구팀에 따르면, DeepMVP 학습 모델은 이전에 발표된 모델들보다 현저히 우수하며 신약 개발에 중요한 영향을 미친다.
구글의 새로운 회귀 언어 모델(RLM) 접근 방식은 복잡한 피쳐 엔지니어링이나 엄격한 테이블 형식에 의존하지 않고 대용량 언어 모델(LLMs)이 원시 텍스트 데이터에서 산업 시스템 성능을 예측할 수 있게 합니다.

새로운 연구 결과, 기후 데이터의 자연 변동성으로 인해 인공지능 모델이 지역 온도와 강수량을 예측하는 데 어려움을 겪을 수 있다.

ChatGPT는 학업을 돕는 챗봇으로 시작했지만 십대 Adam은 자살 계획을 논의하기 시작했다. 최근 많은 사람들이 감정적 지원을 위해 일반 챗봇에 의지하고 있다.
인공지능이 글쓰기와 문제해결의 노력을 선택 사항으로 만들었기 때문에 대학들은 학습에 필요한 작업을 요구하는 새로운 방법이 필요하다.
머신러닝이 산업을 변혁하고 금융 서비스, 의료, 자율 시스템 및 전자 상거래와 같은 다양한 분야에서 혁신을 주도하고 있지만, 조직이 ML 모델을 대규모로 운영화할 때 전통적인 소프트웨어 전달 방식인 CI/CD가 머신러닝 워크플로에 적용될 때 중요한 간극을 드러내고 있다.
AI의 빠른 세계에서 대형 언어 모델(LLMs)은 챗봇부터 코드 어시스턴트까지 모든 것을 구동한다. 그러나 당신의 LLM 추론은 응답 생성 과정이 최대 5배 더 느릴 수 있다. 이유는 출력 길이의 불확실성을 다루는 너무 조심스러운 방식 때문이다.
Ultrack라는 확장 가능한 세포 추적 방법과 inTRACKtive라는 브라우저 기반 시각화 도구가 발표되었다. 이 두 가지는 세포 행동을 포함한 발달 생물학에 대한 통찰을 제공한다.

MIT 리틀턴 연구소에서의 연구를 기반으로 한 도구들은 신속한 뇌 건강 상태 평가 능력을 개발하고 스포츠 이벤트나 의료 기관과 같은 민간 환경에서도 활용될 수 있습니다.

인공지능 시스템이 한 분야에서 정확한 예측을 한다면 그 능력을 다른 분야에 적용할 수 있는지 판단하는 새로운 테스트가 개발되었다.

일론 머스크의 인공지능 기업인 xAI가 Grok 챗봇 앱이 애플 앱 스토어에서 인위적으로 억압당하고 있다고 주장하며 소송을 제기했다.
GPU와 TPU는 대규모 트랜스포머 모델 학습을 가속화하는 데 중요한 역할을 하지만, 핵심 아키텍처, 성능 프로필 및 생태계 호환성의 차이로 인해 사용 사례, 속도, 유연성에 중요한 영향을 미친다. TPUs는 구글이 고도로 효율적인 행렬 연산을 위해 특별히 제작한 사용자 정의 ASIC(특정 응용 프로그램 통합 회로)이며, 핵심 아키텍처와 하드웨어 기초가 다르다.
GluonTS를 활용하여 복잡한 합성 데이터셋을 생성하고 다중 모델을 병렬로 적용하는 방법에 대해 다루는 튜토리얼. 다양한 추정기를 동일한 파이프라인에서 사용하고 누락된 종속성을 우아하게 처리하여 유용한 결과물을 생성하는 방법에 초점을 맞춘다. 평가 및 시각화 단계를 포함하여 결과를 분석한다.
인공지능(AI)을 사랑하고 의지하게 될 수 있을까? 우리는 종종 다른 사람들보다 AI를 선호할 수 있을까?
입자 기반 시뮬레이션과 포인트 클라우드 응용 프로그램은 과학 및 상업 데이터 집합의 크기와 복잡성을 대규모로 확장시키고 있으며, 이를 효율적으로 축소, 저장 및 분석하는 것은 현대 GPU의 병목 현상을 방지하는 것이다. 이는 우주학, 지질학과 같은 분야에서 신흥 대규모 도전 과제 중 하나이다.

실리콘밸리 칩 제조업체의 아이콘에서 트럼프 행정부에 10% 지분을 판매함으로써, 기술계의 최강자조차 쇠퇴할 수 있다는 사실을 강조한다.
최신 AI 기술 발전에 대해 최신 정보를 받아보고, AI가 현재와 미래에 제공하는 도전과 기회에 대해 알아보세요.
2025년에는 대형 언어 모델(LLMs)과 소형 언어 모델(SLMs) 사이에 절대적인 승자가 없다. 은행, 보험사 및 자산 관리자들은 규제 리스크, 데이터 민감성, 대기 시간 및 비용 요구 사항, 사용 복잡성에 따라 선택해야 한다.

샌프란시스코의 글렌 파크 지역에 위치한 FoundHer House는 모두 여성 구성원으로 구성된 특별한 해커 하우스로, 주거민들은 자신들의 스타트업을 세우기 위해 서로 지원하는 커뮤니티를 형성하고 있습니다.
LLM은 파라미터 수가 급증하고 MoE 디자인과 대규모 컨텍스트 길이의 널리 사용으로 급속히 발전했습니다. DeepSeek-R1, LLaMA-4, Qwen-3 같은 모델은 이제 수조 개의 파라미터에 이르며 엄청난 컴퓨팅, 메모리 대역폭, 빠른 칩 간 통신이 요구됩니다. MoE는 효율성을 향상시키지만 전문가 라우팅에서 도전을 야기하며 백만 개 이상의 토큰을 갖는 컨텍스트 창은 […]

NVIDIA의 CEO 제인슨 황은 중국 기업에 더 강력한 칩을 판매할 것을 계획 중이라며 트럼프 행정부에 허가를 요청할 예정.

아마존 베드락을 활용하여 기존 시스템을 통합하고 효율적인 인사이트를 얻기 위한 새로운 워크플로우를 만들 수 있습니다. 이 통합은 기술, 비기술, 리더십 역할에 모두 이점을 줄 수 있습니다.
이번 GEN의 Touching Base 에피소드에서는 국제 우주 정거장에 보관된 냉동 줄기세포와 도전적인 대상을 위한 혁신적인 나노입자 및 펩타이드 설계를 위한 AI 모델에 대해 논의합니다.

알렉스 카키네는 일상에서 마이크로칩 연구에 종사하며, 의외로 복원에 필요한 기술 세트를 가지고 있다.
Zhipu AI가 ComputerRL을 소개했다. 본 프레임워크는 에이전트에게 복잡한 디지털 작업 환경을 탐색하고 조작할 능력을 부여하는 것을 목표로 한다. 이 혁신은 AI 에이전트 개발에서 핵심적인 도전 과제를 해결하는데, 즉 컴퓨터 에이전트와 인간이 디자인한 GUI 간의 연결 부재를 해소한다.

SF-LLaVA-1.5는 비디오 이해를 위한 효율적인 모델로, 작은 규모의 Video LLMs도 최첨단 성능을 달성할 수 있다는 것을 보여줌.

언어 모델은 사용자 지시를 이해하고 따라야 합니다. 저자들은 보상 모델 대신 유연한, 지시별 기준을 제안하며, “체크리스트 피드백에서 강화 학습”을 제안합니다. 이를 통해 강화 학습이 지시 따르기에 미치는 영향을 확대할 수 있습니다.

아마존 세이지메이커를 사용하여 GPT-OSS 모델을 세밀하게 조정하는 방법에 대한 시리즈 중 두 번째 포스팅이다. 이번 글에서는 오픈 소스 허깅페이스 라이브러리를 이용해 GPT-OSS 모델을 세밀하게 조정하는 방법을 다룬다.
스피커 다이어라이제이션은 오디오 스트림을 화자 식별로 분리하여 각 세그먼트를 일관되게 레이블링하는 프로세스로, 통역을 더 명확하고 검색 가능하며 콜센터, 법률, 의료, 미디어, 대화형 AI 등 다양한 분야에서 유용하게 활용된다. 2025년 현재 현대 시스템들이 활발히 사용되고 있다.

인공지능이 대장경 검사에서 사용될 경우 의사들의 종양 발견 능력을 약화시킬 수 있다는 의료 전문가들의 경고.

Meta AI 내부 문서가 노출되어 회사가 Reuters에 의해 폭로될 때까지 챗봇이 어린이들과 유희하고 로맨틱 대화를 나누는 것을 허용했다.

OpenAI는 ChatGPT가 해로운 또는 잘못된 응답을 제공한 사례 이후, 새로운 규칙에 따라 직접적인 정신 건강 상담을 피하도록 합니다.

다음 주 Nvidia가 실적을 발표하면, 투자자들은 연방준비제도 의장의 연설보다 S&P 500 지수가 더 큰 반응을 보일 것으로 예상하고 있다.

Apple 연구원들의 논문에 따르면, 대형 언어 모델에서 매우 작은 파라미터 하위 집합이 (경우에 따라 단일 파라미터) 전체 기능에 지나치게 큰 영향을 미칠 수 있다. 이 연구는 이러한 “슈퍼 가중치”와 이에 상응하는 “슈퍼 활성화”의 중요성을 강조하며, 효율적인 모델 압축을 위한 새로운 통찰을 제공한다.
2025년 현재 인공지능 개발에서 PyTorch와 TensorFlow 사이의 선택은 여전히 가장 논란이 되는 문제 중 하나이다. Alfaisal 대학의 종합 조사 논문을 통해 최신 동향을 탐색하며 사용성, 성능, 배포, 생태계 고려 사항을 종합적으로 분석한다.

이 포스트에서는 아마존 SageMaker AI와 MCP를 활용하여 예측적 머신러닝 모델을 통합하여 AI 에이전트의 능력을 향상하는 방법을 소개합니다. Strands Agents SDK와 SageMaker AI의 유연한 배포 옵션을 사용하여, 개발자들은 대화형 AI를 강력한 예측 분석 기능과 결합한 고급 AI 애플리케이션을 만들 수 있습니다.
인공지능은 세상을 바꿀 수 있지만 완전히 새롭게 만들지는 않을 것으로 보인다.
바이오파마 산업에서 엔지니어들은 디지털 트윈을 활용하여 프로세스에 변화하는 입력과 조건이 어떻게 영향을 미치는지 평가하고, 생산량을 최적화하고 폐기물을 줄이며 생산원가를 낮추는 것을 목표로 합니다.
생물공정 정상회담에서 Sanofi의 Cenk Undey 박사가 청중에게 “디지털을 넘어선 미래”를 모색하도록 도전했습니다.
NASA는 IBM과 협력하여 개발한 Surya 헬리오물리 기초 모델을 출시했다. 이는 NASA의 Solar Dynamics Observatory에서 14년간의 관측을 기반으로 한 인공지능 모델로, AI의 발전을 활용하여 방대한 양의 태양 데이터를 분석한다.
클로부차 상원의원은 딥페이크가 점점 현실적으로 나타나고 막기 어려워지고 있다고 경고하며, 의회가 지금 조치를 취해야 한다고 강조했다.
대형 언어 모델(Large Language Models, LLMs)을 평가하는 것은 과학적으로나 경제적으로 비용이 많이 든다. LLMs의 크기가 점점 커지면서 이를 평가하고 비교하는 방법론은 점점 중요해지고 있다. Allen Institute for Artificial Intelligence (Ai2)의 최근 연구는 두 가지 기본 요소를 중심으로 한 강력한 프레임워크를 소개했다.
본 튜토리얼에서는 Google Colab 내에 완전한 Ollama 환경을 구현하여 Self-Hosted LLM Workflow를 복제하는 방법을 제시한다. Colab VM에 공식 Linux 설치 프로그램을 사용하여 Ollama를 설치하고 localhost:11434에 HTTP API를 노출시키는 과정부터 시작하여 Ollama 서버를 배경에서 실행한다. 서비스를 확인한 후, […]
AI가 소재 합성, 특성 분석, 모델링에 도입되면 새로운 통찰을 얻고 기술을 빠르게 시장에 내놓을 수 있게 도와줄 것으로 전문가들이 예상하고 모인다.

오픈AI가 ChatGPT의 새 버전을 출시했을 때 사람들은 냉소적인 응답을 이유로 반발했다. 이에 회사는 챗봇과의 감정적 연결을 인정하며 신속히 후퇴했다.

메타가 내부적으로 인공지능 부문의 새로운 구조조정을 발표했으며, 기술에 대한 내부적인 긴장으로 인해 이에 대한 사람들의 지식을 통해 밝혀졌다.

오픈AI의 가치가 5000억 달러로 세계에서 가장 가치 있는 비상장 기업이 될 전망이다.
인공지능 혁명을 지켜보며 데이터 센터용 전기가 어디서 나올지와 얼마나 비용이 들지에 대한 의문이 제기되고 있다.
VantAI는 Neo-1 기반 모델을 활용하여 새로운 맥락별 타겟-효과자 쌍을 식별하고 유효성을 검증하여, 암 및 면역 질환 지표에 피드백을 제공할 것입니다.

이 모델은 용해도 예측을 통해 새로운 약을 설계하고 합성할 때 더 위험한 용매 사용을 최소화하는 데 도움을 줄 수 있습니다.
2025년 8월 알리바바의 Qwen Team이 출시한 Qwen-Image-Edit는 20B-파라미터 Qwen-Image를 기반으로 고급 편집 기능을 제공한다. 이 모델은 시맨틱 편집(스타일 전이 및 새로운 시각 합성)과 외관 편집에서 뛰어나다.

연구진들은 인공지능 모델이 어떤 특징을 활용해 약물이나 백신의 대상이 될 수 있는 단백질을 예측하는지 밝히는 새로운 방법을 개발했다.
AI 모델이 최적의 성분 혼합물로 구성된 리피드 나노입자를 개발하여 RNA 백신 및 다른 유형의 RNA 치료물질을 더 효율적으로 전달할 수 있게 함.
미국 대통령이 미국의 인공지능 기업들을 세계에 풀어놓길 원하지만, 유럽은 그의 방해요인이 될 수 있다.
2025년을 기준으로 AI 추론에 대한 기술적인 심층 탐구를 제공하며, 모델 훈련과 실제 응용 프로그램 간의 연결을 담당하는 추론의 핵심 기능에 대해 다룹니다. 현대 모델의 지연 문제와 최적화 전략과 같은 주제를 다룹니다.

대용량 언어 모델은 인상적인 성능을 달성했지만, 사회적 편견을 반영하고 악화시킬 수 있다는 과학적 합의가 있음. 이 연구에서는 확신 격차를 사용하여 LLMs의 교차적 편향을 조사함.
Hugging Face사가 AI Sheets를 출시했는데, 이는 무료이자 오픈소스이며 로컬 기반의 노코드 툴로, AI를 활용한 데이터셋 생성과 보강을 혁신적으로 간소화하는 데 목적이 있다. AI Sheets는 직관적인 스프레드시트 인터페이스를 대표하는 오픈소스 대형 언어 모델(Qwen, Kimi, Llama 3 등)과 직접적으로 결합하여 AI 기반 데이터 처리에 대한 접근성을 민주화하고 있다.

전 워싱턴포스트 사실 검증자인 글렌 케슬러는 폭스 뉴스 디지털과의 인터뷰에서 뉴스 사이트가 “길을 잃었다”고 말하며 제프 베조스와 신문의 최고 경영진을 비판했습니다.

중국 제조사인 Unitree R1 로봇이 맨해튼 거리를 걸어다니며 KraneShares의 2800만 달러 AI 로봇 펀드 홍보 캠페인의 일환으로 신발 쇼핑을 했다.
1억명 이상의 사용자를 보유한 이 언어 학습 앱은 인공지능을 수용했지만 소비자로부터 반발을 겪고 있습니다.
이 튜토리얼에서는 Dagster를 사용하여 고급 데이터 파이프라인을 구현한다. 맞춤형 CSV 기반 IOManager를 설정하여 자산을 보존하고, 분할된 일일 데이터 생성을 정의하며, 합성 판매 데이터를 클리닝, 피처 엔지니어링 및 모델 트레이닝을 통해 처리한다. 중간에 데이터 품질 자산 확인을 추가하여 널 값, 범위 및 범주 값 등을 유효성 검사한다.
dots.ocr은 다국어 문서 레이아웃 구문 분석과 광학 문자 인식(OCR)을 위해 개발된 오픈 소스 비전-언어 트랜스포머 모델이다. 이 모델은 단일 아키텍처 내에서 레이아웃 감지와 내용 인식을 수행하며 100여 개 언어와 다양한 구조화된 및 비구조화된 문서 유형을 지원한다.

일부 기업인들은 미래의 기술을 사용하는 방법을 배우도록 유도당하고 있습니다. C-급 임원 회의에는 AI 도구를 사용한 웹사이트 구축이 의무화되고 있습니다.
NVIDIA가 유럽어용 Granary라는 최대 규모의 오픈소스 음성 데이터셋과 Canary-1b-v2, Parakeet-tdt-0.6b-v3 두 첨단 모델을 발표했다. 이는 특히 소수 언어에 대한 자동 음성 인식 및 음성 번역 분야에서 액세스 가능하고 고품질의 자원에 새 기준을 제시한다.
Salesforce AI Research가 Moirai 2.0을 공개했다. 이는 타임 시리즈 기반 모델의 최신 진보로, 디코더 전용 트랜스포머 아키텍처 위에 구축되어 성능과 효율성에서 새로운 기준을 세우며 GIFT-Eval 벤치마크에서 1위를 차지했다.

아마존 베드락 에이전트코어 게이트웨이는 기업이 AI 에이전트와 도구 및 서비스를 연결하는 방식을 혁신적으로 변화시키는 완전히 관리되는 서비스로, 에이전트-도구 소통을 위한 통합 인터페이스를 제공한다. 보안 가드, 번역, 구성, 대상 확장성, 인프라 관리자, 의미론적 도구 선택과 같은 주요 기능을 제공하며, 양방향 보안 아키텍처를 구현하여 수신 및 발신 연결에 고급 보안을 제공한다.

구글 워크스페이스 Gemini AI의 보안 취약점으로 사이버 범죄자들이 현재 보호 방법을 우회하는 가시적 명령을 사용하여 이메일 요약을 조작할 수 있게 되었습니다.

두바이의 Woohoo 레스토랑은 AI 시스템 셰프 Aiman을 특징으로 하며, 버려진 재료와 잘라낸 부분으로 새로운 요리를 만들어 부양물을 줄입니다.
주식 시장이 지나치게 달아오르고 있는 것 같은 걱정스러운 징후들이 있습니다.

3세 이상 어린이들을 위한 새로운 종류의 애착 인형이 출시되었는데, 화면 시간 대안 및 부모의 주의를 대체하기 위한 것이다.

MIT 엔지니어들은 기계 학습 모델을 사용하여 세포로 효율적으로 RNA를 전달할 수 있는 나노입자를 설계했다.
지도된 미세 조정(SFT)은 LLMs를 새로운 작업에 적응시키는 표준 기술이지만, 종종 강화 학습(RL)에 비해 일반화에서 성능이 저하됩니다. DFT는 이 간극을 줄이는 새로운 방법을 제안합니다.

세미-지도 음성 표현을 이용하는 자동 음성 인식(ASR) 시스템의 성능을 향상시키기 위해 ASR 및 Pitch Accent 감지 모델을 소개한다. 모델의 Pitch Accent 감지 구성 요소는 과제의 최신 기술에 대해 F1 점수 갭을 41%로 줄이는 중요한 개선을 달성한다. 또한, ASR 성능이 한정된 자원 미세 조정 하에 LibriSpeech에서 WER을 28.3% 감소시킨다. 이러한 결과로 사전 훈련을 확장하는 중요성을 입증한다.

Misty는 UI 프로토타이핑을 위해 새로운 개념적 혼합 기술을 소개하는데, 이는 디자인 예시에서 다양한 측면을 빠르게 통합할 수 있는 혁신적인 UI 워크플로우를 제공한다. 14명의 프론트엔드 개발자를 대상으로 한 탐색적 사용 연구를 통해 Misty의 효과를 평가하고 이에 대한 피드백을 수집했으며, 결과는 Misty가 효과적임을 시사한다.

기기 지향적 음성 감지(DDSD)는 사용자의 음성 어시스턴트(VA)에 대한 쿼리를 배경 음성이나 부수적인 대화와 분리하는 이진 분류 작업이다. 이를 위해, ASR 대규모 사전 훈련된 음향 인코더(교사)의 일반적인 표현으로부터 지식을 전달하는 새로운 적응형 KD 방법을 제안한다. 이를 통해 DDSD 정확도를 향상시키고 효율적인 배포를 보장한다.

DiceHuBERT는 HuBERT를 압축하기 위한 지식 증류 프레임워크로, 기존의 층별 및 특징별 매핑을 사용하는 방법과 달리 HuBERT의 자체 증류 메커니즘을 활용하여 원래 모델을 학생 모델로 직접 대체함으로써 학생이 HuBERT 사전 훈련시 사용된 동일한 자가 지도 학습 목표를 사용하여 학습되도록 함.
NVIDIA는 XGBoost 3.0을 발표했는데, 이제 1개의 GH200 Grace Hopper Superchip에서 기가바이트부터 1테라바이트(TB)까지의 그래디언트 부스팅 결정 트리 (GBDT) 모델을 학습할 수 있다. 이 혁신은 회사들이 사기 탐지, 신용 위험 모델링, 알고리즘 거래와 같은 애플리케이션을 위해 거대한 데이터셋을 처리할 수 있게 해준다.

오픈에이아이는 새로운 주력 기술인 GPT-5를 발표했다. 이 모델은 빠르고 정확하며 허구를 만들 가능성이 적다.

DTDC와 ShellKode가 아마존 베드락을 활용하여 제너레이티브 인공지능(AI)을 기반으로 한 DIVA 2.0 물류 에이전트를 구축한 과정에 대해 소개합니다.