미주투데이

OpenAI, 생명과학 연구 평가를 위한 750개 작업 벤치마크 LifeSciBench 발표

OpenAI가 생명과학 연구를 평가하는 750개 작업으로 구성된 LifeSciBench를 발표했습니다. 이 벤치마크는 173명의 박사 과학자들이 작성한 기준을 바탕으로 AI 모델의 추론과 결정을 평가합니다.

2026년 6월 17일 오후 10시 28분

게임 이론에서 일반화된 알고리즘이 전문화된 알고리즘보다 우수할 수 있다

연구자들은 특정 유형의 게임에서 간과된 알고리즘 클래스가 예상보다 훨씬 더 나은 성과를 낼 수 있음을 보여주었다.

2026년 6월 17일 오후 3시 20분MIT News

AWS 생성 AI 서비스를 활용한 지능형 문서 처리 파이프라인 구축

AWS에서 Amazon Bedrock을 활용하여 비용 효율적이고 확장 가능한 지능형 문서 처리 파이프라인을 개발하는 방법을 소개합니다. 이 시스템은 문서에서 인사이트를 자동으로 추출하고 분석합니다.

2026년 6월 12일 오전 10시 43분AWS Blog

Zyphra, Zamba2-VL 출시: 시간 단축을 이룬 하이브리드 비전-언어 모델

Zyphra가 1.2B, 2.7B, 7B 파라미터를 가진 Zamba2-VL 비전-언어 모델을 출시했습니다. 이 모델은 Mamba2와 Transformer를 결합하여 첫 번째 토큰 생성 시간을 대폭 단축합니다.

2026년 6월 12일 오전 4시 06분

사람의 선호 예측에 있어 '세 가지의 힘'을 고려해야 하는 이유

MIT 연구진이 거의 100년 된 무작위 효용 모델에 대한 주요 업그레이드를 제공했습니다. 이 연구는 사람들의 선호를 예측하는 데 있어 새로운 접근 방식을 제시합니다.

2026년 6월 11일 오후 3시 10분MIT News

구글 AI, 텍스트 확산 기술로 4배 빠른 생성이 가능한 DiffusionGemma 공개

구글 딥마인드가 260억 개의 매개변수를 가진 DiffusionGemma 모델을 공개했습니다. 이 모델은 텍스트 확산 기술을 활용하여 GPU에서 최대 4배 빠른 생성 속도를 자랑합니다.

2026년 6월 10일 오후 2시 50분

GEPA를 활용한 반영적 프롬프트 최적화 방법

이 튜토리얼에서는 GEPA를 사용하여 소규모 언어 모델이 다단계 산술 문제를 해결하는 방식을 개선하는 방법을 소개합니다. 약한 초기 프롬프트에서 시작해 구조화된 평가자를 통해 실행 가능한 피드백을 제공합니다.

2026년 6월 7일 오후 1시 05분

NVIDIA Apex를 활용한 트랜스포머 훈련 속도 향상 방법

NVIDIA Apex를 소스에서 빌드하고, FusedAdam, FusedLayerNorm, torch.amp의 성능을 벤치마킹하여 트랜스포머 훈련 속도를 높이는 방법을 소개합니다.

2026년 6월 2일 오전 10시 39분

파랄락스: 소프트맥스를 유지하고 학습된 공분산 보정 분기를 추가한 매개변수화된 로컬 선형 주의 메커니즘

파랄락스는 LLA의 쿼리별 솔버를 학습된 프로젝터로 대체하여 산술 강도를 두 배로 늘리고, 0.6B 및 1.7B에서 혼란도를 개선합니다.

2026년 6월 1일 오후 1시 36분

Ansible 자동화 실습실 설계하기: 플레이북, 인벤토리, 역할, 다이나믹 인벤토리 등

이 튜토리얼에서는 Google Colab 또는 리눅스 환경에서 완전한 Ansible 자동화 실습실을 구축하는 방법을 소개합니다. Ansible 설치부터 인벤토리 설정까지 다양한 개념을 다룹니다.

2026년 5월 29일 오후 12시 49분

사카나 AI, 잔여 네트워크를 독립적으로 학습 가능한 모듈로 변환하는 DiffusionBlocks 제안

사카나 AI가 제안한 DiffusionBlocks는 잔여 네트워크를 독립적으로 학습할 수 있는 블록으로 변환하는 훈련 프레임워크입니다. 이 방법은 레이어 업데이트를 역 확산 잡음 제거 단계로 해석합니다.

2026년 5월 28일 오전 9시 51분

NVIDIA, GRPO 훈련을 위한 새로운 롤아웃 프레임워크 'Polar' 발표

NVIDIA가 언어 에이전트를 훈련하기 위한 새로운 롤아웃 프레임워크 'Polar'를 발표했습니다. 이 프레임워크는 에이전트 하네스를 수정하지 않고도 강화 학습을 통해 훈련할 수 있도록 설계되었습니다.

2026년 5월 28일 오전 2시 09분

키푸 퀀텀, 양자 기계 학습을 위한 오프라인 추론 하이브리드 프레임워크 출시

키푸 퀀텀은 양자 강화 기계 학습 모델이 클래식 하드웨어에서 오프라인으로 추론 작업을 수행할 수 있는 디지털화된 양자 특징 추출(DQFE) 파이프라인을 출시했다.

2026년 5월 20일 오후 11시 50분Quantum Computing Report

아마존 노바 소닉을 활용한 확장 가능한 음성 에이전트 설계

아마존 노바 소닉과 관련 도구를 사용하여 확장 가능하고 유지 관리가 용이한 음성 에이전트를 구축하는 방법을 알아봅니다. 다양한 아키텍처 패턴과 최적의 실천 방법을 소개합니다.

2026년 5월 20일 오전 12시 26분AWS Blog

확률적 경사 하강법(SGD)의 빈도 편향과 Adam의 해결 방법

현대 언어 모델은 불균형한 토큰 분포로 훈련되며, 이는 최적화의 숨겨진 도전 과제를 만듭니다. 일반적인 토큰은 지속적인 기울기 업데이트를 받지만, 희귀한 토큰은 업데이트가 적어 문제를 일으킵니다.

2026년 5월 19일 오전 5시 18분

SHAP 설명 가능성 워크플로우 구현을 위한 코딩 가이드

이 튜토리얼에서는 SHAP 워크플로우를 활용하여 기계 학습 모델을 해석하는 방법을 소개합니다. 다양한 SHAP 설명자를 비교하고, 모델 인식 및 비인식 접근 방식의 정확도와 실행 시간을 분석합니다.

2026년 5월 17일 오후 4시 25분

Nous Research, LLM 사전 훈련 속도 2.5배 향상하는 토큰 슈퍼포지션 트레이닝 발표

Nous Research가 LLM 사전 훈련 시간을 최대 2.5배 단축할 수 있는 토큰 슈퍼포지션 트레이닝(TST) 방법을 발표했다. 이 방법은 모델 아키텍처를 변경하지 않고도 훈련 효율성을 높인다.

2026년 5월 14일 오후 2시 46분

사카나 AI와 NVIDIA, LLM의 추론 및 훈련 속도 향상 위한 TwELL 발표

사카나 AI와 NVIDIA 연구팀이 L1 정규화를 통해 피드포워드 레이어에서 99% 이상의 희소성을 달성하고, 새로운 희소 데이터 형식과 융합된 CUDA 커널을 활용해 GPU 처리 성능을 향상시켰다고 발표했다.

2026년 5월 11일 오후 5시 36분

AI 비전 모델의 편향 문제 해결, 새로운 접근법 제시

새로운 편향 제거 기법인 WRING이 기존 방법의 한계를 극복하며 AI 비전 모델의 편향을 줄이는 데 기여할 것으로 기대된다.

2026년 4월 30일 오전 6시 40분MIT News

최신뉴스 전체보기

차량 배출량을 크게 줄일 수 있는 생태 운전 방법

교차로에서 교통을 완화하기 위해 차량 속도를 자동으로 제어하는 새로운 연구 결과, 탄소 배출량을 11 ~ 22% 줄일 수 있다.

2025년 8월 7일 오전 12시 00분MIT News

AI 혁명과 함께 하는 데이터 저장소 지원

MIT 동문이 공동 창업한 Cloudian의 저장 시스템은 기업이 대규모로 데이터를 제공하는 AI 모델과 에이전트를 지원하고 있다.

2025년 8월 6일 오전 12시 00분MIT News

구글 AI가 LangExtract를 공개: 비구조화 텍스트 문서에서 구조화된 데이터 추출하는 오픈 소스 파이썬 라이브러리

LangExtract는 구글 AI의 새로운 오픈 소스 파이썬 라이브러리로, 비구조화된 텍스트 문서에서 의미 있는 정보를 추출하는 것을 목표로 한다. 이 라이브러리는 Gemini와 같은 LLMs를 사용하여 이러한 과제를 직접 해결한다.

2025년 8월 5일 오전 1시 49분

구글 AI, MLE-STAR 발표: 다양한 AI 작업 자동화 가능한 최첨단 기계 학습 엔지니어링 에이전트

MLE-STAR은 구글 클라우드 연구원들이 개발한 최첨단 에이전트 시스템으로, 복잡한 기계 학습 ML 파이프라인 설계와 최적화를 자동화합니다. MLE-STAR은 웹 규모 검색, 특정 코드 수정, 견고한 검사 모듈을 활용하여 기계 학습 엔지니어링 작업에서 우수한 성능을 발휘합니다.

2025년 8월 2일 오후 11시 20분

MIT 연구진, 증명 가능한 Lipschitz 경계 및 뮤온으로 트랜스포머 민감도 제어 방법 개발

MIT 연구진은 대규모 트랜스포머를 안정적으로 훈련하는 것이 어려운 문제를 해결하기 위해 불안정한 활성화 및 손실 증폭을 줄이기 위해 증명 가능한 Lipschitz 경계를 강제하는 방법을 개발했다.

2025년 8월 2일 오후 4시 54분

대칭 데이터로 효율적인 기계 학습 가능하게 하는 새로운 알고리즘

대칭 데이터를 활용한 효율적인 기계 학습을 가능하게 하는 새로운 알고리즘이 개발되었고, 이는 약물 및 소재 발견을 위한 AI 모델을 향상시킬 수 있다.

2025년 7월 30일 오전 12시 00분MIT News

Unsupervised System 2 Thinking: 에너지 기반 트랜스포머를 활용한 기계 학습의 다음 진화

인공지능 연구는 패턴 인식을 넘어서 인간과 유사한 복잡한 추론이 가능한 시스템으로 진화하고 있다. Energy-Based Transformers (EBTs)는 도메인 특정 감독이나 제한적인 교육 신호에 의존하지 않고 기계에 “System 2 Thinking”을 가능하게 하는 신경 구조로, 기계 학습의 다음 단계로 손꼽힌다.

2025년 7월 24일 오후 11시 51분

로봇, 스스로를 알라: 새로운 시각 기반 시스템이 기계에게 몸을 이해하게 가르칩니다

MIT CSAIL 연구원들이 개발한 Neural Jacobian Fields는 다른 센서 없이 단일 카메라에서 로봇을 제어할 수 있도록 학습할 수 있습니다.

2025년 7월 24일 오후 3시 30분MIT News

이미지 편집이나 생성하는 새로운 방법

MIT 연구진은 특별한 유형의 신경망, 인코더 또는 “토크나이저”가 이전에 인식된 것보다 훨씬 더 많은 작업을 수행할 수 있다고 발견했다.

2025년 7월 21일 오후 3시 00분MIT News

언어 모델이 동적 시나리오 예측에 사용하는 독특한 수학적 바로 가기

언어 모델은 순차적 추적이 아닌 똑똑한 산술을 사용하여 변화하는 상황을 따라갑니다. 이러한 접근 방법을 제어함으로써 엔지니어들은 시스템의 성능을 향상시킬 수 있습니다.

2025년 7월 21일 오전 8시 00분MIT News

Allen Institute for AI-Ai2가 AutoDS를 발표: 개방형 과학적 발견을 위한 베이지안 서프라이즈 주도 엔진

Allen Institute for AI가 AutoDS(자율적 발견을 통한 서프라이즈)를 소개했는데, 이는 인간이 정의한 목표나 질의에 의존하지 않고 베이지안 서프라이즈를 측정하고 찾아내는 가치 있는 가정을 자동으로 생성, 테스트 및 반복함.

2025년 7월 21일 오전 3시 38분

지하 폐기물 처리 시스템에 대한 핵폐기물 장기적 영향을 예측하는 모델

스위스의 지하 실험 결과와 일치하는 시뮬레이션 결과로, 모델링이 핵폐기물 처리 사이트의 안전을 검증하는 데 사용될 수 있다는 것을 시사.

2025년 7월 18일 오전 12시 00분MIT News

LLM이 텍스트와 코드 사이를 전환하는 데 도움을 주는 “스마트 코치”

CodeSteer 시스템은 공급망에서 운송 일정을 예약하는 등 복잡한 문제를 해결할 때 대형 언어 모델의 정확성을 높일 수 있다.

2025년 7월 17일 오전 12시 00분MIT News

AI가 진짜 코딩을 할 수 있을까? 자율 소프트웨어 엔지니어링의 도전 과제 매핑하는 연구

AI가 소프트웨어 개발을 변화시키고 있지만 완전한 자동화에는 여전히 중요한 장애물이 남아있다. 연구팀은 이제 도전 과제를 매핑하고 분야를 전진시키기 위한 연구 계획을 개요로 제시했다.

2025년 7월 16일 오후 4시 55분MIT News

LLM이 자신의 내부 답변 분포를 알까?

이 논문은 대규모 언어 모델(LLMs)이 답변에 대해 확신이 없을 때 그것을 나타내야 한다는 불확실성 양자화의 역할을 탐구한다. LLMs의 다양한 출력 공간을 활용하여 불확실성을 설명하는 문자열을 제안한다.

2025년 7월 11일 오전 12시 00분Apple

AI가 자율 잠수 “글라이더”를 형성

MIT CSAIL 연구원들이 개발한 AI 파이프라인은 수중에서 일렬로 이동하는 바디보드 크기의 차량을 위한 독특한 수력 디자인을 가능하게 하며, 과학자들이 해양 데이터를 수집하는 데 도움을 줄 수 있음.

2025년 7월 9일 오후 4시 35분MIT News

복잡한 추론에 능한 LLMs로 이끄는 연구

연구진은 대규모 언어 모델을 전략 계획이나 프로세스 최적화와 같은 어려운 작업에 보다 적응 가능하게 만드는 방법을 개발했다.

2025년 7월 8일 오전 12시 00분MIT News

확신 토큰을 이용한 학습 루팅 LLMs

대형 언어 모델(Large language models, LLMs)은 다양한 작업에서 탁월한 성능을 보여주며 현재 실제 응용 프로그램에서 증가하고 있습니다. 하지만 특히 고위험 상황에서는 LLM의 출력이 신뢰할 수 없을 때를 알아내는 것이 중요합니다. 이 연구에서는 LLM이 답변에 대한 확신을 신뢰할 수 있는지, 이 신뢰의 개념이 하류 정확도로 어떻게 전환되는지 조사합니다.

2025년 7월 7일 오전 12시 00분Apple

새 소재의 주요 특성을 빠르게 측정하는 로봇 프로브

새로운 반도체를 분석하기 위해 개발된 시스템은 더 강력한 태양 전지의 개발을 간소화할 수 있습니다.

2025년 7월 4일 오후 2시 00분MIT News

Llama 3의 추론력을 포스트 트레이닝만으로 향상시킬 수 있을까? ASTRO는 +16% ~ +20% 벤치마크 향상을 보여줘

Meta AI와 Washington 대학의 연구진이 ASTRO(자동 회귀 검색 가르치는 추론기)를 소개했다. Llama-3.1-70B-Instruct에서 추론을 향상시키기 위한 포스트 트레이닝 프레임워크로, 모델에 컨텍스트 내 검색 수행을 가르치는 것이 특징이다.

2025년 7월 4일 오후 1시 19분

상하이 교통대학 연구원들, 강화 학습-확장 가능한 LLM 개발을 위한 OctoThinker 제안

연구원들이 OctoThinker를 제안하여 강화 학습을 통한 복잡한 추론 작업에 대한 LLM의 발전을 제안했다. CoT 프롬프팅과 대규모 강화 학습을 결합한 LLM은 Deepseek-R1-Zero와 같은 모델이 기본 모델에 직접 RL을 적용함으로써 강한 추론 능력을 보여주었다.

2025년 7월 2일 오후 9시 02분

AI를 활용한 과학적 발견 가속화

Sam Rodriques 박사과 FutureHouse는 AI 에이전트를 개발하여 과학적 발전을 위한 주요 단계를 자동화했다.

2025년 6월 30일 오전 10시 30분MIT News

로봇이 더 높이 뛰고 안전하게 착지할 수 있도록 하는 생성 AI 활용

MIT CSAIL 연구진은 GenAI와 물리 시뮬레이션 엔진을 결합하여 로봇 디자인을 개선했습니다. 결과적으로, 인간이 디자인한 로봇을 능가하는 기계를 만들어 냈습니다.

2025년 6월 27일 오후 1시 00분MIT News

의료 치료를 권장할 때 LLMs는 관련 없는 정보를 고려합니다

환자 메시지에 있는 오타, 추가 공백, 화려한 언어와 같은 비임상 정보가 AI 모델의 정확도를 낮추는 것을 연구자들이 발견했습니다.

2025년 6월 23일 오전 12시 00분MIT News

구글 AI 논문, 기계 학습 평가에서 부분집단 공정성 해석하기 위한 인과적 프레임워크 소개

구글의 AI 논문에서는 인종, 성별, 사회경제적 배경과 같은 속성으로 정의된 다양한 부분집단에서 모델의 성능을 평가하는 것이 기계 학습에서의 공정성을 평가하는 중요한 요소임을 소개하고 있습니다. 이 평가는 의료 분야와 같이 부조그룹 간의 모델 성능 차이가 치료 권고나 진단에 불평등을 초래할 수 있는 맥락에서 중요합니다.

2025년 6월 20일 오전 1시 09분

대형 언어 모델의 편향 해독

연구진이 새로운 연구에서 LLMs의 편향 유형의 원인을 발견하여, 더 정확하고 신뢰할 수 있는 AI 시스템을 위한 길을 열었다.

2025년 6월 17일 오후 4시 00분MIT News

기술 배치에 의미 부여하기

MIT 윤리 컴퓨팅 연구 심포지엄은 기술, 윤리, 사회적 책임이 교차하는 프로젝트를 선보인다.

2025년 6월 11일 오후 4시 15분MIT News

광 프로세서가 6G 무선 신호 처리를 간소화할 수 있다

광 프로세서 칩은 빛의 속도로 딥 러닝을 수행하여 엣지 장치에 실시간 데이터 분석 기능을 제공할 수 있다.

2025년 6월 11일 오후 2시 00분MIT News

손상된 그림 있나요? AI로 생성된 “마스크”로 몇 시간만에 복원하세요

MIT 연구팀이 디지털로 제작된 필름을 사용해 원본 그림을 물리적으로 복원하는 새로운 방법을 개발했다. 필름은 원하는 경우 제거할 수 있다.

2025년 6월 11일 오전 11시 00분MIT News

Mistral AI, 기업 및 오픈 소스 애플리케이션용 고급 Chain-of-Thought LLMs인 Magistral 시리즈 출시

Mistral AI가 최신 시리즈인 Magistral을 소개했다. 이는 추론에 최적화된 대형 언어 모델(Large Language Models)로 LLM 능력 발전의 중요한 한 걸음이다. Magistral 시리즈에는 Apache 2.0 라이선스 하에 공개된 24B-파라미터의 Magistral Small과 기업용 Magistral Medium이 포함되어 있다.

2025년 6월 11일 오전 5시 25분

개인화된 AI 여행 계획의 길을 열다

MIT-IBM 왓슨 AI 연구소의 새로운 프레임워크는 언어 모델을 강화하여 복잡한 여행 일정을 상호작용적으로 개발하고 검증할 수 있게 함.

2025년 6월 10일 오후 3시 00분MIT News

AI를 활용해 기계가 시각 콘텐츠를 이해하도록 돕기

MIT 동문 두 명에 의해 설립된 Coactive는 AI 플랫폼을 구축하여 모든 유형의 콘텐츠로부터 새로운 통찰을 얻을 수 있게 함.

2025년 6월 9일 오후 3시 45분MIT News

강화 학습에서 검증 가능한 보상을 통해 고엔트로피 토큰 선택 (RLVR)이 LLM의 정확성 향상과 훈련 비용 절감에 도움이 됩니다

대형 언어 모델(LLMs)은 각 토큰이 일관된 논리적 설명에 기여하는 Chain-of-Thoughts(CoTs)을 생성한다. 이러한 추론의 품질을 향상시키기 위해 다양한 강화 학습 기술이 사용되고 있으며, 이를 통해 모델은 생성된 출력을 정확성 기준과 일치시키는 피드백 메커니즘으로 학습할 수 있다.

2025년 6월 8일 오후 9시 38분

항생제 내성을 늦출 수 있는 자율 의료는 가능할까?

자율 주행차에 대해 다루는 기사가 많지만, 자율 의료 기술에 대해 논할 때는 거의 언급되지 않는다. 자율 의료가 항생제 내성을 완화시키는데 도움이 될 수 있을지에 대한 가능성을 탐구해볼 필요가 있다.

2025년 6월 6일 오후 11시 37분

AI 모델에게 모르는 것을 가르치기

MIT 연구팀이 Themis AI를 설립하여 AI 모델의 불확실성을 측정하고 지식의 공백을 해결하고 있다.

2025년 6월 3일 오전 12시 00분MIT News

인간처럼 더 스케치하는 AI 모델 가르치기

MIT CSAIL 연구원들이 개발한 SketchAgent는 AI 모델에게 개념을 한 줄씩 스케치하도록 가르쳐, 언어 모델이 독자적으로 개념을 시각적으로 표현하고 인간과 협업할 수 있도록 돕는다.

2025년 6월 2일 오후 2시 50분MIT News

Apple과 Duke 연구진, LLM이 중간 답변 제공 가능하도록 하는 강화 학습 접근 방식 소개, 속도와 정확도 향상

Apple과 Duke 연구진이 속도와 정확도를 향상시키기 위해 LLM이 중간 답변을 제공할 수 있는 강화 학습 접근 방식을 소개했다. 일반적인 “생각한 후에 대답” 방법은 응답 시간을 늦추고 챗봇과 같은 실시간 상호작용을 방해할 수 있으며, 이전 추론 단계의 오류가 최종 답변을 잘못 이끌 수 있는 위험을 안고 있다.

2025년 5월 29일 오후 11시 03분

인공지능이 인간 개입 없이 어떻게 시각과 소리를 연결하는지 학습

MIT 연구팀이 개발한 새로운 기계 학습 모델은 음성과 영상 데이터를 연결시키며, 이는 언젠가는 로봇이 현실 세계에서 상호작용하는 데 도움이 될 수 있을 것이다.

2025년 5월 22일 오전 12시 00분MIT News

인공지능을 활용해 연구진은 인간 세포 내 거의 모든 단백질의 위치를 예측합니다

단백질과 세포 행동에 대한 공동 이해를 토대로 훈련된 이 모델은 질병 진단 및 신약 개발에 도움을 줄 수 있습니다.

2025년 5월 15일 오전 10시 30분MIT News

연구 결과, 시각-언어 모델은 부정어를 처리할 수 없다는 것을 보여줌

“no”나 “not”와 같은 부정어가 의료 진단과 같은 중요한 상황에서 이 인기 있는 AI 모델들이 예상치 못하게 실패하게 할 수 있음

2025년 5월 14일 오전 12시 00분MIT News

NVIDIA, 32B, 14B, 7B 크기의 오픈 코드 추론 모델 오픈 소스화

NVIDIA가 코드 추론과 문제 해결을 위해 고안된 고성능 대형 언어 모델 세트인 OCR 모델을 Apache 2.0 라이선스로 오픈 소스화했다. 32B, 14B, 7B 버전은 최고 성능을 자랑하며 OAI 모델을 능가하는 벤치마킹 결과를 보였다.

2025년 5월 8일 오전 3시 31분

구글, Gemini 2.5 Pro I/O 출시: 코딩에서 GPT-4 Turbo를 앞섬, 네이티브 비디오 이해 지원, 웹 개발 분야 주도

구글이 연례 I/O 개발자 컨퍼런스 직전에 플래그십 AI 모델인 Gemini 2.5 Pro (I/O 에디션)의 초기 미리보기를 공개했다. 이번 버전은 코딩 정확도, 웹 애플리케이션 생성, 비디오 이해 등에서 상당한 향상을 이루었으며, GPT-4 Turbo를 앞서는 성능을 보여주고 있다.

2025년 5월 7일 오후 6시 30분

초당 부드럽고 고품질 비디오를 생성하는 하이브리드 AI 모델

CausVid 생성 AI 도구는 확산 모델을 사용하여 자동회귀(프레임별) 시스템을 가르쳐 안정적이고 고해상도 비디오를 신속하게 생성한다.

2025년 5월 6일 오후 12시 15분MIT News

데이터 주도혁신을 통한 건강 관리 혁명을 위한 로드맵에 대한 Q&A

MIT의 Dimitris Bertsimas 교수가 공동 저술한 새 책은 건강 관리 분야에서 분석이 의사결정과 결과에 미치는 영향을 탐구한다.

2025년 5월 5일 오후 4시 15분MIT News

Microsoft AI가 Phi-4-Reasoning을 공개: 복잡한 추론 작업에서 강력한 성능을 발휘하는 14B 파라미터 오픈웨이트 추론 모델

Microsoft이 공개한 Phi-4-Reasoning은 복잡한 추론 작업에 강력한 성능을 보이는 14B 파라미터 오픈웨이트 추론 모델이다. 대규모 언어 모델의 발전에도 불구하고, 수학 문제 해결, 알고리즘 계획, 코딩과 같은 추론 집중 작업에 대한 효율적인 성능은 여전히 모델 크기, 교육 방법론, 추론 시간 능력으로 제한되어 있다.

2025년 5월 1일 오전 2시 53분

고위험 환경에서 AI 모델 믿을만하게 만드는 방법

미래 불확실성을 보다 정확하게 전달하는 새로운 방법은 연구자와 의료진이 더 나은 결정을 내릴 수 있도록 도울 수 있습니다.

2025년 5월 1일 오전 12시 00분MIT News

바이트댄스, LLM 사전 훈련에서 데이터 품질과 다양성을 위한 통합 AI 프레임워크 ‘QuaDMix’ 소개

대형 언어 모델의 사전 훈련 효율과 일반화는 기본 훈련 말뭉치의 품질과 다양성에 크게 영향을 받는다. 전통적인 데이터 정제 파이프라인은 종종 품질 필터링 다음에 도메인 균형을 적용하여 품질과 다양성을 분리된 목표로 취급한다. 이러한 순차적 최적화는 이러한 요소들 간의 복잡한 상호 의존성을 간과한다. 고품질 데이터셋은 종종…

2025년 4월 27일 오전 2시 16분

세포 배양물에서 미생물 오염을 감지하는 새로운 방법

자외선 조사와 기계 학습을 이용하여 30분 이내에 미생물 오염을 명확히 판단할 수 있는 방법이 개발되었다.

2025년 4월 25일 오후 10시 00분MIT News

화학 반응의 돌이킬 수 없는 지점을 예측하는 새 모델

새로운 컴퓨터 모델을 사용해 화학 반응의 효율적인 설계와 유용한 화합물 생산이 가능해졌다.

2025년 4월 23일 오전 11시 00분MIT News

모든 언어에서 AI 생성 코드의 정확성 향상

MIT에서 개발한 새로운 기술은 특정 프로그래밍 언어나 형식의 규칙을 준수하는 AI 생성 코드를 자동으로 안내하는 기법을 소개했다.

2025년 4월 18일 오전 12시 00분MIT News

LLMs에게 스스로 언어를 정화시키는 훈련

MIT-IBM 왓슨 AI 연구소의 새로운 방법은 대형 언어 모델이 안전하고 윤리적이며 가치에 부합하는 출력물로 자신의 응답을 조절할 수 있게 도와준다.

2025년 4월 14일 오후 5시 50분MIT News

민감한 AI 훈련 데이터를 효율적으로 보호하는 새로운 방법

이 방법은 AI 모델의 정확도를 유지하면서 공격자가 비밀 정보를 추출하지 못하도록 보장한다.

2025년 4월 11일 오전 12시 00분MIT News

Vana, 사용자들이 자신의 데이터로 훈련된 AI 모델의 일부를 소유할 수 있게 함

Vana는 MIT 수업 프로젝트에서 시작된 분산 네트워크에 100만 명 이상의 사람들이 데이터를 기여하고 있으며, 사용자들은 자신의 데이터로 훈련된 AI 모델의 일부를 소유할 수 있다.

2025년 4월 3일 오전 12시 00분MIT News

연구진, LLMs에 복잡한 계획 도전 과제 해결법 가르침

연구진은 모델의 추론 능력을 활용하여 다단계 문제에 최적해를 찾는 “스마트 어시스턴트”를 만드는 새로운 프레임워크를 개발했다.

2025년 4월 2일 오전 12시 00분MIT News

공항 평가를 자동화하고 원격 및 안전하게 만들기

미국 공군 엔지니어이자 박사과정 학생 랜들 피터슨은 인공지능과 차세대 이미징 기술을 활용하여 포장 손상과 미해체 폭탄을 감지하고 있다.

2025년 3월 13일 오전 12시 00분MIT News

로봇 도우미가 실수를 한다면? 올바른 방향으로 가르쳐줘

새로운 연구로 사람이 로봇의 행동을 실시간으로 수정할 수 있게 되었는데, 이는 다른 사람에게 피드백을 주는 것과 유사하다.

2025년 3월 7일 오전 12시 00분MIT News

AI 시스템 FragFold가 타겟에 결합하거나 억제할 수 있는 단백질 조각을 예측합니다

MIT 생물학 연구자들이 개발한 FragFold는 생물학 연구 및 치료 응용 분야에 영향을 줄 수 있는 계산 방법입니다.

2025년 2월 20일 오후 2시 35분MIT News

대형 언어 모델은 다양한 데이터를 일반적인 방식으로 다루며 인간 뇌와 유사하다

최근 연구에 따르면 대형 언어 모델은 기본 의미에 기반하여 다양한 데이터 유형을 표현하고 주요 언어로 데이터를 다루며 추론한다.

2025년 2월 19일 오전 12시 00분MIT News

기후 변화 퍼즐 풀기

Accenture Fellow Shreyaa Raghavan은 기계 학습과 최적화 방법을 적용하여 교통 부문 배출량을 줄이는 방법을 탐구합니다.

2025년 2월 10일 오전 10시 00분MIT News

공통 언어 만들기

Kaiming He 교수가 인공지능이 과학 분야 간 장벽을 낮추고 학문 분야 간 협력을 촉진하는 데 어떤 역할을 하는지에 대해 논의합니다.

2025년 2월 7일 오후 4시 00분MIT News

연어 개체수 관리 향상을 위한 데이터 수집 간소화

사라 비리 조교수는 인공지능을 활용하여 태평양 북서부의 이주하는 연어 모니터링을 개선하고 있다.

2025년 2월 6일 오후 4시 25분MIT News

개발자들이 더 효율적인 시뮬레이션과 AI 모델을 구축하는 데 도움이 되는 사용자 친화적 시스템

두 가지 유형의 데이터 중복을 활용하는 코드를 자동으로 생성함으로써 대역폭, 메모리 및 계산을 절약하는 시스템.

2025년 2월 3일 오전 12시 00분MIT News

AI 보안 취약점을 악용하기 위한 적대적 인공지능 모델링에 대한 3가지 질문

MIT CSAIL 주요 연구원 Una-May O’Reilly는 해커들보다 먼저 AI 모델의 보안 취약점을 드러내는 에이전트를 개발하는 방법에 대해 논의합니다.

2025년 1월 29일 오후 4시 00분MIT News

청정 에너지 프로젝트를 신속히 진행하는 플랫폼

MIT 동문들이 설립한 Station A는 부동산 소유자들에게 청정 에너지 구매 과정을 간단하게 만드는 서비스를 제공하고 있다.

2025년 1월 24일 오전 12시 00분MIT News

분자 세계의 비디오 생성 모델로 나아가며

새로운 시스템이 생성적 AI를 사용하여 분자의 역학을 에뮬레이션하며, 정적인 분자 구조를 연결하고 흐릿한 이미지를 비디오로 발전시키는 과정.

2025년 1월 23일 오전 10시 00분MIT News

Generative AI의 환경 영향 설명

강력한 generative AI 모델의 신속한 개발과 배포는 전력 수요와 수소 소비 증가와 같은 환경적 영향을 야기한다.

2025년 1월 17일 오전 12시 00분MIT News

예술 세계를 더 접근 가능하게 만드는 방법

MIT 수업 프로젝트로 시작된 스타트업 NALA는 예술 구매자와 작가를 직접 연결시킨다.

2025년 1월 16일 오전 12시 00분MIT News

끓는 것의 숨겨진 힘 해제 – 에너지, 우주, 그 너머

박사 Matteo Bucci 교수의 연구는 고대 과정에 새로운 시선을 제공하여 다양한 산업 시스템에서 열전달 효율을 향상시키고 있다.

2025년 1월 2일 오전 12시 00분MIT News

« 이전 1 2