
교차로에서 교통을 완화하기 위해 차량 속도를 자동으로 제어하는 새로운 연구 결과, 탄소 배출량을 11 ~ 22% 줄일 수 있다.

교차로에서 교통을 완화하기 위해 차량 속도를 자동으로 제어하는 새로운 연구 결과, 탄소 배출량을 11 ~ 22% 줄일 수 있다.

MIT 동문이 공동 창업한 Cloudian의 저장 시스템은 기업이 대규모로 데이터를 제공하는 AI 모델과 에이전트를 지원하고 있다.
LangExtract는 구글 AI의 새로운 오픈 소스 파이썬 라이브러리로, 비구조화된 텍스트 문서에서 의미 있는 정보를 추출하는 것을 목표로 한다. 이 라이브러리는 Gemini와 같은 LLMs를 사용하여 이러한 과제를 직접 해결한다.
MLE-STAR은 구글 클라우드 연구원들이 개발한 최첨단 에이전트 시스템으로, 복잡한 기계 학습 ML 파이프라인 설계와 최적화를 자동화합니다. MLE-STAR은 웹 규모 검색, 특정 코드 수정, 견고한 검사 모듈을 활용하여 기계 학습 엔지니어링 작업에서 우수한 성능을 발휘합니다.
MIT 연구진은 대규모 트랜스포머를 안정적으로 훈련하는 것이 어려운 문제를 해결하기 위해 불안정한 활성화 및 손실 증폭을 줄이기 위해 증명 가능한 Lipschitz 경계를 강제하는 방법을 개발했다.

대칭 데이터를 활용한 효율적인 기계 학습을 가능하게 하는 새로운 알고리즘이 개발되었고, 이는 약물 및 소재 발견을 위한 AI 모델을 향상시킬 수 있다.
인공지능 연구는 패턴 인식을 넘어서 인간과 유사한 복잡한 추론이 가능한 시스템으로 진화하고 있다. Energy-Based Transformers (EBTs)는 도메인 특정 감독이나 제한적인 교육 신호에 의존하지 않고 기계에 “System 2 Thinking”을 가능하게 하는 신경 구조로, 기계 학습의 다음 단계로 손꼽힌다.

MIT CSAIL 연구원들이 개발한 Neural Jacobian Fields는 다른 센서 없이 단일 카메라에서 로봇을 제어할 수 있도록 학습할 수 있습니다.

MIT 연구진은 특별한 유형의 신경망, 인코더 또는 “토크나이저”가 이전에 인식된 것보다 훨씬 더 많은 작업을 수행할 수 있다고 발견했다.

언어 모델은 순차적 추적이 아닌 똑똑한 산술을 사용하여 변화하는 상황을 따라갑니다. 이러한 접근 방법을 제어함으로써 엔지니어들은 시스템의 성능을 향상시킬 수 있습니다.

Allen Institute for AI가 AutoDS(자율적 발견을 통한 서프라이즈)를 소개했는데, 이는 인간이 정의한 목표나 질의에 의존하지 않고 베이지안 서프라이즈를 측정하고 찾아내는 가치 있는 가정을 자동으로 생성, 테스트 및 반복함.

스위스의 지하 실험 결과와 일치하는 시뮬레이션 결과로, 모델링이 핵폐기물 처리 사이트의 안전을 검증하는 데 사용될 수 있다는 것을 시사.

CodeSteer 시스템은 공급망에서 운송 일정을 예약하는 등 복잡한 문제를 해결할 때 대형 언어 모델의 정확성을 높일 수 있다.

AI가 소프트웨어 개발을 변화시키고 있지만 완전한 자동화에는 여전히 중요한 장애물이 남아있다. 연구팀은 이제 도전 과제를 매핑하고 분야를 전진시키기 위한 연구 계획을 개요로 제시했다.

이 논문은 대규모 언어 모델(LLMs)이 답변에 대해 확신이 없을 때 그것을 나타내야 한다는 불확실성 양자화의 역할을 탐구한다. LLMs의 다양한 출력 공간을 활용하여 불확실성을 설명하는 문자열을 제안한다.

MIT CSAIL 연구원들이 개발한 AI 파이프라인은 수중에서 일렬로 이동하는 바디보드 크기의 차량을 위한 독특한 수력 디자인을 가능하게 하며, 과학자들이 해양 데이터를 수집하는 데 도움을 줄 수 있음.

연구진은 대규모 언어 모델을 전략 계획이나 프로세스 최적화와 같은 어려운 작업에 보다 적응 가능하게 만드는 방법을 개발했다.

대형 언어 모델(Large language models, LLMs)은 다양한 작업에서 탁월한 성능을 보여주며 현재 실제 응용 프로그램에서 증가하고 있습니다. 하지만 특히 고위험 상황에서는 LLM의 출력이 신뢰할 수 없을 때를 알아내는 것이 중요합니다. 이 연구에서는 LLM이 답변에 대한 확신을 신뢰할 수 있는지, 이 신뢰의 개념이 하류 정확도로 어떻게 전환되는지 조사합니다.
새로운 반도체를 분석하기 위해 개발된 시스템은 더 강력한 태양 전지의 개발을 간소화할 수 있습니다.

Meta AI와 Washington 대학의 연구진이 ASTRO(자동 회귀 검색 가르치는 추론기)를 소개했다. Llama-3.1-70B-Instruct에서 추론을 향상시키기 위한 포스트 트레이닝 프레임워크로, 모델에 컨텍스트 내 검색 수행을 가르치는 것이 특징이다.

연구원들이 OctoThinker를 제안하여 강화 학습을 통한 복잡한 추론 작업에 대한 LLM의 발전을 제안했다. CoT 프롬프팅과 대규모 강화 학습을 결합한 LLM은 Deepseek-R1-Zero와 같은 모델이 기본 모델에 직접 RL을 적용함으로써 강한 추론 능력을 보여주었다.

Sam Rodriques 박사과 FutureHouse는 AI 에이전트를 개발하여 과학적 발전을 위한 주요 단계를 자동화했다.

MIT CSAIL 연구진은 GenAI와 물리 시뮬레이션 엔진을 결합하여 로봇 디자인을 개선했습니다. 결과적으로, 인간이 디자인한 로봇을 능가하는 기계를 만들어 냈습니다.

환자 메시지에 있는 오타, 추가 공백, 화려한 언어와 같은 비임상 정보가 AI 모델의 정확도를 낮추는 것을 연구자들이 발견했습니다.

구글의 AI 논문에서는 인종, 성별, 사회경제적 배경과 같은 속성으로 정의된 다양한 부분집단에서 모델의 성능을 평가하는 것이 기계 학습에서의 공정성을 평가하는 중요한 요소임을 소개하고 있습니다. 이 평가는 의료 분야와 같이 부조그룹 간의 모델 성능 차이가 치료 권고나 진단에 불평등을 초래할 수 있는 맥락에서 중요합니다.

연구진이 새로운 연구에서 LLMs의 편향 유형의 원인을 발견하여, 더 정확하고 신뢰할 수 있는 AI 시스템을 위한 길을 열었다.

MIT 윤리 컴퓨팅 연구 심포지엄은 기술, 윤리, 사회적 책임이 교차하는 프로젝트를 선보인다.

광 프로세서 칩은 빛의 속도로 딥 러닝을 수행하여 엣지 장치에 실시간 데이터 분석 기능을 제공할 수 있다.

MIT 연구팀이 디지털로 제작된 필름을 사용해 원본 그림을 물리적으로 복원하는 새로운 방법을 개발했다. 필름은 원하는 경우 제거할 수 있다.

Mistral AI가 최신 시리즈인 Magistral을 소개했다. 이는 추론에 최적화된 대형 언어 모델(Large Language Models)로 LLM 능력 발전의 중요한 한 걸음이다. Magistral 시리즈에는 Apache 2.0 라이선스 하에 공개된 24B-파라미터의 Magistral Small과 기업용 Magistral Medium이 포함되어 있다.

MIT-IBM 왓슨 AI 연구소의 새로운 프레임워크는 언어 모델을 강화하여 복잡한 여행 일정을 상호작용적으로 개발하고 검증할 수 있게 함.

MIT 동문 두 명에 의해 설립된 Coactive는 AI 플랫폼을 구축하여 모든 유형의 콘텐츠로부터 새로운 통찰을 얻을 수 있게 함.

대형 언어 모델(LLMs)은 각 토큰이 일관된 논리적 설명에 기여하는 Chain-of-Thoughts(CoTs)을 생성한다. 이러한 추론의 품질을 향상시키기 위해 다양한 강화 학습 기술이 사용되고 있으며, 이를 통해 모델은 생성된 출력을 정확성 기준과 일치시키는 피드백 메커니즘으로 학습할 수 있다.
자율 주행차에 대해 다루는 기사가 많지만, 자율 의료 기술에 대해 논할 때는 거의 언급되지 않는다. 자율 의료가 항생제 내성을 완화시키는데 도움이 될 수 있을지에 대한 가능성을 탐구해볼 필요가 있다.

MIT 연구팀이 Themis AI를 설립하여 AI 모델의 불확실성을 측정하고 지식의 공백을 해결하고 있다.

MIT CSAIL 연구원들이 개발한 SketchAgent는 AI 모델에게 개념을 한 줄씩 스케치하도록 가르쳐, 언어 모델이 독자적으로 개념을 시각적으로 표현하고 인간과 협업할 수 있도록 돕는다.

Apple과 Duke 연구진이 속도와 정확도를 향상시키기 위해 LLM이 중간 답변을 제공할 수 있는 강화 학습 접근 방식을 소개했다. 일반적인 “생각한 후에 대답” 방법은 응답 시간을 늦추고 챗봇과 같은 실시간 상호작용을 방해할 수 있으며, 이전 추론 단계의 오류가 최종 답변을 잘못 이끌 수 있는 위험을 안고 있다.

MIT 연구팀이 개발한 새로운 기계 학습 모델은 음성과 영상 데이터를 연결시키며, 이는 언젠가는 로봇이 현실 세계에서 상호작용하는 데 도움이 될 수 있을 것이다.

단백질과 세포 행동에 대한 공동 이해를 토대로 훈련된 이 모델은 질병 진단 및 신약 개발에 도움을 줄 수 있습니다.

“no”나 “not”와 같은 부정어가 의료 진단과 같은 중요한 상황에서 이 인기 있는 AI 모델들이 예상치 못하게 실패하게 할 수 있음

NVIDIA가 코드 추론과 문제 해결을 위해 고안된 고성능 대형 언어 모델 세트인 OCR 모델을 Apache 2.0 라이선스로 오픈 소스화했다. 32B, 14B, 7B 버전은 최고 성능을 자랑하며 OAI 모델을 능가하는 벤치마킹 결과를 보였다.

구글이 연례 I/O 개발자 컨퍼런스 직전에 플래그십 AI 모델인 Gemini 2.5 Pro (I/O 에디션)의 초기 미리보기를 공개했다. 이번 버전은 코딩 정확도, 웹 애플리케이션 생성, 비디오 이해 등에서 상당한 향상을 이루었으며, GPT-4 Turbo를 앞서는 성능을 보여주고 있다.

CausVid 생성 AI 도구는 확산 모델을 사용하여 자동회귀(프레임별) 시스템을 가르쳐 안정적이고 고해상도 비디오를 신속하게 생성한다.

MIT의 Dimitris Bertsimas 교수가 공동 저술한 새 책은 건강 관리 분야에서 분석이 의사결정과 결과에 미치는 영향을 탐구한다.
Microsoft이 공개한 Phi-4-Reasoning은 복잡한 추론 작업에 강력한 성능을 보이는 14B 파라미터 오픈웨이트 추론 모델이다. 대규모 언어 모델의 발전에도 불구하고, 수학 문제 해결, 알고리즘 계획, 코딩과 같은 추론 집중 작업에 대한 효율적인 성능은 여전히 모델 크기, 교육 방법론, 추론 시간 능력으로 제한되어 있다.

미래 불확실성을 보다 정확하게 전달하는 새로운 방법은 연구자와 의료진이 더 나은 결정을 내릴 수 있도록 도울 수 있습니다.
대형 언어 모델의 사전 훈련 효율과 일반화는 기본 훈련 말뭉치의 품질과 다양성에 크게 영향을 받는다. 전통적인 데이터 정제 파이프라인은 종종 품질 필터링 다음에 도메인 균형을 적용하여 품질과 다양성을 분리된 목표로 취급한다. 이러한 순차적 최적화는 이러한 요소들 간의 복잡한 상호 의존성을 간과한다. 고품질 데이터셋은 종종…

자외선 조사와 기계 학습을 이용하여 30분 이내에 미생물 오염을 명확히 판단할 수 있는 방법이 개발되었다.

새로운 컴퓨터 모델을 사용해 화학 반응의 효율적인 설계와 유용한 화합물 생산이 가능해졌다.

MIT에서 개발한 새로운 기술은 특정 프로그래밍 언어나 형식의 규칙을 준수하는 AI 생성 코드를 자동으로 안내하는 기법을 소개했다.

MIT-IBM 왓슨 AI 연구소의 새로운 방법은 대형 언어 모델이 안전하고 윤리적이며 가치에 부합하는 출력물로 자신의 응답을 조절할 수 있게 도와준다.

이 방법은 AI 모델의 정확도를 유지하면서 공격자가 비밀 정보를 추출하지 못하도록 보장한다.

Vana는 MIT 수업 프로젝트에서 시작된 분산 네트워크에 100만 명 이상의 사람들이 데이터를 기여하고 있으며, 사용자들은 자신의 데이터로 훈련된 AI 모델의 일부를 소유할 수 있다.

연구진은 모델의 추론 능력을 활용하여 다단계 문제에 최적해를 찾는 “스마트 어시스턴트”를 만드는 새로운 프레임워크를 개발했다.

미국 공군 엔지니어이자 박사과정 학생 랜들 피터슨은 인공지능과 차세대 이미징 기술을 활용하여 포장 손상과 미해체 폭탄을 감지하고 있다.

새로운 연구로 사람이 로봇의 행동을 실시간으로 수정할 수 있게 되었는데, 이는 다른 사람에게 피드백을 주는 것과 유사하다.

MIT 생물학 연구자들이 개발한 FragFold는 생물학 연구 및 치료 응용 분야에 영향을 줄 수 있는 계산 방법입니다.

최근 연구에 따르면 대형 언어 모델은 기본 의미에 기반하여 다양한 데이터 유형을 표현하고 주요 언어로 데이터를 다루며 추론한다.
Accenture Fellow Shreyaa Raghavan은 기계 학습과 최적화 방법을 적용하여 교통 부문 배출량을 줄이는 방법을 탐구합니다.

Kaiming He 교수가 인공지능이 과학 분야 간 장벽을 낮추고 학문 분야 간 협력을 촉진하는 데 어떤 역할을 하는지에 대해 논의합니다.

사라 비리 조교수는 인공지능을 활용하여 태평양 북서부의 이주하는 연어 모니터링을 개선하고 있다.

두 가지 유형의 데이터 중복을 활용하는 코드를 자동으로 생성함으로써 대역폭, 메모리 및 계산을 절약하는 시스템.

MIT CSAIL 주요 연구원 Una-May O’Reilly는 해커들보다 먼저 AI 모델의 보안 취약점을 드러내는 에이전트를 개발하는 방법에 대해 논의합니다.

MIT 동문들이 설립한 Station A는 부동산 소유자들에게 청정 에너지 구매 과정을 간단하게 만드는 서비스를 제공하고 있다.

새로운 시스템이 생성적 AI를 사용하여 분자의 역학을 에뮬레이션하며, 정적인 분자 구조를 연결하고 흐릿한 이미지를 비디오로 발전시키는 과정.

강력한 generative AI 모델의 신속한 개발과 배포는 전력 수요와 수소 소비 증가와 같은 환경적 영향을 야기한다.

MIT 수업 프로젝트로 시작된 스타트업 NALA는 예술 구매자와 작가를 직접 연결시킨다.

박사 Matteo Bucci 교수의 연구는 고대 과정에 새로운 시선을 제공하여 다양한 산업 시스템에서 열전달 효율을 향상시키고 있다.