미주투데이

퍼플렉시티, 자가 개선 메모리 시스템 '브레인' 출시

퍼플렉시티가 자가 개선 메모리 시스템인 '브레인'을 출시했습니다. 이 시스템은 에이전트의 작업을 기억하며, 성과와 실패를 분석해 개선합니다.

2026년 6월 18일 오후 4시 26분

OpenAI, 생명과학 연구 평가를 위한 750개 작업 벤치마크 LifeSciBench 발표

OpenAI가 생명과학 연구를 평가하는 750개 작업으로 구성된 LifeSciBench를 발표했습니다. 이 벤치마크는 173명의 박사 과학자들이 작성한 기준을 바탕으로 AI 모델의 추론과 결정을 평가합니다.

2026년 6월 17일 오후 10시 28분

Vercel, 오픈소스 AI 에이전트 프레임워크 'Eve' 공개

Vercel이 Apache-2.0 라이선스의 오픈소스 AI 에이전트 프레임워크 'Eve'를 공개했다. 각 에이전트는 기능에 맞춰 파일 디렉토리로 구성되어 있다.

2026년 6월 17일 오후 1시 22분

아톰 컴퓨팅과 누 퀀텀, 중립 원자 QPU 네트워크 구축을 위한 전략적 협력 체결

아톰 컴퓨팅과 누 퀀텀이 중립 원자 양자 프로세서 네트워크 구축을 위한 전략적 협력 관계를 체결했다. 이들은 모듈형 분산 양자 컴퓨팅 아키텍처를 공동 개발할 예정이다.

2026년 6월 17일 오전 8시 52분Quantum Computing Report

MiniMax, 109B 매개변수 MoE 기반의 새로운 희소 주의 메커니즘 MSA 발표

MiniMax가 새로운 희소 주의 메커니즘인 MSA를 발표했습니다. 이 기술은 쿼리당 상위 k 개의 키-값 블록을 선택하여 계산량을 28.4배 줄이는 데 성공했습니다.

2026년 6월 17일 오전 3시 44분

OpenAI, 배포 시뮬레이션 도입으로 에이전틱 코딩의 위험 평가 확대

OpenAI가 2026년 6월 16일 배포 시뮬레이션을 도입했습니다. 이 방법은 새로운 모델 출시 전 과거 대화를 재생하여 배포 시 원치 않는 행동의 비율을 추정합니다.

2026년 6월 17일 오전 1시 49분

헤르메스 에이전트, 비동기 서브 에이전트 추가로 부모 채팅 차단 해제

헤르메스 에이전트가 비동기 서브 에이전트를 도입하여 위임된 작업이 부모 채팅을 차단하지 않도록 개선했습니다. 새로운 도구 세트를 통해 작업을 생성하고 관리하는 방법을 소개합니다.

2026년 6월 16일 오전 5시 21분

AI 에이전트를 활용한 노코드 앱 개발 도구, 'Meet Atoms' 소개

'Meet Atoms'는 개발자나 소프트웨어 엔지니어가 아니더라도 아이디어를 AI에게 설명하면 앱을 구축하고 배포할 수 있는 노코드 도구입니다.

2026년 6월 16일 오전 4시 50분

HPE, 하이브리드 양자 컴퓨팅 추진을 위한 8개 파트너 인프라 이니셔티브 발표

Hewlett Packard Enterprise(HPE)는 양자 컴퓨팅 전략을 확장하며, 양자 하드웨어 및 제어 시스템 분야의 8개 주요 기업과 협력 계약을 체결했다고 발표했다. 이번 이니셔티브는 HPE의 HPC 플랫폼과 다양한 양자 모달리티를 통합하는 것을 목표로 한다.

2026년 6월 15일 오후 8시 40분Quantum Computing Report

사카나 AI, AB-MCTS 상용화로 100페이지 연구 보고서 생성하는 기업 에이전트 출시

사카나 AI의 첫 상용 제품인 사카나 마를린은 최대 8시간 동안 자율적으로 작동하며, AB-MCTS와 AI 과학자 워크플로우를 기반으로 다수의 페이지로 구성된 보고서와 슬라이드를 생성합니다.

2026년 6월 15일 오후 6시 32분

Flash-KMeans: FAISS보다 200배 빠른 IO 인식 K-평균 알고리즘

Flash-KMeans는 Triton GPU 커널을 활용한 오픈소스 IO 인식 K-평균 구현체로, 기존의 수학적 접근을 변경하지 않고도 FAISS보다 200배 빠른 성능을 자랑합니다.

2026년 6월 15일 오전 5시 16분

Z.ai, 100만 토큰 컨텍스트와 두 가지 사고 노력 수준을 갖춘 GLM-5.2 출시

Z.ai가 2026년 6월 13일 GLM-5.2를 출시했습니다. 이 모델은 100만 토큰의 컨텍스트 창을 제공하며, 높은 노력과 최대 노력 수준을 지원합니다. 출시 시점에는 벤치마크가 제공되지 않았습니다.

2026년 6월 15일 오전 2시 10분

다트브릭스, AI 에이전트를 위한 메타 하네스 '옴니젠트' 오픈 소스 공개

다트브릭스가 코딩 에이전트인 클로드 코드, 코덱스, 파이 위에서 작동하는 메타 하네스 '옴니젠트'를 오픈 소스로 공개했습니다. 이 프로젝트는 구성, 정책 관리, 실시간 세션 공유 기능을 제공합니다.

2026년 6월 14일 오전 1시 01분

Moonshot AI, Kimi K2.7-Code 공개: Kimi Code Bench v2에서 +21.8% 성능 향상

Moonshot AI가 Kimi K2.7-Code를 오픈소스로 공개했다. 이 모델은 Kimi K2.6을 기반으로 하며, Kimi Code Bench v2에서 +21.8%의 성능 향상을 기록했다.

2026년 6월 13일 오전 12시 57분

문샷 AI, Kimi K2.6 기반의 로컬 데스크탑 에이전트 Kimi Work 출시

문샷 AI가 macOS와 Windows에서 사용할 수 있는 로컬 데스크탑 에이전트 Kimi Work를 출시했습니다. 이 에이전트는 300개의 서브 에이전트로 구성된 스웜을 운영하며, 웹 브라우저를 제어하고 백그라운드 작업을 예약합니다.

2026년 6월 12일 오전 5시 37분

Zyphra, Zamba2-VL 출시: 시간 단축을 이룬 하이브리드 비전-언어 모델

Zyphra가 1.2B, 2.7B, 7B 파라미터를 가진 Zamba2-VL 비전-언어 모델을 출시했습니다. 이 모델은 Mamba2와 Transformer를 결합하여 첫 번째 토큰 생성 시간을 대폭 단축합니다.

2026년 6월 12일 오전 4시 06분

누스 리서치, 허메스 에이전트 프로필 빌더 출시

누스 리서치가 허메스 에이전트 대시보드를 통해 사용자들이 여러 단계를 거치지 않고도 완전한 에이전트 프로필을 구축할 수 있도록 지원합니다.

2026년 6월 11일 오전 5시 53분

구글 AI, 텍스트 확산 기술로 4배 빠른 생성이 가능한 DiffusionGemma 공개

구글 딥마인드가 260억 개의 매개변수를 가진 DiffusionGemma 모델을 공개했습니다. 이 모델은 텍스트 확산 기술을 활용하여 GPU에서 최대 4배 빠른 생성 속도를 자랑합니다.

2026년 6월 10일 오후 2시 50분

앤트로픽, 클로드 파블 5 및 클로드 미토스 5 출시

앤트로픽이 클로드 파블 5를 일반 사용자에게 제공하고, 클로드 미토스 5는 사이버 안전 장치가 해제된 상태로 제한적으로 출시했습니다. 두 모델은 동일한 기본 모델을 기반으로 하지만, 서로 다른 안전 장치를 갖추고 있습니다.

2026년 6월 10일 오전 4시 26분

최신뉴스 전체보기

퍼플렉시티, 자가 개선 메모리 시스템 ‘브레인’ 출시

퍼플렉시티가 자가 개선 메모리 시스템인 ‘브레인’을 출시했습니다. 이 시스템은 에이전트의 작업을 기억하며, 성과와 실패를 분석해 개선합니다.

2026년 6월 18일 오후 4시 26분

OpenAI, 생명과학 연구 평가를 위한 750개 작업 벤치마크 LifeSciBench 발표

2026년 6월 17일 오후 10시 28분

Vercel, 오픈소스 AI 에이전트 프레임워크 ‘Eve’ 공개

Vercel이 Apache-2.0 라이선스의 오픈소스 AI 에이전트 프레임워크 ‘Eve’를 공개했다. 각 에이전트는 기능에 맞춰 파일 디렉토리로 구성되어 있다.

2026년 6월 17일 오후 1시 22분

아톰 컴퓨팅과 누 퀀텀, 중립 원자 QPU 네트워크 구축을 위한 전략적 협력 체결

2026년 6월 17일 오전 8시 52분Quantum Computing Report

MiniMax, 109B 매개변수 MoE 기반의 새로운 희소 주의 메커니즘 MSA 발표

2026년 6월 17일 오전 3시 44분

OpenAI, 배포 시뮬레이션 도입으로 에이전틱 코딩의 위험 평가 확대

2026년 6월 17일 오전 1시 49분

헤르메스 에이전트, 비동기 서브 에이전트 추가로 부모 채팅 차단 해제

2026년 6월 16일 오전 5시 21분

AI 에이전트를 활용한 노코드 앱 개발 도구, ‘Meet Atoms’ 소개

‘Meet Atoms’는 개발자나 소프트웨어 엔지니어가 아니더라도 아이디어를 AI에게 설명하면 앱을 구축하고 배포할 수 있는 노코드 도구입니다.

2026년 6월 16일 오전 4시 50분

HPE, 하이브리드 양자 컴퓨팅 추진을 위한 8개 파트너 인프라 이니셔티브 발표

2026년 6월 15일 오후 8시 40분Quantum Computing Report

사카나 AI, AB-MCTS 상용화로 100페이지 연구 보고서 생성하는 기업 에이전트 출시

2026년 6월 15일 오후 6시 32분

Flash-KMeans: FAISS보다 200배 빠른 IO 인식 K-평균 알고리즘

Flash-KMeans는 Triton GPU 커널을 활용한 오픈소스 IO 인식 K-평균 구현체로, 기존의 수학적 접근을 변경하지 않고도 FAISS보다 200배 빠른 성능을 자랑합니다.

2026년 6월 15일 오전 5시 16분

Z.ai, 100만 토큰 컨텍스트와 두 가지 사고 노력 수준을 갖춘 GLM-5.2 출시

2026년 6월 15일 오전 2시 10분

다트브릭스, AI 에이전트를 위한 메타 하네스 ‘옴니젠트’ 오픈 소스 공개

다트브릭스가 코딩 에이전트인 클로드 코드, 코덱스, 파이 위에서 작동하는 메타 하네스 ‘옴니젠트’를 오픈 소스로 공개했습니다. 이 프로젝트는 구성, 정책 관리, 실시간 세션 공유 기능을 제공합니다.

2026년 6월 14일 오전 1시 01분

Moonshot AI, Kimi K2.7-Code 공개: Kimi Code Bench v2에서 +21.8% 성능 향상

Moonshot AI가 Kimi K2.7-Code를 오픈소스로 공개했다. 이 모델은 Kimi K2.6을 기반으로 하며, Kimi Code Bench v2에서 +21.8%의 성능 향상을 기록했다.

2026년 6월 13일 오전 12시 57분

문샷 AI, Kimi K2.6 기반의 로컬 데스크탑 에이전트 Kimi Work 출시

2026년 6월 12일 오전 5시 37분

Zyphra, Zamba2-VL 출시: 시간 단축을 이룬 하이브리드 비전-언어 모델

2026년 6월 12일 오전 4시 06분

xAI, Grok Build 플러그인 마켓플레이스 출시

xAI가 Grok Build의 인-터미널 마켓플레이스를 출시했습니다. 이 마켓플레이스는 MongoDB, Vercel, Sentry, Chrome DevTools, Cloudflare, Superpowers 플러그인을 포함하고 있습니다.

2026년 6월 11일 오후 5시 30분

누스 리서치, 허메스 에이전트 프로필 빌더 출시

누스 리서치가 허메스 에이전트 대시보드를 통해 사용자들이 여러 단계를 거치지 않고도 완전한 에이전트 프로필을 구축할 수 있도록 지원합니다.

2026년 6월 11일 오전 5시 53분

구글 AI, 텍스트 확산 기술로 4배 빠른 생성이 가능한 DiffusionGemma 공개

2026년 6월 10일 오후 2시 50분

앤트로픽, 클로드 파블 5 및 클로드 미토스 5 출시

2026년 6월 10일 오전 4시 26분

하버드와 퍼플렉시티 연구, AI 에이전트의 자율 작업 시간 26분 vs 검색 33초

하버드와 퍼플렉시티의 새로운 연구에 따르면, AI 에이전트는 세션당 26분의 자율 작업을 수행하는 반면, 검색 보조자는 33초에 불과한 것으로 나타났다. 이는 자율성, 시간, 비용에서 큰 이점을 보여준다.

2026년 6월 9일 오전 1시 53분

샤오미, 1조 매개변수 모델로 초당 1000개 토큰 처리 성공

샤오미의 MiMo 팀이 TileRT와 함께 MiMo-V2.5-Pro-UltraSpeed를 출시했습니다. 이 모델은 단일 8-GPU 노드에서 1조 매개변수를 활용해 초당 1000개 이상의 토큰을 디코딩할 수 있습니다.

2026년 6월 8일 오후 12시 49분

2026년 최고의 로우코드 및 노코드 AI 도구 21선

로우코드 및 노코드 AI 플랫폼은 프롬프트를 사용해 작동하는 앱, 에이전트 또는 모델로 변환합니다. 이 가이드는 21개의 도구를 비교하며, 각 도구의 공식 사이트 링크도 포함되어 있습니다.

2026년 6월 7일 오후 5시 40분

Harness-1: 20억 매개변수의 강화 학습 기반 검색 서브 에이전트 소개

UIUC와 Chroma가 개발한 Harness-1은 20억 매개변수로 구성된 검색 서브 에이전트로, 강화 학습을 통해 훈련되었습니다. 이 시스템은 검색과 검증을 효율적으로 관리합니다.

2026년 6월 7일 오후 3시 25분

구글, Colab CLI 출시로 개발자와 AI 에이전트의 원격 GPU 및 TPU 사용 지원

구글이 Colab CLI를 출시하여 개발자와 AI 에이전트가 로컬 코드를 원격 Colab GPU 및 TPU 환경에서 실행할 수 있게 되었습니다.

2026년 6월 7일 오전 7시 07분

문샷 AI, 차세대 에이전트를 위한 Kimi Code CLI 출시

문샷 AI가 TypeScript로 작성된 오픈소스 터미널 코딩 에이전트 Kimi Code CLI를 출시했습니다. 이 에이전트는 서브 에이전트와 MCP 구성 기능을 갖추고 있습니다.

2026년 6월 6일 오후 6시 11분

구글 딥마인드, 젬마 4 QAT 체크포인트 Q4_0 및 새로운 모바일 포맷 공개

구글 딥마인드가 젬마 4의 QAT 체크포인트 Q4_0과 새로운 모바일 포맷을 발표했습니다. 이 포맷은 장치 메모리를 절약할 수 있는 특징이 있습니다.

2026년 6월 6일 오전 3시 59분

NVIDIA, Kubernetes용 AI 추론을 위한 CRIU 기반의 빠른 시작 시스템 ‘다이나모 스냅샷’ 출시

NVIDIA가 CRIU 및 cuda-checkpoint 도구를 사용하여 Kubernetes에서 vLLM 추론 작업자를 체크포인트하고 복원하는 ‘다이나모 스냅샷’을 발표했습니다.

2026년 6월 5일 오후 7시 23분

퍼플렉시티 AI, 개인용 컴퓨터를 위한 하이브리드 로컬-서버 추론 오케스트레이터 발표

퍼플렉시티 AI가 개인용 컴퓨터를 위한 하이브리드 로컬-서버 추론 오케스트레이터를 발표했다. 이 시스템은 AI 작업을 자동으로 온디바이스와 클라우드 모델 간에 라우팅한다.

2026년 6월 5일 오후 6시 44분

NVIDIA, Nemotron 3 Ultra 출시: 550B 혼합 전문가 하이브리드 모델

NVIDIA가 550B의 오픈 Mixture-of-Experts 하이브리드 모델인 Nemotron 3 Ultra를 출시했습니다. 이 모델은 1M 토큰 컨텍스트를 지원하며, 유사한 LLM보다 최대 6배 높은 추론 처리량을 자랑합니다.

2026년 6월 5일 오전 6시 42분

스탠포드 연구진, 개인 AI 에이전트를 위한 오픈소스 프레임워크 OpenJarvis 발표

스탠포드 연구진이 개인 AI 시스템을 위한 오픈소스 프레임워크 OpenJarvis를 공개했습니다. 이 프레임워크는 모든 기능을 기기 내에서 수행하며, 클라우드 모델보다 훨씬 저렴한 비용으로 운영됩니다.

2026년 6월 4일 오후 3시 23분

Nous Research, Hermes Desktop 출시: Hermes Agent v0.15.2의 크로스 플랫폼 프론트 엔드

Nous Research가 Hermes Agent v0.15.2를 위한 크로스 플랫폼 GUI인 Hermes Desktop을 출시했습니다. 이 소프트웨어는 단일 에이전트 코어와 메모리를 공유합니다.

2026년 6월 3일 오후 6시 38분

NVIDIA, 물리적 추론과 세계 생성 통합한 Cosmos 3 출시

NVIDIA가 물리적 AI를 위한 자율 회귀 VLM 추론기와 확산 생성기를 결합한 오픈 옴니모달 세계 모델인 Cosmos 3를 출시했다.

2026년 6월 3일 오후 5시 35분

타이니피시, 평문 설명으로 구조화된 실시간 데이터셋을 생성하는 오픈소스 다중 에이전트 시스템 ‘빅셋’ 출시

타이니피시가 ‘빅셋’이라는 오픈소스 다중 에이전트 시스템을 출시했습니다. 사용자가 데이터셋을 한 문장으로 설명하면, 빅셋의 조정자와 하위 에이전트가 실시간 웹을 검색해 구조화된 테이블을 반환합니다.

2026년 6월 3일 오전 2시 57분

알리바바, Qwen3.7-Plus 출시 – 비전, 심층 추론, 도구 호출 및 자율 반복 기능 추가

알리바바의 Qwen 팀이 Bailian 플랫폼에서 Qwen3.7-Plus를 출시했습니다. 이 모델은 이미지와 비디오를 이해하며, 자가 프로그래밍 및 도구 호출 기능을 추가했습니다.

2026년 6월 2일 오후 6시 07분

JetBrains, 12B MoE 모델 Mellum2 출시

JetBrains가 AI 워크플로우를 위해 10.6조 개의 토큰으로 훈련된 12B MoE 모델인 Mellum2를 Apache 2.0 라이선스 하에 출시했다.

2026년 6월 2일 오후 5시 00분

MiniMax, 1M-토큰 컨텍스트 지원하는 MiniMax M3 출시

MiniMax가 새로운 M3 모델을 출시했습니다. 이 모델은 1M-토큰 컨텍스트 창과 함께 이미지, 비디오, 컴퓨터 사용을 지원하는 기능을 갖추고 있습니다.

2026년 6월 2일 오전 5시 40분

메모리 OS: 헬메스 에이전트를 기반으로 한 6계층 오픈소스 메모리 스택 소개

메모리 OS는 헬메스 에이전트 위에 구축된 6계층의 오픈소스 프로젝트로, 로컬 지속 메모리를 추가하고 게이트드 검색 및 위키 기능을 제공합니다.

2026년 6월 2일 오전 1시 53분

파랄락스: 소프트맥스를 유지하고 학습된 공분산 보정 분기를 추가한 매개변수화된 로컬 선형 주의 메커니즘

파랄락스는 LLA의 쿼리별 솔버를 학습된 프로젝터로 대체하여 산술 강도를 두 배로 늘리고, 0.6B 및 1.7B에서 혼란도를 개선합니다.

2026년 6월 1일 오후 1시 36분

Trajectory, 지속 학습을 위한 동시 다중 LoRA 훈련 스택 발표

Trajectory가 UC 버클리 스카이랩 및 Anyscale과 협력하여 지속 학습을 위한 동시 다중 LoRA 훈련 스택을 개발했습니다. 이 시스템은 각 RL 실험을 전용 LoRA 어댑터에 매핑하여 실험 처리량을 2.81배 향상시켰습니다.

2026년 5월 31일 오전 11시 04분

제네시스 AI, 로봇 공학 모델 평가를 위한 물리 플랫폼 ‘제네시스 월드 1.0’ 출시

제네시스 AI가 2026년 5월 27일 물리, 렌더링, 컴파일, 도구를 포함한 시뮬레이션 플랫폼 ‘제네시스 월드 1.0’을 출시했습니다. 이 시스템은 시뮬레이션과 실제 로봇 성능 간의 상관관계를 0.8996으로 달성했습니다.

2026년 5월 30일 오후 6시 25분

헤르메스 에이전트, MCP를 위한 툴 검색 기능 추가

헤르메스 에이전트가 MCP의 컨텍스트 부풀림 문제를 해결하기 위해 툴 검색 기능을 추가했습니다. 이 기능은 BM25 점진적 스키마 공개를 활용하여 정확도를 49%에서 74%까지 향상시킵니다.

2026년 5월 30일 오후 12시 11분

NVIDIA, X-Token 발표: Llama-3.2-1B에서 GOLD보다 평균 3.82점 향상

NVIDIA가 X-Token을 발표하며 GOLD의 두 가지 구조적 문제를 해결하고 GSM8k 정확도를 2.56에서 15.54로 향상시켰습니다.

2026년 5월 30일 오전 8시 19분

StepFun, 198B MoE 비전-언어 모델 Step 3.7 Flash 출시

StepFun이 198B MoE 모델인 Step 3.7 Flash를 출시했습니다. 이 모델은 네이티브 비전 기능과 256k 컨텍스트, 어드바이저 모드를 지원합니다.

2026년 5월 30일 오전 6시 25분

다중 GPU 및 노드를 위한 통합 커널 라이브러리 mKernel 공개

UC 버클리의 UCCL 팀이 다중 GPU 및 노드를 지원하는 mKernel을 출시했습니다. 이 라이브러리는 NVLink와 RDMA를 통합하여 효율적인 GPU 기반 통신을 가능하게 합니다.

2026년 5월 29일 오후 5시 43분

Hexo Labs, 자가 개선 에이전트 SIA 오픈소스 공개

Hexo Labs가 MIT 라이센스 하에 자가 개선 루프인 SIA를 오픈소스로 공개했습니다. 이 에이전트는 각 실행의 경로를 읽고, 구조를 재작성하거나 LoRA 가중치를 업데이트합니다.

2026년 5월 29일 오후 4시 28분

Liquid AI, 8.3B 매개변수를 가진 LFM2.5-8B-A1B 모델 출시

Liquid AI가 8.3B 매개변수 중 1.5B를 활성화한 LFM2.5-8B-A1B 모델을 출시했습니다. 이 모델은 소비자 하드웨어에서 128K의 컨텍스트, 추론 및 도구 호출 기능을 제공합니다.

2026년 5월 29일 오전 8시 29분

앤트로픽, 클로드 오퍼스 4.8 출시 – 동적 워크플로우와 저렴한 빠른 모드 제공

앤트로픽이 클로드 오퍼스 4.8을 출시하며 동적 워크플로우와 저렴한 빠른 모드를 도입했습니다. 현재 연구 미리보기 단계에 있습니다.

2026년 5월 29일 오전 7시 12분

Perplexity AI, 5배 낮은 지연 시간의 유니그램 토크나이저 오픈 소스 공개

Perplexity AI가 재작성한 유니그램 토크나이저를 오픈 소스로 공개했습니다. 이 토크나이저는 재랭커의 지연 시간을 줄이고 CPU 사용량을 5-6배 감소시킵니다.

2026년 5월 28일 오후 6시 08분

사카나 AI, 잔여 네트워크를 독립적으로 학습 가능한 모듈로 변환하는 DiffusionBlocks 제안

사카나 AI가 제안한 DiffusionBlocks는 잔여 네트워크를 독립적으로 학습할 수 있는 블록으로 변환하는 훈련 프레임워크입니다. 이 방법은 레이어 업데이트를 역 확산 잡음 제거 단계로 해석합니다.

2026년 5월 28일 오전 9시 51분

NVIDIA, GRPO 훈련을 위한 새로운 롤아웃 프레임워크 ‘Polar’ 발표

NVIDIA가 언어 에이전트를 훈련하기 위한 새로운 롤아웃 프레임워크 ‘Polar’를 발표했습니다. 이 프레임워크는 에이전트 하네스를 수정하지 않고도 강화 학습을 통해 훈련할 수 있도록 설계되었습니다.

2026년 5월 28일 오전 2시 09분

EAGLE 3.1 발표: LLM 추론의 주의력 드리프트 문제 해결 알고리즘

EAGLE 팀과 vLLM, TorchSpec이 협력하여 EAGLE 3.1을 출시했습니다. 이 알고리즘은 생산 환경에서 발생하는 추측적 디코딩의 불안정성을 해결합니다.

2026년 5월 27일 오후 4시 23분

MEMO: 새로운 지식을 위한 전용 메모리 모델 훈련 모듈형 프레임워크

NUS, MIT, A*STAR의 연구진이 LLM 파라미터를 수정하지 않고 새로운 지식을 훈련할 수 있는 MEMO라는 모듈형 프레임워크를 제안했다.

2026년 5월 27일 오후 2시 24분

D-Wave, Flatiron 주장에 대한 반박 및 초월적 시뮬레이션 이정표 재확인

D-Wave Quantum Inc.가 최근 Flatiron Institute의 주장에 대해 반박하며, 자사의 초월적 양자 컴퓨터 시뮬레이션 이정표를 재확인했습니다. 이들은 고전적인 작업이 양자 어닐링 상태 계산을 복제할 수 있다는 주장에 대응했습니다.

2026년 5월 27일 오후 12시 14분Quantum Computing Report

Together AI, OSCAR 오픈소스 공개: 주의 기반 2비트 KV 캐시 양자화 시스템

Together AI가 OSCAR(오프라인 스펙트럴 공분산 인식 회전)를 공개했습니다. 이 시스템은 긴 문맥의 LLM 서비스를 위한 INT2 KV 캐시 양자화 방법으로, 메모리 사용량을 약 8배 줄이고 디코드 속도를 최대 3배 향상시킵니다.

2026년 5월 26일 오전 6시 24분

2026년 AI 에이전트 및 MCP 서버를 위한 최적의 인증 플랫폼

2026년, AI 에이전트와 MCP 서버의 인증이 중요한 인프라 결정으로 떠오르고 있다. 이 가이드는 WorkOS, Stytch, Auth0, Composio 등 8개 주요 플랫폼을 평가한다.

2026년 5월 25일 오후 7시 34분

WorkOS, OAuth 표준 기반의 오픈 에이전트 등록 프로토콜 auth.md 발표

WorkOS가 AI 에이전트 등록을 위한 새로운 프로토콜 auth.md를 발표했습니다. 이 프로토콜은 웹 애플리케이션이 AI 에이전트의 등록 흐름과 요청할 범위를 안내하는 Markdown 파일을 제공하도록 합니다.

2026년 5월 25일 오후 4시 38분

마이크로소프트 리서치, 웹 자동화 프레임워크 ‘웹라이트’ 발표

마이크로소프트 리서치가 클릭 추적 웹 자동화를 대체하는 터미널 기반 브라우저 에이전트 프레임워크 ‘웹라이트’를 발표했다. 이 프레임워크는 GPT-5.4를 기반으로 하여 Odysseys 벤치마크에서 60.1%의 점수를 기록했다.

2026년 5월 24일 오후 5시 56분

NVIDIA, Gated DeltaNet-2 발표: 델타 규칙에서 지우기와 쓰기를 분리하는 선형 주의 레이어

NVIDIA가 Gated DeltaNet-2를 발표했습니다. 이 모델은 델타 규칙에서 기존의 내용을 지우고 새로운 내용을 쓰는 과정을 분리하여 성능을 향상시킵니다. 1.3B 파라미터로 100B FineWeb-Edu 토큰에서 훈련되어 여러 언어 모델링 작업에서 우수한 성과를 보였습니다.

2026년 5월 24일 오후 4시 42분

텐센트, AI 에이전트를 위한 로컬 메모리 시스템 ‘TencentDB Agent Memory’ 오픈소스 공개

텐센트가 MIT 라이선스 하에 AI 에이전트를 위한 로컬 메모리 시스템인 ‘TencentDB Agent Memory’를 오픈소스로 공개했다. 이 시스템은 4단계의 장기 메모리 구조를 갖추고 있으며, 성능 개선이 보고되었다.

2026년 5월 24일 오전 4시 31분

Nous Research, Contrastive Neuron Attribution(CNA) 발표

Nous Research가 LLM 행동을 조정하기 위한 새로운 방법인 Contrastive Neuron Attribution(CNA)을 발표했습니다. 이 방법은 희소 MLP 뉴런 회로를 식별하고 제거하는 방식으로, SAE 훈련이나 가중치 수정 없이도 가능합니다.

2026년 5월 23일 오후 7시 32분

퍼플렉시티, 개발자 시스템 보호를 위한 오픈소스 도구 ‘범블비’ 공개

퍼플렉시티가 자사의 검색 제품인 코멧과 컴퓨터의 개발자 시스템을 보호하기 위해 사용하는 내부 보안 도구 ‘범블비’를 오픈소스로 공개했습니다. 이 도구는 macOS와 Linux 개발자 엔드포인트를 위한 읽기 전용 재고 수집기입니다.

2026년 5월 23일 오후 5시 17분

마이크로소프트, Fara1.5 출시: OpenAI Operator와 Gemini 2.5를 초월하는 브라우저 컴퓨터 사용 에이전트

마이크로소프트 리서치가 Fara1.5를 출시했습니다. 이 에이전트는 4B, 9B, 27B 크기로 제공되며, Fara1.5-27B는 Online-Mind2Web에서 72%의 성과를 기록했습니다.

2026년 5월 22일 오후 5시 32분

자나두, 알고리즘 QROM 최적화 발표로 토폴리 게이트 오버헤드 절반으로 감소

자나두 퀀텀 테크놀로지스가 나스닥과 TSX에 상장하며, 양자 읽기 전용 메모리(QROM) 모듈의 알고리즘 최적화를 발표했다. 이 최적화는 비클리포드 연산 오버헤드를 절반으로 줄인다.

2026년 5월 22일 오전 8시 40분Quantum Computing Report

2026년, CopilotKit이 에이전틱 AI 스택을 재정의하다

CopilotKit의 2026년 배송 주기를 살펴보며, 새로운 AG-UI 프로토콜, AIMock 테스트 스위트, Pathfinder 서버가 에이전틱 AI를 위한 생산 아키텍처를 어떻게 제공하는지 알아봅니다.

2026년 5월 22일 오전 8시 23분

알리바바, Qwen3.7-Max 발표: 100만 토큰 컨텍스트 윈도우를 갖춘 추론 에이전트 모델

알리바바의 Qwen 팀이 2026 알리바바 클라우드 서밋에서 Qwen3.7-Max를 발표했습니다. 이 모델은 100만 토큰의 컨텍스트 윈도우와 확장된 사고 모드를 특징으로 하며, 코딩 및 디버깅 등 장기 작업에 최적화되어 있습니다.

2026년 5월 22일 오전 7시 33분

Cohere, Command A+ 출시: 218B 스파스 MoE 모델로 두 대의 H100 GPU에서 작동

Cohere가 Command A+를 출시했습니다. 이 모델은 218B 스파스 혼합 전문가 모델로, 이전의 네 가지 Command A 변형을 통합한 것입니다. 두 대의 H100 GPU에서 작동하며, 48개 언어를 지원합니다.

2026년 5월 22일 오전 6시 47분

2026년 오픈AI, 앤트로픽, 구글이 채용하는 포워드 배치 엔지니어란?

오픈AI가 40억 달러 규모의 배포 회사를 출범하고, 앤트로픽이 블랙스톤 및 골드만삭스와 15억 달러 규모의 합작 투자를 체결했습니다. 이들은 포워드 배치 엔지니어 모델을 중심으로 구축되었습니다.

2026년 5월 21일 오후 1시 58분

구글의 TurboQuant 알고리즘 기반의 Rust 벡터 인덱스, Turbovec 소개

Turbovec는 구글 리서치의 TurboQuant 알고리즘을 활용하여 벡터 검색을 지원하며, 16배 압축과 코드북 훈련이 필요 없는 RAG 파이프라인을 제공합니다.

2026년 5월 21일 오전 6시 42분

NVIDIA, 3가지 모드를 지원하는 언어 모델 ‘Nemotron-Labs-Diffusion’ 발표

NVIDIA가 3가지 디코딩 모드를 통합한 언어 모델 ‘Nemotron-Labs-Diffusion’을 출시했습니다. 이 모델은 3B, 8B, 14B 파라미터 크기로 제공되며, 자율 회귀, 확산 기반 병렬 디코딩, 자기 추측 디코딩을 지원합니다.

2026년 5월 20일 오후 7시 41분

알리바바, Qwen3.5-LiveTranslate-Flash 발표: 60개 언어 실시간 다중모드 통역

알리바바의 Qwen 팀이 Qwen3.5-LiveTranslate-Flash를 출시했습니다. 이 모델은 60개 언어를 지원하며, 2.8초의 지연 시간으로 오디오와 비디오를 동시에 처리합니다.

2026년 5월 20일 오후 5시 09분

구글, I/O 2026에서 더 빠르고 저렴한 Gemini 3.5 Flash 발표

구글이 I/O 2026에서 Gemini 3.5 Flash를 공개했습니다. 이 모델은 기존 플래그십 모델보다 코딩 및 에이전트 성능에서 우수하며, 속도는 4배 빠르고 비용은 절반으로 줄였습니다.

2026년 5월 20일 오후 4시 12분

2026년, Upstash, Supabase, Neon 중 어떤 데이터베이스가 적합할까?

Upstash, Supabase, Neon은 각기 다른 데이터베이스 플랫폼으로, 2026년의 코딩 워크플로우에 적합한 선택을 비교합니다.

2026년 5월 20일 오전 7시 10분

구글, I/O 2026에서 독립형 플랫폼 ‘안티그래비티 2.0’ 발표

구글이 I/O 2026 개발자 키노트에서 AI 지원 개발 방식을 혁신하는 ‘안티그래비티 2.0’을 발표했다. 이 플랫폼은 에이전트 오케스트레이션을 중심으로 구성된 독립형 데스크톱 애플리케이션이다.

2026년 5월 20일 오전 5시 30분

2026년 최고의 기업용 에이전틱 AI 플랫폼

2026년 기업용 에이전틱 AI가 파일럿 단계를 넘어 실제 운영에 들어갔습니다. 이 가이드는 Salesforce Agentforce, Microsoft Copilot Studio 등 10대 플랫폼을 가격과 도입 데이터를 기반으로 평가합니다.

2026년 5월 19일 오후 5시 24분

사용자 데이터를 보호하는 MemPrivacy: 엣지-클라우드 프레임워크 소개

MemTensor, HONOR Device, 그리고 동지대학교의 연구팀이 사용자 데이터를 보호하면서도 메모리 유용성을 유지하는 MemPrivacy 프레임워크를 발표했습니다.

2026년 5월 19일 오전 6시 26분

NVIDIA, NVFP4를 활용한 4비트 사전 훈련 방법론 발표

NVIDIA가 NVFP4 마이크로 스케일링 포맷을 기반으로 한 4비트 사전 훈련 방법론을 소개했습니다. 이 방법론은 12B 하이브리드 맘바-트랜스포머에서 10조 개의 토큰으로 검증되었습니다.

2026년 5월 18일 오후 5시 42분

Vercel Labs, AI 에이전트를 위한 시스템 프로그래밍 언어 ‘제로’ 발표

Vercel Labs가 AI 에이전트가 인간의 해석 없이도 네이티브 프로그램을 읽고 수정하며 배포할 수 있도록 설계된 시스템 프로그래밍 언어 ‘제로’를 발표했다.

2026년 5월 17일 오후 5시 11분

Nous Research, 1.4~1.7배 빠른 프리트레인 속도를 제공하는 라이트하우스 어텐션 발표

Nous Research가 발표한 라이트하우스 어텐션은 선택 기반의 계층적 어텐션 메커니즘으로, 프리트레인 중에만 사용되며, 기존의 방법보다 1.4~1.7배 빠른 속도를 자랑합니다.

2026년 5월 17일 오전 7시 23분

LiteLLM 에이전트 플랫폼 소개: 쿠버네티스 기반의 자가 호스팅 인프라

BerriAI가 개발한 LiteLLM 에이전트 플랫폼은 AI 에이전트를 안정적으로 운영할 수 있는 솔루션으로, 격리된 환경에서의 세션 관리 기능을 제공합니다.

2026년 5월 17일 오전 2시 59분

NVIDIA, 단일 GPU에서 720p 비디오 생성하는 SANA-WM 공개

NVIDIA가 SANA-WM을 소개했습니다. 이 오픈소스 모델은 60초 길이의 720p 비디오를 생성하며, 6자유도 카메라 제어를 지원합니다. 64개의 H100 GPU로 훈련되었고, 단일 RTX 5090에서 배포 가능합니다.

2026년 5월 16일 오후 4시 52분

Zyphra, 최초의 MoE 확산 모델 ZAYA1-8B-Diffusion-Preview 출시

Zyphra가 자가 회귀 LLM에서 변환된 최초의 MoE 확산 모델 ZAYA1-8B-Diffusion-Preview를 발표했다. 이 모델은 최대 7.7배의 추론 속도 향상을 보여준다.

2026년 5월 16일 오전 5시 00분

2026년 소프트웨어 개발을 위한 최고의 AI 에이전트 순위

2026년 AI 코딩 에이전트 분야는 더욱 발전하고 복잡해졌습니다. Claude Code는 코드 품질에서 87.6%로 선두를 달리고 있으며, GPT-5.5는 82.7%로 뒤를 잇고 있습니다. 그러나 OpenAI가 오염된 것으로 선언한 벤치마크가 여전히 사용되고 있습니다.

2026년 5월 15일 오후 5시 23분

Poetiq의 메타 시스템, LiveCodeBench Pro에서 모든 LLM 성능 향상

Poetiq의 메타 시스템이 Gemini 3.1 Pro를 사용해 LiveCodeBench Pro를 위한 모델 비의존적 추론 하네스를 자동으로 구축하고 최적화했습니다. 이 하네스는 다른 모델에도 적용되어 모두 성능이 향상되었습니다.

2026년 5월 15일 오후 12시 38분

Cline, 오픈 소스 에이전트 런타임 Cline SDK 출시

Cline이 내부 에이전트 하니스를 오픈 소스 TypeScript SDK인 @cline/sdk로 분리하여 출시했습니다. 이 SDK는 CLI와 칸반을 지원하며, VS Code와 JetBrains 확장도 이전 중입니다.

2026년 5월 15일 오전 7시 57분

Nous Research, LLM 사전 훈련 속도 2.5배 향상하는 토큰 슈퍼포지션 트레이닝 발표

Nous Research가 LLM 사전 훈련 시간을 최대 2.5배 단축할 수 있는 토큰 슈퍼포지션 트레이닝(TST) 방법을 발표했다. 이 방법은 모델 아키텍처를 변경하지 않고도 훈련 효율성을 높인다.

2026년 5월 14일 오후 2시 46분

패스티노 랩스, 3억 개 파라미터의 안전 모더레이션 모델 GLiGuard 오픈 소스 공개

패스티노 랩스가 3억 개 파라미터를 가진 오픈 소스 안전 모더레이션 모델 GLiGuard를 공개했습니다. 이 모델은 네 가지 안전 작업을 단일 처리로 수행하며, 기존 모델보다 높은 처리량과 낮은 지연 시간을 자랑합니다.

2026년 5월 14일 오전 5시 41분

틸드 리서치, 뮤온의 숨겨진 뉴런 사망 문제를 해결하는 오로라 최적화기 발표

틸드 리서치가 신경망 훈련을 위한 새로운 최적화기 오로라를 발표했다. 이 최적화기는 널리 사용되는 뮤온 최적화기의 구조적 결함을 해결하며, 훈련 중 상당수의 MLP 뉴런이 영구적으로 사망하는 문제를 다룬다.

2026년 5월 12일 오후 5시 07분

메타와 스탠포드 연구진, 토큰화 없이 50% 이상 메모리 대역폭 절감하는 빠른 바이트 잠재 변환기 제안

메타 FAIR와 스탠포드 대학의 연구진이 서브워드 토큰화 없이 50% 이상의 메모리 대역폭 비용을 줄이는 세 가지 추론 방법을 제안했습니다.

2026년 5월 12일 오전 2시 52분

사카나 AI와 NVIDIA, LLM의 추론 및 훈련 속도 향상 위한 TwELL 발표

사카나 AI와 NVIDIA 연구팀이 L1 정규화를 통해 피드포워드 레이어에서 99% 이상의 희소성을 달성하고, 새로운 희소 데이터 형식과 융합된 CUDA 커널을 활용해 GPU 처리 성능을 향상시켰다고 발표했다.

2026년 5월 11일 오후 5시 36분

2026년 최고의 벡터 데이터베이스: 가격, 확장 한계 및 아키텍처 비교

벡터 데이터베이스는 RAG 및 에이전틱 AI의 핵심 검색 인프라로 자리잡고 있습니다. 이 가이드는 아키텍처, 가격, 확장성 측면에서 9개의 주요 시스템을 비교합니다.

2026년 5월 11일 오전 8시 56분

NVIDIA, Rust에서 CUDA로 변환하는 실험적 컴파일러 cuda-oxide 발표

NVIDIA의 NVlabs가 Rust로 작성된 GPU 커널을 PTX로 변환하는 실험적 컴파일러인 cuda-oxide v0.1.0을 출시했다. 이 컴파일러는 단일 명령어로 호스트와 장치 코드를 동시에 컴파일할 수 있다.

2026년 5월 10일 오후 3시 01분

NVIDIA, 30B, 23B, 12B 모델을 포함한 Star Elastic 발표

NVIDIA가 Star Elastic을 발표했습니다. 이 방법은 30B, 23B, 12B 파라미터 규모의 여러 추론 모델을 하나의 체크포인트에 통합하여 훈련 효율성을 높입니다.

2026년 5월 10일 오전 7시 24분

GitHub, AI 코딩 에이전트를 위한 오픈 소스 툴킷 ‘Spec-Kit’ 공개

GitHub가 AI 코딩 에이전트를 위한 새로운 오픈 소스 툴킷 ‘Spec-Kit’을 발표했습니다. 이 툴킷은 명세 기반 개발을 지원하며, AI 코딩 에이전트의 한계를 극복하는 데 도움을 줄 것으로 기대됩니다.

2026년 5월 9일 오후 12시 59분

OpenAI, Codex에 Chrome 확장 프로그램 추가

OpenAI가 Codex의 Chrome 확장 프로그램을 출시하여 AI 에이전트가 LinkedIn, Salesforce, Gmail 등 다양한 웹사이트에 접근할 수 있게 되었습니다.

2026년 5월 9일 오전 7시 22분

라이트시크 재단, 에이전틱 작업을 위한 오픈소스 LLM 추론 엔진 ‘토큰스피드’ 출시

라이트시크 재단이 에이전틱 코딩 시스템의 성능을 높이기 위해 오픈소스 LLM 추론 엔진 ‘토큰스피드’를 발표했다. 이 엔진은 TensorRT-LLM 수준의 성능을 목표로 하고 있다.

2026년 5월 8일 오전 7시 03분

메타 AI, NeuroAI 모델 벤치마킹을 위한 오픈소스 프레임워크 NeuralBench 출시

메타 AI 팀이 NeuroAI 모델을 벤치마킹하기 위한 오픈소스 프레임워크 NeuralBench를 출시했습니다. 이 프레임워크는 36개의 EEG 작업과 94개의 데이터셋을 포함하며, 9,478명의 피험자와 13,603시간의 뇌 기록을 기반으로 합니다.

2026년 5월 7일 오후 5시 37분

OpenAI, 대규모 AI 슈퍼컴퓨터 훈련을 위한 새로운 네트워킹 프로토콜 MRC 발표

OpenAI가 AMD, 브로드컴, 인텔, 마이크로소프트, NVIDIA와 협력하여 MRC(다중 경로 신뢰 연결)라는 새로운 오픈 네트워킹 프로토콜을 개발했습니다. 이 프로토콜은 대규모 AI 훈련 클러스터의 GPU 네트워킹 성능과 복원력을 향상시킵니다.

2026년 5월 7일 오후 4시 50분

Zyphra, AMD 하드웨어로 훈련된 ZAYA1-8B 모델 출시

Zyphra가 760M의 활성 파라미터를 가진 추론 Mixture of Experts 모델 ZAYA1-8B를 출시했다. 이 모델은 수학 및 코딩 벤치마크에서 기존의 대형 모델들을 능가하며, 새로운 지능 밀도를 제시하고 있다.

2026년 5월 7일 오후 2시 44분

CopilotKit, 에이전트 애플리케이션에 지속적인 메모리를 제공하는 기업 인텔리전스 플랫폼 출시

CopilotKit Intelligence는 오픈소스 CopilotKit 스택 위에 관리되는 지속성 레이어를 추가하여 에이전트가 컨텍스트와 상태, 상호작용 기록을 유지할 수 있도록 지원합니다.

2026년 5월 7일 오전 6시 10분

1 2 3 4 다음 »