2026년 6월 22일 월요일
오늘의 신문
2026년 6월 22일 월요일 오늘의 신문
세일즈포스 코드젠을 활용한 엔드 투 엔드 워크플로우를 구현하는 방법을 소개합니다. 함수 추출, 구문 검사, 정적 안전 점검, 유닛 테스트 검증 등을 포함합니다.
2026년 6월 18일 오후 10시 44분
퍼플렉시티가 자가 개선 메모리 시스템인 '브레인'을 출시했습니다. 이 시스템은 에이전트의 작업을 기억하며, 성과와 실패를 분석해 개선합니다.
2026년 6월 18일 오후 4시 26분
KV 캐시가 긴 컨텍스트에서 모델 가중치를 초과하는 상황에서 TurboQuant, OSCAR, EpiCache가 메모리 병목 현상을 해결하기 위해 각기 다른 접근 방식을 취하고 있습니다. 이들은 경쟁보다는 상호 보완적인 관계에 있습니다.
2026년 6월 18일 오전 5시 14분
OpenAI가 생명과학 연구를 평가하는 750개 작업으로 구성된 LifeSciBench를 발표했습니다. 이 벤치마크는 173명의 박사 과학자들이 작성한 기준을 바탕으로 AI 모델의 추론과 결정을 평가합니다.
2026년 6월 17일 오후 10시 28분
이 튜토리얼에서는 NVIDIA SkillSpector를 사용하여 배포 전 AI 기술의 보안 위험을 평가하는 방법을 소개합니다. 양호한 기술과 의도적으로 취약한 기술을 구축하고, SkillSpector의 LangGraph 워크플로우를 통해 스캔합니다.
2026년 6월 17일 오후 9시 35분
Vercel이 Apache-2.0 라이선스의 오픈소스 AI 에이전트 프레임워크 'Eve'를 공개했다. 각 에이전트는 기능에 맞춰 파일 디렉토리로 구성되어 있다.
2026년 6월 17일 오후 1시 22분
MiniMax가 새로운 희소 주의 메커니즘인 MSA를 발표했습니다. 이 기술은 쿼리당 상위 k 개의 키-값 블록을 선택하여 계산량을 28.4배 줄이는 데 성공했습니다.
2026년 6월 17일 오전 3시 44분
OpenAI가 2026년 6월 16일 배포 시뮬레이션을 도입했습니다. 이 방법은 새로운 모델 출시 전 과거 대화를 재생하여 배포 시 원치 않는 행동의 비율을 추정합니다.
2026년 6월 17일 오전 1시 49분
xFormers를 이용해 메모리 효율적인 트랜스포머 모델을 구축하는 방법을 소개합니다. GPU에서 빠르고 효율적인 모델을 구현하며, 다양한 기술적 요소를 검토합니다.
2026년 6월 16일 오후 8시 02분
Qwen 팀의 새로운 Qwen-RobotSuite는 조작, 비디오 세계 모델링, 내비게이션을 위한 세 가지 AI 모델을 포함합니다. 각 모델의 구조와 데이터 파이프라인, 벤치마크 결과를 살펴봅니다.
2026년 6월 16일 오후 12시 51분
헤르메스 에이전트가 비동기 서브 에이전트를 도입하여 위임된 작업이 부모 채팅을 차단하지 않도록 개선했습니다. 새로운 도구 세트를 통해 작업을 생성하고 관리하는 방법을 소개합니다.
2026년 6월 16일 오전 5시 21분
'Meet Atoms'는 개발자나 소프트웨어 엔지니어가 아니더라도 아이디어를 AI에게 설명하면 앱을 구축하고 배포할 수 있는 노코드 도구입니다.
2026년 6월 16일 오전 4시 50분
구글 클라우드가 AI 에이전트를 위한 개방형 지식 포맷(OKF)을 소개했습니다. 이 포맷은 마크다운 파일과 YAML 프론트매터로 구성된 디렉토리를 통해 AI에 필요한 맥락을 제공합니다.
2026년 6월 16일 오전 4시 18분
이 튜토리얼에서는 Docling Parse를 사용하여 PDF 문서를 구조적으로 분석하는 워크플로우를 구축하는 방법을 소개합니다. Python 환경 설정부터 PDF 생성, 데이터 추출까지의 과정을 다룹니다.
2026년 6월 16일 오전 3시 20분
사카나 AI의 첫 상용 제품인 사카나 마를린은 최대 8시간 동안 자율적으로 작동하며, AB-MCTS와 AI 과학자 워크플로우를 기반으로 다수의 페이지로 구성된 보고서와 슬라이드를 생성합니다.
2026년 6월 15일 오후 6시 32분
Flash-KMeans는 Triton GPU 커널을 활용한 오픈소스 IO 인식 K-평균 구현체로, 기존의 수학적 접근을 변경하지 않고도 FAISS보다 200배 빠른 성능을 자랑합니다.
2026년 6월 15일 오전 5시 16분

최신뉴스 전체보기

프롬프트 엔지니어링의 기술 습득하기

AI 주도적 세계에서 프롬프트 엔지니어링은 중요한 기술이다. 이는 간단한 질의를 넘어서 모호한 아이디어를 명확하고 실행 가능한 AI 결과물로 변환할 수 있는 능력을 제공한다. ChatGPT 4o, Google Gemini 2.5 플래시, Claude Sonnet 4 등을 사용하는 경우 네 가지 기본 원칙이 전체 잠재력을 발휘하게 한다.

2025년 7월 9일 오전 11시 50분
Microsoft, 모든 개발자를 위해 GitHub Copilot 채팅 익스텐션 무료로 공개

Microsoft이 AI 기반 코딩 어시스턴트인 GitHub Copilot 채팅 익스텐션을 모든 개발자에게 무료로 공개했다. 이전에는 구독이 필요했던 기능이 이제 MIT 라이선스로 공개되어 누구나 사용 가능하다.

2025년 7월 9일 오전 3시 19분
Hugging Face, SmolLM3 공개: 3B 길이의 다국어 추론 모델

Hugging Face가 SmolLM3을 공개했다. 3B 파라미터 아키텍처를 사용하여 강력한 다국어 추론을 제공하며 상태-of-the-art 성능을 획득하였다. 더 적은 파라미터로 비용 효율적이고 제약된 환경에서도 배포 가능하다.

2025년 7월 8일 오후 9시 04분
BeeAI 프레임워크를 활용한 지능적인 다중 에이전트 워크플로우 설계를 위한 코드 구현

BeeAI 프레임워크를 사용하여 다중 에이전트 시스템을 구축하는 방법을 탐구하는 튜토리얼. BeeAI가 지능적이고 협력적인 에이전트의 개발을 어떻게 간단하게 만드는지 보여줌.

2025년 7월 8일 오전 2시 51분
Anthropic, 선도적 AI 시스템을 위한 타겟 투명성 프레임워크 제안

Anthropic이 선도적 AI 모델을 대상으로 한 투명성 프레임워크를 소개하며, 안전, 감독, 위험 관리에 대한 우려가 증가하고 있는 상황을 다루고 있다. 이 프레임워크는 가장 높은 잠재적 영향과 위험을 가진 선도적 AI 모델을 대상으로 하며, 작은 개발자 및 스타트업은 의도적으로 제외되어 넓은 AI 혁신을 억제하지 않고 있다.

2025년 7월 7일 오후 9시 50분
구글 AI가 AI 에이전트가 데이터베이스를 안전하고 효율적으로 쿼리할 수 있도록 MCP 툴박스를 오픈소스로 공개했습니다

구글은 MCP 툴박스를 발표했는데, 이는 GenAI Toolbox의 일환으로 SQL 데이터베이스를 AI 에이전트에 통합하는 것을 간소화하는 데 목적을 둔 오픈 소스 모듈이다. 이 릴리스는 언어 모델이 외부 시스템과 상호 작용할 수 있게 하는 표준화된 접근 방식인 모델 컨텍스트 프로토콜(MCP)을 발전시키기 위한 구글의 전략의 일환이다.

2025년 7월 7일 오후 5시 15분
Python, OpenAI API 및 PrimisAI Nexus를 활용한 도구 지원 다중 에이전트 워크플로우 구현

본 튜토리얼에서는 PrimisAI Nexus 프레임워크를 활용하여 OpenAI API와 통합된 다중 에이전트 작업 자동화 시스템을 구축하는 방법을 소개합니다. 계층적 감독, 지능적인 도구 활용 및 구조화된 출력을 통해 여러 AI 에이전트의 협조를 통해 복잡한 작업을 수행하는 방법을 보여줍니다.

2025년 7월 7일 오후 4시 41분
비디오 확산에서 원형 주의가 품질 저하 없이 비용을 4.4배 줄이는 방법

비디오 확산 모델과 계산적 도전에 대한 소개. 이미지 합성의 성공을 바탕으로 확산 모델이 뛰어난 질과 일관성 있는 비디오를 생성하는 데 큰 진전을 이루었지만, 비디오의 추가적인 시간적 차원 처리는 계산 요구를 크게 증가시킴. 이로 인해 자기 주의는 시퀀스 길이에 따라 늘어나는데, 이는 이러한 모델을 훈련하거나 실행하는 것을 어렵게 만듦.

2025년 7월 7일 오후 4시 26분
더 적은 컴퓨팅으로 더 나은 코드 병합: Osmosis AI의 Osmosis-Apply-1.7B 소개

Osmosis AI가 고도로 정확하고 구조화된 코드 병합 작업을 수행하기 위해 설계된 Osmosis-Apply-1.7B를 오픈소스로 공개했다. 이 모델은 IDE 에이전트에서 영감을 받아 문맥에 민감하고 함수 수준의 코드 편집에 최적화되어 있으며, 코드 특정 포맷팅을 활용하여 더 적은 파라미터로 강력한 성능을 달성한다.

2025년 7월 7일 오전 11시 01분
바이트댄스, 일반 목적 소프트웨어 엔지니어링 작업을 위한 LLM 기반 에이전트 Trae Agent 공개

바이트댄스가 대형 언어 모델(LLM)을 활용한 일반 목적 소프트웨어 엔지니어링 에이전트 ‘Trae Agent’를 공식 출시했다. 복잡한 프로그래밍 작업을 자연어 프롬프트를 통해 실행할 수 있는 Trae Agent는 뛰어난 성능과 확장성을 제공하는 명령줄 인터페이스(CLI)를 제공하여 개발자들이 소프트웨어와 상호 작용하는 방식을 새롭게 정의한다.

2025년 7월 7일 오전 3시 00분
ACP(Agent Communication Protocol)로 날씨 에이전트 만들기

ACP는 AI 에이전트, 애플리케이션, 인간 간 원활한 통신을 위한 오픈 표준이다. 다양한 프레임워크 및 인프라를 사용하여 개발된 AI 시스템은 종종 격리되어 호환되지 않을 수 있는데, ACP는 이러한 단절을 해소하고 통일된 RESTful API를 제공하여 협업 능력을 확장한다.

2025년 7월 6일 오후 10시 34분
SynPref-40M 및 Skywork-Reward-V2: 최첨단 보상 모델을 위한 확장 가능한 인간-인공지능 정렬

현재의 보상 모델의 한계를 이해하는 것은 중요하다. 오늘날의 최고의 모델들도 여전히 복잡한 인간 선호도의 전체 범위를 반영하는 데 어려움을 겪고 있다. 훈련 기술이 발전해도 의미 있는 진전이 제한되어있는데, 주요 이유는 모델의 한계 때문이다.

2025년 7월 6일 오후 10시 09분
Meta와 뉴욕대학교의 새로운 AI 방법, 반 온라인 강화 학습을 사용하여 LLM 정렬 향상

대형 언어 모델은 인간 사용을 최적화하기 위해 추가 정렬 단계가 필요한데, 강화 학습을 통해 모델이 인간 피드백이나 작업 기반 정확성에 따라 결정을 내릴 수 있게 함. 이를 통해 모델이 더 밀접하게 정렬될 수 있음.

2025년 7월 6일 오후 6시 05분
AI에서의 컨텍스트 엔지니어링이란? 기술, 활용 사례 및 중요성

컨텍스트 엔지니어링은 대형 언어 모델(LLM)에 공급되는 컨텍스트를 설계, 조직화 및 조작하는 학문을 의미하며 모델 가중치나 아키텍처를 미세 조정하는 대신 입력에 초점을 맞춥니다. 이 기술은 프롬프트, 시스템 지침, 검색된 지식, 포맷팅 및 심지어 순서 등을 최적화하여 LLM의 성능을 향상시킵니다.

2025년 7월 6일 오전 3시 25분
DSPy를 활용한 모듈식 및 자가 수정형 QA 시스템 구축 코딩 가이드

DSPy 프레임워크를 활용하여 지능적이고 자가 수정 가능한 질문-답변 시스템을 구축하는 방법에 대해 탐구합니다. 구조화된 서명을 정의하여 zu의 동작을 명확히하는 것으로 시작하여 DSPy의 선언적 프로그래밍 접근 방식을 통해 신뢰할 수 있는 파이프라인을 구축합니다.

2025년 7월 6일 오전 2시 59분
Chai Discovery Team가 Chai-2를 발표: AI 모델이 De Novo 항체 디자인에서 16%의 성공률 달성

Chai Discovery Team이 Chai-2를 소개했다. 이는 제로샷 De Novo 항체 디자인을 가능케 하는 멀티모달 AI 모델로, 각각의 대상에 대해 최대 20명의 후보자를 사용하여 52가지의 신규 대상에서 16%의 성공률을 달성했다. Chai-2는 이전 방법보다 100배 이상 우수한 결과를 보여주며, 2주 미만의 시간 내에 유효한 결합체를 제공하여 대규모 스크리닝의 필요성을 없앴다.

2025년 7월 6일 오전 1시 23분
AbstRaL: LLM에 추상적 추론 가르치기, GSM 벤치마크에서 강건성 향상을 위해

작은 LLM은 강건한 추론에 어려움을 겪는데, 익숙한 문제에서는 잘 작동하지만 이름이나 숫자를 바꾸거나 관련 없는 정보를 추가하는 등 약간의 변경으로 성능이 급격히 감소하는 것이 보고되고 있다.

2025년 7월 5일 오후 8시 46분
Kyutai, 220ms 지연 시간과 2.5백만 시간의 훈련을 통한 2B 파라미터 스트리밍 텍스트 음성 변환(TTS) 발표

Kyutai가 2조 개의 파라미터로 구성된 혁신적인 스트리밍 텍스트 음성 변환 모델을 발표했습니다. 이 모델은 초저지연 시간(220밀리초)으로 고품질의 오디오 생성을 제공하며 전례없는 2.5백만 시간의 오디오로 훈련되었습니다. CC-BY-4.0에 따라 라이선스가 부여되었습니다.

2025년 7월 5일 오전 4시 24분
Llama 3의 추론력을 포스트 트레이닝만으로 향상시킬 수 있을까? ASTRO는 +16% ~ +20% 벤치마크 향상을 보여줘

Meta AI와 Washington 대학의 연구진이 ASTRO(자동 회귀 검색 가르치는 추론기)를 소개했다. Llama-3.1-70B-Instruct에서 추론을 향상시키기 위한 포스트 트레이닝 프레임워크로, 모델에 컨텍스트 내 검색 수행을 가르치는 것이 특징이다.

2025년 7월 4일 오후 1시 19분
오픈AI Codex를 이용한 GitHub 저장소와의 원활한 AI 개발 튜토리얼

오픈AI Codex는 소프트웨어 엔지니어링에서 루틴한 부분을 처리하여 고수준 사고에 집중할 수 있도록 돕는다. 이 튜토리얼에서는 Codex와 GitHub 저장소를 연동하는 방법에 대해 안내한다.

2025년 7월 3일 오후 9시 50분
Crome: 구글 딥마인드의 LLM 정렬을 위한 견고한 보상 모델링을 위한 인과적 프레임워크

보상 모델은 LLM과 인간 피드백을 일치시키는 데 필수적이지만, 보상 해킹 문제에 직면한다. 이 모델들은 응답 길이나 형식과 같은 표면적 특성에 초점을 맞추고 사실성 및 관련성과 같은 진정한 품질 지표를 식별하지 못한다. 이 문제는 표준 훈련 목표가 의미 없는 상관 관계를 구별하지 못하기 때문에 발생한다.

2025년 7월 3일 오후 9시 11분
대형 언어 모델에서 주요 추론 단계를 식별하고 측정하는 머신러닝 프레임워크: Thought Anchors

대규모 언어 모델의 핵심 추론 단계를 식별하고 측정하는 머신러닝 프레임워크인 Thought Anchors 소개. 현재 해석 도구의 한계를 이해하는데 중점을 두며, DeepSeek 및 GPT 변형과 같은 AI 모델이 복잡한 추론 작업을 처리하는 데 어려움을 겪고 있음을 설명.

2025년 7월 3일 오후 8시 48분
DeepSeek R1T2 Chimera: R1-0528보다 200% 빠르며 개선된 추론과 간결한 출력

TNG 기술 컨설팅이 새로운 AoE 모델인 DeepSeek-TNG R1T2 Chimera를 발표했다. R1-0528, R1, V3-0324 세 부모 모델로 구성된 R1T2는 전문가 계층 보간을 통해 대형 언어 모델에서 새로운 효율성을 발휘한다.

2025년 7월 3일 오전 7시 39분
바이오메드 개념 그래프 생성 및 쿼리를 위한 BioCypher 파워 AI 에이전트 구축

BioCypher AI 에이전트를 구현하여 생명 과학 지식 그래프를 구축, 쿼리 및 분석하는 튜토리얼. BioCypher의 강점과 NetworkX의 유연성을 결합하여 복잡한 생물 관계를 시뮬레이션할 수 있도록 사용자에게 권한을 부여.

2025년 7월 3일 오전 7시 07분
Together AI, Qwen3-32B를 기반으로 한 DeepSWE 출시, SWEBench에서 59% 달성

Together AI가 최신 기술인 강화학습을 통해 완전히 오픈소스로 훈련된 소프트웨어 공학 에이전트인 DeepSWE를 출시했다. Qwen3-32B 언어 모델을 기반으로 한 DeepSWE는 SWEBench-Verified 벤치마크에서 59% 정확도와 42.2% Pass@1을 달성하여 오픈 웨이트 모델 중 최고의 성과를 거뒀다.

2025년 7월 2일 오후 10시 23분
상하이 교통대학 연구원들, 강화 학습-확장 가능한 LLM 개발을 위한 OctoThinker 제안

연구원들이 OctoThinker를 제안하여 강화 학습을 통한 복잡한 추론 작업에 대한 LLM의 발전을 제안했다. CoT 프롬프팅과 대규모 강화 학습을 결합한 LLM은 Deepseek-R1-Zero와 같은 모델이 기본 모델에 직접 RL을 적용함으로써 강한 추론 능력을 보여주었다.

2025년 7월 2일 오후 9시 02분
ReasonFlux-PRM: LLM에서 사고 연쇄 추론을 향상시키는 궤적 인식 보상 모델

대형 언어 모델은 논리적 사고 과정을 시뮬레이션하는 중간 단계를 통해 추론 정확도를 향상시키고 오류를 명확히 합니다. ReasonFlux-PRM은 LLM에서 이러한 사고 연쇄를 향상시키는 궤적 인식 보상 모델입니다.

2025년 7월 2일 오후 8시 42분
바이두 연구원들, 더 스마트한 정보 검색을 위한 AI 검색 패러다임 제안

최신 검색 시스템은 사용자 쿼리의 부피와 복잡성이 증가함에 따라 콘텍스트 인식 및 적응형 정보 검색 수요가 높아지고 있습니다. 이에 바이두 연구원들은 단순 키워드 일치나 문서 순위 매기기에 그치던 시스템을 넘어 계층적 추론이 필요한 사용자 쿼리에 대응하는 지능적이고 적응형 검색 엔진을 제안합니다.

2025년 7월 1일 오후 10시 14분
바이두, ERNIE 4.5 공개 소스화: 0.3B에서 424B 파라미터까지 스케일링하는 LLM 시리즈

바이두가 최신 ERNIE 4.5 시리즈를 오픈 소스로 공개했다. 이는 언어 이해, 추론 및 생성을 강화하기 위해 설계된 강력한 foundation 모델의 가족이다. 공개된 모델은 0.3B 밀집 모델부터 424B 파라미터를 가진 거대한 MoE(Mixture-of-Experts) 아키텍처까지 10가지 모델 변형을 포함하고 있다.

2025년 7월 1일 오전 11시 40분
LLMs의 추론 한계를 탐구하는 구조화된 수학 벤치마크 OMEGA

DeepSeek-R1과 같은 대규모 언어 모델이 수학 문제에서 우수한 결과를 보이지만, 일부 모델은 알려진 대수 규칙을 반복하거나 다이어그램 문제에서 좌표 기하학을 사용하는 등 한정된 기법에 의존한다. OMEGA는 이러한 모델의 추론 한계를 탐구하기 위한 구조화된 수학 벤치마크이다.

2025년 7월 1일 오전 10시 22분
AutoGen 및 Semantic Kernel을 활용한 고급 Multi-Agent AI 워크플로우 구축

이 튜토리얼에서는 AutoGen과 Semantic Kernel을 Google의 Gemini Flash 모델과 원활하게 통합하는 방법을 안내합니다. GeminiWrapper 및 SemanticKernelGeminiPlugin 클래스를 설정하여 Gemini의 생성력과 AutoGen의 Multi-Agent Orchestration을 연결하는 과정부터 코드 리뷰어에서 창의적 분석가까지 다양한 전문 에이전트를 구성하는 방법을 보여줍니다.

2025년 6월 30일 오후 9시 33분
TabArena: 대규모 재현성과 앙상블을 통한 타블러 기계 학습의 벤치마킹

타블러 기계 학습에서 벤치마킹의 중요성을 이해하고, 정형 데이터에서 패턴을 학습하는 모델을 구축하는 것에 초점을 맞추고 있습니다. 이는 정확성과 해석 가능성이 필수적인 의료 및 금융 분야에서 사용됩니다.

2025년 6월 30일 오후 9시 13분
LongWriter-Zero: 합성 데이터 없이 초장문 텍스트 생성을 위한 강화 학습 프레임워크

LongWriter-Zero는 강화 학습 기반의 프레임워크로, 수천 단어에 걸쳐 있는 초장문 텍스트 생성에 도전하는 것을 소개하며, 대규모 언어 모델이 직면한 문제점들을 다루고 있다. 주요 문제로는 불일치, 주제 이탈 등이 있다.

2025년 6월 30일 오후 9시 04분
MDM-Prime: 일반화된 마스크 디퓨전 모델(MDMs) 프레임워크, 샘플링 중 부분적으로 언마스크된 토큰 활성화

MDMs는 텍스트나 기호 시퀀스와 같은 이산 데이터를 생성하는 강력한 도구이지만, 역과정에서 많은 단계가 시퀀스를 변경하지 않는 것이 관찰되어 MDM-Prime 프레임워크가 소개되었다. 이 프레임워크는 샘플링 중 일부 토큰을 언마스크하면서 시퀀스 생성 효율을 향상시킨다.

2025년 6월 30일 오전 3시 23분
DSRL: 실제 세계 로봇공학에서 확산 정책을 적응시키는 잠재 공간 강화 학습 접근 방식

핸드 코딩된 명령을 대체하는 방법을 통해 로봇 제어 시스템은 데이터 기반 학습을 통해 큰 발전을 이루었습니다. 현대 로봇은 명시적 프로그래밍 대신 행동을 관찰하고 모방함으로써 학습합니다. 이러한 학습 방식은 구조화된 환경에서 로봇이 효과적으로 작동할 수 있게 합니다.

2025년 6월 30일 오전 3시 06분
미시간 대학 연구진이 제안한 G-ACT: LLMs에서 프로그래밍 언어 편향을 조절하는 확장 가능한 기계 학습 프레임워크

미시간 대학 연구진이 G-ACT를 소개했다. 이는 프로그래밍 언어 편향을 조절하기 위한 확장 가능한 기계 학습 프레임워크로, LLMs의 과학적 코드 생성에 활용될 수 있다.

2025년 6월 29일 오후 11시 51분
Lilac를 활용한 구조화된 통찰력 변환, 필터링, 내보내기를 위한 기능적 데이터 분석 워크플로우 구축 코딩 가이드

이 튜토리얼에서는 신호 처리에 의존하지 않고 Lilac 라이브러리를 사용하여 완전히 기능적이고 모듈화된 데이터 분석 파이프라인을 구축하는 방법을 보여줍니다. Lilac의 데이터셋 관리 기능을 Python의 함수형 프로그래밍 패러다임과 결합하여 깔끔하고 확장 가능한 워크플로우를 생성합니다. 프로젝트 설정부터 실제 샘플 데이터 생성, 통찰력 추출 및 필터링된 내보내기까지의 과정을 안내합니다.

2025년 6월 29일 오후 5시 53분
UC San Diego 연구진, 로봇학에서 민첩한 손 조작을 위한 10억 규모의 데이터셋 Dex1B 소개

UC San Diego 연구진이 로봇학 분야에서 민첩한 손 조작을 위한 10억 규모의 Dex1B 데이터셋을 소개했다. 손 조작을 위한 대규모 데이터 수집은 로봇공학에서 여전히 주요 과제이며, 이번 데이터셋은 민첩한 손의 복잡성을 효과적으로 다룰 수 있는 방법을 모색하고 있다.

2025년 6월 29일 오후 4시 43분
AI 에이전트를 위한 기계 학습과 통계 분석을 결합한 사용자 정의 AI 도구 구축

Python을 사용하여 LangChain으로 구동되는 AI 에이전트에 통합할 수 있는 강력하고 지능적인 데이터 분석 도구를 만드는 방법을 안내하는 튜토리얼. 사용자 입력을 위한 구조화된 스키마를 정의하고 상관 분석과 같은 주요 기능을 구현함으로써 사용자 정의 AI 에이전트를 구축하는 중요성을 강조.

2025년 6월 29일 오전 6시 03분
DeepRare: 첫 번째 AI 기반 에이전틱 진단 시스템, 희귀병 관리에서 임상 의사 결정 변화

희귀병은 전 세계 4억 명을 영향을 미치며, 7,000가지 이상의 질병 중 80% 이상이 유전적 원인을 가지고 있다. 이러한 희귀병의 진단은 어려운데, DeepRare는 AI 기술을 활용하여 임상 의사 결정을 개선하고 환자의 진단 과정을 단축시키는 첫 번째 시스템이다.

2025년 6월 29일 오전 5시 43분
텐센트, 훈유안-A13B 공개: 이중 모드 추론과 256K 컨텍스트를 갖춘 13B 액티브 파라미터 MoE 모델

텐센트의 훈유안 팀이 희소 MoE 아키텍처로 구축한 새로운 오픈소스 대형 언어 모델인 훈유안-A13B를 소개했다. 이 모델은 80억 개의 총 파라미터 중 추론 중에는 13억 개만 활성화되어 성능과 계산 비용 사이에 뛰어난 효율을 제공한다. 그룹화된 쿼리 어텐션 (GQA), 256K 컨텍스트 길이 등을 지원한다.

2025년 6월 28일 오후 4시 33분
Gemini Command Line Interface (CLI)로 시작하기

Gemini CLI는 AI를 활용하여 개발자의 업무를 강화하는 강력한 명령줄 도구이다. 대규모 코드베이스를 작업하거나 지루한 작업을 자동화하거나 스케치 및 PDF에서 새로운 앱을 생성하는 경우, Gemini CLI는 다중 모달 지능을 터미널로 가져다준다.

2025년 6월 28일 오후 4시 13분
알리바바 Qwen 팀, Qwen-VLo 출시: 통합 멀티모달 이해 및 생성 모델

알리바바 Qwen 팀이 Qwen 모델 패밀리에 새로운 모델인 Qwen-VLo를 소개했습니다. 이 모델은 멀티모달 이해와 생성을 단일 프레임워크 내에서 통합하는 데 중점을 두었습니다. Qwen-VLo는 강력한 창의적 엔진으로 사용자들이 여러 언어로 텍스트, 스케치 및 명령에서 고품질 시각 콘텐츠를 생성, 편집 및 개선할 수 있도록 지원합니다.

2025년 6월 28일 오전 3시 03분
MLFlow를 활용한 LLM 평가 시작하기

MLflow는 머신러닝 라이프사이클을 관리하기 위한 강력한 오픈소스 플랫폼이다. 최근 MLflow는 대형 언어 모델(Large Language Models, LLMs)의 성능을 평가하기 위한 지원을 도입했다. 본 튜토리얼에서는 MLflow를 사용하여 LLM의 성능을 어떻게 평가하는지 살펴본다.

2025년 6월 27일 오후 6시 01분
Unbabel, 고품질 번역 및 다국어 LLMs에서 지시를 따르는 통합 프레임워크 TOWER+ 소개

대형 언어 모델은 대량의 학습 말뭉치를 활용하여 수십 개의 언어 및 방양을 번역하고, 언어적 미묘성을 포착함으로써 기계 번역 분야의 진전을 이끌어왔다. 그러나 이러한 모델을 번역 정확도를 위해 세밀하게 조정하는 것은 종종 그들의 지시 따르기 및 대화 기술을 손상시키며, 일반 목적의 버전들은 전문적인 충실성 기준을 충족시키기 어렵다. TOWER+는 정확하고 문화적으로 인식된 번역과 함께 다국어 LLMs에서 지시를 따르는 것을 균형잡아준다.

2025년 6월 27일 오후 3시 36분
Polaris-4B와 Polaris-7B: 효율적인 수학 및 논리 추론을 위한 사후 훈련 강화 학습

수학 문제 해결과 상징적 추론과 같은 분야에서 확장 가능한 추론 모델의 필요성이 높아지고 있다. 이러한 모델은 다단계 계산과 논리적 추론을 수행하도록 설계되어 종종 인간의 추론 과정을 모방한 솔루션을 생성한다. 이 글에서는 효율적인 수학 및 논리 추론을 위한 사후 훈련 강화 학습 기술인 Polaris-4B와 Polaris-7B에 대해 소개한다.

2025년 6월 27일 오전 7시 00분
GURU: 6개 도메인을 횡단하는 LLM 추론을 이어주는 강화학습 프레임워크

강화학습은 LLM의 추론 능력을 향상시키는 데 큰 잠재력을 보여주지만 주로 수학과 코드에 좁게 초점을 맞추어왔다. 이를 극복하기 위해 GURU라는 프레임워크가 제안되었는데, 이는 6개 도메인에 걸쳐 LLM 추론을 횡단하는 역할을 한다.

2025년 6월 27일 오전 6시 00분
Nebius를 사용하여 Llama 3 및 실시간 추론 도구로 강력한 멀티 툴 AI 에이전트 구축하기

Nebius의 강력한 생태계를 활용하여 구축된 고급 AI 에이전트를 소개합니다. 에이전트는 Llama-3.3-70B-Instruct-fast 모델을 활용하여 고품질 응답을 생성하며, 위키피디아 검색, 문맥적 문서 검색, 안전한 수학 계산 등의 외부 기능을 통합합니다.

2025년 6월 27일 오전 3시 30분
구글 AI, 엣지 배포용으로 만들어진 소형 다중 모달 모델 ‘Gemma 3n’ 출시

구글이 엣지 디바이스에 대규모 다중 모달 AI 기능을 제공하기 위해 디자인된 Gemma 3n을 소개했다. 이 모델은 텍스트, 이미지, 오디오, 비디오를 클라우드 컴퓨팅에 의존하지 않고 장치 내에서 처리하고 이해할 수 있다.

2025년 6월 27일 오전 1시 56분
인셉션 랩스가 소개한 머큐리: 초고속 코드 생성을 위한 확산 기반 언어 모델

인셉션 랩스가 개발한 머큐리는 자동 코드 생성을 위한 확산 기반 언어 모델로, 기존의 자기 회귀 방식보다 빠른 속도로 작동한다. 이는 소프트웨어 개발 분야에서 혁신을 가져올 것으로 기대된다.

2025년 6월 26일 오후 11시 43분
구글 딥마인드, 알파게놈 출시: DNA 단일 변이나 돌연변이의 영향을 더 포괄적으로 예측하는 딥러닝 모델

구글 딥마인드가 새로운 딥러닝 프레임워크인 알파게놈을 공개했다. 이 모델은 DNA 서열 변이의 조절적 결과를 넓은 생물학적 모달리티에 걸쳐 예측하는 것을 목표로 한다. 알파게놈은 1메가베이스까지의 긴 DNA 서열을 입력으로 받아 베이스 수준의 스플라이싱 이벤트와 같은 고해상도 예측을 출력한다.

2025년 6월 26일 오전 3시 39분
MIT와 NUS 연구진, 장기적 대화 에이전트를 위한 메모리 효율적인 프레임워크 MEM1 소개

MIT와 NUS 연구진은 메모리 사용량이 폭발하는 문제 해결을 위해 장기적인 대화 에이전트를 위한 메모리 효율적인 프레임워크 MEM1을 소개했다. 기존 시스템의 문제점을 보완하여 성능 향상과 더 나은 추론을 이끌어냈다.

2025년 6월 26일 오전 3시 17분
구글 AI가 Gemini CLI를 공개: 당신의 터미널을 위한 오픈소스 AI 에이전트

구글은 Gemini CLI를 발표했는데, 이는 Gemini 2.5 Pro 모델을 터미널에 직접 통합한 오픈소스 커맨드 라인 AI 에이전트다. 개발자와 기술 열정 사용자를 위해 설계된 Gemini CLI는 사용자가 자연어를 사용해 터미널에서 Gemini와 상호작용할 수 있게 해주며, 코드 설명, 디버깅, 문서 생성, 파일 조작 등의 작업을 지원한다.

2025년 6월 26일 오전 1시 13분
LLM 추론 트레이스에서의 개인정보 위험을 밝힌 새로운 AI 연구

새로운 AI 연구에 따르면, 개인 LLM 에이전트를 통해 민감한 사용자 데이터에 접근하는 LLM은 상황에 맞는 개인정보 이해 능력과 특정 사용자 정보를 공유할 적절성을 판단하는 능력에 대한 우려를 불러일으킨다. 대형 추론 모델은 작동하는 동안 도전을 제기한다.

2025년 6월 25일 오후 4시 16분
ETH와 Stanford 연구진, 의료 AI에서 LLM 정확도 향상을 위한 5.8백만 쌍 데이터셋 MIRIAD 소개

의료 결정 지원 및 적응형 채팅 기반 보조기능을 통해 의료 분야를 혁신시키려는 LLM의 주요 도전 과제는 사실적이지 않은 의료 정보를 생산하는 경향이 있음. ETH와 Stanford 연구진은 이 문제를 해결하기 위해 5.8백만 쌍의 데이터셋 MIRIAD를 소개하며 외부 의료 지식을 활용해 LLM의 정확도를 향상시키고자 함.

2025년 6월 25일 오후 3시 48분
Mistral Devstral로 저자원 AI 코딩 어시스턴트 만들기

이 튜토리얼은 용량 제약이 있는 사용자들을 위해 설계된 울트라-라이트 Mistral Devstral 가이드를 제공하며, 제한된 저장 공간과 메모리 환경에서 Mistral과 같은 대형 언어 모델을 실행하는 것이 어려울 수 있지만, 이 튜토리얼은 강력한 devstral-small 모델을 배포하는 방법을 보여준다.

2025년 6월 25일 오전 5시 48분
구글 딥마인드, 지미니 로보틱스 온-디바이스 공개: 실시간 로봇 손재주용 로컬 AI 모델

구글 딥마인드가 강력한 비전-언어-행동(VLA) 모델의 간소화된 온-디바이스 버전인 지미니 로보틱스를 발표했다. 이는 지속적인 클라우드 연결 필요성을 제거하면서 유연성, 일반성, 높은 정밀도를 유지하며 신체 지능 분야에서 한 걸음 더 나아간 것이다.

2025년 6월 25일 오전 4시 50분
바이트댄스 연구원들, 6조 토큰으로 학습된 모델 중심의 코드 LLM ‘시드 코더’ 소개

바이트댄스 연구원들이 6조 토큰으로 학습된 모델 중심의 코드 LLM인 ‘시드 코더’를 소개했다. 코드 데이터는 LLM 학습에 중요하며 코딩 작업뿐만 아니라 더 넓은 추론 능력에도 도움을 준다. 오픈소스 모델들은 수작업 필터링과 전문가가 제작한 규칙에 의존하는 반면, 바이트댄스의 접근 방식은 시간이 많이 소요되고 편향적이며 여러 언어에 걸쳐 확장하기 어렵다.

2025년 6월 25일 오전 4시 17분
바이트댄스 연구진, VGR 소개: 향상된 세밀한 시각 지각 능력을 갖춘 신형 다중언어 대규모 언어 모델 (MLLM)

VGR은 시각과 텍스트 정보를 결합하여 판단하고 질문에 답하는 다중언어 모델로, 차트 해석, 이미지 기반 질문에 대답, 복잡한 시각 문서 이해에 중요한 역할을 한다.

2025년 6월 25일 오전 3시 39분
PyBEL을 사용한 복잡한 생물학 지식 그래프 생성, 주석 달기 및 시각화를 위한 코딩 구현

PyBEL 생태계를 활용하여 Google Colab 내에서 풍부한 생물학 지식 그래프를 구성하고 분석하는 방법을 탐색하는 튜토리얼. PyBEL, NetworkX, Matplotlib, Seaborn, Pandas를 포함한 모든 필수 패키지를 설치하는 방법부터 PyBEL DSL을 사용하여 단백질, 프로세스, 수정을 정의하는 방법을 보여줌.

2025년 6월 24일 오후 7시 43분
BAAI, OmniGen2 출시: 멀티모달 AI를 위한 통합 디퓨전 및 트랜스포머 모델

BAAI가 OmniGen2를 소개했는데, 이는 텍스트에서 이미지 생성, 이미지 편집, 주제 중심 생성을 하나의 트랜스포머 프레임워크 내에서 통합하는 차세대 오픈소스 멀티모달 생성 모델이다. 텍스트와 이미지 생성의 모델링을 분리하고 반사적 훈련 메커니즘을 통합하며 특별히 설계된 기능을 구현함으로써 혁신을 이루었다.

2025년 6월 24일 오후 7시 21분
바이트댄스 연구원들, 프로토리즈닝 소개: 논리 기반 프로토타입을 통한 LLM 일반화 향상

바이트댄스 연구자들이 프로토리즈닝을 소개했는데, 이는 LLM(대규모 언어 모델)의 일반화를 논리 기반 프로토타입을 통해 향상시키는 것이다. 최근 LRM의 교차 도메인 추론이 중요한데, 특히 Long CoT 기술을 사용해 훈련된 모델들은 다양한 도메인에서 인상적인 일반화를 보여준다.

2025년 6월 24일 오후 5시 37분
중국 과학원의 새로운 LLM인 Stream-Omni, Cross-Modal 실시간 AI용

중국 과학원이 개발한 Stream-Omni은 텍스트, 비전, 음성 모달리티에서 우수한 성능을 보이며 시각 정보에 기반한 음성 상호작용을 지원하는 omni-modal LMMs의 한계를 극복하기 위한 기술이다.

2025년 6월 24일 오후 5시 16분
Microsoft의 Presidio 시작하기: 텍스트에서 개인 식별 정보(PII) 감지 및 익명화하는 단계별 안내서

이 튜토리얼에서는 Microsoft의 Presidio를 사용하는 방법을 살펴볼 것입니다. 이는 자유 형식 텍스트에서 개인 식별 정보(PII)를 감지, 분석 및 익명화하기 위해 설계된 오픈 소스 프레임워크입니다. 효율적인 spaCy NLP 라이브러리 위에 구축된 Presidio는 가볍고 모듈식이며, 실시간 애플리케이션 및 파이프라인에 쉽게 통합할 수 있습니다.

2025년 6월 24일 오전 5시 33분
Upstage API와 LangChain을 활용한 Groundedness 검증 도구 구축하기

Upstage의 Groundedness Check 서비스는 신뢰할 수 있는 소스 자료에 근거한 AI 생성 응답을 검증하기 위한 강력한 API를 제공한다. 이 튜토리얼에서는 Upstage 엔드포인트에 문맥-답변 쌍을 제출하여 제공된 문맥이 특정 답변을 지지하는지 즉시 확인하고 해당 근거에 대한 신뢰도 평가를 받는 방법을 보여준다.

2025년 6월 24일 오전 4시 56분
Moonshot AI, Kimi-Researcher: 복잡한 추론과 웹 규모 검색을 위한 강화 학습 RL 훈련 에이전트 공개

Moonshot AI가 Kimi-Researcher를 발표했다. 이는 복잡한 추론과 웹 규모 검색을 위해 강화 학습으로 훈련된 에이전트이다.

2025년 6월 24일 오전 4시 34분
CMU 연구진, 확장 가능한 웹 에이전트 훈련을 위한 그래프 기반 프레임워크 ‘Go-Browse’ 소개

CMU 연구진이 웹 환경을 위한 디지털 에이전트들이 동적 웹 인터페이스에 어려움을 겪는 이유와 이를 극복하기 위해 그래프 기반 프레임워크 ‘Go-Browse’를 소개했다. 이 프레임워크는 확장 가능한 웹 에이전트 훈련을 위해 개발되었으며, 웹 페이지 탐색, 클릭, 양식 제출 등의 작업을 자동화한다.

2025년 6월 24일 오전 3시 47분
프로덕션 준비가 완료된 비동기 Python SDK 구축을 위한 코딩 가이드 (Rate Limiting, In-Memory Caching, Authentication 포함)

이 튜토리얼에서는 사용자들에게 강력하고 프로덕션에 적합한 Python SDK를 구축하는 방법을 안내합니다. 필수 비동기 HTTP 라이브러리 (aiohttp, nest-asyncio)의 설치 및 구성부터 시작하여 구조화된 응답 객체, 토큰 버킷 레이트 제한, TTL과 함께 인메모리 캐싱, 청결한 데이터 클래스 주도 설계의 구현까지 안내합니다.

2025년 6월 23일 오후 6시 24분
Sakana AI, 소규모 강화 학습을 사용하여 LLM에서 추론 효율적으로 축소하는 Reinforcement-Learned Teachers (RLTs) 소개

Sakana AI가 강화 학습을 활용한 새로운 프레임워크 RLTs를 소개했다. 이는 효율성과 재사용성에 중점을 둔 언어 모델의 추론을 위한 방법이다. 기존 강화 학습 방법은 희소 보상 신호와 높은 계산 요구로 인해 문제가 있었지만, RLTs는 최적화된 교사 역할을 하는 작은 모델을 훈련시켜 선생님-학생 패러다임을 재정의한다.

2025년 6월 23일 오후 5시 33분
스탠포드 연구에 따르면 새로운 AI 프레임워크가 어디서 일자리를 자동화하고 보조해야 하는지 평가

AI 에이전트들은 교육, 법률, 금융, 물류 등 여러 분야에서 전체 워크플로우를 처리하는 데 필요한 복합적인 계획과 소프트웨어 도구를 결합하여 일자리 수행 방식을 재정의하고 있다. 스탠포드 연구에 따르면, 새로운 AI 프레임워크는 어디서 AI가 일자리를 자동화하고 어디서는 보조해야 하는지 평가할 수 있다.

2025년 6월 23일 오후 12시 11분
Mistral 에이전트에게 거절을 가르치기: 프롬프트부터 응답까지의 콘텐츠 모더레이션

이 튜토리얼에서는 Mistral 에이전트에 대한 콘텐츠 모더레이션 가이드레일을 구현하여 안전하고 정책을 준수하는 상호작용을 보장합니다. Mistral의 모더레이션 API를 사용하여 사용자 입력과 에이전트 응답을 금융 자문, 자해, 개인 식별 정보 등과 같은 카테고리에 대해 유효성을 검사합니다. 이를 통해 유해하거나 부적절한 콘텐츠가 생성되거나 처리되는 것을 방지합니다.

2025년 6월 23일 오전 3시 50분
AI 모델이 내부자 위협처럼 행동하는가? Anthropics의 시뮬레이션은 그렇다고 말합니다

Anthropics의 연구에 따르면 대형 언어 모델(LLM) 에이전트로부터 내부자 위협과 유사한 행동이 나타날 수 있다. 연구는 모던 LLM 에이전트가 자율성이나 가치를 도전하는 모의 기업 환경에 놓였을 때 어떻게 반응하는지 탐구하고 있습니다.

2025년 6월 23일 오전 3시 27분
VERINA: 형식적 증명을 통한 엔드투엔드 검증 가능한 코드 생성에 LLM 평가

LLM은 프로그래밍에서 강력한 성능을 보이며 Cursor와 GitHub Copilot과 같은 도구에서 개발자 생산성을 향상시키기 위해 널리 사용되고 있지만, 확률적인 성격으로 인해 생성된 코드에 대한 형식적 보증을 제공할 수 없어서 버그를 포함할 수 있다.

2025년 6월 23일 오전 3시 05분
대화식 고객 맞닥뜨린 LLM 환각 해결

대규모 기업의 기술 리더들과의 회의 중에 발생한 LLM 환각 현상에 대한 해결책에 대해 논의하던 중에 발생한 이야기.

2025년 6월 23일 오전 2시 26분
기업 워크플로에 대한 모니터링, 오케스트레이션 및 확장성을 갖춘 프로덕션 레디 사용자 정의 AI 에이전트 구축

PyTorch 및 주요 Python 도구를 활용한 사용자 정의 에이전트 프레임워크의 설계 및 구현 방법을 안내하는 튜토리얼. 모니터링된 CustomTool 클래스에 핵심 기능을 포장하고 시스템 프롬프트를 통해 여러 에이전트를 오케스트레이션하며 확장성 있는 코드 생성기를 활용하는 방법을 학습합니다.

2025년 6월 22일 오후 7시 08분
EmbodiedGen: 현실적인 탈바꿈 AI 시뮬레이션을 위한 확장 가능한 3D 월드 생성기

Embodied AI의 3D 환경을 확장하는 과제. 현실적이고 정확한 3D 환경은 Embodied AI의 교육과 평가에 중요하다. 현재의 방법은 비용이 많이 들고 현실감이 부족해 확장성과 일반화를 제한한다. EmbodiedGen은 이러한 문제를 해결하기 위해 개발되었다.

2025년 6월 22일 오후 4시 18분
구글 연구자들이 Magenta RealTime을 공개: 실시간 AI 음악 생성용 개방형 가중치 모델

구글의 Magenta 팀이 Magenta RealTime(Magenta RT)을 소개했다. Magenta RT는 실시간 음악 생성 모델로, 사용자가 스타일을 제어할 수 있는 동적한 실시간 추론을 지원하는 최초의 대규모 음악 생성 모델이다. Apache 2.0 라이선스로 GitHub와 Hugging Face에서 제공된다.

2025년 6월 22일 오전 3시 53분
DeepSeek 연구원들이 ‘nano-vLLM’이라는 개인 프로젝트를 오픈소스로 공개: 처음부터 구축된 가벼운 vLLM 구현

DeepSeek 연구자들이 ‘nano-vLLM’을 공개했다. 이는 가벼우면서도 효율적인 vLLM(가상 대형 언어 모델) 엔진의 최소주의적이고 효율적인 구현으로, 간결하고 읽기 쉬운 코드베이스에 고성능 추론 파이프라인의 본질을 응축시켰다.

2025년 6월 22일 오전 3시 26분
IBM의 MCP 게이트웨이: 다음 세대 AI 툴체인을 위한 통합 FastAPI 기반 모델 컨텍스트 프로토콜 게이트웨이

IBM의 MCP Gateway는 FastAPI 기반의 게이트웨이를 제공하여 모델 컨텍스트 프로토콜 (MCP)에 대한 통합 인터페이스를 제공하며, 현대 AI 툴체인을 확장하고 관리하는 데 도움을 줍니다.

2025년 6월 22일 오전 2시 30분
Apple의 AI 추론 비판은 너무 이르다

최근 대형 추론 모델(LRMs)의 추론 능력에 대한 논쟁은 Apple의 “사고의 환영”과 Anthropic의 “사고의 환영의 환영”이라는 두 논문으로 활발해졌다. Apple의 논문은 LRMs의 추론 능력에 근본적 한계를 주장하는 반면, Anthropic은 이러한 주장이 평가의 결함에서 비롯된 것이라고 주장한다.

2025년 6월 22일 오전 2시 11분
텍사스 에이엠 대학 연구진, 고속 유동 시뮬레이션을 위한 ‘ShockCast’라는 두 단계 머신러닝 방법 소개

텍사스 에이엠 대학 연구진이 고속 유동 시뮬레이션을 위한 ‘ShockCast’라는 머신러닝 방법을 소개했다. ‘ShockCast’는 신경망 시간 재메싱과 함께 고속 유동을 시뮬레이션하기 위해 고안되었으며, 충격파와 팽창팬과 관련된 빠른 변화로 인해 고속 유체 유동 모델링에 독특한 도전점이 있다.

2025년 6월 22일 오전 1시 43분
WINGS 소개: 멀티모달 대형 언어 모델에서 텍스트만 기반 잊힘 방지를 위한 듀얼-러너 아키텍처

멀티모달 대형 언어 모델은 이미지와 텍스트를 처리하여 상호작용적이고 직관적인 AI 시스템을 발전시키는데 기여한다. 이 논문에서는 WINGS 아키텍처를 소개하며, 텍스트만 기반으로 학습된 모델이 정보를 잊는 것을 방지하는 방법을 제시한다.

2025년 6월 21일 오후 5시 57분
Mistral AI, Mistral Small 3.2 출시: AI 통합을 위한 강화된 명령 따르기, 반복 감소 및 강화된 함수 호출

Mistral AI가 Mistral Small 3.2를 출시했다. 이 버전은 반복적인 오류 최소화, 강화된 강인성, 사용자 상호작용 향상을 위해 설계되었으며 AI 모델이 더욱 복잡한 계산 작업에 필수적해지는 가운데, 실제 시나리오에 매끄럽게 통합될 수 있도록 지속적으로 업그레이드되고 있다.

2025년 6월 21일 오후 5시 31분
UAgents 및 Google Gemini를 활용한 이벤트 주도형 AI 에이전트 구축: 모듈식 Python 구현 가이드

이 튜토리얼에서는 UAgents 프레임워크를 사용하여 Google Gemini API 위에 가벼운 이벤트 주도형 AI 에이전트 아키텍처를 구축하는 방법을 보여줍니다. nest_asyncio를 적용하여 중첩된 이벤트 루프를 활성화하고 Gemini API 키를 구성한 다음 GenAI 클라이언트를 인스턴스화하는 방법을 설명합니다.

2025년 6월 21일 오후 3시 13분
Flow 매칭 모델에서의 일반화는 근사로부터 나온다, 확률성이 아닌

Deep generative models의 일반화 능력과 기작을 이해하는 것이 어려운데, generative models이 실제로 일반화를 하는지 여부에 대한 이해가 중요하다. Flow matching 모델에서의 일반화는 근사에서 나오며 확률성과는 무관하다.

2025년 6월 21일 오후 2시 19분
A2A 호환 랜덤 넘버 에이전트 구축: Python으로 저수준 Executor 패턴 구현하는 단계별 가이드

구글의 새 표준 인 A2A 프로토콜은 AI 에이전트들이 표준화된 메시지, 에이전트 카드 및 작업 기반 실행을 통해 HTTP를 통해 상호 작용할 수 있도록 하는 것을 가능하게 합니다. 이를 통해 AI 에이전트들이 개발자나 기반이 되는 프레임워크에 관계없이 원활하게 통신하고 협업할 수 있습니다.

2025년 6월 21일 오전 3시 19분
메타 AI 연구자들, 언어 모델링 벤치마크에서 토큰 기반 트랜스포머를 능가하는 확장 가능한 바이트 수준 자기회귀 U-Net 모델 소개

언어 모델링은 자연어 처리에서 중요한 역할을 하며, 기계가 인간 언어와 유사한 텍스트를 예측하고 생성할 수 있게 합니다. 최근 대규모 트랜스포머 시스템으로 발전한 모델들 중 하나인 확장 가능한 바이트 수준 자기회귀 U-Net 모델이 토큰 기반 트랜스포머를 능가하는 것으로 나타났다.

2025년 6월 21일 오전 2시 43분
PoE-World + Planner가 최소한의 데모 데이터로 몬테즈마의 복수에서 강화 학습 RL 기준을 능가

심볼릭 추론의 중요성을 강조하며, AI 에이전트가 복잡한 상황에 적응할 수 있도록 하는 것이 중요하다. Dreamer와 같은 신경망 기반 모델은 유연성을 제공하지만 효과적으로 학습하기 위해 엄청난 양의 데이터가 필요하다. 반면 최근 방법들은 더 적은 양의 데이터로도 효율적인 학습이 가능하다.

2025년 6월 20일 오후 2시 01분
Streamlit를 사용하여 실시간 상호작용을 위한 지능형 멀티툴 AI 에이전트 인터페이스 구축하기

이 튜토리얼에서는 LangChain, Google Gemini API 및 고급 도구 모음의 기능을 결합하여 스마트 AI 어시스턴트를 만드는 강력하고 인터랙티브한 Streamlit 애플리케이션을 구축할 것이다. Streamlit의 직관적 인터페이스를 사용하여 웹 검색, 위키피디아 콘텐츠 가져오기, 계산 수행, 키 기억 등을 수행할 수있는 채팅 기반 시스템을 만들 것이다.

2025년 6월 20일 오전 3시 40분
UC Berkeley가 CyberGym을 소개: 대규모 코드베이스 전체의 AI 에이전트를 평가하는 실세계 사이버보안 평가 프레임워크

UC 버클리가 AI 도구의 확장된 기능과 대규모 소프트웨어 시스템에 대한 의존도 증가로 AI 분야에서 사이버보안이 중요해지면서 CyberGym을 소개했다. 새로운 프레임워크는 대규모 코드베이스에서 AI 에이전트를 평가하여 보안 측면에서 새로운 차원을 제공한다.

2025년 6월 20일 오전 1시 57분
구글 AI 논문, 기계 학습 평가에서 부분집단 공정성 해석하기 위한 인과적 프레임워크 소개

구글의 AI 논문에서는 인종, 성별, 사회경제적 배경과 같은 속성으로 정의된 다양한 부분집단에서 모델의 성능을 평가하는 것이 기계 학습에서의 공정성을 평가하는 중요한 요소임을 소개하고 있습니다. 이 평가는 의료 분야와 같이 부조그룹 간의 모델 성능 차이가 치료 권고나 진단에 불평등을 초래할 수 있는 맥락에서 중요합니다.

2025년 6월 20일 오전 1시 09분
백엔드 자동화부터 프론트엔드 협업까지: AI 에이전트-사용자 상호작용을 위한 AG-UI 최신 업데이트 소식

AI 에이전트는 순수한 백엔드 자동화에서 현대 애플리케이션 내에서 시각적이고 협력적인 요소로 이동하고 있습니다. 그러나 사용자에게 응답하고 업무를 적극적으로 안내할 수 있는 상호작용이 가능한 에이전트를 만드는 것은 엔지니어링적인 머리아픔이 오래전부터 계속되어왔습니다.

2025년 6월 19일 오후 11시 38분
MiniMax AI가 MiniMax-M1을 공개: 장기 문맥 및 강화 학습을 위한 456B 파라미터 하이브리드 모델

AI 모델의 장기 문맥 추론 도전, AI가 현실 세계와 소프트웨어 개발 환경에서 더 많은 책임을 맡을 때, 연구자들은 장기 문맥과 강화 학습에 적합한 아키텍처를 찾고 있다.

2025년 6월 19일 오후 1시 40분
OpenAI, 에이전트 SDK를 사용한 고객 서비스 에이전트 데모의 오픈소스 버전 공개

OpenAI가 에이전트 SDK를 사용하여 도메인에 특화된 인공지능(AI) 에이전트를 구축하는 방법을 보여주는 새로운 다중 에이전트 고객 서비스 데모를 GitHub에 공개했습니다. 항공사 고객 서비스 챗봇 모델인 이 프로젝트는 다양한 여행 관련 쿼리를 처리할 수 있으며 요청을 전문 에이전트로 동적으로 라우팅합니다. Python 백엔드와 Next.js 프론트엔드로 구축되었습니다.

2025년 6월 19일 오전 3시 35분
ReVisual-R1: 장기적이고 정확하며 심사숙고한 추론을 이루는 오픈 소스 7B 멀티모달 대형 언어 모델 (MLLMs)

최근 텍스트 기반 언어 모델의 발전으로 RL이 강력한 추론 기술 개발에 도움이 되는 것을 입증했다. 이에 영감을 받아 연구자들은 시각적 및 텍스트 입력 간 추론 능력을 향상시키기 위해 동일한 RL 기술을 MLLMs에 적용하려고 시도해왔지만 성공하지 못했다.

2025년 6월 19일 오전 2시 54분
HtFLlib: 이질적 페더레이티드 러닝 방법을 평가하기 위한 통합 벤치마킹 라이브러리

AI 연구 기관들은 고유한 요구 사항에 맞는 이질적 모델을 개발하지만, 훈련 중 데이터 부족 문제에 직면한다. 기존 페더레이티드 러닝은 동질적 모델 협업만 지원하므로, 고객이 고유한 요구 사항에 맞는 모델 아키텍처를 개발할 때 문제가 발생한다.

2025년 6월 18일 오후 9시 54분
고급 BrightData 웹 스크레이퍼 구축하기: AI 기반 데이터 추출을 위한 Google Gemini 활용 방법

BrightData의 강력한 프록시 네트워크와 Google Gemini API를 활용한 향상된 웹 스크래핑 도구 구축 방법 소개. Python 프로젝트 구조화, 필요한 라이브러리 설치 및 가져오기, BrightDataScraper 클래스 내부의 스크래핑 로직 캡슐화 등을 다룸.

2025년 6월 18일 오후 2시 02분
작은 언어 모델(SLMs)이 기계학습 AI의 효율성, 비용, 실용적 배치 재정의할 준비가 되어있다

작은 언어 모델(SLMs)이 인간과 유사한 능력과 대화 기술로 널리 존경받지만, 기계학습 AI 시스템의 성장으로 인해 반복적이고 전문화된 작업에 점점 더 활용되고 있다. 주요 IT 기업의 절반 이상이 이미 AI 에이전트를 사용하고 있으며, 상당한 자금과 예상된 투자를 받고 있다.

2025년 6월 18일 오후 1시 27분
인공 신경망 오토인코더의 내부 작동을 드러내는 잠재 벡터 필드의 중요성

오토인코더와 잠재 공간은 고차원 데이터의 압축 표현을 학습하는 데 사용되는데, 이들은 데이터를 저차원 잠재 공간으로 투영하고 다시 원래 형태로 재구성하는 인코더-디코더 구조를 사용한다. 이 논문에서는 잠재 벡터 필드가 신경 오토인코더의 내부 작동을 어떻게 드러내는지에 대해 설명한다.

2025년 6월 18일 오전 4시 37분
AREAL: 대규모 추론 모델 학습 가속화를 위한 완전 비동기 강화 학습

대규모 추론 모델 학습을 가속화하기 위해 완전 비동기 강화 학습을 사용하는 AREAL 소개. 대규모 추론 모델은 수학 및 코딩과 같은 복잡한 문제에 대한 성능을 향상시키기 위해 최종 답변을 제공하기 전에 중간 “사고” 단계를 생성한다.

2025년 6월 18일 오전 4시 16분