
‘AutoAgent’는 AI 엔지니어가 자신의 에이전트를 최적화할 수 있도록 돕는 오픈소스 라이브러리입니다. 반복적인 작업을 줄이고 효율성을 높이는 데 기여할 것으로 기대됩니다.

‘AutoAgent’는 AI 엔지니어가 자신의 에이전트를 최적화할 수 있도록 돕는 오픈소스 라이브러리입니다. 반복적인 작업을 줄이고 효율성을 높이는 데 기여할 것으로 기대됩니다.
패션은 항상 사람의 선호를 예측하는 것이며, 오늘날 인공지능을 통해 이러한 예측이 가능해졌다. 알고리즘과 머신러닝을 활용하여 패션의 미래를 디자인하는 방법을 살펴본다.

넷플릭스 AI 팀이 동영상에서 물체를 지우는 AI 모델 ‘VOID’를 오픈소스로 공개했습니다. 이 모델은 물체 제거 후에도 자연스러운 장면을 유지하는 데 도움을 줍니다.
이 튜토리얼에서는 Z.AI의 GLM-5 모델을 활용하여 실제 에이전틱 애플리케이션을 위한 시스템 구축 방법을 소개합니다. 기본 환경 설정부터 고급 기능까지 단계별로 설명합니다.
구글 딥마인드의 연구팀이 LLM을 활용해 게임 이론 알고리즘을 스스로 재작성하는 AlphaEvolve를 개발했습니다. 이 시스템은 전문가들을 능가하는 성과를 보였습니다.

기술 혁신 연구소(TII)가 자연어 프롬프트를 활용한 오픈 어휘 그라운딩 및 세분화를 위한 0.6B 매개변수 초기 융합 변환기 ‘Falcon Perception’을 발표했다. 이 기술은 언어와 비전 간의 상호작용을 개선할 것으로 기대된다.
이 튜토리얼에서는 NVIDIA 모델 최적화기를 사용하여 Google Colab에서 딥러닝 모델을 훈련하고 가지치기 및 미세 조정하는 전체 파이프라인을 구축하는 방법을 설명합니다.

Arcee AI가 복잡한 다단계 추론이 가능한 오픈 소스 AI 모델 ‘Trinity Large Thinking’을 Apache 2.0 라이선스 하에 공개했다. 이는 개발자들에게 투명한 대안을 제공한다.

구글의 최신 모델을 NVIDIA RTX AI PC에서 더욱 빠르게 실행하여 개인화된 AI 어시스턴트를 구축할 수 있는 방법을 소개합니다. 이 과정에서 발생하는 ‘토큰 세금’ 문제를 해결하는 기술적 진전을 다룹니다.

IBM이 기업급 문서 데이터 추출을 위해 설계된 비전-언어 모델인 Granite 4.0 3B 비전을 출시했습니다. 이 모델은 고충실도의 시각적 추론을 제공하는 전문 어댑터로 구성되어 있습니다.
이 튜토리얼에서는 AgentScope 워크플로우를 처음부터 끝까지 구축하고 Colab에서 실행하는 방법을 설명합니다. OpenAI와 AgentScope를 연결하고 기본 모델 호출을 검증하는 과정이 포함됩니다.

Z.ai가 GLM-5V-Turbo를 출시했습니다. 이 모델은 시각적 인식과 코드 실행 간의 간극을 메우는 데 중점을 두고 있으며, 소프트웨어 엔지니어링에 필요한 엄격한 구문으로 시각 정보를 변환하는 데 강점을 보입니다.
이 튜토리얼에서는 Hugging Face Transformers와 HF Token을 사용하여 Gemma 3 1B 인스트럭션을 위한 Colab 워크플로우를 구축하고 실행하는 방법을 단계별로 설명합니다.
Hugging Face가 TRL(Transformer Reinforcement Learning) v1.0을 공식 출시했습니다. 이 버전은 연구 중심의 라이브러리에서 안정적인 프로덕션 준비 프레임워크로의 전환을 의미합니다.

구글이 비디오 생성 포트폴리오의 새로운 모델인 Veo 3.1 Lite를 발표했다. 이 모델은 생산 규모 배포의 주요 장애물인 가격 문제를 해결하기 위해 설계되었다.

Liquid AI가 LFM2.5-350M 모델을 출시했습니다. 이 모델은 28T 토큰으로 훈련된 350M 파라미터의 컴팩트한 구조로, 기존의 스케일링 법칙에 도전하는 사례로 주목받고 있습니다.
이 튜토리얼에서는 A-Evolve 프레임워크를 사용하여 OpenAI 기반의 에이전트를 구축하고, 맞춤형 벤치마크를 정의하며, 진화 엔진을 개발하는 과정을 설명합니다.

알리바바 Qwen 팀이 Qwen3.5-Omni를 출시했습니다. 이 모델은 텍스트, 오디오, 비디오를 통합하여 실시간 상호작용을 지원하는 멀티모달 언어 모델로, 기존의 모델들과 차별화된 점이 있습니다.

마이크로소프트가 다양한 언어에 대한 고품질 의미 표현을 제공하는 다국어 텍스트 임베딩 모델 Harrier-OSS-v1을 발표했다. 이 모델은 270M, 0.6B, 27B의 세 가지 규모로 제공된다.

세일즈포스 AI 연구팀이 음성 AI의 반응 속도를 획기적으로 개선하는 VoiceAgentRAG를 발표했다. 이 기술은 음성 기반 RAG 시스템의 지연 시간을 크게 줄여 자연스러운 대화 흐름을 유지할 수 있도록 돕는다.

에이전트 인프라가 AI 에이전트를 위한 올인원 런타임인 AIO 샌드박스를 공개했습니다. 이 오픈소스 프로젝트는 코드 실행을 위한 기능적이고 격리된 환경을 제공합니다.
이 튜토리얼에서는 OpenAI 호환 모델을 사용하여 CAI 사이버 보안 AI 프레임워크를 단계별로 구축하고 탐색합니다. 환경 설정부터 API 키 안전 로딩, 기본 에이전트 생성까지 다룹니다.

아마존 연구팀이 자율 AI 에이전트 개발을 자동화하는 A-Evolve라는 인프라를 발표했습니다. 이 프레임워크는 수동 조정 대신 자동화된 진화 과정을 통해 에이전트 개발을 혁신할 것으로 기대됩니다.

Chroma가 다중 홉 검색, 컨텍스트 관리 및 확장 가능한 합성 작업 생성을 위한 20억 파라미터의 에이전틱 검색 모델 ‘Context-1’을 발표했다. 이 모델은 기존의 컨텍스트 윈도우의 한계를 극복하는 데 중점을 두고 있다.
구글이 AI 기능을 제품에 통합하면서 새로운 기술적 개체인 ‘Google-Agent’가 서버 로그에 등장했습니다. 이는 자동화된 인덱서와 사용자 요청을 구분하는 데 중요한 역할을 합니다.
이 튜토리얼에서는 HKUDS의 초경량 개인 AI 에이전트 프레임워크인 나노봇을 깊이 있게 탐구합니다. 기본 시스템을 수동으로 재구성하며 나노봇의 핵심 기능을 이해하는 방법을 소개합니다.

Mistral AI가 오픈 웨이트 텍스트-투-스피치 모델인 Voxtral TTS를 출시했습니다. 이는 회사의 오디오 생성 분야로의 첫 번째 주요 진출로, 개발자 생태계에서 독점 음성 API와의 경쟁을 목표로 하고 있습니다.

NVIDIA 연구진이 다중 턴 LLM 에이전트를 위한 강화 학습 인프라인 ProRL AGENT를 소개했다. 이 시스템은 ‘롤아웃-서비스’ 철학을 채택하여 에이전트 롤아웃 조정을 훈련 루프와 분리한다.
이 튜토리얼에서는 마크다운 노트를 탐색 가능한 지식 그래프로 다루는 오픈소스 개인 지식 관리 시스템 IWE를 구현합니다. 개발자 지식 기반을 구축하고, 위키 링크와 마크다운 링크를 연결하는 방법을 설명합니다.
openJiuwen 커뮤니티가 자가 진화하는 AI 에이전트 ‘JiuwenClaw’를 출시했습니다. 이 AI는 실제 작업을 수행하는 데 중점을 두고 개발되었습니다.

메타가 새로운 뇌 인코딩 모델 TRIBE v2를 발표했습니다. 이 모델은 비디오, 오디오, 텍스트 자극에 대한 fMRI 반응을 예측할 수 있는 기능을 갖추고 있습니다.

구글이 개발자들을 위해 ‘제미니 3.1 플래시 라이브’를 공개했습니다. 이 모델은 저지연의 자연스러운 음성 상호작용을 목표로 하며, 멀티모달 스트림을 처리할 수 있는 기술적 기반을 제공합니다.
이 튜토리얼에서는 Claude 스타일의 사고로 증류된 Qwen3.5 모델을 사용하여 Colab 파이프라인을 설정하는 방법을 설명합니다. 27B GGUF 변형과 경량 2B 4비트 버전 간의 전환이 가능합니다.

코히어가 새로운 자동 음성 인식 모델 ‘코히어 트랜스크라이브’를 출시하며 기업 AI 시장에 진입했습니다. 이 모델은 비구조화된 오디오를 실용적인 텍스트로 변환하는 데 도움을 줍니다.

텐센트 AI 연구소가 7B 매개변수를 가진 Covo-Audio라는 음성 언어 모델을 공개했습니다. 이 모델은 연속 오디오 입력을 처리하고 오디오 출력을 생성하는 통합 아키텍처를 제공합니다.
이 튜토리얼에서는 MolmoWeb을 사용하여 스크린샷에서 직접 웹사이트를 이해하고 상호작용하는 AI 에이전트를 구축하는 방법을 소개합니다. Colab 환경을 설정하고, 4비트 양자화를 통해 MolmoWeb-4B 모델을 로드합니다.
NVIDIA가 새로운 AI 프레임워크인 PivotRL을 소개했습니다. 이 프레임워크는 4배 적은 롤아웃 턴으로 높은 에이전틱 정확도를 달성할 수 있도록 설계되었습니다.
구글이 대형 언어 모델의 메모리 통신 오버헤드를 줄이기 위해 TurboQuant라는 새로운 압축 알고리즘을 발표했습니다. 이 알고리즘은 LLM의 키-값 캐시 메모리를 6배 줄이고 최대 8배의 속도 향상을 제공합니다.

대형 언어 모델(LLM)을 운영할 때 GPU 메모리가 주요 제한 요소로 작용하며, 이는 요청마다 토큰 수준 데이터를 저장하기 위한 KV 캐시가 필요하기 때문이다. 페이지드 어텐션 기술이 이 문제를 해결할 수 있다.
이 튜토리얼에서는 HKUDS가 개발한 자가 진화형 기술 엔진 OpenSpace를 소개합니다. AI 에이전트의 효율성을 높이고, 작업 수행을 통해 학습하는 방법을 다룹니다.
메타의 FAIR 연구팀과 코넬 대학교, 카네기 멜론 대학교의 연구자들이 극소수의 파라미터로도 대형 언어 모델이 추론을 학습할 수 있음을 입증했습니다. 이들은 TinyLoRA라는 새로운 방법을 소개했습니다.
얀 르쿤의 새로운 LeWorldModel 연구는 픽셀 데이터에서 훈련된 세계 모델이 겪는 ‘표현 붕괴’ 문제를 해결하기 위한 접근 방식을 제시합니다. 이 연구는 예측 목표를 충족하기 위해 중복된 임베딩을 생성하는 문제를 다룹니다.

메타 AI의 하이퍼 에이전트는 단순히 작업을 해결하는 것을 넘어, 학습 방식을 혁신적으로 변화시키고 있습니다. 이는 AI의 자기 개선 가능성을 한층 높이는 발전으로 평가됩니다.
루마랩스가 기존의 확산 파이프라인의 ‘의도 격차’를 해결하기 위해 구조적 추론이 가능한 이미지 모델 ‘유니-1’을 출시했다. 이 모델은 이미지 생성 전에 추론 단계를 도입하여 새로운 워크플로우를 제시한다.
이 튜토리얼에서는 Google의 새로운 오픈소스 MCP 서버인 colab-mcp를 활용하여 Google Colab 노트북과 런타임을 프로그래밍적으로 제어하는 AI 에이전트를 설계하는 방법을 소개합니다.

검색 엔진에 쿼리를 입력할 때, 어떤 문서가 관련성이 있는지를 결정하고 순위를 매기는 방법에 대해 BM25와 RAG의 차이를 살펴봅니다.
이 튜토리얼에서는 Google DeepMind가 개발한 RLax 라이브러리를 사용하여 CartPole 환경을 해결하는 강화 학습 에이전트를 구현합니다. JAX, Haiku, Optax와 함께 Deep Q-Learning(DQN) 에이전트를 구축하는 방법을 소개합니다.
AI 에이전트 개발의 현재 상태는 여러 경쟁 생태계 간의 단편화로 특징지어집니다. GitAgent는 이러한 문제를 해결하기 위한 새로운 솔루션으로 주목받고 있습니다.
이 튜토리얼에서는 Python을 이용한 계산 재료 과학을 위한 pymatgen 라이브러리의 기능을 탐구합니다. 실리콘, 염화나트륨, LiFePO4 유사 물질의 결정 구조를 구축하고, 이들의 격자 속성과 조성을 분석합니다.

머신러닝 모델을 생산 환경에 배포하는 것은 ML 생애 주기에서 중요한 단계입니다. 기존 모델을 직접 교체하는 것은 위험할 수 있으며, 이를 안전하게 수행하기 위한 네 가지 전략이 소개됩니다.
이 튜토리얼에서는 신뢰도를 추정하고 자기 평가 기능을 포함한 불확실성 인식 대형 언어 모델 시스템을 구축하는 방법을 소개합니다. 이 시스템은 답변을 생성하고 그에 대한 신뢰도를 평가합니다.

NVIDIA가 Nemotron-Cascade 2를 출시했습니다. 이 모델은 30B Mixture-of-Experts(MoE) 구조로, 3B의 활성화된 매개변수를 통해 뛰어난 추론 능력을 제공합니다.
이 튜토리얼에서는 HKUDS가 개발한 오픈소스 에이전트 군집 지능 프레임워크인 ClawTeam의 핵심 아키텍처를 소개합니다. 복잡한 목표를 하위 작업으로 분해하는 리더 에이전트와 자율적으로 작업을 수행하는 전문 작업 에이전트의 개념을 구현합니다.
LlamaIndex가 AI 에이전트 워크플로우에서 공간 PDF를 파싱하기 위한 CLI 및 TypeScript 기반 라이브러리인 LiteParse를 출시했습니다. 이 도구는 데이터 수집 파이프라인의 병목 현상을 해결하는 데 도움을 줄 것으로 기대됩니다.

구글이 AI 에이전트가 Google Colab 환경과 직접 상호작용할 수 있는 오픈소스 MCP 서버를 출시했습니다. 이로 인해 에이전트는 클라우드 기반 Jupyter 노트북에서 Python 코드를 생성하고 수정하며 실행할 수 있는 프로그램적 접근이 가능해졌습니다.
이 튜토리얼에서는 Diffrax 라이브러리를 사용하여 미분 방정식을 해결하고 신경 미분 방정식 모델을 구축하는 방법을 설명합니다. JAX, Diffrax 등 필요한 과학 컴퓨팅 라이브러리 설치부터 시작합니다.
카네기 멜론 대학교와 프린스턴 대학교의 연구팀이 새로운 상태 공간 모델 Mamba-3를 발표했습니다. 이 모델은 2배 작은 상태를 사용하며, MIMO 디코딩 하드웨어 효율성을 개선했습니다.

칭화대학교와 앤트 그룹의 연구진이 자율 LLM 에이전트인 OpenClaw의 취약점을 완화하기 위한 5단계 생애주기 기반 보안 프레임워크를 공개했습니다. 이 프레임워크는 OpenClaw의 ‘커널-플러그인’ 구조의 취약점을 분석한 결과에서 출발했습니다.

바이두 치안판 팀이 40억 개 매개변수를 가진 ‘치안판-OCR’을 출시했습니다. 이 모델은 문서 파싱, 레이아웃 분석, 문서 이해를 통합하여 이미지에서 직접 Markdown으로 변환할 수 있습니다.

NVIDIA가 자율 AI 에이전트를 위한 안전한 런타임 환경인 ‘OpenShell’을 오픈소스로 공개했습니다. 이 시스템은 도구 사용과 코드 실행이 가능한 자율 AI 에이전트의 보안 문제를 해결하기 위한 것입니다.

ServiceNow Research가 복잡한 전문 워크플로우를 수행할 수 있는 자율 에이전트를 평가하기 위한 새로운 벤치마크인 EnterpriseOps-Gym을 소개했습니다. 이 벤치마크는 기업 환경의 특정 도전 과제를 반영합니다.

언슬로스 AI가 고성능 대형 언어 모델(LLM) 미세 조정을 위한 로컬 노코드 인터페이스 ‘언슬로스 스튜디오’를 출시했습니다. 이 스튜디오는 VRAM 사용량을 70% 줄여 효율성을 높입니다.

구글과 연구팀이 아프리카 언어를 위한 다국어 음성 데이터셋 WAXAL을 발표했다. 이 데이터셋은 24개 언어를 포함하며, 자동 음성 인식 및 텍스트 음성 변환 모델 훈련에 활용될 예정이다.
이 튜토리얼에서는 NVIDIA Warp를 사용하여 Python에서 고성능 GPU 및 CPU 시뮬레이션을 구축하는 방법을 소개합니다. Colab 호환 환경을 설정하고 Warp를 초기화하는 과정이 포함됩니다.

Mistral AI가 Mistral Small 4를 출시했습니다. 이 모델은 다양한 기능을 통합하여 단일 배포 대상으로 설계되었습니다. Mistral Small 4는 지시 수행, 추론, 다중 모드 이해를 결합한 첫 번째 모델입니다.

문샷 AI 연구팀이 변환기 모델의 성능 향상을 위해 깊이별 주의를 활용한 새로운 잔여 연결 방식을 발표했습니다. 이 방식은 기존의 고정 잔여 혼합 방식의 구조적 문제를 해결하는 데 중점을 두고 있습니다.
IBM이 다국어 자동 음성 인식 및 번역을 위한 컴팩트한 음성 모델 Granite 4.0 1B Speech를 출시했습니다. 이 모델은 메모리 사용량과 지연 시간, 계산 효율성을 중시하는 기업 및 엣지 스타일의 음성 배포를 목표로 하고 있습니다.
이 튜토리얼에서는 OpenClaw와 Python을 사용하여 기업 수준의 AI 거버넌스 시스템을 구축하는 방법을 소개합니다. OpenClaw 런타임 설정과 API를 통한 에이전트와의 상호작용을 다룹니다.
OpenViking은 AI 에이전트를 위한 오픈소스 컨텍스트 데이터베이스로, 파일 시스템 기반의 메모리와 검색 기능을 제공합니다. 이 프로젝트는 에이전트 시스템이 컨텍스트를 단순한 텍스트 덩어리로 취급하지 않도록 설계되었습니다.
LangChain이 다단계, 상태 유지, 복잡한 작업에 적합한 AI 에이전트용 라이브러리 ‘Deep Agents’를 출시했다. 이 라이브러리는 계획, 메모리, 컨텍스트 분리를 지원한다.

Zhipu AI가 문서 파싱과 핵심 정보 추출에 최적화된 0.9B 규모의 멀티모달 OCR 모델 GLM-OCR을 선보였다. 이 모델은 실제 문서에서 표, 수식 등 복잡한 구조를 효율적으로 처리하는 것을 목표로 한다.
이 튜토리얼에서는 Outlines를 활용해 타입 안전하고 구조화된 언어 모델 출력물을 생성하는 방법을 소개한다. Literal, int, bool 같은 타입 제약을 적용하고, Pydantic 모델로 엄격한 스키마 검증을 구현한다.
개리 탄이 AI 코딩을 위한 오픈소스 툴킷 ‘gstack’을 발표했다. 이 시스템은 제품 기획, 엔지니어링 리뷰, 출시, 품질 검증을 각각 독립된 모드로 분리해 신뢰성을 높이는 데 중점을 뒀다.

구글 딥마인드가 수학 경시대회 수준을 넘어 전문 연구를 수행할 수 있는 AI 에이전트 ‘알레시아’를 선보였다. 이 AI는 자연어로 해법을 생성, 검증, 수정하며 복잡한 연구 문제를 해결한다.

최근 AI 에이전트 생태계에서는 외부 도구와 도메인 지식 활용을 위한 두 가지 접근법인 스킬과 모델 컨텍스트 프로토콜(MCP)이 주목받고 있다. 이들은 설정과 작업 수행 방식에서 차이를 보인다.

구글 AI 연구팀이 Gemini 모델을 활용해 비정형 글로벌 뉴스에서 구조화된 역사 데이터를 추출하는 새로운 방법론 ‘Groundsource’를 발표했다. 이 프로젝트는 급작스러운 자연재해에 대한 역사 데이터 부족 문제를 해결하는 데 목적이 있다.
이 튜토리얼에서는 Andrej Karpathy가 제안한 AutoResearch 프레임워크를 구글 콜랩에 맞게 구현하는 방법을 소개합니다. 자동화된 실험 파이프라인을 구축해 하이퍼파라미터 조정과 실험 추적을 자동으로 수행합니다.

스탠퍼드 대학 연구진이 기기 내에서 완전히 작동하는 개인 AI 에이전트를 개발할 수 있는 오픈소스 프레임워크 ‘OpenJarvis’를 발표했다. 이 플랫폼은 로컬 우선 AI 시스템 구축을 위한 연구 및 배포용 인프라를 제공한다.
이 튜토리얼에서는 계속해서 안전한 부분 추론 업데이트를 스트리밍하는 동안 온라인으로 생각하고 행동하는 스트리밍 의사 결정 에이전트를 구축합니다. 이는 이동하는 장애물과 이동하는 목표가 있는 동적 그리드 월드를 구현하고, 온라인 A* 플래너를 사용하여 미래 몇 단계에만 집중합니다.

NVIDIA가 Nemotron 3 Super를 공개했다. 이 모델은 복잡한 다중 에이전트 응용 프로그램을 위해 설계된 놀라운 1200억 파라미터 추론 모델로, 경쟁 모델보다 5배 높은 처리량을 제공한다.

구글이 Gemini Embedding 2를 발표했다. 이 모델은 텍스트 뿐만 아니라 이미지, 비디오, 오디오, 문서 등을 임베딩 공간으로 가져와 AI 개발자가 고차원 저장 및 교차 모달 검색 도전에 대처할 수 있도록 설계되었다.
Fish Audio의 S2-Pro은 Fish Speech 생태계 내에서의 플래그십 모델로, 고품질의 다중 화자 합성과 150ms 미만의 대기 시간을 갖춘 오픈 아키텍처로의 전환을 대표함. 릴리스는 제로샷 보이스 클로닝과 세밀한 음성 복제를 위한 프레임워크를 제공함.
이 튜토리얼에서는 간단한 작업 설명서로부터 자동으로 다른 에이전트를 설계하는 메타 에이전트를 구축합니다. 작업을 분석하고 도구를 선택하며 메모리 아키텍처를 선택하고 계획자를 구성한 다음 완전히 작동하는 에이전트 런타임을 인스턴스화하는 시스템을 구현합니다. 정적 에이전트 템플릿을 넘어서 동적이고 자가 구성되는 아키텍처를 구축합니다.

NVIDIA가 Nemotron-Terminal을 공개했다. 이는 LLM 터미널 에이전트의 확장을 위한 체계적인 데이터 엔지니어링 파이프라인으로, 자율 주행 AI 에이전트 구축 경쟁에서 데이터가 병목 현상을 일으키고 있다. 새로운 모델과 훈련 전략의 불투명성은 연구자와 개발자를 고비용의 암묵적인 사이클로 몰아넣고 있다.
이 튜토리얼에서는 내부 비평가와 불확실성 추정 프레임워크를 통합하여 단순한 응답 생성을 넘어진 심화된 에이전트 시스템을 구축한다. 다중 샘플 추론을 시뮬레이션하고 후보 응답을 정확도, 일관성, 안전성 측면에서 평가하며, 엔트로피, 분산, 일관성 측정을 사용하여 예측 불확실성을 양적화한다. 자신감을 균형있게 유지하기 위해 위험에 민감한 선택 전략을 구현한다.
바이트댄스가 DeerFlow 2.0을 공개했다. 이 프레임워크는 ‘슈퍼에이전트’로 일을 제안하는 것뿐만 아니라 실행하는 기능을 갖추고 있어, 복잡한 작업을 수행할 수 있다.
Andrew Ng와 그의 팀이 개발한 Context Hub은 코딩 에이전트의 정적 훈련 데이터와 현대 API의 빠르게 변화하는 현실 사이의 간극을 줄이기 위해 설계된 오픈 소스 도구입니다.

Anthropic은 Claude Code를 통해 고급 에이전틱 다단계 추론 루프를 활용해 복잡한 보안 연구를 자동화하는 코드 리뷰를 소개하고 있다. 이는 AI가 보일러플레이트만 작성하는 것을 넘어서 실제로 왜 Kubernetes 클러스터가 새벽 3시에 알람을 울리는지 이해하는 AI 에이전트를 지향하는 것이다.
구글 연구팀은 현재의 AI 에이전트들이 ‘확률적 추론’ 능력을 크게 부족하다고 주장하며, 대규모 언어 모델(LLM)이 새로운 증거를 기반으로 믿음을 업데이트하는 냉정하고 단단한 논리에 대해 얼마나 고집스러운지 설명했다.
이 튜토리얼에서는 Scanpy를 사용하여 단일 세포 RNA 시퀀싱 분석을 위한 완전한 파이프라인을 구축합니다. 필요한 라이브러리를 설치하고 PBMC 3k 데이터세트를 로드한 다음 품질 관리, 필터링, 정규화를 수행하여 데이터를 준비합니다. 고변동 유전자를 식별하고 차원 축소를 위해 PCA를 수행한 후 클러스터링 및 시각화를 진행합니다.

OpenAI가 Codex Security를 소개했습니다. 이는 코드베이스를 분석하여 취약점을 확인하고 개발자가 수정 전에 검토할 수 있는 보안 에이전트입니다. 제품은 ChatGPT Enterprise, Business 및 Edu 고객을 대상으로 연구 미리보기로 롤아웃 중입니다.
구글이 안드로이드 개발 작업에서 Large Language Models (LLMs)의 성능을 측정하기 위한 새로운 리더보드 및 평가 프레임워크인 안드로이드 벤치를 공개했다. 데이터셋, 방법론, 테스트 하네스는 GitHub에서 공개되었으며, 일반 코딩 벤치마크가 캡처하지 못하는 안드로이드 개발 작업에 적합하다.

Liquid AI가 LocalCowork를 발표했는데, 이는 LFM2-24B-A2B를 활용한 모델로, 기업 워크플로우를 기기 내에서 완전히 실행할 수 있도록 해준다. API 호출과 데이터 이탈을 없애 프라이버시에 민감한 환경에서 사용된다.
이 튜토리얼에서는 Daft를 사용하여 고성능의 파이썬 데이터 엔진으로 엔드투엔드 분석 파이프라인을 구축하는 방법을 탐구합니다. MNIST 데이터셋을 로드한 다음 UDF, 피처 엔지니어링, 집계, 조인 및 지연 실행을 통해 점진적으로 변환하는 방법을 살펴봅니다. 구조화된 데이터 처리, 숫자 계산, 이미지 처리 등을 원활하게 결합하는 방법을 보여줍니다.
구글 워크스페이스 API를 애플리케이션과 데이터 파이프라인에 통합하는 것은 REST 엔드포인트, 페이지네이션, OAuth 2.0 흐름을 처리하는 보일러플레이트 코드를 작성해야 하는데, 구글 AI 팀이 ‘gws’ CLI 도구를 공개했다. 이 오픈소스 도구는 Google Workspace를 위한 통합된 동적 명령줄 인터페이스를 제공한다.

OpenAI는 심포니를 공개했습니다. 이는 구조화된 ‘실행’을 통해 자율 AI 코딩 에이전트를 관리하기 위한 오픈 소스 프레임워크로, 이 프로젝트는 이슈 트래커를 LLM 기반 에이전트에 연결하여 소프트웨어 개발 작업을 자동화하는 시스템을 제공합니다. 시스템 아키텍처는 Elixir 및 BEAM을 사용합니다.
본 튜토리얼에서는 Tree-of-Thoughts(TOT) 다중 분기 추론 에이전트를 처음부터 구축한다. 선형 사고 체인 대신에 여러 추론 분기를 생성하고 각 분기를 휴리스틱 평가 함수로 점수를 매기며 약한 후보를 제거하고 가장 강력한 경로만 계속 확장하는 시스템을 설계한다.

YuanLab AI가 오픈소스 Mixture-of-Experts (MoE) 대형 언어 모델인 Yuan 3.0 Ultra를 공개했다. 이 모델은 1조 개의 총 파라미터와 68.8조 개의 활성화된 파라미터를 특징으로 하며, 기업 성능을 최적화하고 사전 훈련 효율성을 높이는 것을 목표로 한다.
이 튜토리얼에서는 EverMem-스타일의 영구적인 에이전트 OS를 구축하는 방법에 대해 알아본다. FAISS를 사용하여 짧은 기간의 대화적 맥락과 장기 기억 벡터를 결합하여 각 응답 생성 전 관련 과거 정보를 회상할 수 있게 한다. 의미 기억과 함께 SQLite에 구조화된 레코드를 저장하여 타임스탬프, 중요도 점수, 메모리 신호(선호도 등)와 같은 메타데이터를 영속화한다.
LangWatch는 AI 개발이 단순한 채팅 인터페이스에서 복잡한 자율 에이전트로 이동함에 따라 산업이 직면한 중요한 병목 현상, 즉 비결정론에 대응하기 위해 설계된 오픈소스 플랫폼이다. LangWatch는 AI 에이전트의 엔드 투 엔드 추적, 시뮬레이션 및 체계적인 테스팅을 가능하게 한다.