2026년 6월 21일 일요일
오늘의 신문
2026년 6월 21일 일요일 오늘의 신문
세일즈포스 코드젠을 활용한 엔드 투 엔드 워크플로우를 구현하는 방법을 소개합니다. 함수 추출, 구문 검사, 정적 안전 점검, 유닛 테스트 검증 등을 포함합니다.
2026년 6월 18일 오후 10시 44분
퍼플렉시티가 자가 개선 메모리 시스템인 '브레인'을 출시했습니다. 이 시스템은 에이전트의 작업을 기억하며, 성과와 실패를 분석해 개선합니다.
2026년 6월 18일 오후 4시 26분
KV 캐시가 긴 컨텍스트에서 모델 가중치를 초과하는 상황에서 TurboQuant, OSCAR, EpiCache가 메모리 병목 현상을 해결하기 위해 각기 다른 접근 방식을 취하고 있습니다. 이들은 경쟁보다는 상호 보완적인 관계에 있습니다.
2026년 6월 18일 오전 5시 14분
OpenAI가 생명과학 연구를 평가하는 750개 작업으로 구성된 LifeSciBench를 발표했습니다. 이 벤치마크는 173명의 박사 과학자들이 작성한 기준을 바탕으로 AI 모델의 추론과 결정을 평가합니다.
2026년 6월 17일 오후 10시 28분
이 튜토리얼에서는 NVIDIA SkillSpector를 사용하여 배포 전 AI 기술의 보안 위험을 평가하는 방법을 소개합니다. 양호한 기술과 의도적으로 취약한 기술을 구축하고, SkillSpector의 LangGraph 워크플로우를 통해 스캔합니다.
2026년 6월 17일 오후 9시 35분
Vercel이 Apache-2.0 라이선스의 오픈소스 AI 에이전트 프레임워크 'Eve'를 공개했다. 각 에이전트는 기능에 맞춰 파일 디렉토리로 구성되어 있다.
2026년 6월 17일 오후 1시 22분
MiniMax가 새로운 희소 주의 메커니즘인 MSA를 발표했습니다. 이 기술은 쿼리당 상위 k 개의 키-값 블록을 선택하여 계산량을 28.4배 줄이는 데 성공했습니다.
2026년 6월 17일 오전 3시 44분
OpenAI가 2026년 6월 16일 배포 시뮬레이션을 도입했습니다. 이 방법은 새로운 모델 출시 전 과거 대화를 재생하여 배포 시 원치 않는 행동의 비율을 추정합니다.
2026년 6월 17일 오전 1시 49분
xFormers를 이용해 메모리 효율적인 트랜스포머 모델을 구축하는 방법을 소개합니다. GPU에서 빠르고 효율적인 모델을 구현하며, 다양한 기술적 요소를 검토합니다.
2026년 6월 16일 오후 8시 02분
Qwen 팀의 새로운 Qwen-RobotSuite는 조작, 비디오 세계 모델링, 내비게이션을 위한 세 가지 AI 모델을 포함합니다. 각 모델의 구조와 데이터 파이프라인, 벤치마크 결과를 살펴봅니다.
2026년 6월 16일 오후 12시 51분
헤르메스 에이전트가 비동기 서브 에이전트를 도입하여 위임된 작업이 부모 채팅을 차단하지 않도록 개선했습니다. 새로운 도구 세트를 통해 작업을 생성하고 관리하는 방법을 소개합니다.
2026년 6월 16일 오전 5시 21분
'Meet Atoms'는 개발자나 소프트웨어 엔지니어가 아니더라도 아이디어를 AI에게 설명하면 앱을 구축하고 배포할 수 있는 노코드 도구입니다.
2026년 6월 16일 오전 4시 50분
구글 클라우드가 AI 에이전트를 위한 개방형 지식 포맷(OKF)을 소개했습니다. 이 포맷은 마크다운 파일과 YAML 프론트매터로 구성된 디렉토리를 통해 AI에 필요한 맥락을 제공합니다.
2026년 6월 16일 오전 4시 18분
이 튜토리얼에서는 Docling Parse를 사용하여 PDF 문서를 구조적으로 분석하는 워크플로우를 구축하는 방법을 소개합니다. Python 환경 설정부터 PDF 생성, 데이터 추출까지의 과정을 다룹니다.
2026년 6월 16일 오전 3시 20분
사카나 AI의 첫 상용 제품인 사카나 마를린은 최대 8시간 동안 자율적으로 작동하며, AB-MCTS와 AI 과학자 워크플로우를 기반으로 다수의 페이지로 구성된 보고서와 슬라이드를 생성합니다.
2026년 6월 15일 오후 6시 32분
Flash-KMeans는 Triton GPU 커널을 활용한 오픈소스 IO 인식 K-평균 구현체로, 기존의 수학적 접근을 변경하지 않고도 FAISS보다 200배 빠른 성능을 자랑합니다.
2026년 6월 15일 오전 5시 16분

최신뉴스 전체보기

AI 엔지니어의 작업을 혁신하는 오픈소스 라이브러리 ‘AutoAgent’

‘AutoAgent’는 AI 엔지니어가 자신의 에이전트를 최적화할 수 있도록 돕는 오픈소스 라이브러리입니다. 반복적인 작업을 줄이고 효율성을 높이는 데 기여할 것으로 기대됩니다.

2026년 4월 5일 오전 5시 21분
인공지능과 인간의 비전이 만나는 패션 디자인의 미래

패션은 항상 사람의 선호를 예측하는 것이며, 오늘날 인공지능을 통해 이러한 예측이 가능해졌다. 알고리즘과 머신러닝을 활용하여 패션의 미래를 디자인하는 방법을 살펴본다.

2026년 4월 5일 오전 4시 45분
넷플릭스 AI 팀, 물체를 동영상에서 지우는 AI 모델 ‘VOID’ 오픈소스 공개

넷플릭스 AI 팀이 동영상에서 물체를 지우는 AI 모델 ‘VOID’를 오픈소스로 공개했습니다. 이 모델은 물체 제거 후에도 자연스러운 장면을 유지하는 데 도움을 줍니다.

2026년 4월 4일 오전 5시 03분
Z.AI GLM-5로 생산 준비 완료 에이전틱 시스템 구축하기

이 튜토리얼에서는 Z.AI의 GLM-5 모델을 활용하여 실제 에이전틱 애플리케이션을 위한 시스템 구축 방법을 소개합니다. 기본 환경 설정부터 고급 기능까지 단계별로 설명합니다.

2026년 4월 3일 오후 11시 06분
구글 딥마인드, LLM으로 게임 이론 알고리즘 재작성 성공

구글 딥마인드의 연구팀이 LLM을 활용해 게임 이론 알고리즘을 스스로 재작성하는 AlphaEvolve를 개발했습니다. 이 시스템은 전문가들을 능가하는 성과를 보였습니다.

2026년 4월 3일 오후 6시 26분
TII, 자연어 프롬프트 기반의 오픈 어휘 그라운딩 및 세분화를 위한 0.6B 매개변수 초기 융합 변환기 ‘Falcon Perception’ 발표

기술 혁신 연구소(TII)가 자연어 프롬프트를 활용한 오픈 어휘 그라운딩 및 세분화를 위한 0.6B 매개변수 초기 융합 변환기 ‘Falcon Perception’을 발표했다. 이 기술은 언어와 비전 간의 상호작용을 개선할 것으로 기대된다.

2026년 4월 3일 오전 4시 49분
NVIDIA 모델 최적화 파이프라인 구축을 위한 단계별 가이드

이 튜토리얼에서는 NVIDIA 모델 최적화기를 사용하여 Google Colab에서 딥러닝 모델을 훈련하고 가지치기 및 미세 조정하는 전체 파이프라인을 구축하는 방법을 설명합니다.

2026년 4월 3일 오전 3시 48분
Arcee AI, Apache 2.0 오픈 추론 모델 ‘Trinity Large Thinking’ 발표

Arcee AI가 복잡한 다단계 추론이 가능한 오픈 소스 AI 모델 ‘Trinity Large Thinking’을 Apache 2.0 라이선스 하에 공개했다. 이는 개발자들에게 투명한 대안을 제공한다.

2026년 4월 2일 오후 7시 56분
구글 제마 4와 NVIDIA가 혁신하는 로컬 에이전틱 AI

구글의 최신 모델을 NVIDIA RTX AI PC에서 더욱 빠르게 실행하여 개인화된 AI 어시스턴트를 구축할 수 있는 방법을 소개합니다. 이 과정에서 발생하는 ‘토큰 세금’ 문제를 해결하는 기술적 진전을 다룹니다.

2026년 4월 2일 오후 4시 35분
IBM, 기업 문서 데이터 추출을 위한 Granite 4.0 3B 비전 모델 출시

IBM이 기업급 문서 데이터 추출을 위해 설계된 비전-언어 모델인 Granite 4.0 3B 비전을 출시했습니다. 이 모델은 고충실도의 시각적 추론을 제공하는 전문 어댑터로 구성되어 있습니다.

2026년 4월 2일 오전 2시 04분
생산 준비 완료된 AgentScope 워크플로우 구축하기

이 튜토리얼에서는 AgentScope 워크플로우를 처음부터 끝까지 구축하고 Colab에서 실행하는 방법을 설명합니다. OpenAI와 AgentScope를 연결하고 기본 모델 호출을 검증하는 과정이 포함됩니다.

2026년 4월 2일 오전 1시 34분
Z.ai, GLM-5V-Turbo 출시: 멀티모달 비전 코딩 모델로 소프트웨어 엔지니어링 최적화

Z.ai가 GLM-5V-Turbo를 출시했습니다. 이 모델은 시각적 인식과 코드 실행 간의 간극을 메우는 데 중점을 두고 있으며, 소프트웨어 엔지니어링에 필요한 엄격한 구문으로 시각 정보를 변환하는 데 강점을 보입니다.

2026년 4월 1일 오후 7시 04분
Gemma 3 1B 인스트럭션 생성 AI 파이프라인 구축하기

이 튜토리얼에서는 Hugging Face Transformers와 HF Token을 사용하여 Gemma 3 1B 인스트럭션을 위한 Colab 워크플로우를 구축하고 실행하는 방법을 단계별로 설명합니다.

2026년 4월 1일 오후 12시 59분
Hugging Face, TRL v1.0 출시: SFT, 보상 모델링, DPO 및 GRPO 워크플로우를 위한 통합 포스트 트레이닝 스택

Hugging Face가 TRL(Transformer Reinforcement Learning) v1.0을 공식 출시했습니다. 이 버전은 연구 중심의 라이브러리에서 안정적인 프로덕션 준비 프레임워크로의 전환을 의미합니다.

2026년 4월 1일 오전 3시 04분
구글 AI, 저비용 고속 비디오 생성 위한 Veo 3.1 Lite 출시

구글이 비디오 생성 포트폴리오의 새로운 모델인 Veo 3.1 Lite를 발표했다. 이 모델은 생산 규모 배포의 주요 장애물인 가격 문제를 해결하기 위해 설계되었다.

2026년 4월 1일 오전 2시 22분
Liquid AI, LFM2.5-350M 모델 출시: 28T 토큰으로 훈련된 350M 파라미터의 컴팩트 모델

Liquid AI가 LFM2.5-350M 모델을 출시했습니다. 이 모델은 28T 토큰으로 훈련된 350M 파라미터의 컴팩트한 구조로, 기존의 스케일링 법칙에 도전하는 사례로 주목받고 있습니다.

2026년 4월 1일 오전 1시 01분
A-Evolve를 활용한 맞춤형 OpenAI 에이전트 구축 및 발전 방법

이 튜토리얼에서는 A-Evolve 프레임워크를 사용하여 OpenAI 기반의 에이전트를 구축하고, 맞춤형 벤치마크를 정의하며, 진화 엔진을 개발하는 과정을 설명합니다.

2026년 3월 31일 오후 2시 24분
알리바바, Qwen3.5 Omni 출시: 텍스트, 오디오, 비디오 및 실시간 상호작용을 위한 네이티브 멀티모달 모델

알리바바 Qwen 팀이 Qwen3.5-Omni를 출시했습니다. 이 모델은 텍스트, 오디오, 비디오를 통합하여 실시간 상호작용을 지원하는 멀티모달 언어 모델로, 기존의 모델들과 차별화된 점이 있습니다.

2026년 3월 31일 오전 1시 17분
마이크로소프트, 다국어 임베딩 모델 Harrier-OSS-v1 출시

마이크로소프트가 다양한 언어에 대한 고품질 의미 표현을 제공하는 다국어 텍스트 임베딩 모델 Harrier-OSS-v1을 발표했다. 이 모델은 270M, 0.6B, 27B의 세 가지 규모로 제공된다.

2026년 3월 30일 오후 6시 22분
세일즈포스 AI 연구, 음성 RAG 지연 시간을 316배 단축하는 VoiceAgentRAG 발표

세일즈포스 AI 연구팀이 음성 AI의 반응 속도를 획기적으로 개선하는 VoiceAgentRAG를 발표했다. 이 기술은 음성 기반 RAG 시스템의 지연 시간을 크게 줄여 자연스러운 대화 흐름을 유지할 수 있도록 돕는다.

2026년 3월 30일 오전 5시 56분
에이전트 인프라, AI 에이전트를 위한 올인원 런타임 AIO 샌드박스 출시

에이전트 인프라가 AI 에이전트를 위한 올인원 런타임인 AIO 샌드박스를 공개했습니다. 이 오픈소스 프로젝트는 코드 실행을 위한 기능적이고 격리된 환경을 제공합니다.

2026년 3월 29일 오후 8시 04분
고급 사이버 보안 AI 에이전트 구축하기: CAI 활용법

이 튜토리얼에서는 OpenAI 호환 모델을 사용하여 CAI 사이버 보안 AI 프레임워크를 단계별로 구축하고 탐색합니다. 환경 설정부터 API 키 안전 로딩, 기본 에이전트 생성까지 다룹니다.

2026년 3월 29일 오후 7시 28분
자동화된 AI 에이전트 개발을 위한 A-Evolve 소개

아마존 연구팀이 자율 AI 에이전트 개발을 자동화하는 A-Evolve라는 인프라를 발표했습니다. 이 프레임워크는 수동 조정 대신 자동화된 진화 과정을 통해 에이전트 개발을 혁신할 것으로 기대됩니다.

2026년 3월 29일 오후 2시 17분
Chroma, 20억 파라미터의 에이전틱 검색 모델 ‘Context-1’ 출시

Chroma가 다중 홉 검색, 컨텍스트 관리 및 확장 가능한 합성 작업 생성을 위한 20억 파라미터의 에이전틱 검색 모델 ‘Context-1’을 발표했다. 이 모델은 기존의 컨텍스트 윈도우의 한계를 극복하는 데 중점을 두고 있다.

2026년 3월 29일 오전 4시 25분
구글, 사용자 주도 AI 접근과 검색 크롤링 시스템 간의 기술적 경계 정의

구글이 AI 기능을 제품에 통합하면서 새로운 기술적 개체인 ‘Google-Agent’가 서버 로그에 등장했습니다. 이는 자동화된 인덱서와 사용자 요청을 구분하는 데 중요한 역할을 합니다.

2026년 3월 29일 오전 2시 03분
나노봇의 전체 에이전트 파이프라인 탐색을 위한 코딩 가이드

이 튜토리얼에서는 HKUDS의 초경량 개인 AI 에이전트 프레임워크인 나노봇을 깊이 있게 탐구합니다. 기본 시스템을 수동으로 재구성하며 나노봇의 핵심 기능을 이해하는 방법을 소개합니다.

2026년 3월 29일 오전 1시 40분
Mistral AI, 저지연 다국어 음성 생성을 위한 Voxtral TTS 출시

Mistral AI가 오픈 웨이트 텍스트-투-스피치 모델인 Voxtral TTS를 출시했습니다. 이는 회사의 오디오 생성 분야로의 첫 번째 주요 진출로, 개발자 생태계에서 독점 음성 API와의 경쟁을 목표로 하고 있습니다.

2026년 3월 28일 오후 4시 58분
NVIDIA, 다중 턴 LLM 에이전트를 위한 ProRL AGENT 공개

NVIDIA 연구진이 다중 턴 LLM 에이전트를 위한 강화 학습 인프라인 ProRL AGENT를 소개했다. 이 시스템은 ‘롤아웃-서비스’ 철학을 채택하여 에이전트 롤아웃 조정을 훈련 루프와 분리한다.

2026년 3월 28일 오전 1시 38분
AI 기반 지식 그래프로 구현한 IWE의 컨텍스트 브리지

이 튜토리얼에서는 마크다운 노트를 탐색 가능한 지식 그래프로 다루는 오픈소스 개인 지식 관리 시스템 IWE를 구현합니다. 개발자 지식 기반을 구축하고, 위키 링크와 마크다운 링크를 연결하는 방법을 설명합니다.

2026년 3월 27일 오후 4시 06분
openJiuwen 커뮤니티, 자가 진화하는 AI 에이전트 ‘JiuwenClaw’ 발표

openJiuwen 커뮤니티가 자가 진화하는 AI 에이전트 ‘JiuwenClaw’를 출시했습니다. 이 AI는 실제 작업을 수행하는 데 중점을 두고 개발되었습니다.

2026년 3월 27일 오후 1시 02분
메타, 비디오·오디오·텍스트 자극에 대한 fMRI 반응 예측 모델 TRIBE v2 발표

메타가 새로운 뇌 인코딩 모델 TRIBE v2를 발표했습니다. 이 모델은 비디오, 오디오, 텍스트 자극에 대한 fMRI 반응을 예측할 수 있는 기능을 갖추고 있습니다.

2026년 3월 27일 오전 12시 39분
구글, 실시간 멀티모달 음성 모델 ‘제미니 3.1 플래시 라이브’ 공개

구글이 개발자들을 위해 ‘제미니 3.1 플래시 라이브’를 공개했습니다. 이 모델은 저지연의 자연스러운 음성 상호작용을 목표로 하며, 멀티모달 스트림을 처리할 수 있는 기술적 기반을 제공합니다.

2026년 3월 26일 오후 10시 38분
Qwen3.5 모델을 위한 Claude 스타일 사고 구현 튜토리얼

이 튜토리얼에서는 Claude 스타일의 사고로 증류된 Qwen3.5 모델을 사용하여 Colab 파이프라인을 설정하는 방법을 설명합니다. 27B GGUF 변형과 경량 2B 4비트 버전 간의 전환이 가능합니다.

2026년 3월 26일 오후 7시 04분
코히어 AI, 기업 음성 인공지능을 위한 자동 음성 인식 모델 ‘코히어 트랜스크라이브’ 출시

코히어가 새로운 자동 음성 인식 모델 ‘코히어 트랜스크라이브’를 출시하며 기업 AI 시장에 진입했습니다. 이 모델은 비구조화된 오디오를 실용적인 텍스트로 변환하는 데 도움을 줍니다.

2026년 3월 26일 오전 11시 01분
텐센트, 실시간 오디오 대화 및 추론을 위한 7B 음성 언어 모델 Covo-Audio 오픈 소스 공개

텐센트 AI 연구소가 7B 매개변수를 가진 Covo-Audio라는 음성 언어 모델을 공개했습니다. 이 모델은 연속 오디오 입력을 처리하고 오디오 출력을 생성하는 통합 아키텍처를 제공합니다.

2026년 3월 26일 오전 3시 33분
MolmoWeb-4B를 활용한 비전 기반 웹 AI 에이전트 구축 방법

이 튜토리얼에서는 MolmoWeb을 사용하여 스크린샷에서 직접 웹사이트를 이해하고 상호작용하는 AI 에이전트를 구축하는 방법을 소개합니다. Colab 환경을 설정하고, 4비트 양자화를 통해 MolmoWeb-4B 모델을 로드합니다.

2026년 3월 25일 오후 7시 13분
NVIDIA, 새로운 AI 프레임워크 PivotRL 발표

NVIDIA가 새로운 AI 프레임워크인 PivotRL을 소개했습니다. 이 프레임워크는 4배 적은 롤아웃 턴으로 높은 에이전틱 정확도를 달성할 수 있도록 설계되었습니다.

2026년 3월 25일 오전 4시 39분
구글, LLM 메모리 효율을 6배 향상시키는 TurboQuant 압축 알고리즘 발표

구글이 대형 언어 모델의 메모리 통신 오버헤드를 줄이기 위해 TurboQuant라는 새로운 압축 알고리즘을 발표했습니다. 이 알고리즘은 LLM의 키-값 캐시 메모리를 6배 줄이고 최대 8배의 속도 향상을 제공합니다.

2026년 3월 25일 오전 3시 11분
대형 언어 모델의 페이지드 어텐션 기술

대형 언어 모델(LLM)을 운영할 때 GPU 메모리가 주요 제한 요소로 작용하며, 이는 요청마다 토큰 수준 데이터를 저장하기 위한 KV 캐시가 필요하기 때문이다. 페이지드 어텐션 기술이 이 문제를 해결할 수 있다.

2026년 3월 24일 오후 5시 45분
OpenSpace를 활용한 자가 진화형 기술 엔진 설계 튜토리얼

이 튜토리얼에서는 HKUDS가 개발한 자가 진화형 기술 엔진 OpenSpace를 소개합니다. AI 에이전트의 효율성을 높이고, 작업 수행을 통해 학습하는 방법을 다룹니다.

2026년 3월 24일 오후 5시 31분
TinyLoRA: 13개 파라미터로 91.8% GSM8K 달성한 AI 연구

메타의 FAIR 연구팀과 코넬 대학교, 카네기 멜론 대학교의 연구자들이 극소수의 파라미터로도 대형 언어 모델이 추론을 학습할 수 있음을 입증했습니다. 이들은 TinyLoRA라는 새로운 방법을 소개했습니다.

2026년 3월 24일 오후 2시 49분
얀 르쿤, 픽셀 기반 예측 세계 모델링의 JEPA 붕괴를 겨냥한 새로운 LeWorldModel 연구 발표

얀 르쿤의 새로운 LeWorldModel 연구는 픽셀 데이터에서 훈련된 세계 모델이 겪는 ‘표현 붕괴’ 문제를 해결하기 위한 접근 방식을 제시합니다. 이 연구는 예측 목표를 충족하기 위해 중복된 임베딩을 생성하는 문제를 다룹니다.

2026년 3월 24일 오전 1시 53분
메타 AI의 새로운 하이퍼 에이전트, 학습 규칙을 재정립하다

메타 AI의 하이퍼 에이전트는 단순히 작업을 해결하는 것을 넘어, 학습 방식을 혁신적으로 변화시키고 있습니다. 이는 AI의 자기 개선 가능성을 한층 높이는 발전으로 평가됩니다.

2026년 3월 23일 오후 9시 42분
루마랩스, 의도를 고려한 이미지 생성 모델 ‘유니-1’ 출시

루마랩스가 기존의 확산 파이프라인의 ‘의도 격차’를 해결하기 위해 구조적 추론이 가능한 이미지 모델 ‘유니-1’을 출시했다. 이 모델은 이미지 생성 전에 추론 단계를 도입하여 새로운 워크플로우를 제시한다.

2026년 3월 23일 오후 8시 44분
Google Colab 워크플로우 자동화를 위한 AI 에이전트 설계 방법

이 튜토리얼에서는 Google의 새로운 오픈소스 MCP 서버인 colab-mcp를 활용하여 Google Colab 노트북과 런타임을 프로그래밍적으로 제어하는 AI 에이전트를 설계하는 방법을 소개합니다.

2026년 3월 23일 오후 2시 33분
BM25와 RAG의 정보 검색 방식 차이

검색 엔진에 쿼리를 입력할 때, 어떤 문서가 관련성이 있는지를 결정하고 순위를 매기는 방법에 대해 BM25와 RAG의 차이를 살펴봅니다.

2026년 3월 22일 오후 9시 33분
RLax와 JAX를 활용한 CartPole 강화 학습 에이전트 구현하기

이 튜토리얼에서는 Google DeepMind가 개발한 RLax 라이브러리를 사용하여 CartPole 환경을 해결하는 강화 학습 에이전트를 구현합니다. JAX, Haiku, Optax와 함께 Deep Q-Learning(DQN) 에이전트를 구축하는 방법을 소개합니다.

2026년 3월 22일 오후 5시 54분
AI 에이전트를 위한 GitAgent: LangChain, AutoGen, Claude Code 간의 단편화를 해결하다

AI 에이전트 개발의 현재 상태는 여러 경쟁 생태계 간의 단편화로 특징지어집니다. GitAgent는 이러한 문제를 해결하기 위한 새로운 솔루션으로 주목받고 있습니다.

2026년 3월 22일 오후 5시 21분
Pymatgen을 활용한 결정 구조 구축 및 분석 튜토리얼

이 튜토리얼에서는 Python을 이용한 계산 재료 과학을 위한 pymatgen 라이브러리의 기능을 탐구합니다. 실리콘, 염화나트륨, LiFePO4 유사 물질의 결정 구조를 구축하고, 이들의 격자 속성과 조성을 분석합니다.

2026년 3월 22일 오전 12시 46분
안전한 머신러닝 모델 배포를 위한 네 가지 전략

머신러닝 모델을 생산 환경에 배포하는 것은 ML 생애 주기에서 중요한 단계입니다. 기존 모델을 직접 교체하는 것은 위험할 수 있으며, 이를 안전하게 수행하기 위한 네 가지 전략이 소개됩니다.

2026년 3월 21일 오후 7시 02분
신뢰도 추정과 자기 평가 기능을 갖춘 불확실성 인식 LLM 시스템 구축 튜토리얼

이 튜토리얼에서는 신뢰도를 추정하고 자기 평가 기능을 포함한 불확실성 인식 대형 언어 모델 시스템을 구축하는 방법을 소개합니다. 이 시스템은 답변을 생성하고 그에 대한 신뢰도를 평가합니다.

2026년 3월 21일 오후 5시 39분
NVIDIA, Nemotron-Cascade 2 출시: 30B MoE 모델로 향상된 추론 능력 제공

NVIDIA가 Nemotron-Cascade 2를 출시했습니다. 이 모델은 30B Mixture-of-Experts(MoE) 구조로, 3B의 활성화된 매개변수를 통해 뛰어난 추론 능력을 제공합니다.

2026년 3월 20일 오후 6시 38분
ClawTeam의 다중 에이전트 군집 조정 구현 튜토리얼

이 튜토리얼에서는 HKUDS가 개발한 오픈소스 에이전트 군집 지능 프레임워크인 ClawTeam의 핵심 아키텍처를 소개합니다. 복잡한 목표를 하위 작업으로 분해하는 리더 에이전트와 자율적으로 작업을 수행하는 전문 작업 에이전트의 개념을 구현합니다.

2026년 3월 20일 오후 2시 09분
LlamaIndex, AI 에이전트 워크플로우를 위한 LiteParse 출시

LlamaIndex가 AI 에이전트 워크플로우에서 공간 PDF를 파싱하기 위한 CLI 및 TypeScript 기반 라이브러리인 LiteParse를 출시했습니다. 이 도구는 데이터 수집 파이프라인의 병목 현상을 해결하는 데 도움을 줄 것으로 기대됩니다.

2026년 3월 20일 오전 2시 43분
구글, 오픈소스 MCP 서버 출시 – 로컬 AI 에이전트와 Colab GPU 사용 가능

구글이 AI 에이전트가 Google Colab 환경과 직접 상호작용할 수 있는 오픈소스 MCP 서버를 출시했습니다. 이로 인해 에이전트는 클라우드 기반 Jupyter 노트북에서 Python 코드를 생성하고 수정하며 실행할 수 있는 프로그램적 접근이 가능해졌습니다.

2026년 3월 19일 오후 6시 45분
Diffrax와 JAX를 활용한 고급 미분 방정식 해법 및 신경 미분 방정식 모델 구현 가이드

이 튜토리얼에서는 Diffrax 라이브러리를 사용하여 미분 방정식을 해결하고 신경 미분 방정식 모델을 구축하는 방법을 설명합니다. JAX, Diffrax 등 필요한 과학 컴퓨팅 라이브러리 설치부터 시작합니다.

2026년 3월 19일 오전 4시 11분
Mamba-3: 2배 작은 상태와 향상된 MIMO 디코딩 효율성을 갖춘 새로운 상태 공간 모델

카네기 멜론 대학교와 프린스턴 대학교의 연구팀이 새로운 상태 공간 모델 Mamba-3를 발표했습니다. 이 모델은 2배 작은 상태를 사용하며, MIMO 디코딩 하드웨어 효율성을 개선했습니다.

2026년 3월 19일 오전 2시 01분
칭화대와 앤트 그룹, 자율 LLM 에이전트 보안 프레임워크 발표

칭화대학교와 앤트 그룹의 연구진이 자율 LLM 에이전트인 OpenClaw의 취약점을 완화하기 위한 5단계 생애주기 기반 보안 프레임워크를 공개했습니다. 이 프레임워크는 OpenClaw의 ‘커널-플러그인’ 구조의 취약점을 분석한 결과에서 출발했습니다.

2026년 3월 18일 오후 5시 04분
바이두, 통합 문서 인공지능 모델 ‘치안판-OCR’ 발표

바이두 치안판 팀이 40억 개 매개변수를 가진 ‘치안판-OCR’을 출시했습니다. 이 모델은 문서 파싱, 레이아웃 분석, 문서 이해를 통합하여 이미지에서 직접 Markdown으로 변환할 수 있습니다.

2026년 3월 18일 오후 2시 41분
NVIDIA, 자율 AI 에이전트를 위한 안전한 런타임 환경 ‘OpenShell’ 오픈소스 공개

NVIDIA가 자율 AI 에이전트를 위한 안전한 런타임 환경인 ‘OpenShell’을 오픈소스로 공개했습니다. 이 시스템은 도구 사용과 코드 실행이 가능한 자율 AI 에이전트의 보안 문제를 해결하기 위한 것입니다.

2026년 3월 18일 오전 4시 42분
ServiceNow Research, 현실 기업 환경 평가를 위한 EnterpriseOps-Gym 발표

ServiceNow Research가 복잡한 전문 워크플로우를 수행할 수 있는 자율 에이전트를 평가하기 위한 새로운 벤치마크인 EnterpriseOps-Gym을 소개했습니다. 이 벤치마크는 기업 환경의 특정 도전 과제를 반영합니다.

2026년 3월 18일 오전 3시 08분
언슬로스 AI, VRAM 사용량 70% 줄인 로컬 노코드 인터페이스 ‘언슬로스 스튜디오’ 출시

언슬로스 AI가 고성능 대형 언어 모델(LLM) 미세 조정을 위한 로컬 노코드 인터페이스 ‘언슬로스 스튜디오’를 출시했습니다. 이 스튜디오는 VRAM 사용량을 70% 줄여 효율성을 높입니다.

2026년 3월 17일 오후 6시 32분
구글 AI, 아프리카 다국어 음성 데이터셋 WAXAL 공개

구글과 연구팀이 아프리카 언어를 위한 다국어 음성 데이터셋 WAXAL을 발표했다. 이 데이터셋은 24개 언어를 포함하며, 자동 음성 인식 및 텍스트 음성 변환 모델 훈련에 활용될 예정이다.

2026년 3월 17일 오전 4시 37분
NVIDIA Warp를 활용한 고성능 GPU 가속 시뮬레이션 구축 방법

이 튜토리얼에서는 NVIDIA Warp를 사용하여 Python에서 고성능 GPU 및 CPU 시뮬레이션을 구축하는 방법을 소개합니다. Colab 호환 환경을 설정하고 Warp를 초기화하는 과정이 포함됩니다.

2026년 3월 17일 오전 12시 42분
Mistral AI, Mistral Small 4 모델 출시: 119B 매개변수를 가진 통합 모델

Mistral AI가 Mistral Small 4를 출시했습니다. 이 모델은 다양한 기능을 통합하여 단일 배포 대상으로 설계되었습니다. Mistral Small 4는 지시 수행, 추론, 다중 모드 이해를 결합한 첫 번째 모델입니다.

2026년 3월 16일 오후 6시 48분
문샷 AI, 깊이별 주의를 통한 고정 잔여 혼합 대체 기술 발표

문샷 AI 연구팀이 변환기 모델의 성능 향상을 위해 깊이별 주의를 활용한 새로운 잔여 연결 방식을 발표했습니다. 이 방식은 기존의 고정 잔여 혼합 방식의 구조적 문제를 해결하는 데 중점을 두고 있습니다.

2026년 3월 16일 오전 2시 48분
IBM, 다국어 음성 모델 Granite 4.0 1B Speech 출시

IBM이 다국어 자동 음성 인식 및 번역을 위한 컴팩트한 음성 모델 Granite 4.0 1B Speech를 출시했습니다. 이 모델은 메모리 사용량과 지연 시간, 계산 효율성을 중시하는 기업 및 엣지 스타일의 음성 배포를 목표로 하고 있습니다.

2026년 3월 16일 오전 12시 57분
OpenClaw를 활용한 기업 AI 거버넌스 시스템 설계 튜토리얼

이 튜토리얼에서는 OpenClaw와 Python을 사용하여 기업 수준의 AI 거버넌스 시스템을 구축하는 방법을 소개합니다. OpenClaw 런타임 설정과 API를 통한 에이전트와의 상호작용을 다룹니다.

2026년 3월 15일 오후 6시 12분
OpenViking: AI 에이전트를 위한 오픈소스 컨텍스트 데이터베이스

OpenViking은 AI 에이전트를 위한 오픈소스 컨텍스트 데이터베이스로, 파일 시스템 기반의 메모리와 검색 기능을 제공합니다. 이 프로젝트는 에이전트 시스템이 컨텍스트를 단순한 텍스트 덩어리로 취급하지 않도록 설계되었습니다.

2026년 3월 15일 오후 2시 49분
LangChain, 다단계 AI 에이전트를 위한 구조화된 실행 환경 ‘Deep Agents’ 공개

LangChain이 다단계, 상태 유지, 복잡한 작업에 적합한 AI 에이전트용 라이브러리 ‘Deep Agents’를 출시했다. 이 라이브러리는 계획, 메모리, 컨텍스트 분리를 지원한다.

2026년 3월 15일 오전 5시 07분
Zhipu AI, 문서 파싱과 핵심 정보 추출 위한 0.9B 멀티모달 OCR 모델 GLM-OCR 공개

Zhipu AI가 문서 파싱과 핵심 정보 추출에 최적화된 0.9B 규모의 멀티모달 OCR 모델 GLM-OCR을 선보였다. 이 모델은 실제 문서에서 표, 수식 등 복잡한 구조를 효율적으로 처리하는 것을 목표로 한다.

2026년 3월 15일 오전 4시 08분
Outlines와 Pydantic으로 타입 안전하고 스키마 제약된 LLM 파이프라인 구축하기

이 튜토리얼에서는 Outlines를 활용해 타입 안전하고 구조화된 언어 모델 출력물을 생성하는 방법을 소개한다. Literal, int, bool 같은 타입 제약을 적용하고, Pydantic 모델로 엄격한 스키마 검증을 구현한다.

2026년 3월 14일 오후 9시 33분
개리 탄, 계획부터 코드 리뷰·QA·출시에 이르는 오픈소스 AI 코딩 시스템 ‘gstack’ 공개

개리 탄이 AI 코딩을 위한 오픈소스 툴킷 ‘gstack’을 발표했다. 이 시스템은 제품 기획, 엔지니어링 리뷰, 출시, 품질 검증을 각각 독립된 모드로 분리해 신뢰성을 높이는 데 중점을 뒀다.

2026년 3월 14일 오전 4시 44분
구글 딥마인드, 수학 경시대회에서 전문 연구까지 가능한 AI 에이전트 ‘알레시아’ 공개

구글 딥마인드가 수학 경시대회 수준을 넘어 전문 연구를 수행할 수 있는 AI 에이전트 ‘알레시아’를 선보였다. 이 AI는 자연어로 해법을 생성, 검증, 수정하며 복잡한 연구 문제를 해결한다.

2026년 3월 13일 오후 7시 05분
모델 컨텍스트 프로토콜(MCP)과 AI 에이전트 스킬 비교: LLM을 위한 구조화 도구와 행동 지침 분석

최근 AI 에이전트 생태계에서는 외부 도구와 도메인 지식 활용을 위한 두 가지 접근법인 스킬과 모델 컨텍스트 프로토콜(MCP)이 주목받고 있다. 이들은 설정과 작업 수행 방식에서 차이를 보인다.

2026년 3월 13일 오전 4시 32분
구글 AI, ‘Groundsource’ 공개…Gemini 모델로 비정형 뉴스 데이터를 역사적 정보로 변환

구글 AI 연구팀이 Gemini 모델을 활용해 비정형 글로벌 뉴스에서 구조화된 역사 데이터를 추출하는 새로운 방법론 ‘Groundsource’를 발표했다. 이 프로젝트는 급작스러운 자연재해에 대한 역사 데이터 부족 문제를 해결하는 데 목적이 있다.

2026년 3월 13일 오전 4시 07분
구글 콜랩에서 Andrej Karpathy의 AutoResearch 프레임워크로 자율 머신러닝 연구 루프 구축하기

이 튜토리얼에서는 Andrej Karpathy가 제안한 AutoResearch 프레임워크를 구글 콜랩에 맞게 구현하는 방법을 소개합니다. 자동화된 실험 파이프라인을 구축해 하이퍼파라미터 조정과 실험 추적을 자동으로 수행합니다.

2026년 3월 12일 오후 6시 46분
스탠퍼드 연구진, 도구와 학습 기능 갖춘 개인 AI 에이전트용 오픈소스 프레임워크 ‘OpenJarvis’ 공개

스탠퍼드 대학 연구진이 기기 내에서 완전히 작동하는 개인 AI 에이전트를 개발할 수 있는 오픈소스 프레임워크 ‘OpenJarvis’를 발표했다. 이 플랫폼은 로컬 우선 AI 시스템 구축을 위한 연구 및 배포용 인프라를 제공한다.

2026년 3월 12일 오후 5시 21분
동적 환경에서 부분 추론, 온라인 재계획, 반응형 중간 실행 적응을 갖춘 스트리밍 의사 결정 에이전트 설계 방법

이 튜토리얼에서는 계속해서 안전한 부분 추론 업데이트를 스트리밍하는 동안 온라인으로 생각하고 행동하는 스트리밍 의사 결정 에이전트를 구축합니다. 이는 이동하는 장애물과 이동하는 목표가 있는 동적 그리드 월드를 구현하고, 온라인 A* 플래너를 사용하여 미래 몇 단계에만 집중합니다.

2026년 3월 11일 오후 7시 44분
NVIDIA, Nemotron 3 Super 공개: 120B 파라미터 오픈소스 하이브리드 Mamba-Attention MoE 모델, 에이전틱 AI에 5배 높은 처리량 제공

NVIDIA가 Nemotron 3 Super를 공개했다. 이 모델은 복잡한 다중 에이전트 응용 프로그램을 위해 설계된 놀라운 1200억 파라미터 추론 모델로, 경쟁 모델보다 5배 높은 처리량을 제공한다.

2026년 3월 11일 오후 2시 19분
구글 AI, Gemini Embedding 2 소개: 텍스트, 이미지, 비디오, 오디오, 문서를 포함한 다중 모달 임베딩 모델

구글이 Gemini Embedding 2를 발표했다. 이 모델은 텍스트 뿐만 아니라 이미지, 비디오, 오디오, 문서 등을 임베딩 공간으로 가져와 AI 개발자가 고차원 저장 및 교차 모달 검색 도전에 대처할 수 있도록 설계되었다.

2026년 3월 11일 오전 3시 18분
Fish Audio가 Fish Audio S2를 출시하며 감정을 엄청나게 제어할 수 있는 혁신적인 텍스트 음성 변환(TTS)의 새로운 세대를 선보임

Fish Audio의 S2-Pro은 Fish Speech 생태계 내에서의 플래그십 모델로, 고품질의 다중 화자 합성과 150ms 미만의 대기 시간을 갖춘 오픈 아키텍처로의 전환을 대표함. 릴리스는 제로샷 보이스 클로닝과 세밀한 음성 복제를 위한 프레임워크를 제공함.

2026년 3월 11일 오전 12시 58분
자동으로 작업별 AI 에이전트를 구축, 생성 및 정제하는 자가 설계 메타 에이전트를 구축하는 방법

이 튜토리얼에서는 간단한 작업 설명서로부터 자동으로 다른 에이전트를 설계하는 메타 에이전트를 구축합니다. 작업을 분석하고 도구를 선택하며 메모리 아키텍처를 선택하고 계획자를 구성한 다음 완전히 작동하는 에이전트 런타임을 인스턴스화하는 시스템을 구현합니다. 정적 에이전트 템플릿을 넘어서 동적이고 자가 구성되는 아키텍처를 구축합니다.

2026년 3월 11일 오전 12시 23분
NVIDIA AI, Nemotron-Terminal: LLM 터미널 에이전트 확장을 위한 체계적인 데이터 엔지니어링 파이프라인 공개

NVIDIA가 Nemotron-Terminal을 공개했다. 이는 LLM 터미널 에이전트의 확장을 위한 체계적인 데이터 엔지니어링 파이프라인으로, 자율 주행 AI 에이전트 구축 경쟁에서 데이터가 병목 현상을 일으키고 있다. 새로운 모델과 훈련 전략의 불투명성은 연구자와 개발자를 고비용의 암묵적인 사이클로 몰아넣고 있다.

2026년 3월 10일 오후 4시 15분
내부 비평가, 자기 일관성 추론 및 불확실성 추정을 결합한 신뢰할 수 있는 의사 결정을 위한 위험 인식 AI 에이전트 구축 방법

이 튜토리얼에서는 내부 비평가와 불확실성 추정 프레임워크를 통합하여 단순한 응답 생성을 넘어진 심화된 에이전트 시스템을 구축한다. 다중 샘플 추론을 시뮬레이션하고 후보 응답을 정확도, 일관성, 안전성 측면에서 평가하며, 엔트로피, 분산, 일관성 측정을 사용하여 예측 불확실성을 양적화한다. 자신감을 균형있게 유지하기 위해 위험에 민감한 선택 전략을 구현한다.

2026년 3월 10일 오전 2시 35분
바이트댄스, 복잡한 작업을 수행하는 오픈소스 슈퍼에이전트 하네스 ‘DeerFlow 2.0’ 출시

바이트댄스가 DeerFlow 2.0을 공개했다. 이 프레임워크는 ‘슈퍼에이전트’로 일을 제안하는 것뿐만 아니라 실행하는 기능을 갖추고 있어, 복잡한 작업을 수행할 수 있다.

2026년 3월 10일 오전 2시 10분
Andrew Ng의 팀이 발표한 Context Hub: 코딩 에이전트에게 필요한 최신 API 문서를 제공하는 오픈 소스 도구

Andrew Ng와 그의 팀이 개발한 Context Hub은 코딩 에이전트의 정적 훈련 데이터와 현대 API의 빠르게 변화하는 현실 사이의 간극을 줄이기 위해 설계된 오픈 소스 도구입니다.

2026년 3월 9일 오후 4시 47분
Anthropic, 고급 에이전틱 다단계 추론 루프를 사용하여 복잡한 보안 연구 자동화를 위한 Claude Code를 통한 코드 리뷰 도입

Anthropic은 Claude Code를 통해 고급 에이전틱 다단계 추론 루프를 활용해 복잡한 보안 연구를 자동화하는 코드 리뷰를 소개하고 있다. 이는 AI가 보일러플레이트만 작성하는 것을 넘어서 실제로 왜 Kubernetes 클러스터가 새벽 3시에 알람을 울리는지 이해하는 AI 에이전트를 지향하는 것이다.

2026년 3월 9일 오후 4시 28분
‘베이지안’ 업그레이드: 왜 구글 AI의 새 가르침 방법이 LLM 추론의 열쇠인가

구글 연구팀은 현재의 AI 에이전트들이 ‘확률적 추론’ 능력을 크게 부족하다고 주장하며, 대규모 언어 모델(LLM)이 새로운 증거를 기반으로 믿음을 업데이트하는 냉정하고 단단한 논리에 대해 얼마나 고집스러운지 설명했다.

2026년 3월 9일 오전 4시 23분
Scanpy를 사용하여 클러스터링 시각화 및 세포 유형 주석에 대한 완전한 단일 세포 RNA 시퀀싱 분석 파이프라인 구축 코딩 가이드

이 튜토리얼에서는 Scanpy를 사용하여 단일 세포 RNA 시퀀싱 분석을 위한 완전한 파이프라인을 구축합니다. 필요한 라이브러리를 설치하고 PBMC 3k 데이터세트를 로드한 다음 품질 관리, 필터링, 정규화를 수행하여 데이터를 준비합니다. 고변동 유전자를 식별하고 차원 축소를 위해 PCA를 수행한 후 클러스터링 및 시각화를 진행합니다.

2026년 3월 9일 오전 1시 03분
OpenAI, 콘텍스트 인식 취약점 탐지 및 패치 생성을 위한 Codex Security 연구 미리보기 소개

OpenAI가 Codex Security를 소개했습니다. 이는 코드베이스를 분석하여 취약점을 확인하고 개발자가 수정 전에 검토할 수 있는 보안 에이전트입니다. 제품은 ChatGPT Enterprise, Business 및 Edu 고객을 대상으로 연구 미리보기로 롤아웃 중입니다.

2026년 3월 6일 오후 3시 49분
구글 AI, 안드로이드 개발을 위한 LLMs 평가 프레임워크 및 리더보드 ‘안드로이드 벤치’ 공개

구글이 안드로이드 개발 작업에서 Large Language Models (LLMs)의 성능을 측정하기 위한 새로운 리더보드 및 평가 프레임워크인 안드로이드 벤치를 공개했다. 데이터셋, 방법론, 테스트 하네스는 GitHub에서 공개되었으며, 일반 코딩 벤치마크가 캡처하지 못하는 안드로이드 개발 작업에 적합하다.

2026년 3월 6일 오후 2시 53분
Liquid AI, LFM2-24B-A2B를 활용한 LocalCowork 출시, Model Context Protocol (MCP)를 통해 로컬에서 개인정보 보호형 에이전트 워크플로우 실행

Liquid AI가 LocalCowork를 발표했는데, 이는 LFM2-24B-A2B를 활용한 모델로, 기업 워크플로우를 기기 내에서 완전히 실행할 수 있도록 해준다. API 호출과 데이터 이탈을 없애 프라이버시에 민감한 환경에서 사용된다.

2026년 3월 6일 오전 12시 45분
Daft를 활용한 고성능 구조화 및 이미지 데이터 처리를 위한 확장 가능한 엔드투엔드 머신러닝 데이터 파이프라인 구축 코딩 가이드

이 튜토리얼에서는 Daft를 사용하여 고성능의 파이썬 데이터 엔진으로 엔드투엔드 분석 파이프라인을 구축하는 방법을 탐구합니다. MNIST 데이터셋을 로드한 다음 UDF, 피처 엔지니어링, 집계, 조인 및 지연 실행을 통해 점진적으로 변환하는 방법을 살펴봅니다. 구조화된 데이터 처리, 숫자 계산, 이미지 처리 등을 원활하게 결합하는 방법을 보여줍니다.

2026년 3월 5일 오후 6시 07분
구글 AI, 워크스페이스 API용 CLI 도구 ‘gws’ 공개: 인간과 AI 에이전트를 위한 통합 인터페이스 제공

구글 워크스페이스 API를 애플리케이션과 데이터 파이프라인에 통합하는 것은 REST 엔드포인트, 페이지네이션, OAuth 2.0 흐름을 처리하는 보일러플레이트 코드를 작성해야 하는데, 구글 AI 팀이 ‘gws’ CLI 도구를 공개했다. 이 오픈소스 도구는 Google Workspace를 위한 통합된 동적 명령줄 인터페이스를 제공한다.

2026년 3월 5일 오후 5시 50분
OpenAI가 심포니를 공개: 구조화된 확장 가능한 실행을 통해 자율 AI 에이전트 조작

OpenAI는 심포니를 공개했습니다. 이는 구조화된 ‘실행’을 통해 자율 AI 코딩 에이전트를 관리하기 위한 오픈 소스 프레임워크로, 이 프로젝트는 이슈 트래커를 LLM 기반 에이전트에 연결하여 소프트웨어 개발 작업을 자동화하는 시스템을 제공합니다. 시스템 아키텍처는 Elixir 및 BEAM을 사용합니다.

2026년 3월 5일 오후 12시 37분
고급 Tree-of-Thoughts 다중 분기 추론 에이전트 설계 방법: 빔 서치, 휴리스틱 스코어링, 깊이 제한 가지치기

본 튜토리얼에서는 Tree-of-Thoughts(TOT) 다중 분기 추론 에이전트를 처음부터 구축한다. 선형 사고 체인 대신에 여러 추론 분기를 생성하고 각 분기를 휴리스틱 평가 함수로 점수를 매기며 약한 후보를 제거하고 가장 강력한 경로만 계속 확장하는 시스템을 설계한다.

2026년 3월 5일 오후 12시 00분
YuanLab AI, 강력한 지능과 탁월한 효율성을 위해 만들어진 플래그십 멀티모달 MoE Foundation 모델인 Yuan 3.0 Ultra 공개

YuanLab AI가 오픈소스 Mixture-of-Experts (MoE) 대형 언어 모델인 Yuan 3.0 Ultra를 공개했다. 이 모델은 1조 개의 총 파라미터와 68.8조 개의 활성화된 파라미터를 특징으로 하며, 기업 성능을 최적화하고 사전 훈련 효율성을 높이는 것을 목표로 한다.

2026년 3월 5일 오전 12시 55분
EverMem-스타일의 영구적 AI 에이전트 OS 구축 방법: 계층적 메모리, FAISS 벡터 검색, SQLite 저장, 자동 메모리 통합

이 튜토리얼에서는 EverMem-스타일의 영구적인 에이전트 OS를 구축하는 방법에 대해 알아본다. FAISS를 사용하여 짧은 기간의 대화적 맥락과 장기 기억 벡터를 결합하여 각 응답 생성 전 관련 과거 정보를 회상할 수 있게 한다. 의미 기억과 함께 SQLite에 구조화된 레코드를 저장하여 타임스탬프, 중요도 점수, 메모리 신호(선호도 등)와 같은 메타데이터를 영속화한다.

2026년 3월 4일 오후 6시 50분
LangWatch, AI 에이전트를 위한 누락된 평가 계층 오픈소스화

LangWatch는 AI 개발이 단순한 채팅 인터페이스에서 복잡한 자율 에이전트로 이동함에 따라 산업이 직면한 중요한 병목 현상, 즉 비결정론에 대응하기 위해 설계된 오픈소스 플랫폼이다. LangWatch는 AI 에이전트의 엔드 투 엔드 추적, 시뮬레이션 및 체계적인 테스팅을 가능하게 한다.

2026년 3월 4일 오후 1시 36분