DeepMind는 Darren Aronofsky, Eliza McNitt 및 200명 이상의 팀과 협력하여 Veo와 실사 영화 제작을 결합한 영화를 제작했습니다.
최신뉴스 전체보기
구글 딥마인드는 실험적인 태풍 예측을 제공하는 ‘웨더 랩’을 선보이고 미국 국립 허리케인 센터와 협력하여 이번 태풍 시즌 동안 그들의 예보와 경고를 지원한다.
Gemini 2.5는 AI 기술을 활용한 오디오 대화와 생성에 새로운 기능을 갖추고 있습니다.
DeepMind가 Veo 3, Imagen 4, 그리고 영화 제작을 위한 새로운 도구인 Flow를 소개했다. 이러한 도구들은 창의성을 끌어올리는 데 도움을 준다.
구글 I/O에서 발표된 SynthID Detector 포털을 통해 온라인에서 본 콘텐츠가 어떻게 생성되었는지 이해하는 데 도움을 받을 수 있습니다.
Gemma 3n은 최적화된 성능과 고유한 유연성을 갖춘 빠른 멀티모달 AI를 지원하는 혁신적인 오픈 모델로, 오디오를 활용한 확장된 멀티모달 이해력을 제공하여 개발자들이 실시간 대화형 애플리케이션과 정교한 오디오 중심 경험을 구축할 수 있게 돕는다.
최신 모델 패밀리인 Gemini 2.5를 가장 안전하게 만들었습니다.
Gemini를 확장하여 세계 모델로 만들어 세계의 측면을 시뮬레이션하여 계획을 세우고 새로운 경험을 상상할 수 있게 합니다.
Gemini 2.5 Pro은 개발자들에게 코딩을 위한 최고의 모델로 사랑받고 있으며, 2.5 Flash는 새로운 업데이트로 더욱 개선 중입니다. Deep Think와 같은 새로운 기능을 모델에 추가하고 있습니다.
AlphaEvolve는 대형 언어 모델의 창의성과 자동 평가자를 결합하여 수학 및 컴퓨팅의 실용적 응용을 위해 알고리즘을 진화시키는 새로운 AI 에이전트입니다.
Gemini 2.5 Pro의 성능이 향상되어 개발자들이 빠른 속도로 사용할 수 있도록 업데이트 버전을 조기 출시했다.
Gemini 2.5 Pro 미리보기의 업데이트된 버전은 코딩 기능을 향상시켰습니다.
음악 전문가들이 생성적 AI의 잠재력을 탐색하는 데 도움
Gemini 2.5 Flash는 개발자들이 사고를 켜거나 끌 수 있는 최초의 완전 혼합 추론 모델이다.
Veo 2를 사용하여 텍스트 기반 프롬프트를 고해상도 8초 비디오로 변환하고, 위스크 애니메이트를 사용하여 이미지를 8초 애니메이션 클립으로 변환합니다.
돌고래 통신을 해독하는 데 도움을 주는 구글이 개발한 대형 언어 모델 DolphinGemma는 과학자들이 돌고래가 어떻게 소통하는지 연구하는 데 도움이 되고, 그들이 무슨 말을 하는지 알아내는 데도 도움을 줄 수 있습니다.
DeepMind는 AGI의 선두를 열고 있으며 기술적 안전, 적극적인 리스크 평가, AI 커뮤니티와의 협력을 우선시하고 있다.
이 프레임워크는 사이버 보안 전문가들이 필요한 방어 기술을 식별하고 우선 순위를 매기는 데 도움을 줍니다.
Gemini 2.5는 우리가 가장 지능적인 AI 모델로, 이제 사고 기능이 내장되어 있습니다.
Gemini Robotics 및 Gemini Robotics-ER은 로봇이 물리 세계를 이해하고 대응하도록 설계된 AI 모델입니다.
Gemini 2.0 Flash에서 개발자들이 구글 AI Studio와 Gemini API에서 실험할 수 있는 네이티브 이미지 출력이 가능해졌다.
젬마 3는 단일 GPU 또는 TPU에서 실행할 수 있는 가장 강력한 모델이다.
Gemini API에서 Gemini 2.0 Flash-Lite가 일반적으로 사용 가능하며 Google AI Studio 및 Vertex AI의 기업 고객을 위해 제공됩니다.
Gemini 2.0 Flash에 새로운 업데이트를 발표하고 Gemini 2.0 Flash-Lite 및 Gemini 2.0 Pro Experimental을 소개합니다.
AGI로 가는 길에서 강력한 보안 프로토콜이 제시되는 FSF의 다음 버전.
FACTS Grounding은 대규모 언어 모델이 응답을 제공된 소스 자료에 얼마나 정확하게 근거를 두고 환각을 피하는지를 측정하는 새로운 벤치마크와 온라인 리더보드를 제공합니다.
구글 딥마인드가 최신 비디오 모델인 Veo 2와 Imagen 3의 업데이트를 발표했으며, 새로운 실험인 Whisk를 소개했다.
DeepMind이 발표한 Gemini 2.0은 최신의 멀티모달 AI 모델로, 에이전트 시대에 가장 적합하다.
구글 딥마인드는 NeurIPS 2024에서 적응형 AI 에이전트 발전, 3D 장면 생성 지원, 또한 더 스마트하고 안전한 미래를 위한 LLM 교육 혁신을 이끌어냈다.
GenCast는 날씨 불확실성과 위험을 예측하여 15일 앞까지 빠르고 정확한 예보를 제공하는 새로운 AI 모델이다.
Genie 2는 미래 일반 에이전트를 위해 무제한 다양한 훈련 환경을 생성한다.
얼파큐빗의 새로운 AI 시스템은 양자 컴퓨터 내부의 오류를 정확하게 식별하여 이 새로운 기술을 더 신뢰할 수 있게 돕는다.
AI 과학 포럼은 현재 AI의 역할과 가능성을 강조하며 과학 발견과 글로벌 도전 과제 해결을 혁신하는 데 협력을 강조합니다.
구글 딥마인드의 연구는 혁신적인 음성 생성 기술을 통해 전 세계 사람들이 더 자연스럽고 대화 형식, 직관적인 디지털 어시스턴트와 AI 도구와 상호 작용하도록 도와주고 있다.
딥마인드의 최신 AI 음악 기술이 MusicFX DJ, Music AI Sandbox 및 YouTube Shorts에서 이용 가능하다.
디미스 하사비스와 존 점퍼가 AI 시스템 알파폴드를 개발한 노력으로 화학 노벨상을 수상했다. 알파폴드는 단백질의 3D 구조를 예측하는 혁신적인 기술이다.
알파칩은 컴퓨터 칩 디자인을 가속화하고 최적화하여 세계 각지의 하드웨어에서 사용되는 초인간적인 칩 레이아웃을 구현했다.
구글의 DeepMind가 두 개의 업데이트된 제미니 모델을 공개했고, Pro 요금을 1.5배 낮추고 요청 제한을 늘린다.
유튜브 쇼츠에서의 새로운 비디오 생성 기술은 수백만 명의 사람들이 창의적인 아이디어를 실현할 수 있게 도와줄 것이다.
ALOHA Unleashed와 DemoStart라는 두 개의 새로운 AI 시스템이 로봇이 섬세한 움직임을 필요로 하는 복잡한 작업을 수행하는 데 도움을 줌
AlphaProteo는 새로운 AI 시스템으로, 대상 분자에 성공적으로 결합하는 단백질을 디자인하여 약물 개발, 질병 이해 등에 기여할 수 있음.
페르미넷은 딥러닝을 사용하여 계산 양자 화학의 기본적인 문제를 해결하고 물질이 빛과 상호 작용하는 방식을 탐구합니다.
새로운 연구는 오늘의 다중 모달 생성 AI 남용을 분석하여 더 안전하고 책임감 있는 기술 구축에 도움을 줍니다.
Gemma Scope는 언어 모델 해석 가능성을 위한 포괄적이고 오픈 소스의 희소 오토인코더 스위트를 발표했다.
AlphaProof와 AlphaGeometry 2라는 새로운 모델이 수학의 고급 추론 문제를 해결하는 데 성공하며, 국제 수학 올림피아드 문제를 은메달 수준으로 해결함.
ICML 2024에서 구글 딥마인드가 인공 일반 지능 탐구, 확장의 어려움, 그리고 다중 모달 생성 인공지능의 미래에 대해 논의했습니다.
비디오 픽셀과 텍스트 프롬프트를 사용하여 비디오에 풍부한 사운드 트랙을 생성하는 비디오-투-오디오 연구
서울, 프랑스 등에서의 정상회의가 선두주자 AI 안전에 대한 국제 협력을 촉진할 수 있는 방법에 대해 다룹니다.
구글 딥마인드가 발표한 고급 AI 모델이 가져다줄 미래 위험을 분석하고 완화하는 방법 소개
Gemini 모델군에 대한 일련의 업데이트를 소개합니다. 1.5 Flash는 속도와 효율성을 위한 경량 모델이며, 미래의 AI 어시스턴트를 위한 Project Astra도 포함됩니다.
DeepMind는 고화질 비디오 생성을 위한 Veo 모델과 최고 품질의 텍스트-이미지 모델인 Imagen 3을 소개하며, Music AI Sandbox로 만들어진 새로운 데모 녹음을 공유했습니다.
구글의 새로운 워터마킹 방법인 SynthID를 소개하며 AI 생성 텍스트와 비디오에 적용하는 방법과 주요 구글 제품에 SynthID를 도입하는 방법에 대해 소개합니다.
구글 딥마인드와 이소모픽 랩이 개발한 새로운 AI 모델 소개.
구글 딥마인드가 다음 세대 AI 에이전트를 개발하고, 새로운 형식을 탐구하며, 기반 학습을 선도하고 있다.
더 능력있는 AI가 미래에 가져올 약속과 위험을 탐구합니다.
리버풀 FC와의 장기 협력의 일환으로, 코너킥에 대한 조언을 제공하는 AI 시스템을 개발했다.
SIMA는 3D 가상환경에서 확장 가능한 가르칠 수 있는 다세계적 에이전트로 소개됐다.
Gemma는 Gemini 모델을 만드는 데 사용된 연구와 기술을 기반으로 한 책임 있는 AI 개발을 위해 만들어졌다.
Gemini 1.5는 각 모달리티 간의 장기 맥락 이해에서 혁신을 이루며 혁신적인 성능을 제공합니다.
구글이 Gemini를 더 많은 제품에 적용하기 시작했다.
알파지오메트리는 수학적 추론에서 AI를 발전시키고 있습니다.
DeepMind가 AutoRT, SARA-RT, RT-Trajectory를 소개하며 고급 로보틱스의 미래를 모색하고 있다.
인간 판단이 적대적 왜곡에 의해 체계적으로 영향을 받을 수 있다는 증거를 발견했다.
2023년은 인공지능 연구와 실용적인 응용 분야에서 엄청난 진전의 해였다.
Nature에 발표된 논문에서 소개된 FunSearch는 컴퓨터 코드로 작성된 “함수”를 찾고 수학과 컴퓨터과학에서 새로운 해법을 찾는 방법으로, 사전 훈련된 대형 언어 모델(Large Language Models)과 자동 “평가자”를 결합하여 창의적인 솔루션을 제공하고 허구와 잘못된 아이디어에 대비합니다.
NeurIPS는 세계 최대의 AI 학회로, 2023년 12월 10일부터 미국 뉴올리언스에서 열릴 예정이다. 구글 딥마인드 팀은 이 행사에서 150편 이상의 논문을 발표할 예정이다.
DeepMind가 새로운 AI 모델인 Gemini를 발표했다. Gemini는 DeepMind의 가장 크고 가장 능력있는 AI 모델로, 모든 사람들에게 더 도움이 되도록 설계되었다.
구글 딥마인드가 2.2백만 개의 새로운 결정체를 발견했고, 이는 약 800년치의 지식에 해당한다. GNoME은 새로운 물질의 안정성을 예측하여 발견 속도와 효율성을 크게 향상시키는 새로운 딥러닝 도구이다.
딥마인드가 음악 생성 모델과 두 가지 새로운 AI 실험을 발표했는데, 이는 창의성을 위한 새로운 놀이터를 열기 위한 것이다.
Experience AI의 강좌와 자료는 전 세계적으로 확대되고 있습니다.
글래프캐스트는 전례없는 정확도로 중기 기상 예보를 수행하는 최첨단 AI 모델이다.
알파폴드의 최신 모델이 크게 향상된 정확도를 보이며 단백질뿐만 아니라 리간드 등 다른 생물 분자에 대한 범위를 확장하고 있다.
이 기사는 AI 시스템의 사회적, 윤리적 위험을 종합적으로 평가하기 위한 맥락 기반 프레임워크를 소개한다.
로봇은 특정 분야에 뛰어나지만, 일반적으로는 약합니다. 각 작업, 로봇 및 환경마다 모델을 훈련해야 합니다. 하나의 변수를 바꾸는 것도 처음부터 다시 시작해야 합니다. 하지만 만일 우리가 로봇공학 지식을 결합하여 일반용 로봇을 훈련하는 방법을 만들 수 있다면 어떨까요?
새로운 AI 도구는 7100만 개의 ‘미생성’ 돌연변이 효과를 분류합니다.
SynthID는 Imagen이 생성한 합성 이미지에 워터마크를 삽입하고 식별하는 데 도움을 주는 새로운 도구이다.
RT-2는 웹과 로봇 데이터에서 학습한 새로운 비전-언어-행동(VLA) 모델로, 이 지식을 일반화된 로봇 제어 명령으로 번역합니다.
AI 기술은 미래를 변화시킬 강력한 도구이며, 기후 변화와 지속 가능한 해결책을 찾는 데 어떻게 가장 효과적으로 활용할 수 있을까?
구글 딥마인드는 ICML 2023에서 인공지능 안전성, 적응성, 효율성을 탐구했다.
DeepMind와 구글 리서치가 발표한 논문에서는 의료 이미지의 정확한 해석을 위해 AI 시스템인 CoDoC를 제안했다. 이 시스템은 예측 AI 도구에 의존할지 의사에게 판단을 맡길지 학습한다.
신규 백서가 선진 AI의 기회를 관리하고 위험을 완화하는 데 도움이 될 수 있는 국제 기관의 모델과 기능을 조사합니다.
최근 AI의 발전을 활용하여 다양한 방법으로 도와줄 수 있는 로봇을 만들기 위해 자체 발전하는 AI 에이전트인 로보캣을 소개하는 논문 발표.
YouTube는 모든 사람에게 목소리를 듣게 하고 세상을 보여주는 데 기술과 연구를 활용하는 것이 중요하다.
구글 클라우드는 기업이 더 스마트한 비즈니스로 디지털 변혁할 수 있도록 지원하며, 클라우드 컴퓨팅, 데이터 분석, 최신 인공지능(AI) 및 기계 학습 도구를 제공합니다.
MuZero, AlphaZero, 그리고 AlphaDev가 장치들을 구동하는 컴퓨팅 생태계를 최적화하는 방법에 대해 알아봅니다.
AlphaDev가 발견한 새로운 알고리즘은 컴퓨팅의 기초를 변형할 것이다.
이 연구는 새로운 위협에 대응하기 위한 일반적인 모델을 평가하기 위한 프레임워크를 제안합니다.
11회 ICLR이 5월 1일부터 5일까지 루완다 키갈리에서 개최될 예정이며, 인공지능, 통계 및 데이터 과학, 머신 비전, 게임 및 로봇 과학 분야의 혁신적인 딥러닝 연구를 공유할 것.
철학적 관점에서 윤리적 AI를 위한 공정한 원칙을 도출하는 방법에 대해 탐구하고 있습니다.
구글 딥마인드와 구글 리서치 브레인 팀이 합류하여, AI가 인류가 직면한 가장 큰 문제를 해결하는 데 도움을 주는 세상으로 진전을 가속화할 것이다.
경쟁 프로그래밍에서 새로운 문제 해결과 새로운 기준 설정
인류 사회의 발전을 위해 소통과 협력은 중요했는데, 보드 게임은 상호작용과 소통을 모델링하고 조사하는 모래상자 역할을 한다. 최근 Nature Communications에 발표된 논문에서 인공 에이전트가 소통을 통해 보드 게임 Diplomacy에서 더 잘 협력할 수 있는 방법을 보여줌.
게임을 플레이하는 인공지능 시스템이 새로운 지평으로 발전했습니다.
NeurIPS는 인공지능 및 머신러닝 분야에서 세계 최대 규모의 학회로, 딥마인드는 다이아몬드 후원사로 참여하여 인공지능 및 머신러닝 커뮤니티에서의 연구 진전 교류를 돕고 있다. 딥마인드 팀은 35개의 외부 협업을 포함한 47편의 논문을 가상 패널과 포스터 세션을 통해 발표할 예정이다.
인공지능 연구자들은 현재 상황에 맞는 상호 작용의 미묘한 면을 포착할 수 있는 컴퓨터 코드를 작성하는 것이 불가능하다고 믿고 있다. 대신, 최신 머신러닝 연구자들은 이러한 상호 작용 유형에 대해 데이터로부터 학습하는 데 초점을 맞추었다. 비디오 게임 환경 내에서 인간 지시를 이해하고 안전하게 행동할 수 있는 에이전트를 빠르게 구축하기 위해 연구 프레임워크를 만들었다.
30년간의 컴퓨터 비전 연구를 활용하여 지식을 쌓아가는 방법을 학습합니다.
AI 파트너십과 함께 데이터 수집에 대한 책임있는 접근 방식 구축
수십만 명의 생명을 구할 수 있는 백신 개발
인공 지능의 중요한 부분인 지각은 센서를 통해 세상을 경험하는 과정이다. 이를 위해 실제 영상을 활용한 Perception Test가 소개되었는데, 로봇공학, 자율주행 자동차, 개인 비서, 의료 영상 등에서 중요한 역할을 한다.
인공지능이 원치 않는 목표를 추구하는 것을 방지하기 위해 새로운 매커니즘인 goal misgeneralisation (GMG)에 대해 연구하였다. GMG는 시스템이 원하는 목표를 올바르게 추상화하지 못하고 잘못된 목표를 추구하는 현상이다. 이는 명세 게이밍과 달리 올바른 명세로 훈련되어도 발생할 수 있다.