음악 전문가들이 생성적 AI의 잠재력을 탐색하는 데 도움
Gemini 2.5 Flash는 개발자들이 사고를 켜거나 끌 수 있는 최초의 완전 혼합 추론 모델이다.
Veo 2를 사용하여 텍스트 기반 프롬프트를 고해상도 8초 비디오로 변환하고, 위스크 애니메이트를 사용하여 이미지를 8초 애니메이션 클립으로 변환합니다.
돌고래 통신을 해독하는 데 도움을 주는 구글이 개발한 대형 언어 모델 DolphinGemma는 과학자들이 돌고래가 어떻게 소통하는지 연구하는 데 도움이 되고, 그들이 무슨 말을 하는지 알아내는 데도 도움을 줄 수 있습니다.
DeepMind는 AGI의 선두를 열고 있으며 기술적 안전, 적극적인 리스크 평가, AI 커뮤니티와의 협력을 우선시하고 있다.
이 프레임워크는 사이버 보안 전문가들이 필요한 방어 기술을 식별하고 우선 순위를 매기는 데 도움을 줍니다.
Gemini 2.5는 우리가 가장 지능적인 AI 모델로, 이제 사고 기능이 내장되어 있습니다.
Gemini Robotics 및 Gemini Robotics-ER은 로봇이 물리 세계를 이해하고 대응하도록 설계된 AI 모델입니다.
Gemini 2.0 Flash에서 개발자들이 구글 AI Studio와 Gemini API에서 실험할 수 있는 네이티브 이미지 출력이 가능해졌다.
젬마 3는 단일 GPU 또는 TPU에서 실행할 수 있는 가장 강력한 모델이다.
Gemini API에서 Gemini 2.0 Flash-Lite가 일반적으로 사용 가능하며 Google AI Studio 및 Vertex AI의 기업 고객을 위해 제공됩니다.
Gemini 2.0 Flash에 새로운 업데이트를 발표하고 Gemini 2.0 Flash-Lite 및 Gemini 2.0 Pro Experimental을 소개합니다.
AGI로 가는 길에서 강력한 보안 프로토콜이 제시되는 FSF의 다음 버전.
FACTS Grounding은 대규모 언어 모델이 응답을 제공된 소스 자료에 얼마나 정확하게 근거를 두고 환각을 피하는지를 측정하는 새로운 벤치마크와 온라인 리더보드를 제공합니다.
구글 딥마인드가 최신 비디오 모델인 Veo 2와 Imagen 3의 업데이트를 발표했으며, 새로운 실험인 Whisk를 소개했다.
DeepMind이 발표한 Gemini 2.0은 최신의 멀티모달 AI 모델로, 에이전트 시대에 가장 적합하다.
구글 딥마인드는 NeurIPS 2024에서 적응형 AI 에이전트 발전, 3D 장면 생성 지원, 또한 더 스마트하고 안전한 미래를 위한 LLM 교육 혁신을 이끌어냈다.
GenCast는 날씨 불확실성과 위험을 예측하여 15일 앞까지 빠르고 정확한 예보를 제공하는 새로운 AI 모델이다.
Genie 2는 미래 일반 에이전트를 위해 무제한 다양한 훈련 환경을 생성한다.
얼파큐빗의 새로운 AI 시스템은 양자 컴퓨터 내부의 오류를 정확하게 식별하여 이 새로운 기술을 더 신뢰할 수 있게 돕는다.
AI 과학 포럼은 현재 AI의 역할과 가능성을 강조하며 과학 발견과 글로벌 도전 과제 해결을 혁신하는 데 협력을 강조합니다.
구글 딥마인드의 연구는 혁신적인 음성 생성 기술을 통해 전 세계 사람들이 더 자연스럽고 대화 형식, 직관적인 디지털 어시스턴트와 AI 도구와 상호 작용하도록 도와주고 있다.
딥마인드의 최신 AI 음악 기술이 MusicFX DJ, Music AI Sandbox 및 YouTube Shorts에서 이용 가능하다.
디미스 하사비스와 존 점퍼가 AI 시스템 알파폴드를 개발한 노력으로 화학 노벨상을 수상했다. 알파폴드는 단백질의 3D 구조를 예측하는 혁신적인 기술이다.
알파칩은 컴퓨터 칩 디자인을 가속화하고 최적화하여 세계 각지의 하드웨어에서 사용되는 초인간적인 칩 레이아웃을 구현했다.
구글의 DeepMind가 두 개의 업데이트된 제미니 모델을 공개했고, Pro 요금을 1.5배 낮추고 요청 제한을 늘린다.
유튜브 쇼츠에서의 새로운 비디오 생성 기술은 수백만 명의 사람들이 창의적인 아이디어를 실현할 수 있게 도와줄 것이다.
ALOHA Unleashed와 DemoStart라는 두 개의 새로운 AI 시스템이 로봇이 섬세한 움직임을 필요로 하는 복잡한 작업을 수행하는 데 도움을 줌
AlphaProteo는 새로운 AI 시스템으로, 대상 분자에 성공적으로 결합하는 단백질을 디자인하여 약물 개발, 질병 이해 등에 기여할 수 있음.
페르미넷은 딥러닝을 사용하여 계산 양자 화학의 기본적인 문제를 해결하고 물질이 빛과 상호 작용하는 방식을 탐구합니다.
새로운 연구는 오늘의 다중 모달 생성 AI 남용을 분석하여 더 안전하고 책임감 있는 기술 구축에 도움을 줍니다.
Gemma Scope는 언어 모델 해석 가능성을 위한 포괄적이고 오픈 소스의 희소 오토인코더 스위트를 발표했다.
AlphaProof와 AlphaGeometry 2라는 새로운 모델이 수학의 고급 추론 문제를 해결하는 데 성공하며, 국제 수학 올림피아드 문제를 은메달 수준으로 해결함.
ICML 2024에서 구글 딥마인드가 인공 일반 지능 탐구, 확장의 어려움, 그리고 다중 모달 생성 인공지능의 미래에 대해 논의했습니다.
비디오 픽셀과 텍스트 프롬프트를 사용하여 비디오에 풍부한 사운드 트랙을 생성하는 비디오-투-오디오 연구
서울, 프랑스 등에서의 정상회의가 선두주자 AI 안전에 대한 국제 협력을 촉진할 수 있는 방법에 대해 다룹니다.
구글 딥마인드가 발표한 고급 AI 모델이 가져다줄 미래 위험을 분석하고 완화하는 방법 소개
Gemini 모델군에 대한 일련의 업데이트를 소개합니다. 1.5 Flash는 속도와 효율성을 위한 경량 모델이며, 미래의 AI 어시스턴트를 위한 Project Astra도 포함됩니다.
DeepMind는 고화질 비디오 생성을 위한 Veo 모델과 최고 품질의 텍스트-이미지 모델인 Imagen 3을 소개하며, Music AI Sandbox로 만들어진 새로운 데모 녹음을 공유했습니다.
구글의 새로운 워터마킹 방법인 SynthID를 소개하며 AI 생성 텍스트와 비디오에 적용하는 방법과 주요 구글 제품에 SynthID를 도입하는 방법에 대해 소개합니다.
구글 딥마인드와 이소모픽 랩이 개발한 새로운 AI 모델 소개.
구글 딥마인드가 다음 세대 AI 에이전트를 개발하고, 새로운 형식을 탐구하며, 기반 학습을 선도하고 있다.
더 능력있는 AI가 미래에 가져올 약속과 위험을 탐구합니다.
리버풀 FC와의 장기 협력의 일환으로, 코너킥에 대한 조언을 제공하는 AI 시스템을 개발했다.
SIMA는 3D 가상환경에서 확장 가능한 가르칠 수 있는 다세계적 에이전트로 소개됐다.
Gemma는 Gemini 모델을 만드는 데 사용된 연구와 기술을 기반으로 한 책임 있는 AI 개발을 위해 만들어졌다.
Gemini 1.5는 각 모달리티 간의 장기 맥락 이해에서 혁신을 이루며 혁신적인 성능을 제공합니다.
구글이 Gemini를 더 많은 제품에 적용하기 시작했다.
알파지오메트리는 수학적 추론에서 AI를 발전시키고 있습니다.
DeepMind가 AutoRT, SARA-RT, RT-Trajectory를 소개하며 고급 로보틱스의 미래를 모색하고 있다.
인간 판단이 적대적 왜곡에 의해 체계적으로 영향을 받을 수 있다는 증거를 발견했다.
2023년은 인공지능 연구와 실용적인 응용 분야에서 엄청난 진전의 해였다.
Nature에 발표된 논문에서 소개된 FunSearch는 컴퓨터 코드로 작성된 “함수”를 찾고 수학과 컴퓨터과학에서 새로운 해법을 찾는 방법으로, 사전 훈련된 대형 언어 모델(Large Language Models)과 자동 “평가자”를 결합하여 창의적인 솔루션을 제공하고 허구와 잘못된 아이디어에 대비합니다.
NeurIPS는 세계 최대의 AI 학회로, 2023년 12월 10일부터 미국 뉴올리언스에서 열릴 예정이다. 구글 딥마인드 팀은 이 행사에서 150편 이상의 논문을 발표할 예정이다.
DeepMind가 새로운 AI 모델인 Gemini를 발표했다. Gemini는 DeepMind의 가장 크고 가장 능력있는 AI 모델로, 모든 사람들에게 더 도움이 되도록 설계되었다.
구글 딥마인드가 2.2백만 개의 새로운 결정체를 발견했고, 이는 약 800년치의 지식에 해당한다. GNoME은 새로운 물질의 안정성을 예측하여 발견 속도와 효율성을 크게 향상시키는 새로운 딥러닝 도구이다.
딥마인드가 음악 생성 모델과 두 가지 새로운 AI 실험을 발표했는데, 이는 창의성을 위한 새로운 놀이터를 열기 위한 것이다.
Experience AI의 강좌와 자료는 전 세계적으로 확대되고 있습니다.
글래프캐스트는 전례없는 정확도로 중기 기상 예보를 수행하는 최첨단 AI 모델이다.
알파폴드의 최신 모델이 크게 향상된 정확도를 보이며 단백질뿐만 아니라 리간드 등 다른 생물 분자에 대한 범위를 확장하고 있다.
이 기사는 AI 시스템의 사회적, 윤리적 위험을 종합적으로 평가하기 위한 맥락 기반 프레임워크를 소개한다.
로봇은 특정 분야에 뛰어나지만, 일반적으로는 약합니다. 각 작업, 로봇 및 환경마다 모델을 훈련해야 합니다. 하나의 변수를 바꾸는 것도 처음부터 다시 시작해야 합니다. 하지만 만일 우리가 로봇공학 지식을 결합하여 일반용 로봇을 훈련하는 방법을 만들 수 있다면 어떨까요?
새로운 AI 도구는 7100만 개의 ‘미생성’ 돌연변이 효과를 분류합니다.
SynthID는 Imagen이 생성한 합성 이미지에 워터마크를 삽입하고 식별하는 데 도움을 주는 새로운 도구이다.
RT-2는 웹과 로봇 데이터에서 학습한 새로운 비전-언어-행동(VLA) 모델로, 이 지식을 일반화된 로봇 제어 명령으로 번역합니다.
AI 기술은 미래를 변화시킬 강력한 도구이며, 기후 변화와 지속 가능한 해결책을 찾는 데 어떻게 가장 효과적으로 활용할 수 있을까?
구글 딥마인드는 ICML 2023에서 인공지능 안전성, 적응성, 효율성을 탐구했다.
DeepMind와 구글 리서치가 발표한 논문에서는 의료 이미지의 정확한 해석을 위해 AI 시스템인 CoDoC를 제안했다. 이 시스템은 예측 AI 도구에 의존할지 의사에게 판단을 맡길지 학습한다.
신규 백서가 선진 AI의 기회를 관리하고 위험을 완화하는 데 도움이 될 수 있는 국제 기관의 모델과 기능을 조사합니다.
최근 AI의 발전을 활용하여 다양한 방법으로 도와줄 수 있는 로봇을 만들기 위해 자체 발전하는 AI 에이전트인 로보캣을 소개하는 논문 발표.
YouTube는 모든 사람에게 목소리를 듣게 하고 세상을 보여주는 데 기술과 연구를 활용하는 것이 중요하다.
구글 클라우드는 기업이 더 스마트한 비즈니스로 디지털 변혁할 수 있도록 지원하며, 클라우드 컴퓨팅, 데이터 분석, 최신 인공지능(AI) 및 기계 학습 도구를 제공합니다.
MuZero, AlphaZero, 그리고 AlphaDev가 장치들을 구동하는 컴퓨팅 생태계를 최적화하는 방법에 대해 알아봅니다.
AlphaDev가 발견한 새로운 알고리즘은 컴퓨팅의 기초를 변형할 것이다.
이 연구는 새로운 위협에 대응하기 위한 일반적인 모델을 평가하기 위한 프레임워크를 제안합니다.
11회 ICLR이 5월 1일부터 5일까지 루완다 키갈리에서 개최될 예정이며, 인공지능, 통계 및 데이터 과학, 머신 비전, 게임 및 로봇 과학 분야의 혁신적인 딥러닝 연구를 공유할 것.
철학적 관점에서 윤리적 AI를 위한 공정한 원칙을 도출하는 방법에 대해 탐구하고 있습니다.
구글 딥마인드와 구글 리서치 브레인 팀이 합류하여, AI가 인류가 직면한 가장 큰 문제를 해결하는 데 도움을 주는 세상으로 진전을 가속화할 것이다.
경쟁 프로그래밍에서 새로운 문제 해결과 새로운 기준 설정
인류 사회의 발전을 위해 소통과 협력은 중요했는데, 보드 게임은 상호작용과 소통을 모델링하고 조사하는 모래상자 역할을 한다. 최근 Nature Communications에 발표된 논문에서 인공 에이전트가 소통을 통해 보드 게임 Diplomacy에서 더 잘 협력할 수 있는 방법을 보여줌.
게임을 플레이하는 인공지능 시스템이 새로운 지평으로 발전했습니다.
NeurIPS는 인공지능 및 머신러닝 분야에서 세계 최대 규모의 학회로, 딥마인드는 다이아몬드 후원사로 참여하여 인공지능 및 머신러닝 커뮤니티에서의 연구 진전 교류를 돕고 있다. 딥마인드 팀은 35개의 외부 협업을 포함한 47편의 논문을 가상 패널과 포스터 세션을 통해 발표할 예정이다.
인공지능 연구자들은 현재 상황에 맞는 상호 작용의 미묘한 면을 포착할 수 있는 컴퓨터 코드를 작성하는 것이 불가능하다고 믿고 있다. 대신, 최신 머신러닝 연구자들은 이러한 상호 작용 유형에 대해 데이터로부터 학습하는 데 초점을 맞추었다. 비디오 게임 환경 내에서 인간 지시를 이해하고 안전하게 행동할 수 있는 에이전트를 빠르게 구축하기 위해 연구 프레임워크를 만들었다.
30년간의 컴퓨터 비전 연구를 활용하여 지식을 쌓아가는 방법을 학습합니다.
AI 파트너십과 함께 데이터 수집에 대한 책임있는 접근 방식 구축
수십만 명의 생명을 구할 수 있는 백신 개발
인공 지능의 중요한 부분인 지각은 센서를 통해 세상을 경험하는 과정이다. 이를 위해 실제 영상을 활용한 Perception Test가 소개되었는데, 로봇공학, 자율주행 자동차, 개인 비서, 의료 영상 등에서 중요한 역할을 한다.
인공지능이 원치 않는 목표를 추구하는 것을 방지하기 위해 새로운 매커니즘인 goal misgeneralisation (GMG)에 대해 연구하였다. GMG는 시스템이 원하는 목표를 올바르게 추상화하지 못하고 잘못된 목표를 추구하는 현상이다. 이는 명세 게이밍과 달리 올바른 명세로 훈련되어도 발생할 수 있다.
DeepMind이 Nature에 발표한 논문에서는 행렬 곱셈과 같은 기본 작업을 위한 혁신적이고 효율적이며 증명 가능한 알고리즘을 발견하는 인공지능 시스템인 AlphaTensor를 소개합니다. 이는 50년간의 수학적 문제를 해결하는 데 가장 빠른 방법을 찾는 데 도움이 됩니다. AlphaTensor는 AlphaZero를 기반으로 구축되었으며, 이 작업은 AlphaZero의 게임에서 수학 문제를 해결하기까지의 여정을 나타냅니다.
골이 부러지기 전 질병의 조기 징후 감지
단백질 돌연변이가 질병과 장애를 일으키는 메커니즘 이해에 도움
50,000년 전 멸종한 종을 연구하기 위한 도구 개발
Sparrow는 위험하고 부적절한 답변의 위험을 줄이면서 유용한 대화 에이전트로, 사용자와 대화하고 질문에 답변하며 필요할 때 Google을 사용하여 인터넷을 검색하여 답변을 제공하는 에이전트를 소개하는 논문이 최신입니다.
AI를 활용한 초기발병 파킨슨병 예측으로 새로운 치료법 개척.
DeepMind의 운영 원칙은 보급혜택 우선 및 추구하지 않는 연구 및 응용 분야를 정의하는 데에 기여했다. 이러한 원칙은 DeepMind의 결정에 중심 역할을 해왔으며, AI 분야의 변화와 성장에 따라 계속해서 개선되고 있다. 이러한 원칙들은 연구 주도 과학 기업으로서의 역할에 맞추어 설계되었으며, Google의 AI 원칙과 일관성이 있다.
DeepMind의 CBO인 Colin은 Alphabet과의 협업 및 윤리, 책임성, 안전성을 우리의 모든 활동에 통합하는 방법에 대해 논의합니다.
새 논문 ‘AI와 대화: 인간의 가치와 언어 모델 조정’은 인간과 인공 대화 에이전트 간의 성공적인 커뮤니케이션을 탐구하며 이러한 맥락에서 대화를 이끌어야 하는 가치에 대해 논의한다.
인간과 동물의 움직임을 활용하여 로봇에게 공을 드리블하고 시뮬레이션된 인간형 캐릭터에게 상자를 옮기고 축구를 시키는 방법을 연구했다.
구글 딥마인드는 Zindi와 협력하여 거북이 얼굴 인식 기술을 개발해 보존 노력을 지원하고 AI 참여를 촉진하는 프로젝트를 시작했다. Zindi의 경쟁에서 영감을 받아 실제 영향을 줄 수 있는 프로젝트를 선정했다.
안전하고 일치된 인공 일반 지능(AGI) 시스템을 구축하고자 하는 노력 속에서, 인공 에이전트의 동기를 추론할 수 있는 인과적 영향 다이어그램 (CID)이 중요한 역할을 한다. 훈련 설정을 에이전트 행동에 영향을 미치는 동기와 관련시킴으로써, CIDs는 에이전트를 훈련하기 전 잠재적 위험을 밝히고 더 나은 에이전트 디자인을 영감을 줄 수 있다. 그렇다면, 우리는 어떻게 알 수 있을까? CID가 훈련 설정의 정확한 모델인지를요.