미주투데이

Amazon FSx for Lustre와 TurboQuant로 LLM 모델 로딩 가속화 및 컨텍스트 윈도우 확대

AWS GPU 인스턴스에서 대형 언어 모델을 배포할 때, GPU 고대역폭 메모리에 모델을 로딩하는 시간이 길어지는 문제를 해결하기 위한 방법이 소개됐다.

2026년 6월 2일 오전 1시 07분AWS Blog

오라클과 클래식, OCI와 함께 36큐빗 포트폴리오 최적화를 위한 양자 AI 에이전트 통합

오라클과 양자 소프트웨어 개발 플랫폼인 클래식이 자연어 AI 생성과 대규모 고전 시뮬레이션 클러스터를 연결하는 HPC 개념 증명을 성공적으로 완료했습니다. 이 소프트웨어 워크플로우는 AI 에이전트가 복잡한 양자 코드를 생성하는 과정을 보여줍니다.

2026년 5월 27일 오후 5시 53분Quantum Computing Report

IQM, 하이브리드 양자-HPC 채택 가속화를 위한 HPC 통합 서비스 출시

IQM 양자 컴퓨터가 HPC 통합 서비스를 공식 출시했습니다. 이 서비스는 IQM의 초전도 양자 컴퓨터를 고성능 컴퓨팅 환경에 통합하기 위한 턴키 솔루션입니다.

2026년 5월 13일 오전 4시 07분Quantum Computing Report

AWS Batch와 Parakeet-TDT를 활용한 비용 효율적인 다국어 오디오 전사

이 글에서는 Amazon S3에 업로드된 오디오 파일을 자동으로 처리하는 확장 가능한 전사 파이프라인 구축 방법을 소개합니다. 또한, 비용 절감을 위한 Amazon EC2 스팟 인스턴스와 버퍼링 스트리밍 추론 사용법도 설명합니다.

2026년 4월 22일 오후 5시 05분AWS Blog

하이페리온 리서치의 양자 분석가 밥 소렌슨과의 팟캐스트

유발 보거가 하이페리온 리서치의 밥 소렌슨과 양자 컴퓨팅과 고성능 컴퓨팅의 융합에 대해 이야기합니다. 이들은 HPC 센터를 위한 문제 중심의 채택 전략을 제시합니다.

2026년 3월 23일 오후 1시 06분Quantum Computing Report

파스칼, NVIDIA와 함께 CUDA-Q 통합으로 HPC 워크플로우 혁신

파스칼이 NVIDIA의 CUDA-Q 플랫폼을 자사의 양자 자원 관리 인터페이스와 통합하여, 표준 고성능 컴퓨팅 환경에서 양자 프로세서를 네이티브 가속기로 활용할 수 있게 되었습니다.

2026년 3월 16일 오후 8시 33분Quantum Computing Report

아마존 세이지메이커 하이퍼팟에서 일본어 능력을 향상시킨 일본 주권 LLM인 Training Llama 3.3 Swallow 훈련

도쿄 과학 연구소가 아마존 세이지메이커 하이퍼팟을 사용하여 70억 개의 파라미터를 가진 일본어 능력이 향상된 대형 언어 모델 Llama 3.3 Swallow을 성공적으로 훈련시켰다. 이 모델은 GPT-4o-mini 및 다른 선두 모델을 능가하는 일본어 작업에서 우수한 성능을 보여준다. 이 기술 보고서는 프로젝트 중 개발된 훈련 인프라, 최적화 및 모범 사례를 상세히 설명한다.

2025년 6월 13일 오전 11시 54분AWS Blog

최신뉴스 전체보기