밀리언 종 목록: 베이스캠프 연구가 신종 종으로부터 일련의 서열 데이터를 발굴
BaseData는 서열 기반 AI 모델 교육용으로 제안된 최대 데이터베이스로, 100만 개의 신종 종으로 구성되어 모든 공개 데이터베이스를 합친 것과 비교했을 때 단백질 다양성이 10배 확대되었다.
BaseData는 서열 기반 AI 모델 교육용으로 제안된 최대 데이터베이스로, 100만 개의 신종 종으로 구성되어 모든 공개 데이터베이스를 합친 것과 비교했을 때 단백질 다양성이 10배 확대되었다.