2025-04-15
HaiPress
구글,돌고래 소리 학습한 LLM 공개
돌고래가 내는 휘슬음 등 학습해
소리 패턴 파악·다음 소리 예측도
합성 휘슬음으로 양방향 소통도
구글이 돌고래의 소리를 학습해 개발한 AI 모델 ‘돌핀젬마’ 소개 영상 [출처 = 구글 유튜브 캡처] 돌고래가 내는 소리를 이해하고 양방향으로 돌고래와 대화까지 할 수 있는 인공지능(AI) 기술이 등장했다.
구글은 14일(현지시간) 자사 블로그를 통해 돌고래의 소리를 학습한 거대언어모델(LLM)인 ‘돌핀젬마(DolphinGemma)’를 개발하고 있다고 밝혔다.
구글은 미국 조지아 공대,돌고래 연구 기관인 ‘야생 돌고래 프로젝트(WDP)’와 손잡고 돌핀젬마를 개발했다. 이들은 돌고래가 내는 소리를 구조화하고 분석하도록 AI를 학습하고,돌고래와 유사한 새로운 소리를 생성해 돌고래와 직접 소통하는 것까지를 목표로 했다.
구글은 이번 연구의 의의에 대해 “서로 다른 종의 소통을 추구하는 접근법을 통해 AI의 경계를 넓히고,해양 세계와의 잠재적인 연결을 확장할 수 있다”라고 밝혔다.
구글이 협력한 WDP는 40년 넘게 바하마 섬 인근에서 대서양 알락 돌고래들을 관찰하면서 돌고래 개체가 어떻게 행동하고 어떤 소리를 내는지를 관찰하면서 돌고래의 소리와 특정 행동의 상관관계를 분석한 연구 기관이다.
돌고래는 휘슬음과 클릭음 등의 소리로 수중에서 서로 소통하는데,돌고래들이 싸울 때 주로 내는 파열음이나 어미 돌고래가 새끼를 부를 때 사용하는 특유의 휘슬음 등의 패턴을 밝혀낸 것이다.
어미 알락 돌고래가 먹이 사냥 중인 새끼를 관찰하고 있다. 어미 돌고래는 먹이를 다 먹은 새끼 돌고래를 부르기 위해 특유의 휘슬음을 낸다(왼쪽). 해당 휘슬음을 시각화한 스펙트로그램(오른쪽) [출처 = 구글 블로그] 구글의 돌핀젬마는 이같은 WDP의 방대한 데이터베이스를 자사의 경량 AI 모델인 ‘젬마’에 학습시켰다.
돌핀젬마는 인간이 사용하는 AI 모델처럼 학습된 데이터를 기반으로 문장의 다음 단어를 예측하는 방식으로 작동한다.
돌고래가 내는 소리를 돌핀젬마에 입력하면,AI가 해당 소리 시퀀스를 처리해 패턴을 파악한 후 그다음에 나올 가능성이 큰 소리를 예측하는 것이다.
이를 통해 과학자들은 돌고래들이 내는 소리를 돌핀젬마로 분석함으로써 과거에는 인간이 의미를 유추해야 했던 돌고래의 의사소통을 이제는 AI로 분석할 수 있게 됐다.
구글은 돌고래가 이해할 수 있는 새로운 소리를 생성해 돌고래와 양방향으로 소통할 수 있는 기술도 개발했다.
구글은 새로운 합성 휘슬음을 만든 다음,이를 돌고래가 좋아하는 해초와 같은 물체와 연결했다.
이어 인간 사이에서 해당 휘슬음을 활용해 해초를 얻는 장면을 시연함으로써,돌고래가 이를 보고 따라해 새로운 휘슬음으로 원하는 물체를 요청하는 방법을 배우도록 한 것이다.
돌핀젬마의 또 다른 특징은 4억개의 파라미터로 구성된 소형 모델로 스마트폰에도 탑재가 가능하다는 것이다. 일반적으로 소형 언어 모델(SLM)로 불리는 AI 모델들도 파라미터가 70억개 내외인데,이와 비교했을 때도 굉장히 작은 크기다.
구글은 WDP 연구자들이 별도 기기 없이도 각자 사용하는 구글 픽셀 스마트폰상에서 돌핀 젬마를 구동할 수 있도록 했다.
구글은 올해 여름에 돌핀젬마 모델을 오픈소스로 공유할 예정이다. 구글은 “돌핀젬마는 대서양 알락 돌고래 소리로 훈련된 모델이지만,다른 고래 종을 연구하는 연구자들에게도 유용할 것”이라고 밝혔다.