‘컨트롤타워형 AI’ 앞다퉈 발표하는 빅테크 기업들...‘초거대 AI’ 불꽃 경쟁 서막

-카카오, 한국어 초거대 언어모델 ‘KoGPT’ 이어 글 쓰고 그림도 그리는 ‘민달리’ 개발
-LG AI연구원, 출범 1년만 초거대 AI ‘엑사원’ 공개...계열사 사업 전반에 적용 예정
-‘하이퍼클로바’ 고도화 나선 네이버 “한국어 시작해 다국어·이미지 영역도 개발할 것”

최근 빅테크 기업들이 초거대 인공지능(AI) 모델과 기술 개발 전략 발표에 경쟁하듯 나서고 있다. 이는 AI를 단순히 특정 서비스에 적용하는 것이 아닌, 그룹 차원의 총체적인 역할을 담당할 ‘컨트롤타워형 AI’를 지목하고 있다는 점에서 온 관심이 집중되고 있다.

업계에서는 이를 두고 본격 ‘초거대 AI’를 둘러싼 빅테크들의 치열한 경쟁이 예고되는 시점이라고 입을 모은다.

한 업계 관계자는 녹색경제신문에 “AI 사업은 전 세계적으로 빅테크 사이에서 가장 확실한 신성장 사업으로 통한다”라며, “이를 잘 아는 국내 기업들도 기술 확보에 우위를 선점하기 위해 컨트롤타워형의 AI 기술 개발 체계를 확립함으로써 관련 생태계를 구축하기 위한 경쟁에 뛰어들고 있으며 이는 전체적으로도 한국 AI 산업 발전에 커다란 긍정 효과를 가져다 줄 것으로 내다본다”라고 전망했다.

15일 녹색경제신문 취재를 종합하면 카카오, 네이버, LG 등 국내 빅테크 기업들이 잇따라 ‘초거대 AI’ 기술 개발 전략과 사업 방향을 발표하며 향후 기업 AI 산업의 청사진을 공개했다.

카카오, 한국어 초거대 언어모델 ‘KoGPT’ 이어 글 쓰고 그림도 그리는 AI 멀티모달 ‘minDALL-E’ 개발

먼저 카카오 그룹의 AI 부문 자회사, 카카오브레인은 이날 오픈소스 커뮤니티인 깃허브(github)에서 초거대 AI 멀티모달(multimodal) ‘민달리(minDALL-E)’를 깜짝 공개하며 누리꾼들을 놀라게 했다.

민달리는 이용자가 텍스트를 이용해 명령어를 입력하면 실시간으로 원하는 이미지를 그려주는 이미지 생성 모델이다. 단순히 “강아지를 그려줘”, “집을 그려줘”에서 그치는 것이 아니라 “바나나 껍질로 만든 의자를 그려줘”, “보름달과 파리 에펠탑이 같이 있는 그림을 보여줘” 등 구체적이고 상세한 내용의 명령어까지 모두 수행한다는 것이 특징이다. 1400만장의 텍스트와 이미지 세트를 사전 학습해 이뤄낸 성과다.

민달리는 카카오가 공개한 두 번째 초거대 AI 모델로, 이에 앞서 지난달에는 한국어 언어모델인 ‘KoGPT’를 개발해 선보이기도 했다.

KoGPT 모델은 Open AI의 언어 모델 GPT-3의 한국어 특화 버전이다. 60억개의 매개변수와 2000억개 토큰(token)의 한국어 데이터를 바탕으로 구축했으며, 카카오는 추후 영어, 일본어 모델과 더불어 베트남어, 말레이시아어 등 동남아시아 언어 모델까지 준비해 오픈소스화를 진행할 방침이라고 전했다.

LG AI연구원, 출범 1년만 초거대 AI ‘엑사원’ 공개...계열사 사업 전반에 적용 예정

LG AI 토크 콘서트에서 배경훈 원장이 키노트 스피치를 하고 있다. [사진=LG]

LG그룹의 AI 싱크탱크, LG AI연구원은 설립 1주년을 맞아 그간 꽁꽁 숨겨두었던 초거대 AI 모델 ‘엑사원(EXAONE)’을 세상에 공개하며 주요 연구 성과와 향후 계획을 발표했다.

엑사원은 인공 신경망의 파라미터를 국내 최대 규모인 약 3000억개를 보유한 언어모델로, 초기 개발 시점부터 한국어뿐만 아니라 영어 데이터를 함께 학습한 것이 다른 국내 기업들 모델과의 차별점이다. LG에 따르면 엑사원은 개발 초기 당시 13억개, 130억개 파라미터 크기 수준의 모델만으로도 카카오 등이 채택한 GPT-3 성능을 능가했다.

14일 온라인으로 진행된 LG AI 토크 콘서트에서 배경훈 LG AI연구원 원장은 “엑사원은 전문가와의 소통에서 가장 중요한 목적대화와 감성분류 영역에서 최고 수준을 보였으며, 이미지 복원 퀄리티를 보여주는 FID 스코어에서도 최상 점수를 기록했다”라며, “특히, 전공 문헌 전체 맥락을 이해해 대규모 물질데이터를 추출 가능하고 엑사원을 통해 지난 100년간 발간된 모든 물질 정보를 데이터베이스화하고 신소재 AI가 인사이트 발굴하도록 개발할 예정”이라고 말했다.

LG는 LG전자, LG화학, LG유플러스, LG CNS 등 LG 계열사들이 보유한 전문 데이터를 포함해 논문, 특허 등의 정제된 말뭉치들을 학습해 다양한 산업 분야에 적용할 계획이며 더불어 금융·패션·유통·교육 등 다양한 글로벌 파트너사와 함께 연합을 결성해 초거대 AI 활용 영역을 넓혀 나갈 방침이다.

‘하이퍼클로바’ 고도화 나선 네이버, 한국어 특화 모델로 시작했지만 다국어·이미지 영역도 개발할 것

올 5월 이미 초거대 AI 언어모델 ‘하이퍼클로바(HyperCLOVA)’를 선보인 바 있는 네이버는 최근 후속 연구를 공개하며 영어 등 다국어 데이터를 추가 학습하고 이미지-텍스트까지 함께 사용할 수 있는 모델을 개발 중이라고 밝혔다.

초반에는 한국어 특화 모델로 개발을 시작했지만, 학습에 활용하는 말뭉치를 늘릴 필요가 있다고 판단, 초거대 언어모델 파라미터를 효율적으로 사용하기 위해 다국어 차원의 학습을 진행하겠다는 전략이다.

이미지 등 다른 형태의 데이터를 다루는 영역에도 뛰어들기로 했다. 네이버는 현재 자체 서비스인 네이버 블로그·카페 내 사용자 데이터 일부를 개인정보 마스킹 처리 후 연구에 사용하고 있으며, 최근 이를 통해 수집한 이미지 URL 데이터 11억건과 개인정보 마스킹한 텍스트 데이터 5억 3000만건을 조율한 뒤 6100만건의 이미지-텍스트 URL을 생성했다고 설명했다.

앞서 네이버는 하이클로바 공개 당시 해당 AI 모델 개발을 위해 700페타플롭스(PF) 성능의 슈퍼컴퓨터를 도입했으며, 서울대·카이스트(KAIST)와 각각 공동 연구소를 설립하기로 하는 등 대규모 투자를 지속하고 있다고 전했다. 슈퍼컴퓨터 도입과 AI 개발, 공동 연구소 설립 등에 투입된 비용은 대략 수천억원 규모에 달하는 것으로 전해졌다.