카카오, 맥락 파악하는 멀티모달 AI 모델 ‘허니비’ 공개…카카오톡 더 ‘똑똑해’지나
상태바
카카오, 맥락 파악하는 멀티모달 AI 모델 ‘허니비’ 공개…카카오톡 더 ‘똑똑해’지나
  • 한서율 기자
  • 승인 2024.01.20 03:30
  • 댓글 0
이 기사를 공유합니다

카카오, 멀티모달 AI ‘허니비’ 공개로 적용처 확장
카톡AI, 멀티모달 AI로 성장해 사용자 경험 높여야
이미지 인식해 텍스트로 답하는 멀티모달 언어모델 오픈소스 ‘허니비’ 공개. [사진=카카오브레인]
이미지 인식해 텍스트로 답하는 멀티모달 언어모델 오픈소스 ‘허니비’ 공개. [사진=카카오브레인]

카카오브레인이 이미지와 언어 맥락을 학습해 대답하는 멀티모달 언어모델(MLLM) ‘허니비’를 오픈 소스로 공개한 가운데, 카카오톡에도 MLLM이 탑재될지 관심이 쏠린다.

카카오 관계자는 “카카오브레인이 오픈 소스로 공개한 ‘허니비’의 경우 비상업적 용도로 이용이 가능하다”며,  “오픈 소스로 공개하는 큰 이유 중 하나는 소스의 보완성과 딥러닝 커뮤니티에 기여하기 위한 것”이라고 밝혔다.

그러면서 그는 “멀티모달 언어모델 허니비의 경우 인간의 학습 보조 및 교육을 위한 도구로 이용될 것”이라고 말했다.

‘허니비’는 이미지와 언어 맥락을 학습해 대답하는 모델이다. 현재 공개된 카톡AI 기능인 안읽은 카톡 요약, 상대에 따른 말투 수정 등의 기능과도 연관성이 있다.

이에 따라 업계에서는 카카오가 멀티모달 언어모델 개발로 카톡 내 AI 고도화를 위한 시작이라는 의견도 나온다.

카카오톡, 멀티모달 AI 적용해 사용자 경험 향상 기대

멀티모달 AI는 이미지에 대한 맥락파악이 가능해 카카오톡에 탑재되면 기존 AI 기능을 고도화 해 사용자 경험을 향상시킬 것으로 전망된다. 

IT 업계 관계자는 “카카오가 공개한 멀티모달 AI 모델이 카카오톡에 탑재될 경우 이미지와 텍스트를 함께 보여주며 질문에 답하는 기능, 상대방의 프로필 사진, 최근 대화 내용 등을 고려하여, 말투를 수정하는 기능이 이용될 수 있다”며, “대화의 맥락을 파악하고, 대화자에 따른 자연스러운 대화를 이어가는 기능을 강화할 수 있을 것”이라고 답했다.

현재 상용화된 카톡AI는 카카오브레인의 기술을 이용해 제공되는 것으로 알려졌다. 

카카오브레인은 카카오의 AI기술을 담당하는 자회사로, 방대한 학습데이터를 가진 자체 언어 모델을 보유하고 있다. 당사 모델은 인간과 유사한 수준의 자연어 이해 및 생성 능력을 바탕으로 다양한 과제와 주제에 대한 답변 또는 문장을 생성할 수 있다고 밝혔다.

다만, 멀티모달 AI가 카카오톡에 탑재되기까지 다소 시간이 소요될 것으로 예상된다.

카카오 관계자는 “허니비는 서비스 활용 계획보다는 높은 수준의 MLLM을 학습시킬 방법을 자세히 공개하고, 이미지와 LLM을 연결할 수 있는 새로운 모듈을 제안한 것”이라며 “아직 이를 통한 사업화를 고려한 것은 아니다”라고 답했다.

국내 메이저 통신업계 관계자는 “현재 대규모 언어모델에 대한 시장반응을 보고 있기에 멀티모달 언어모델 상용화까지 조금 더 걸릴 것”이라며, “카카오가 허니비의 성능과 안정성을 충분히 검증하고, 시장 수요를 분석한 후 멀티모달 AI를 적용할지 결정할 것으로 보인다”고 예측했다.

한서율 기자  lycaon@greened.kr

▶ 기사제보 : pol@greened.kr(기사화될 경우 소정의 원고료를 드립니다)
▶ 녹색경제신문 '홈페이지' / '페이스북 친구추가'

댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.