LG CNS, 국내 최초 AI 표준데이터 10만개 무료 공개... "AI, 장문 답변 가능해져"
상태바
LG CNS, 국내 최초 AI 표준데이터 10만개 무료 공개... "AI, 장문 답변 가능해져"
  • 김명현 기자
  • 승인 2019.09.05 10:50
  • 댓글 0
이 기사를 공유합니다

- 지난해 12월 공개한 ‘코쿼드 1.0’ 대비 표준데이터 7만개에서 10만개로 확대

LG CNS가 국내 최초로 AI의 자연어 이해를 위한 한국어 표준데이터 10만여개를 제작해 국내 AI 업계에 무료 개방한다.

LG CNS는 5일 강서구 마곡 LG사이언스파크에 국내 AI 전문가 300여명을 초청해 AI 
커뮤니티 행사 ‘AI Tech Talk(테크톡) for NLU’을 열어 ‘코쿼드 2.0’ 출시를 발표했다. 

'코쿼드 2.0'은 ‘코쿼드 1.0’ 대비 한국어 표준데이터를 7만개에서 10만개로 확대하고, 
단답형에서 장문의 답변이 가능한 AI를 개발할 수 있도록 데이터를 강화한 버전이다. 

예를 들어, “대한민국의 수도와 그 면적은?”이라는 질문에 “서울특별시, 605.25km2 입니다”고 답하는 AI는 코쿼드 1.0 학습만으로 충분히 개발 가능했지만, “서울특별시의 특징은?”이라는 질문에 “도시 중앙으로 한강이 흐르고 북한산, 관악산, 도봉산 등의 여러 산들로 둘러싸인…”이라는 장문의 답을 위해서는 코쿼드 2.0으로 AI를 학습시켜야 한다. 

코쿼드 2.0은 AI가 표나 리스트 형태에 담긴 정보도 읽어 답변할 수 있게끔 표준
데이터 범위도 확대했다. 

이번에 출시한 한국어 표준데이터는 ‘코쿼드 2.0’ 웹사이트에서 누구나 다운로드 가능하다. 

[사진 LG CNS]
[사진 LG CNS]

현신균 LG CNS CTO(최고기술책임자) 부사장은 “응용분야가 무궁무진한 AI 언어 개발 분야에서 내부적으로 쌓은 데이터를 AI 업계 전체에 개방해 국내 AI 연구자들 간 상생을 위한 AI 개방형 생태계 조성에 기여코자 한다”고 말했다.

한편, LG CNS는 지난해 12월 위키백과 정보를 기반으로 AI 학습용 한국어 표준데이터 7만개가 탑재된 '코쿼드 1.0'을 제작해 AI 업계에 공개했다.

공개 후 AI 전문가들이 모인 국내 최대 오픈 커뮤니티인 '텐서플로우 코리아'에서는 표준 데이터 공개에 대한 반응이 뜨거웠고, 네이버·카카오 등의 AI 기술 기업들과 AI 현업 종사자 등 50여개 팀이 코쿼드를 사용한 AI 개발에 나선 바 있다.

 

김명현 기자  lycaon@greened.kr

▶ 기사제보 : pol@greened.kr(기사화될 경우 소정의 원고료를 드립니다)
▶ 녹색경제신문 '홈페이지' / '페이스북 친구추가'

댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.