[MIT 10대 혁신기술 10] 인공지능의 새로운 장을 여는 '강화학습'
상태바
[MIT 10대 혁신기술 10] 인공지능의 새로운 장을 여는 '강화학습'
  • 백성요 기자
  • 승인 2017.07.20 09:58
  • 댓글 0
이 기사를 공유합니다

-딥러닝 기술을 강화...알파고가 이세돌 9단 이긴 이후 기존 AI에 대한 인식 급변

MIT(Massachusetts Institute of Technology)는 2002년부터 해마다 경제, 정치, 의학은 물론 문화에도 영향을 미치는 10대 혁신 기술을 발표해 왔다. 올해는 ▲뇌 임플란트 ▲자율 운행 트럭 ▲안면인식 결재 ▲실용적 양자 컴퓨팅 ▲360도 셀카 ▲기존보다 2배 효율적인 태양전지 ▲유전자 치료 2.0 ▲세포지도 ▲사물 봇넷 ▲강화학습 등 10가지 혁신 기술을 발표했다. 이 기술들은 지금, 혹은 10년 이상 지나 실현될 것으로 전망된다. 이에 본지에서는 10회에 걸쳐 MIT가 선정한 '10대 혁신기술 2017'에 대해 알아본다.

 

MIT테크리뷰가 마지막으로 선택한 기술은 강화학습(reinforcement learning)이다. 컴퓨터가 학습 알고리즘을 통해 선택 가능한 행동들 중에 보상을 최대화하는 행동, 혹은 행동 순서를 선택하는 방법이다. 

지난해 3월, 구글의 형제회사 딥마인드가 개발한 딥-러닝 기술 기반의 알파고가 세계 바둑 최고수 중 한 명인 이세돌 9단을 4:1로 꺾으며 인공지능에 대한 관심은 크게 높아졌다. 지난 5월에는 현재 세계 랭킹 1윙인 커제 9단과의 3번기에서 진화한 알파고가 모두 승리를 가져갔다. 

강화학습이 더욱 각광받는 이유는 데이터의 패턴을 인식하기 위해 매우 큰 신경망 컴퓨터를 사용하는 딥-러닝과 결합해 인공지능의 학습효과를 극대화 할 수 있기 때문이다. 

딥-러닝으로 인공지능이 어디까지 학습할 수 있는지는 알파고와 인간 바둑 최고수간의 대국으로 이미 증명됐다. 

바둑같은 게임, 스포츠를 제외하고 강화학습 기술이 가장 빠르게 상용화 될 수 있는 분야를 MIT테크리뷰는 자율주행차로 봤다. 

MIT테크리뷰는 자율주행차의 운전 시뮬레이션을 보고 "가장 놀라운 점은 자동차의 주행을 책임지는 소프트웨어가 기존의 의미에서 전혀 프로그래밍 되지 않았다는 것"이라고 전했다. 

차선을 바꿀때마다 주행은 느리게 진행되고 자동차들은 서로 엇갈리는 등 사고의 위험이 동반되지만, 원활하게 차선이 변경될 때마다 시스템은 그 행동을 이끌어내는 과정에 대해 학습한다. 

사실 강화학습의 원리는 매우 간단하다. 에드워드 쏜다이크는 이미 100년 전에 레버를 누르면 탈출할 수 있는 상자 안에 고양이를 가둬 놓고 강화학습의 원리를 보여줬다. 

우연히 레버를 밟은 고양이는 상자의 문이 열리는 것을 발견하고, 이 행동이 반복되면서 결국 '레버를 누르면 문이 열린다'는 것을 배웠다. 특히 처음 레버를 누르게 될 때에 비해, 시간이 갈수록 레버를 눌러보는 시간이 짧아지는 것도 관찰됐다. 

인공지능의 창립자로 불리는 마빈 민스키 MIT 교수는 이 과정이 기계에 유용하게 재현될 수 있다고 생각하고, 1951년 미로 탐색을 배우는 고양이를 모방한 기계를 만들었다. 

민스키 교수의 'Stochastic Neural Analogy Reinforcement Computer(SNARC)'는 수십개의 튜브, 모터 및 클러치로 구성됐는데, 이는 40개의 뉴런과 시냅스의 동작을 시뮬레이션 한 결과다. 

그의 실험은 수십년간 성공하지 못했으나 1992년 IBM의 연구원 제럴드 테사우로가 주사위 놀이 프로그램을 시연했다. 이는 사람과 경쟁이 가능할만큼 인공지능 분야에서 큰 성취로 여겨졌으나 더욱 복잡한 문제에 적용하기 어렵다는 것이 증명됐다. 

2016년 3월, 바둑으로 인간을 이긴 알파고의 등장으로 이런 견해는 극적인 반전을 맞았다. 

인공지능은 현재 자율주행차, 스마트홈 등 4차 산업의 핵심기술로 자리잡았다. 

 

 

 

백성요 기자  sypaek@greened.kr

▶ 기사제보 : pol@greened.kr(기사화될 경우 소정의 원고료를 드립니다)
▶ 녹색경제신문 '홈페이지' / '페이스북 친구추가'

댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.