[TECH meets DESIGN] 오픈 AI ‘소라’ 동영상 플랫폼, 칩 업계 르네상스 오나?
상태바
[TECH meets DESIGN] 오픈 AI ‘소라’ 동영상 플랫폼, 칩 업계 르네상스 오나?
  • 박진아 유럽 주재기자
  • 승인 2024.02.23 09:59
  • 댓글 0
이 기사를 공유합니다

- 소수 적함성 시험단 대상으로 실험 중
- 정책 당국 규제·저작권 소송건 해결 즉시 대중 사용자에 배포될 것

생성형 인공지능(Generative Artificial Intelligence, 이하 생성형 AI) 기술을 개발하는 미국의 테크기업 오픈 AI가 최근인 2월 15일(미국 샌프란시스코 현지시간 기준) 새로운 동영상 생성 플랫폼인 ‘소라(Sora)’를 공개했다.

소라는 사용자가 플랫폼에 문자(text) 형식으로 생성하고자 하는 텍스트로 된 명령 프롬프트를 입력하면 상상의 최대 짜리 길이의 극현실적인 고화질 동영상 결과물을 창출해 내는 새 인공지능 프로그램이다.

샘 올트먼 오픈 AI 최고경영자가 ‘소라’를 이용해 생성한 동영상을 X SNS 플랫폼을 통해 발표한 결과물. “산 정상에서 팟캐스트 방송을 하고 있는 리트리버 개 두마리”라는 텍스트 프롬프트를 입력해 산출됐다. 이미지 출처: X=Sam Altman@sama
샘 올트먼 오픈 AI 최고경영자가 ‘소라’를 이용해 생성한 동영상을 X SNS 플랫폼을 통해 발표한 결과물. “산 정상에서 팟캐스트 방송을 하고 있는 리트리버 개 두마리”라는 텍스트 프롬프트를 입력해 산출됐다. 이미지 출처: X=Sam Altman@sama

 

생성형 AI는 작년 2023년부터 대중 사용자를 대상으로 배포된 테크 분야의 혁신적 AI 분야다. 

텍스트 프롬프트로 문자 결과물(output)을 생성하는 챗GPT(ChatGPT), 문자 프롬프트로 2차원 사진 또는 그림을 생성하는 달리(DALL-E)와 미드저니(Midjourney)가 지금까지 소개된 대표적인 생성형 챗봇들이다.

여기에 추가로 지난주 오픈 AI가 새로 론칭한 ‘소라’는 기존 텍스트 및 2차원 이미지 생성형 AI에 사용됐던 동일한 기술과 데이터를 응용하지만 AI 시스템 작동에 훨씬 가중적이고 복잡한 데이터 분석 처리 능력을 요하기 때문에 아직은 일반인들의 접근 및 사용은 불가능한 상태다.

생성형 AI의 가장 놀랍고도 신통방통한 능력은 방대한 규모의 입력된 문자 및 이미지 데이터를 기반으로 사용자가 프롬프트를 입력하면 이전 지구상 땅과 하늘 사이 그 어디에서도 없었던 전혀 새로운 결과물을 창조해 낼 수 있다는 것이다.

15일 소셜미디어 플랫폼 X(前 트위터)를 통해서 소라 론칭을 선언한 샘 올트먼(Sam Altman) 오픈 AI 최고경영자는 사용자들에게 소라를 이용해 생성할 수 있는 동영상 명령 프롬프트 아이디어를 공개적으로 모집했다.

여느 오픈 AI 챗봇 툴들과 마찬가리로 소라 역시 궁극적으로 대중 사용자 대상으로 공식 론칭하는 것이 목표다.

오픈 AI의 ‘소라(Sora)’로 출력시킨 텍스트→동영상 생성 이미지. 이 같은 생생하고 실감 나는 결과물을 얻으려면 프롬프트를 다음과 같이 제법 상세하게 명령해야 한다. “서 네댓 거대하고 털북숭이 매머드가 눈 덮인 목초지 위로 달음박질 치고, 걷는 매머드의 긴 털은 바람에 살짝 나부끼고 나무는 눈으로 덮여있고, 저 먼 배경에는 절묘하게 눈덮인 산정상이 보인다. 오후 중반 빛, 성긴 구름, 후경 멀리에 뜬 태양의 따스한 대기광 효과, 낮은 카메라 시야로 크고 털 많은 포유동물을 촬영한 이미지의 깊이가 있는 아름다운 사진. 동영상 출처: OpenAI
오픈 AI의 ‘소라(Sora)’로 출력시킨 텍스트→동영상 생성 이미지. 이 같은 생생하고 실감 나는 결과물을 얻으려면 프롬프트를 다음과 같이 제법 상세하게 명령해야 한다. “서 네댓 거대하고 털북숭이 매머드가 눈 덮인 목초지 위로 달음박질 치고, 걷는 매머드의 긴 털은 바람에 살짝 나부끼고 나무는 눈으로 덮여있고, 저 먼 배경에는 절묘하게 눈덮인 산정상이 보인다. 오후 중반 빛, 성긴 구름, 후경 멀리에 뜬 태양의 따스한 대기광 효과, 낮은 카메라 시야로 크고 털 많은 포유동물을 촬영한 이미지의 깊이가 있는 아름다운 사진." 동영상 출처: OpenAI

 

♢ 해결할 문제거리 — 기술적 미흡성, 딥페이크 오용 가능성, 인간 창조자 작품 저작권 침해

오픈 AI는 소라의 대중적 론칭 실현을 위해 현재 미국 국회의 입법자들과 이미지 데이터에 대한 저작권 소유자인 예술가들(사진가, 화가, 그래픽 아티스트 등) 및 이미지 자료 소재지 당국들과 각종 법적 교전을 추진 중인 것으로 알려졌다.

언뜻 세심히 뜯어보지 않은 훈련되지 않은 눈으로 봤을 때 소라가 생성한 동영상은 사진을 보듯 놀랍도록 극사실적이고 그럴듯한 것은 사실이지만 자세히 뜯어보면 공간 해석력, 복잡한 세부 묘사, 시간적 인과관계 혼동 등 맥락 해석 면에서 미흡하다고 소라 개발진은 스스로 지적한다. 가령, 어떤 사람이 쿠키에 한 입 씹었지만 쿠키에는 베어먹은 자국이 남지 않은 채로 동영상이 진행될 수 있다.

그럼에도 불구하고 소라는 공간 및 배경 내 사물 처리, 인간의 신체적 움직임, 표정 등 감정 표현에 매우 능숙해서 동영상과 사운드를 결합시킬 경우 시청자를 강력하게 설득시킬 수 있는 잠재적 위력을 지녔다.

소라 AI 동영상 생성 플랫폼이 초래할 수 있는 최대의 해악으로 딥페이크(deepfake)가 꼽히는 이유는 바로 그래서다.

특히, 올해는 40여 국가 전 세계 인구의 절반가량이 투표에 참여하게 될 이른바 ‘슈퍼 선거의 해’가 될 전망인 가운데, 많은 정부·정당 및 정치인, 기업, 일반 개인들이 두루 어떤 형태나 규모에 있어서든 생성 AI의 영향을 받고 그에 따른 피해자가 될 위험에 노출돼있다.

정부 차원의 규제는 늘 테크 기업의 기술 개발 및 투입 속도 보다 뒤떨어진다. 예를 들어, 작년 2023년 12월 EU에서 합의된 세계 최초의 AI 규제 법안은 2년 후인 정식 최종 법안 승인 이후부터 법적 효력이 발휘된다.

그때까지 오픈 AI를 비롯한 구글, 메타, 그리고 런웨이 ML 등 여러 신흥 AI 스타트업 등 오픈AI 기술을 개발하는 테크기업들은 이른바 ‘레드 팀원들(red teamers)’을 동원해 자체적으로 혐오 콘텐츠와 편향적 오정보를 감시하고 색출하는 작업을 자진적으로 실시할 계획이다. 

실제로 최근 주말인 2월 16일~19일 3일간 독일 뮌헨에서 열린 제60회 차 뮌헨 보안 컨퍼런스(MSC 2024, 행사장: 바이어리셔호프 호텔) 행사에 참가한 전 세계 20개 인공지능 개발 테크기업들은 올해 전 세계서 실시될 선거에 AI로 생성된 딥페이크 이미지나 동영상 배포에 대항해 공동 대응하겠다고 서약했다.

독일 뮌헨에서 열린 2024년 제60회 차 뮌헨 보안 컨퍼런스 행사 중 '오픈소스 인텔리전스'를 주제로 한 토론 세션 광경. 자료: MSC/Hildenbrand
독일 뮌헨에서 열린 2024년 제60회 차 뮌헨 보안 컨퍼런스 행사 중 '오픈소스 인텔리전스'를 주제로 한 토론 세션 광경. 자료: MSC/Hildenbrand

 

오픈 AI의 소라 외에도 생성형  인공지능 분야의 기술적 선두 쟁취를 향해 경쟁하는 유사한 기능의 생성형 AI 동영상 플랫폼은 여럿 있다. 

예컨대, 글로벌 빅 테크의 대표적 기업인 구글이 개발한 뤼미에르(Lumiere)는 현재 오픈 AI에 대적할 가장 강력한 경쟁자로 평가된다. 뤼미에르는 자체 기술력을 활용, 구글이 구축해 놓은 스틸 이미지 데이터로부터 문자 프롬프트를 접수 받아 동영상을 생성시킬 수 있다.

신흥 AI 테크 기업인 런웨이(Runway)와 피카(Pika)도 자체적 기술로 텍스트→동영상 생성 AI 모델을 제공하는 유망 기업이다.

2월 22일 AP 통신의 보도에 따르면, 2월 21일 캘리포니아 샌호세에서 열린 인텔 파운드리(Intel Foundry) 행사 중 토론 석상에 등장한 샘 올트먼과 팻 겔싱어(Pat Gelsinger) 인텔 최고경영자는 오픈 AI를 비롯한 인공지능 플랫폼은 다량의 데이터 분석 및 산출을 위해서 현재 보다 훨씬 많은 고성능 AI 특화된 첨단 프로세서 칩 공급이 절실하다는데 합의했다.

오픈 AI의 올트먼 최고경영자의 그 같은 발언은 대만의 칩 제조업체인 엔비디어(Nvidia)에 밀려 고전 중인 실리콘밸리의 반도체 기업 인텔을 비롯한 글로벌 칩 제조업체들 주도의 ‘실리코노미(Siliconomy)’ — ‘반도체 칩 기술이 이끄는 혁신 경제’를 의미 — 의 미래 재부흥의 가능성과 의지를 강조한 것으로 풀이된다.

오픈 AI와 협력체인 마이크로소프트(MS)는 2023년 12월부터 AI 시스템 데이터 입력 관련 뉴욕타임스 지를 포함한 작가 및 미술가들로부터 콘텐츠 저작권 침해 혐의로 고소된 상태여서 향후 AI 챗봇에 대한 저작권법의 판결 여부도 주목된다.

박진아 유럽 주재기자  gogreen@greened.kr

▶ 기사제보 : pol@greened.kr(기사화될 경우 소정의 원고료를 드립니다)
▶ 녹색경제신문 '홈페이지' / '페이스북 친구추가'

댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.