모나리자가 랩을 한다고?
마이크로소프트(MS)는 최근 모나리자와 같은 정지 이미지를 말하거나 노래하는 이미지로 변환시키는 등 비범한 기능을 갖춘 인공지능 기술을 선보였다.
이 기술은 말하는 사람의 오디오 클립과 정지 이미지를 결합해, 마치 실제로 말하는 것처럼 보이는 동영상을 생성하는 것이다.
MS가 선보인 데모(DEMO)에서는 모나리자가 앤 해서웨이의 랩을 흥미롭게 소화해내는 모습이 포함됐다.
VASA-1 모델은 만화나 예술 작품까지도 생동감 있게 만들어내는 능력을 지니고 있으며, 매력적인 립싱크와 자연스러운 얼굴 표정의 움직임을 통해 새로운 차원의 리얼리티를 선사하고 있다.
CNN에 따르면 마이크로소프트가 이 기술이 특히 교육적 목적, 의사소통에 어려움을 겪는 사람들의 접근성 개선, 심지어 인간을 위한 가상 동반자 생성 등 다양한 분야에 활용될 수 있을 것으로 기대하고 있다.
하지만 이러한 혁신적인 기술이 사람의 신원을 사칭하는 데 사용될 가능성을 내포하고 있어, 잘못된 정보의 확산이나 크리에이티브 산업에 대한 혼란을 초래할 우려도 제기되고 있다.
이에 대해 마이크로소프트는 현재로서는 이 AI 모델을 일반에 공개할 계획이 없으며, 적절한 윤리적 관리와 안전한 사용을 위한 규제가 마련될 때까지 기다리겠다고 밝혔다.
연구 팀은 이 기술이 현실적이고 유해하지 않은 콘텐츠 생성에만 사용되어야 한다고 강조하며, 모든 사용이 책임감 있게 이루어져야 함을 당부했다.
마이크로소프트의 AI 모델이 다른 유사한 도구보다 뛰어난 성능을 발휘할 수 있음을 자랑하며, 실시간으로 인간의 대화 행동을 모방하는 아바타 생성에 큰 진전이 있을 것으로 전망되고 있다.
[위키리크스한국=유 진 기자]
yoojin@wikileaks-kr.org