Microsoft의 최신 AI 비디오 생성기에서 가짜를 만들어내는 이상한 이빨
Microsoft 연구원들은 최근 하나의 정적인 이미지만으로 개인의 매우 사실적인 동영상을 제작할 수 있는 고급 인공 지능 시스템인 VASA-1의 개발 내용을 자세히 설명하는 논문을 발표했습니다. 현재 공개 계획은 없지만 이 기술은 부자연스러운 치아 모양과 같은 사소한 결함이 있긴 하지만 놀라운 잠재력을 보여줍니다.
인공 지능은 환자 치료 결과를 개선하고 프로세스를 간소화하기 위해 의료 환경에서 점점 더 많이 활용되고 있습니다. 이러한 발전을 회의적으로 보는 시각도 있지만, 인공지능은 의료 전문가들이 다양한 질환을 진단하고 치료하는 방식을 혁신할 수 있는 잠재력을 가지고 있다는 점을 인식하는 것이 중요합니다. 의사는 머신러닝 알고리즘과 기타 첨단 기술을 활용하여 방대한 양의 데이터에 액세스하고 이를 통해 환자 치료에 대해 보다 정보에 입각한 결정을 내릴 수 있습니다. 궁극적으로 AI를 의료 분야에 통합하는 것은 이 분야가 발전하고 가장 필요한 사람들에게 더 나은 치료를 제공할 수 있는 흥미로운 기회입니다.
VASA-1 모델은 사람 얼굴의 정지 사진 또는 Microsoft에서 게시한 예시 에서 실제로 존재하지 않는 사람의 AI 생성 얼굴을 촬영한 후 오디오 파일을 공급받아 얼굴 뉘앙스와 자연스러운 동작이 포함된 동기화된 비디오를 생성할 수 있습니다.
Microsoft에서 제공한 동영상에서 알 수 있듯이 VASA-1은 놀라운 기능을 보여주지만, 치아 구조를 정확하게 렌더링하는 능력에는 일관성이 없는 것으로 보입니다. 자세히 살펴보면 치아는 캐리커처처럼 보일 수 있으며, 이는 나머지 이미지의 사실적인 특성과 대조를 이루며 전체적인 시각적 표현과의 일관성이 부족합니다.
VASA-1 비디오 MicrosoftOff영어
비디오를 천천히 보면 앞서 언급한 이 웹사이트의 GIF에서 볼 수 있듯이 독특한 치아 특징의 두드러진 특성을 더욱 선명하게 관찰할 수 있습니다. 그러나 가상의 개인의 신체적 특성을 비평하는 행위의 윤리적 함의를 생각해보고, 문제의 대상이 실재하지 않는다는 점을 상기하는 것이 중요합니다.
Microsoft는 또한 다른 측면에서는 높은 수준의 사실성을 보이지만 치아 묘사에서 인상적인 사실성을 보여주는 데모 비디오를 통해 인공 지능 기술의 또 다른 사례를 선보였습니다. 이러한 놀라운 성과는 정지 이미지와 오디오 녹음만을 포함한 제한된 범위의 데이터 소스를 제작 과정의 기초로 활용했기 때문일 수 있습니다.
VASA-1 데모영어
남성이 등장하는 동영상에 표시되는 치아 특징의 두드러짐에 차이가 있을 수 있습니다. 이는 남성이 여성만큼 말을 할 때 턱을 크게 벌리지 않기 때문일 수 있습니다. 그러나 자세히 살펴보면 이러한 현상이 예상과 완전히 일치하지 않는다는 것을 알 수 있습니다.
VASA-1 데모 (남성)꺼짐영어
연구자들이 주목한 흥미로운 점 중 하나는 이 모델이 비교적 빠르게 고품질 비디오를 생성할 수 있다는 점인데, 이는 OpenAI의 Sora와 같은 다른 AI 생성기가 어려움을 겪었던 것으로 알려져 있습니다. 실제로 이 논문에서는 단일 NVIDIA RTX 4090 GPU .
빠른 속도 덕분에 실시간 언어 번역 서비스를 비롯한 다양한 애플리케이션에서 즉각적인 비디오 콘텐츠를 제공할 수 있습니다.
저자의 접근 방식은 정확한 얼굴과 머리 움직임 등 뛰어난 비디오 충실도를 제공할 뿐만 아니라 초기 지연을 최소화하면서 초당 최대 40프레임의 속도로 512x512 해상도 영상을 생성할 수 있는 기능을 제공합니다. 이러한 혁신을 통해 사용자는 사람과 같은 대화 습관을 보이는 매우 사실적인 가상 캐릭터와 실시간으로 상호 작용할 수 있습니다.
VASA-1의 실시간 효율성 비디오 영어
연구자들은 이러한 기술에 내재된 위험성을 잘 이해하고 있으며, 이는 현재 마이크로소프트가 일반 대중에게 공개를 서두르는 것을 주저하는 이유일 수 있습니다. 그럼에도 불구하고 연구원들은 사회 전체에 도움이 될 것으로 판단되는 특정 애플리케이션을 발견했습니다.
우리의 연구 노력은 관련 조사와 함께 교육 평등 증진, 장애에 직면한 개인의 의사소통 기회 강화, 필요한 사람들에게 위로 또는 재활 지원 제공 및 기타 다양한 이점을 제공하는 데 중요한 의미를 지니고 있습니다. Facebook은 인류의 번영을 촉진하는 것을 목표로 책임감 있는 AI 개발을 수행하기 위해 노력하고 있습니다.
앞서 언급한 상황을 고려할 때, 혁신이 적절한 가이드라인을 준수하여 신중하게 사용될 것이라는 확신이 들 때까지 인터넷 기반 데모, 애플리케이션 프로그래밍 인터페이스(API), 제품, 추가 구현 세부 사항 또는 관련 제안을 제공하지 않는 것이 당사의 의도입니다.
첨단 기술과 관련된 사기 행위의 만연을 고려할 때 이러한 조치의 시행을 고려하는 것이 현명할 수 있습니다. 2024년 미국 대선이 불과 7개월 앞으로 다가왔고 글로벌 파시즘의 유령이 여전히 우려되는 상황에서 인공지능이 만들어낸 속임수에 대한 인류의 취약성을 인식하지 않을 수 없습니다. 이러한 상황을 고려할 때 Microsoft와 같은 규모의 기업이라면 인터넷에 널리 퍼진 조작의 잠재적 결과를 완화하기 위한 노력을 기울이는 것이 합리적일 것입니다.