숨이 멎을 듯 놀랍지만 무서운 OpenAI의 동영상 생성기 Sora
OpenAI 는 목요일에 최고의 텍스트-비디오 생성기인 Sora 을 소개하며 이 AI 모델의 기능을 보여주는 아름답고 충격적으로 사실적인 동영상을 공개했습니다. 소라는 현재 소수의 연구자와 크리에이터에게 제공되며, 이 모델은 영화 산업과 딥페이크 문제에 재앙을 불러올 수 있는 광범위한 공개 전에 테스트할 수 있습니다.
최근 인공지능 개발 및 구현과 관련된 기업에 대한 법적 소송이 증가하는 추세인 것으로 보입니다. 이러한 소송의 이유는 다양할 수 있지만 개인정보 침해, 차별, 인공지능 시스템으로 인한 피해에 대한 책임 등의 문제에 대한 우려에서 비롯된 것으로 보입니다. AI 기술의 윤리적 의미를 고려하고 그 사용이 개인이나 사회 전체에 부당한 피해나 불이익을 초래하지 않도록 하는 것이 중요합니다.
OpenAI는 블로그 게시물 에서 “Sora는 여러 캐릭터, 특정 유형의 동작, 피사체와 배경의 정확한 디테일이 포함된 복잡한 장면을 생성할 수 있습니다.“라고 말했습니다. “이 모델은 사용자가 프롬프트에서 요청한 내용뿐만 아니라 실제 세계에서 이러한 사물이 어떻게 존재하는지도 이해합니다.”
OpenAI가 개발한 Sora의 정확한 출시일은 아직 일반 대중에게 공개되지 않았습니다.
Sora는 AI 기반 텍스트 및 이미지 생성기인 ChatGPT와 Dall-E에 이어 OpenAI의 첫 번째 AI 동영상 생성 분야 벤처입니다. 이 툴은 크리에이티브 툴이라기보다는 엔비디아의 수석 연구원 짐 팬 박사가 지적한 것처럼 " 데이터 기반 물리 엔진, “에 가깝다는 점에서 독특합니다. 소라는 단순히 이미지를 생성하는 것이 아니라 주변 환경에서 물체의 물리학을 결정하고 이러한 계산을 기반으로 비디오를 렌더링합니다.
Sora를 사용하여 비디오 콘텐츠를 제작하는 것은 매우 간단하며, 사용자가 간단한 텍스트 입력만으로 안내를 받을 수 있습니다. 이 과정은 인공지능을 사용하여 이미지를 생성하는 것과 유사하며, 매우 사실적이거나 애니메이션으로 시각적으로 표현할 수 있습니다. 이러한 비디오의 인상적인 결과물은 단 몇 분 만에 얻을 수 있습니다.
Sora는 확산 모델 접근 방식을 사용하여 동영상을 생성하며, 불분명하고 정적인 시각적 표현으로 시작하여 점차 아래에 묘사된 세련된 결과물로 전환합니다. 마찬가지로 미드저니와 스테이블 디퓨전의 이미징 및 시네마틱 장치 모두 이미지와 동영상을 생성하는 각각의 프로세스에서 디퓨전 모델을 사용합니다.
실제로 OpenAI의 Sora는 경쟁사 대비 우수한 비디오 생성 모델로 돋보입니다.소라의 결과물은 더 길고 유동적이며 일관된 시퀀스가 매끄럽게 어우러져 실제 비디오 콘텐츠를 제작한 것 같은 느낌을 줍니다. 이와 대조적으로 다른 AI가 생성한 비디오 모델은 소라가 보여주는 자연스러운 흐름과 연속성이 결여된 일련의 단절된 정적 이미지로 나타납니다. OpenAI는 경쟁사를 훨씬 뒤처지게 하는 탁월한 동영상 생성기를 공개함으로써 인공지능 분야에서 다시 한 번 그 역량을 입증했습니다.
의심할 여지 없이, 소라가 제작한 동영상은 기존 영화 제작진이나 애니메이터가 상당한 시간과 노력을 들여 제작해야 할 만큼 뛰어난 퀄리티를 보여줍니다. 이러한 점을 고려할 때, 소라의 혁신은 편집 및 그래픽 디자인 분야에 큰 영향을 미친 ChatGPT와 인공지능 이미지 프로듀서에서 목격된 것과 비슷한 수준의 격변을 영화계에 가져올 것으로 예상됩니다. 이러한 발전은 주목할 만한 성과인 동시에 영상 콘텐츠 개발자의 고용 안정성에 대한 우려를 불러일으키고 있습니다.
OpenAI는 인과관계를 이해하고 공간 관계를 적절히 파악하는 등 소라 언어 모델에서 개선이 필요한 특정 영역을 파악했습니다. 예를 들어, 쿠키를 깨무는 사람의 모습을 묘사하는 동영상을 생성할 때 쿠키 자체에 예상되는 움푹 들어간 부분을 시각적으로 표현하지 못할 수 있습니다. 또한 모델의 공간 인식 능력이 저하되어 왼쪽과 오른쪽 방향을 잘못 해석하고 특정 환경 내에서 개인이나 사물이 어떻게 상호 작용하는지 파악하지 못할 수도 있습니다.
최근 딥페이크 기술 조작과 관련된 안타까운 사건들을 고려할 때 안전 문제는 무엇보다 중요합니다. 이에 따라 OpenAI는 사기성 콘텐츠를 식별하는 메커니즘을 개발하고 기존 기술을 활용해 유해한 텍스트 입력을 걸러낼 계획입니다. 이러한 조치는 칭찬할 만하지만, 개인이 최신 AI 시스템의 보안 기능을 우회하는 데 있어 보여준 독창성 때문에 그 효과에 대해서는 회의적인 시각이 남아 있습니다.
소라는 영화 산업과 해로운 콘텐츠 제작에 잠재적인 영향을 미칠 수 있는 매혹적인 동시에 불안한 수준의 숙련도를 보여줍니다. 테일러 스위프트가 등장하는 조작된 영상이 널리 유포되거나 조 바이든 전 대통령을 사실적으로 사칭한 인물이 집무실 안에서 뉴햄프셔 유권자들에게 설득력 있는 호소를 하는 가상 시나리오를 상상해 보세요.현재 소라는 일반 대중에게 공개되지 않았지만, 이러한 획기적인 기술에 내재된 기능은 이미 최종 출시에 그림자를 드리우기 시작했습니다.