Sora AI 생성기: 놀랍고 우려스럽습니다.
OpenAI는 최고의 AI 텍스트-비디오 생성기를 출시했으며 그 결과는 놀라우면서도 끔찍했습니다.
OpenAI는 AI 모델의 기능을 강조하는 놀랍도록 사실적인 비디오를 제공하는 최첨단 텍스트-비디오 도구인 Sora AI Generator를 공개했습니다. 현재 Sora AI Generator가 더 널리 공개되기 전에 제한된 그룹의 연구원과 창작자들만이 Sora AI Generator를 테스트할 수 있습니다. 이러한 발전은 영화 산업에 대한 잠재적인 영향과 점점 커지는 딥페이크 기술 문제에 대한 우려를 불러일으켰습니다.
Sora AI 생성기는 복잡한 장면을 생성할 수 있습니다.
OpenAI는 블로그 게시물에서 “Sora AI 생성기는 여러 캐릭터, 특정 유형의 동작, 피사체와 배경의 정확한 세부 정보로 복잡한 장면을 생성할 수 있습니다.”라고 말했습니다. "모델은 사용자가 프롬프트에서 요청한 내용뿐만 아니라 그러한 것들이 실제 세계에 어떻게 존재하는지 이해합니다."
Sora AI 생성기가 대중에게 공개되는 시기
OpenAI는 Sora가 일반 대중에게 공개되는 구체적인 출시 날짜를 제공하지 않았습니다. Sora는 OpenAI의 AI 비디오 생성 부문 데뷔를 기념하며 회사의 기존 AI 기반 텍스트 및 이미지 생성기인 ChatGPT 및 Dall-E를 보완합니다. 이 제품의 특징은 기존의 창의적인 도구가 아닌 "데이터 기반 물리 엔진"에 더 중점을 두고 있다는 점입니다. 이는 Nvidia 수석 연구원인 Jim Fan 박사가 강조한 특징입니다. Sora의 혁신적인 접근 방식에는 이미지 생성뿐만 아니라 주변 환경 내 물체의 물리학을 계산하고 이러한 계산을 기반으로 비디오를 제작하는 것도 포함됩니다.
Sora AI 생성기 사용 방법
Sora를 사용하여 비디오를 만드는 것은 간단한 과정입니다. 사용자는 AI 기반 이미지 생성기와 유사하게 몇 가지 문장을 프롬프트로 입력할 수 있습니다. 이 도구를 사용하면 사용자는 사실적인 스타일과 애니메이션 스타일 중 하나를 선택하여 짧은 시간 내에 인상적인 결과를 얻을 수 있습니다. Sora AI Generator는 흐릿하고 정적으로 채워진 프레임으로 비디오 생성을 시작하고 점차적으로 아래에 표시된 세련된 최종 버전으로 다듬는 확산 모델로 작동합니다. Midjourney와 Stable Diffusion의 이미지 및 비디오 생성기는 모두 확산 모델로도 작동합니다.
Sora AI 생성기는 잠재적으로 영화 산업을 혼란에 빠뜨릴 수 있습니다.
Sora가 제작한 비디오는 전문 영화 제작진이나 애니메이터가 일반적으로 몇 시간씩 작업해야 할 수준의 품질을 보여주어 매우 인상적입니다. 영화 산업에 대한 Sora의 잠재적인 파괴적인 영향은 ChatGPT와 AI 기반 이미지 생성기가 편집 및 디자인 부문에 미친 놀라운 영향을 반영합니다. 그 기술은 눈부시지만, 앞으로 영상 제작자의 직업 안정에 대한 우려도 낳습니다. OpenAI에 따르면, 특히 원인과 결과를 이해하는 측면에서 아직 개선해야 할 부분이 남아 있습니다. 예를 들어, Sora AI Generator는 누군가가 쿠키를 물고 있는 모습을 묘사하는 비디오를 생성할 수 있지만 다음 프레임에서는 쿠키에 물린 자국이 표시되지 않을 수 있습니다. 또한 이 모델은 공간 인식에 어려움을 겪어 왼쪽과 오른쪽을 혼동하거나 장면 내에서 사람이나 사물이 어떻게 상호 작용해야 하는지 파악하지 못하는 경우가 발생합니다.
특히 최근 몇 달 동안 AI 기술이 딥페이크를 생성하는 데 어떻게 남용되었는지를 고려할 때 안전도 주요 관심사입니다. Sora AI 생성기도 예외는 아닙니다.
OpenAI는 오해의 소지가 있는 콘텐츠를 탐지하는 데 도움이 되는 도구를 구축하고 유해한 텍스트 프롬프트를 거부하는 기존 기술을 적용할 것이라고 밝혔습니다. 그러나 사람들이 현재 AI 모델의 보호를 우회하는 방식을 고려할 때 이러한 노력이 얼마나 성공적일지는 의문입니다.
Sora AI 생성기는 무서운 만큼 인상적입니다.
이 고급 AI 비디오 생성기가 영화 산업에 미치는 잠재적 영향과 유해한 콘텐츠 생성 가능성은 분명합니다. Taylor Swift 딥페이크를 비디오로 전환하거나 Joe Biden이 뉴햄프셔 유권자에게 딥페이크 전화 통화를 한 것과 유사한 집무실의 사실적인 메시지를 구상하는 등의 시나리오를 생각해 보세요. Sora는 아직 대중에게 공개되지 않았지만 공식 출시 전부터 이러한 강력한 기술이 미치는 영향은 상당합니다.