Sora는 2024년 2월 발표되었을 때 OpenAI의 첫 번째 비디오 세대 모델이었습니다. 그러나 ChatGPT Plus 및 Pro 구독자가 사용할 수 있게 된 12월까지는 공식적으로 출시되지 않았습니다. Sora를 사용하면 사용자는 텍스트나 기타 프롬프트를 사용하여 비디오를 생성할 수 있습니다. 이 영상의 시각적 내용은 인상적이었지만 뭔가가 빠졌습니다. 오디오가 부족했으며 이것이 Sora 2가 제공하는 주요 업그레이드입니다.
OpenAI의 Sora 2 비디오 생성기는 이제 동기화된 대화 및 음향 효과의 형태로 오디오를 추가합니다. 업그레이드는 9월 30일에 출시되었으며 회사는 이를 “이전 비디오 세대 모델에서는 매우 어렵고 어떤 경우에는 완전히 불가능한 작업을 수행할 수 있는” 모델이라고 설명했습니다. Sora 2는 특히 비디오 사실성과 관련된 Sora의 한계를 개선합니다. Sora를 사용하면 애니메이션이 제대로 기반을 갖추지 못했다는 느낌이 들었고 때로는 알고리즘이 생성된 비디오에 기본 물리 법칙을 적용하는 것을 잊어버린 것처럼 보였습니다. OpenAI는 이를 모델이 지나치게 낙관적이며 비디오를 현실적으로 유지하기보다는 프롬프트 실행에 너무 많이 의존하는 것으로 보았습니다.
향상된 현실감 외에도 Sora 2는 Sora iOS 앱과 함께 출시되는 새로운 Cameos 기능을 도입합니다. 이를 통해 사용자는 생성된 비디오에 자신의 모습을 포함할 수 있습니다. 귀하의 신원을 확인하기 위해 짧은 일회성 비디오 및 오디오 녹음을 녹화하면 Sora 2는 정확한 모양과 음성 렌더링을 통해 생성된 모든 장면에 귀하를 데려갈 수 있습니다. 이는 인간, 동물, 심지어 사물에도 적용됩니다. 또한 OpenAI가 Sora 2를 비디오용 “GPT-3.5 순간”이라고 부르는 이유를 보여주며, 이번 릴리스를 통해 Sora 2가 몇 세대 앞서 있음을 시사합니다.
Sora 2 액세스 및 가격 구조
OpenAI는 Sora 2 출시에 매우 전략적인 접근 방식을 채택했습니다. 이 모델은 초대 전용 액세스를 통해 미국과 캐나다에서 먼저 출시된 후 아시아 대륙, 특히 일본, 한국, 태국, 베트남 및 대만으로 확대되었습니다. 초대 전용 액세스는 현재 Sora 앱(Sora 2 포함)을 사용하려는 사용자가 모델을 무료로 사용하려면 입장하기 전에 iOS 앱 대기자 명단에 가입해야 함을 의미합니다. Sora 2의 Android 통합은 아직 발표되지 않았습니다. 하지만 이번 달 소라 안드로이드 앱(소라 포함)이 출시돼 첫날 약 47만 건의 다운로드를 기록했다.
가격과 관련하여 Sora 2는 크레딧 시스템을 사용하므로 모든 비디오는 해상도, 기간 및 표준 모델을 사용하는지 Pro 모델을 사용하는지 여부에 따라 크레딧을 차지합니다. 현재 iOS 및 웹 릴리스에서는 초대받은 사람만 Sora 2 표준 버전을 무료로 사용할 수 있습니다. 여기에는 비디오 생성, 오디오 효과 및 기본 편집과 같은 모든 핵심 기능이 포함됩니다. 하지만 월 200달러짜리 ChatGPT Pro를 구독하고 있다면 추가 비용 없이 Sora 2 Pro에 액세스할 수 있습니다. 아직 실험 단계이긴 하지만 이를 통해 고품질 비디오 생성에 액세스할 수 있습니다.
Sora 2를 사용하면 10초짜리 비디오에는 10크레딧이 필요하고, 15초짜리 비디오에는 20크레딧이 필요하며, 1세대와 2세대의 비디오만 얻을 수 있습니다. ChatGPT Pro에서만 사용할 수 있는 Sora 2 Pro의 경우 10초 표준 해상도 비디오는 4세대에 40크레딧이 필요하고, 15초 표준 해상도 비디오는 8세대에 80크레딧이 필요하며, 25초 비디오에는 12세대에 120크레딧이 필요합니다. 10초 및 15초 고해상도 비디오는 25세대 및 50세대로 제공되며 비용은 각각 250 및 500크레딧입니다. OpenAI는 또한 API에 Sora 2를 도입할 계획을 밝혔으며 Sora 1 Turbo는 계속 사용할 수 있음을 확인했습니다.
