OpenAI از Sora 2، پیشرفتهترین مدل تولید ویدیوی خود و برنامه اجتماعی شبیه تیک تاک رونمایی کرد

شرکت OpenAI بهطور رسمی از Sora 2، جدیدترین مدل تولید ویدئو و صدا رونمایی کرده است. این مدل جدید به گفته شرکت، نسبت به نسخههای پیشین واقعگراتر، دقیقتر از نظر قوانین فیزیکی و قابلکنترلتر است.
شبیهسازی واقعیت با دقت فیزیکی
در حالی که مدلهای ویدئویی قبلی برای برآوردهکردن درخواستها گاه قوانین فیزیک را نقض میکردند – مثلاً اگر بازیکن بسکتبال شوت را از دست میداد، توپ بهطور غیرواقعی وارد حلقه میشد – Sora 2 چنین موقعیتهایی را به شکلی طبیعی بازآفرینی میکند. به عنوان مثال، توپ پس از برخورد به تخته عقب بازتاب میکند، همانطور که در دنیای واقعی رخ میدهد.
کنترلپذیری پیشرفته و تنوع سبکها
اوپنایآی اعلام کرده است که این مدل جهشی بزرگ در قابلیت کنترل به شمار میرود و میتواند دستورالعملهای پیچیده را در چندین نما دنبال کند، در حالی که تداوم وضعیت جهان را بهدقت حفظ میکند.
این مدل در تولید ویدئوهای واقعگرایانه، سینمایی و حتی سبک انیمه عملکرد درخشانی دارد.
تولید همزمان تصویر و صدا
یکی از ویژگیهای مهم Sora 2، توانایی تولید همزمان ویدئو و صدا است. این مدل قادر است افکتهای صوتی، گفتار و صداگذاری پسزمینه را با سطح بالایی از واقعگرایی تولید کند.
تزریق عناصر دنیای واقعی
OpenAI همچنین قابلیت جالبی را معرفی کرده است: با تحلیل یک ویدئو از فرد، مدل میتواند ظاهر و صدای آن شخص را به صحنههای تولیدشده اضافه کند.
اپلیکیشن اجتماعی «Sora»
همراه با معرفی این مدل، اوپنایآی یک اپلیکیشن iOS به نام Sora عرضه کرده که بر پایه Sora 2 کار میکند. این برنامه مشابه یک پلتفرم اجتماعی شبیه به تیکتاک عمل میکند و به کاربران امکان میدهد:
-
ویدئوهای خود را تولید کنند،
-
محتوای دیگران را بازسازی و ریمیکس کنند،
-
به فید شخصیسازیشده دسترسی داشته باشند،
-
و در قالب «cameo» در صحنههای دیگران حضور پیدا کنند.
طبق توضیحات شرکت، کاربران میتوانند تنها با یک ضبط کوتاه ویدئویی و صوتی برای تأیید هویت و ثبت چهره و صدای خود، وارد صحنههای تولیدی دیگران شوند و با دقتی چشمگیر بازآفرینی شوند.




