«خارج از این دنیا»: ابزار تبدیل متن به ویدیو OpenAI، سورا، اینترنت را روشن میکند
استارتآپ با پشتیبانی مایکروسافت، رسانههای اجتماعی را با ویدیوهای فوقالعادهای که با استفاده از پیامهای متنی ایجاد شدهاند، شگفتزده میکند.
OpenAI، خالق ChatGPT، از شکل جدیدی از هوش مصنوعی پرده برداری کرده است که بر اساس پیام های متنی، ویدیوی واقعی ایجاد می کند. واکنشهای حیرتانگیز آنلاین.
OpenAI در روز پنجشنبه در یک پست وبلاگی گفت:
مدل تبدیل متن به ویدئو، به نام سورا، “درکی عمیق از زبان” دارد و می تواند “شخصیت های قانع کننده ای ایجاد کند که احساسات پر جنب و جوش را بیان می کنند.”
این استارتآپ تحت حمایت مایکروسافت گفت: “Sora میتواند صحنههای پیچیده با شخصیتهای متعدد، انواع حرکت خاص، و جزئیات دقیق سوژه و پسزمینه ایجاد کند.”
“مدل نه تنها آنچه را که کاربر در درخواست درخواست کرده است، بلکه چگونگی وجود آن چیزها در دنیای فیزیکی را نیز درک میکند.”
سام آلتمن، مدیر عامل OpenAI در X از کاربران دعوت کرد تا قبل از پست کردن نتایجی که شامل ویدیوهای واقعی از دو گلدن رتریور در حال پادکست در بالای کوه، مادربزرگ ساختن گنوکی و حیوانات دریایی در مسابقه دوچرخهسواری در بالای آن میشد، درخواستهایی را برای Sora پیشنهاد کنند. از اقیانوس.
https://t.co/uCuhUPv51N pic.twitter.com/nej4TIwgaP
— سم آلتمن (@sama) 15 فوریه ۲۰۲۴
بلوک نقل قول>
کیفیت فوقالعاده واقعی ویدیوها واکنشهای خیرهکنندهای را در رسانههای اجتماعی برانگیخت و کاربران نتایج را «خارج از این دنیا» و «تغییرکننده بازی» نامیدند.
الن تی کاربر X گفت: «دو ساعت گذشته است و مغز من هنوز نمیتواند این ویدیوهای OpenAI Sora تولید شده را پردازش کند.
این تظاهرات همچنین نگرانیهایی را در مورد خطرات احتمالی، بهویژه در سالی که تحت نظارت دقیق انتخابات در سراسر جهان بود، از جمله انتخابات ریاستجمهوری ایالات متحده در نوامبر افزایش داد.
OpenAI در پست وبلاگ خود گفت که چندین مرحله ایمنی مهم را قبل از انتشار Sora برای عموم انجام خواهد داد.
شرکت گفت: «ما با تیمهای قرمز کار میکنیم – متخصصان حوزه در زمینههایی مانند اطلاعات نادرست، محتوای نفرتانگیز، و تعصب – که به طور خصمانه مدل را آزمایش خواهند کرد.
“ما همچنین در حال ساخت ابزارهایی برای کمک به شناسایی محتوای گمراهکننده مانند طبقهبندیکننده تشخیصی هستیم که میتواند تشخیص دهد چه زمانی یک ویدیو توسط Sora تولید شده است.”
OpenAI همچنین اذعان کرد که سورا دارای نقاط ضعفی است، از جمله مشکل در تداوم و تشخیص چپ از راست.
این استارتآپ مستقر در سانفرانسیسکو گفت: «برای مثال، شخصی ممکن است از یک کوکی گاز بگیرد، اما پس از آن، کوکی ممکن است علامت نیش نداشته باشد.
رقبای OpenAI متا و گوگل نیز فناوری هوش مصنوعی متن به ویدئو را نشان دادهاند، اما مدلهای آنها نتایجی به اندازه سورا واقعبینانه ارائه نکردهاند.
SORA به تازگی از این دنیا خارج شده است.
مدل جدید متن به ویدیو OpenAI به تازگی حذف شده و دیوانه کننده است.
نمونههای بیشتر در زیر ⬇️ pic.twitter.com/qbMy5Rz5Mc
— لینوس (●ᴗ●) (@LinusEkenstam) 15 فوریه ۲۰۲۴