«خارج از این دنیا»: ابزار تبدیل متن به ویدیو OpenAI، سورا، اینترنت را روشن می‌کند

۲۷ بهمن ۱۴۰۲ - ۲۰:۳۷

استارت‌آپ با پشتیبانی مایکروسافت، رسانه‌های اجتماعی را با ویدیوهای فوق‌العاده‌ای که با استفاده از پیام‌های متنی ایجاد شده‌اند، شگفت‌زده می‌کند.

OpenAI، خالق ChatGPT، از شکل جدیدی از هوش مصنوعی پرده برداری کرده است که بر اساس پیام های متنی، ویدیوی واقعی ایجاد می کند. واکنش‌های حیرت‌انگیز آنلاین.

OpenAI در روز پنجشنبه در یک پست وبلاگی گفت:

مدل تبدیل متن به ویدئو، به نام سورا، “درکی عمیق از زبان” دارد و می تواند “شخصیت های قانع کننده ای ایجاد کند که احساسات پر جنب و جوش را بیان می کنند.”

این استارت‌آپ تحت حمایت مایکروسافت گفت: “Sora می‌تواند صحنه‌های پیچیده با شخصیت‌های متعدد، انواع حرکت خاص، و جزئیات دقیق سوژه و پس‌زمینه ایجاد کند.”

“مدل نه تنها آنچه را که کاربر در درخواست درخواست کرده است، بلکه چگونگی وجود آن چیزها در دنیای فیزیکی را نیز درک می‌کند.”

سام آلتمن، مدیر عامل OpenAI در X از کاربران دعوت کرد تا قبل از پست کردن نتایجی که شامل ویدیوهای واقعی از دو گلدن رتریور در حال پادکست در بالای کوه، مادربزرگ ساختن گنوکی و حیوانات دریایی در مسابقه دوچرخه‌سواری در بالای آن می‌شد، درخواست‌هایی را برای Sora پیشنهاد کنند. از اقیانوس.

https://t.co/uCuhUPv51N pic.twitter.com/nej4TIwgaP

— سم آلتمن (@sama) 15 فوریه ۲۰۲۴

بلوک نقل قول>

کیفیت فوق‌العاده واقعی ویدیوها واکنش‌های خیره‌کننده‌ای را در رسانه‌های اجتماعی برانگیخت و کاربران نتایج را «خارج از این دنیا» و «تغییرکننده بازی» نامیدند.

الن تی کاربر X گفت: «دو ساعت گذشته است و مغز من هنوز نمی‌تواند این ویدیوهای OpenAI Sora تولید شده را پردازش کند.

این تظاهرات همچنین نگرانی‌هایی را در مورد خطرات احتمالی، به‌ویژه در سالی که تحت نظارت دقیق انتخابات در سراسر جهان بود، از جمله انتخابات ریاست‌جمهوری ایالات متحده در نوامبر افزایش داد.

OpenAI در پست وبلاگ خود گفت که چندین مرحله ایمنی مهم را قبل از انتشار Sora برای عموم انجام خواهد داد.

شرکت گفت: «ما با تیم‌های قرمز کار می‌کنیم – متخصصان حوزه در زمینه‌هایی مانند اطلاعات نادرست، محتوای نفرت‌انگیز، و تعصب – که به طور خصمانه مدل را آزمایش خواهند کرد.

“ما همچنین در حال ساخت ابزارهایی برای کمک به شناسایی محتوای گمراه‌کننده مانند طبقه‌بندی‌کننده تشخیصی هستیم که می‌تواند تشخیص دهد چه زمانی یک ویدیو توسط Sora تولید شده است.”

OpenAI همچنین اذعان کرد که سورا دارای نقاط ضعفی است، از جمله مشکل در تداوم و تشخیص چپ از راست.

این استارت‌آپ مستقر در سانفرانسیسکو گفت: «برای مثال، شخصی ممکن است از یک کوکی گاز بگیرد، اما پس از آن، کوکی ممکن است علامت نیش نداشته باشد.

رقبای OpenAI متا و گوگل نیز فناوری هوش مصنوعی متن به ویدئو را نشان داده‌اند، اما مدل‌های آن‌ها نتایجی به اندازه سورا واقع‌بینانه ارائه نکرده‌اند.

SORA به تازگی از این دنیا خارج شده است.

مدل جدید متن به ویدیو OpenAI به تازگی حذف شده و دیوانه کننده است.

نمونه‌های بیشتر در زیر ⬇️ pic.twitter.com/qbMy5Rz5Mc

— لینوس (●ᴗ●) (@LinusEkenstam) 15 فوریه ۲۰۲۴

الجزیره