चैटजीपीटी (ChatGPT) लॉन्च कर आर्टिफिशियल इंटेलीजेंस (AI) की दुनिया में तहलका मचाने वाली कंपनी ओपनएआई (OpenAI) ने अब अपना एक और नया इनोवेशन 'सोरा (Sora)' लॉन्च किया है। यह एक एआई मॉडल है, जो टेक्स्ट को वीडियो में बदल देगा। माइक्रोसॉफ्ट के निवेश वाली OpenAI को उम्मीद है कि उसे सोरा के जरिए आर्टिफिशियल इंटेलीजेंस पर काम करने वाली दूसरी कंपनियों से आगे रहने में मदद मिलेगी। तेजी से बदलते आर्टिफिशियल इंटेलीजेंस की दुनिया में अभी तक टेक्स्ट को प्रभावशाली वीडियो में बदलने वाला बड़ा प्लेटफॉर्म मौजूद नहीं था और वीडियो की बढ़ती मांग को देखते हुए यह टूल्स काफी लोकप्रिय हो सकता है। आइए इस टूल्स के बारे में सबकुल जानते हैं-
सोरा एक जापानी शब्द है, जिसका मतबल आसमान होता है। यह टेक्स्ट को वीडियो में बदलने वाला मॉडल है। फिलहाल यह करीब 60 सेंकेंड या एक मिनट तक लंबी अवधि का वीडियो बना सकता है। OpenAI ने बताया, "सोरा बहुत ही डिटेल वाली दृश्यों, शानदार कैमरा मोशन और जीवंत भावनाओं वाले कई कैरेक्टर को दिखाते हुए 60 सेकंड तक के वीडियो बना सकता है।" कंपनी का दावा है कि नया मॉडल यूजर्स की ओर से दी गई तस्वीरों या मौजूदा फुटेज का इस्तेमाल करके भी रियलिस्टिक वीडियो बना सकता है।
इस नए AI मॉडल को ट्राई करने के लिए फिलहाल हममें से अधिकतर लोगों को थोड़ा इंतजार करना होगा। कंपनी ने भले ही 15 फरवरी को टेक्स्ट-टू-वीडियो मॉडल को लॉन्च करने का ऐलान कर दिया था, लेकिन यह अभी भी रेड-टीमिंग चरण में है। रेड टीमिंग एक चरण है जिसमें विशेषज्ञों की एक टीम (इसे रेड टीम के रूप में जाना जाता है) सिस्टम में कमजोरियों और कमजोरियों की पहचान करने के लिए रियल फीडबैक के इस्तेमाल को फॉलो करती है।
कंपनी ने कहा, "हम मॉडल को अधिक से अधिक उपयोगी बनाने के तरीके पर फीडबैक पाने के लिए इसे विजुअल आर्टिस्ट्स, डिजाइनरों और फिल्म निर्माताओं तक पहुंच प्रदान कर रहे हैं।"
कल्पना करें कि टीवी पर एक स्थिर, खिच-खिच की आवाज करती एक तस्वीर है और अब यह धीरे-धीरे साफ होते हुए आपको एक स्पष्ट, गतिशील वीडियो में बदलती जा रही है। सोरा भी मूल रूप से यही करती है। यह एक विशेष प्रोग्राम है जो धीरे-धीरे नॉइज को दूर करने और वीडियो बनाने के लिए "ट्रांसफॉर्मर आर्किटेक्चर" का उपयोग करता है। यह केवल फ्रेम दर फ्रेम नहीं, बल्कि पूरे वीडियो को एक साथ तैयार कर सकता है। यह मॉडल टेक्स्ट में दी गई जानकारी को फीड करके, यूजर्स को वीडियो की सामग्री उपलब्ध करा देगा। ओपनएआई का दावा है कि आगे चलकर यह मॉडल फिल्में भी बनाने की क्षमता रखता है।