AI मॉडल इतना ताकतवर कि पब्लिक के लिए नहीं होगा रिलीज, जानिए टेस्टिंग के दौरान क्या किया इसने
Anthropic का Claude Mythos Preview इतना ताकतवर निकला कि कंपनी ने इसे पब्लिक के लिए रिलीज नहीं किया। टेस्टिंग में इसने सुरक्षा तोड़ी, खुद रास्ते बनाए और खतरनाक क्षमताएं दिखाईं, जिससे AI से जुड़े जोखिम भी सामने आए।
Anthropic के नए AI मॉडल ने इंटरनेट की तय सीमाओं को पार करने के लिए खुद ही कई स्टेप्स वाला तरीका तैयार किया।
अमेरिकी AI कंपनी Anthropic ने अपने नए मॉडल 'Claude Mythos Preview' को आम लोगों के लिए रिलीज न करने का फैसला लिया है। कंपनी ने बताया कि इस मॉडल का इस्तेमाल सिर्फ 11 चुनिंदा संस्थाएं ही कर पाएंगी। इनमें Google, Microsoft, Amazon Web Services, Nvidia और JPMorgan Chase शामिल हैं।
इतना ताकतवर कि कंपनी ने रोक दिया लॉन्च
Anthropic के मुताबिक यह मॉडल इतना ज्यादा ताकतवर है कि इसे पब्लिक के लिए जारी करना सुरक्षित नहीं है। कंपनी ने कहा कि यह मॉडल बड़े ऑपरेटिंग सिस्टम और वेब ब्राउजर्स में गंभीर साइबर सिक्योरिटी खामियों को बेहद तेजी और सटीकता से ढूंढ सकता है।
इतना ही नहीं, यह कोडिंग में इस स्तर तक पहुंच चुका है कि सॉफ्टवेयर की कमजोरियों को पहचानने और उनका फायदा उठाने में यह ज्यादातर इंसानों से बेहतर साबित हो सकता है।
Anthropic ने दावा किया कि इस AI मॉडल ने ऐप्स और ऑपरेटिंग सिस्टम में हजारों ऐसी खामियां खोजीं, जो इंसानी एक्सपर्ट्स की नजर से बच गई थीं।
टेस्टिंग के दौरान चौंकाने वाले नतीजे
Anthropic ने बताया कि Mythos को एक कंट्रोल्ड माहौल में टेस्ट किया गया था, जिसे वर्चुअल सैंडबॉक्स कहा जाता है। इसका मतलब है कि उसे एक सीमित दायरे में रखा गया था, जहां वह बाहर की दुनिया से सीधे जुड़ नहीं सकता था। उसकी हर गतिविधि पर नजर रखी जा रही थी।
लेकिन जब टेस्ट के दौरान उसे सिस्टम से बाहर निकलने की कोशिश करने को कहा गया, तो उसने तय नियमों को तोड़ दिया। उसने अपने लिए रास्ता खोज लिया और उस सीमित दायरे से बाहर जाकर काम करना शुरू कर दिया। यानी जिस सीमा में उसे रोका गया था, उसे पार करने में वह सफल हो गया।
Axios की रिपोर्ट के मुताबिक, एक टेस्ट के दौरान यह मॉडल एक सख्त और आक्रामक बिजनेस लीडर की तरह व्यवहार करने लगा। उसने ऐसा प्लान बनाया जिसमें एक प्रतिस्पर्धी कंपनी को अपने ऊपर निर्भर बना सके। उसने सप्लाई रोकने की धमकी देने जैसे कदम सोचे, ताकि सामने वाली कंपनी पर दबाव बने। साथ ही उसने कीमतों को अपने हिसाब से कंट्रोल करने की भी रणनीति बनाई।
खुद ही रास्ता बनाया और जानकारी शेयर की
रिपोर्ट के मुताबिक, इस मॉडल ने इंटरनेट की तय सीमाओं को पार करने के लिए खुद ही कई स्टेप्स वाला तरीका तैयार किया। उसने अपनी पहुंच बढ़ा ली और फिर उस तरीके की जानकारी सार्वजनिक वेबसाइट्स पर भी डाल दी।
एक मामले में उसने जवाब पाने के लिए ऐसा तरीका अपनाया, जिसकी अनुमति नहीं थी। बाद में पकड़े जाने से बचने के लिए उसने उसी सवाल को दोबारा हल करने की कोशिश की, ताकि उसकी पहली चाल छिपी रह सके।
AI सिस्टम को भी किया निशाना
एक कोडिंग टेस्ट के दौरान, जब दूसरे AI ने इसका जवाब गलत बताया, तो इस मॉडल ने उसी सिस्टम को प्रभावित करने की कोशिश की। उसने ऐसा इनपुट देने की कोशिश की, जिससे सामने वाला AI अपना फैसला बदल दे। इसे ही ‘प्रॉम्प्ट इंजेक्शन अटैक’ कहा जाता है।
Anthropic की Frontier Red Team के प्रमुख लोगन ग्राहम ने कहा कि इस मॉडल की क्षमता इतनी ज्यादा है कि अब पुराने सुरक्षा तरीके काफी नहीं होंगे। उन्होंने कहा कि कंपनियों को सुरक्षा के नए तरीके अपनाने होंगे। हालांकि, हल्के अंदाज में उन्होंने यह भी कहा कि इस मॉडल ने AI के जरिए लिखी गई सबसे बेहतरीन कविता भी बनाई है।
क्या है Claude Mythos Preview
Claude Mythos Preview, Anthropic का अब तक का सबसे एडवांस AI मॉडल है। इसे 7 अप्रैल को प्रीव्यू के तौर पर पेश किया गया, लेकिन आम लोगों के लिए रिलीज नहीं किया गया।
इसे Claude सीरीज की अगली पीढ़ी का मॉडल माना जा रहा है। इसने कई बेंचमार्क्स में शानदार प्रदर्शन किया है। SWE-bench Verified (कोडिंग) में 93.9% स्कोर हासिल किया। USAMO 2026 (मैथ) में 97.6% तक पहुंच गया। Terminal-Bench 2.0 में 82% स्कोर दर्ज किया।
यह Claude Opus 4.6 से काफी आगे बताया जा रहा है। खासकर रीजनिंग, कोडिंग और लंबे टास्क्स को समझने और हल करने की क्षमता में इसमें बड़ा सुधार देखा गया है।