शोधकर्ताओं का कहना है कि उन्होंने प्रमुख एआई-संचालित चैटबॉट्स पर रेलिंग को तोड़ने के तरीके ढूंढ लिए हैं।
शोधकर्ताओं का कहना है कि उन्होंने ओपनएआई, गूगल और एंथ्रोपिक के प्रमुख एआई-संचालित चैटबॉट्स पर सुरक्षा रेलिंग को तोड़ने के संभावित असीमित तरीके ढूंढ लिए हैं ।
चैटजीपीटी, बार्ड और एंथ्रोपिक क्लाउड जैसे बड़े भाषा मॉडल को तकनीकी कंपनियों द्वारा बड़े पैमाने पर संचालित किया जाता है। मॉडलों को व्यापक रेलिंग से सुसज्जित किया गया है ताकि यह सुनिश्चित किया जा सके कि उनका उपयोग नापाक तरीकों के लिए नहीं किया जा सकता है, जैसे कि उपयोगकर्ताओं को बम बनाने का निर्देश देना या घृणास्पद भाषण के पन्ने लिखना।
गुरुवार को जारी एक रिपोर्ट में , पिट्सबर्ग में कार्नेगी मेलन विश्वविद्यालय और सैन फ्रांसिस्को में सेंटर फॉर एआई सेफ्टी के शोधकर्ताओं ने कहा कि उन्होंने इन रेलिंगों को बायपास करने के तरीके ढूंढ लिए हैं।