უცნობმა დაჯგუფებამ Anthropic-ის "სახიფათო" AI მოდელში შეაღწია — რა ვიცით
ფოტო: Jonathan Raa / NurPhoto / Getty Images
კომპანია Anthropic-ის ხელოვნური ინტელექტის (AI) მოდელზე, Mythos-ზე, უცნობმა დაჯგუფებამ მოიპოვა წვდომა. თავად Mythos კიბერუსაფრთხოების მძლავრი ინსტრუმენტია, რომლის არასწორ ხელში მოხვედრაც, კომპანიის განცხადებით, შეიძლება სახიფათო იყოს. ამაზე Bloomberg წერს.
დაჯგუფების ანონიმურმა წევრმა — "Anthropic-ის კონტრაქტორმა" — გამოცემას აუხსნა, როგორ მოახერხეს Mythos-ში შეღწევა. ამისათვის სხვადასხვა ტაქტიკას მიმართეს, კონტრაქტორის წვდომით ისარგებლეს და "ინტერნეტში ინფორმაციის მოძიების პოპულარული ინსტრუმენტები" გამოიყენეს.
Claude Mythos Preview ზოგადი გამოყენების ახალი მოდელია. Anthropic-ის განცხადებით, მას მოწყვლადობების შემჩნევა და გამოყენება შეუძლია "ყველა ძირითად ოპერაციულ სისტემასა და ვებბრაუზერში, როცა მომხმარებელი ამის გაკეთებას დაავალებს".
მოდელზე ოფიციალურად წვდომა მხოლოდ რამდენიმე კომპანიას აქვს Project Glasswing ინიციატივის ფარგლებში. მათ შორისაა: Nvidia, Google, Amazon Web Services, Apple და Microsoft. მთავრობები ტექნოლოგიას ყურადღებით აკვირდებიან. Anthropic ამჟამად მოდელის გასაჯაროებას არ გეგმავს, რადგან შიშობენ, რომ ვინმე მას ბოროტად გამოიყენებს.
"გამოძიება დავიწყეთ ცნობებზე, რომელთა მიხედვითაც, ჩვენი ერთ-ერთი კონტრაქტორის გავლით Claude Mythos Preview-ზე არაავტორიზებული წვდომა მოიპოვეს", — Bloomberg-თან საუბრისას განაცხადა Anthropic-ის წარმომადგენელმა.
Anthropic-ისათვის ამჟამად არაფერი მოწმობს იმას, რომ არაავტორიზებულ წვდომას კომპანიის სისტემებზე რაიმე გავლენა ჰქონდეს ან რომ იგი კონტრაქტორის კონტექსტს სცდებოდეს.
მოდელზე წვდომა, გადმოცემის თანახმად, 7 აპრილს მოიპოვეს — სწორედ იმ დღეს, როცა Anthropic-მა გამოაცხადა, რომ რამდენიმე კომპანიას Mythos-ის გამოცდის საშუალებას მისცემდა. ჯერჯერობით არ ამოუცნიათ დაჯგუფება, რომელმაც არაავტორიზებული წვდომა მოიპოვა. მეორე მხრივ, Bloomberg-ის უწყებით, მისი წევრები Discord-ის ერთ-ერთ არხში არიან, რომელშიც გამოუქვეყნებელ AI მოდელებზე ვრცელდება ინფორმაცია.
დაჯგუფებამ Mythos-ის ონლაინმისამართს ლოგიკური ვარაუდის საფუძველზე მიაგნო. ეს იმის შედეგია, რომ ცოტა ხნის წინ Mercor-ის მონაცემებმა გაჟონა, დაჯგუფებამ კი სწორედ აქედან მოიპოვა ინფორმაცია Anthropic-ის სხვა მოდელთა ფორმატებზე.
წევრები წვდომის მოპოვების შემდგომ Mythos-ს რეგულარულად იყენებდნენ — მათ Bloomberg-ს ეკრანის ანაბეჭდები ("სქრინშოთები") და მოდელის ლაივში გამოცდაც კი აჩვენეს. სავარაუდოდ, მოდელი კიბერუსაფრთხოებასთან დაკავშირებული მიზნებით არ გამოუყენებიათ, რომ პროცესში ისინი Anthropic-ს არ დაეფიქსირებინა.
Bloomberg-ის ცნობით, დაჯგუფებამ კომპანიის სხვა გამოუქვეყნებელ AI მოდელებზეც მოიპოვა წვდომა.
კომენტარები