უცნობმა დაჯგუფებამ Anthropic-ის "სახიფათო" AI მოდელში შეაღწია

კომპანია Anthropic-ის ხელოვნური ინტელექტის (AI) მოდელზე, Mythos-ზე, უცნობმა დაჯგუფებამ მოიპოვა წვდომა. თავად Mythos კიბერუსაფრთხოების მძლავრი ინსტრუმენტია, რომლის არასწორ ხელში მოხვედრაც, კომპანიის განცხადებით, შეიძლება სახიფათო იყოს. ამაზე Bloomberg წერს.

დაჯგუფების ანონიმურმა წევრმა — "Anthropic-ის კონტრაქტორმა" — გამოცემას აუხსნა, როგორ მოახერხეს Mythos-ში შეღწევა. ამისათვის სხვადასხვა ტაქტიკას მიმართეს, კონტრაქტორის წვდომით ისარგებლეს და "ინტერნეტში ინფორმაციის მოძიების პოპულარული ინსტრუმენტები" გამოიყენეს.

Claude Mythos Preview ზოგადი გამოყენების ახალი მოდელია. Anthropic-ის განცხადებით, მას მოწყვლადობების შემჩნევა და გამოყენება შეუძლია "ყველა ძირითად ოპერაციულ სისტემასა და ვებბრაუზერში, როცა მომხმარებელი ამის გაკეთებას დაავალებს".

მოდელზე ოფიციალურად წვდომა მხოლოდ რამდენიმე კომპანიას აქვს Project Glasswing ინიციატივის ფარგლებში. მათ შორისაა: Nvidia, Google, Amazon Web Services, Apple და Microsoft. მთავრობები ტექნოლოგიას ყურადღებით აკვირდებიან. Anthropic ამჟამად მოდელის გასაჯაროებას არ გეგმავს, რადგან შიშობენ, რომ ვინმე მას ბოროტად გამოიყენებს.

"გამოძიება დავიწყეთ ცნობებზე, რომელთა მიხედვითაც, ჩვენი ერთ-ერთი კონტრაქტორის გავლით Claude Mythos Preview-ზე არაავტორიზებული წვდომა მოიპოვეს", — Bloomberg-თან საუბრისას განაცხადა Anthropic-ის წარმომადგენელმა.

Anthropic-ისათვის ამჟამად არაფერი მოწმობს იმას, რომ არაავტორიზებულ წვდომას კომპანიის სისტემებზე რაიმე გავლენა ჰქონდეს ან რომ იგი კონტრაქტორის კონტექსტს სცდებოდეს.

მოდელზე წვდომა, გადმოცემის თანახმად, 7 აპრილს მოიპოვეს — სწორედ იმ დღეს, როცა Anthropic-მა გამოაცხადა, რომ რამდენიმე კომპანიას Mythos-ის გამოცდის საშუალებას მისცემდა. ჯერჯერობით არ ამოუცნიათ დაჯგუფება, რომელმაც არაავტორიზებული წვდომა მოიპოვა. მეორე მხრივ, Bloomberg-ის უწყებით, მისი წევრები Discord-ის ერთ-ერთ არხში არიან, რომელშიც გამოუქვეყნებელ AI მოდელებზე ვრცელდება ინფორმაცია.

დაჯგუფებამ Mythos-ის ონლაინმისამართს ლოგიკური ვარაუდის საფუძველზე მიაგნო. ეს იმის შედეგია, რომ ცოტა ხნის წინ Mercor-ის მონაცემებმა გაჟონა, დაჯგუფებამ კი სწორედ აქედან მოიპოვა ინფორმაცია Anthropic-ის სხვა მოდელთა ფორმატებზე.

წევრები წვდომის მოპოვების შემდგომ Mythos-ს რეგულარულად იყენებდნენ — მათ Bloomberg-ს ეკრანის ანაბეჭდები ("სქრინშოთები") და მოდელის ლაივში გამოცდაც კი აჩვენეს. სავარაუდოდ, მოდელი კიბერუსაფრთხოებასთან დაკავშირებული მიზნებით არ გამოუყენებიათ, რომ პროცესში ისინი Anthropic-ს არ დაეფიქსირებინა.

Bloomberg-ის ცნობით, დაჯგუფებამ კომპანიის სხვა გამოუქვეყნებელ AI მოდელებზეც მოიპოვა წვდომა.

თუ სტატიაში განხილული თემა და ხელოვნური ინტელექტის სფერო შენთვის საინტერესოა, შემოგვიერთდი ჯგუფში, სადაც ვლაპარაკობთ ხელოვნურ ინტელექტზე.

ბოლო ამბები:

გირჩევთ

უცნობმა დაჯგუფებამ Anthropic-ის "სახიფათო" AI მოდელში შეაღწია — რა ვიცით

კომენტარები

კვირის ტოპ-5

გირჩევთ