AI მკვლევრების მკაცრი კრიტიკის შემდეგ Anthropic უკან იხევს
ფოტო: NurPhoto/Getty Images
Anthropic უარს ამბობს პოლიტიკაზე, რომელიც კონკურენტებს ფარულად უზღუდავდა თავისი ახალი AI მოდელის, Claude Fable 5-ის გამოყენებას სხვა AI მოდელების შესაქმნელად. კომპანიამ კურსი შეცვალა მას შემდეგ, რაც AI სამეცნიერო საზოგადოებამ ეს გადაწყვეტილება მკაცრად გააკრიტიკა.
"ვცვლით Fable 5-ის დაცვის მექანიზმებს მოწინავე LLM განვითარების სფეროში, რათა ისინი ხილული გახდეს", — განაცხადა Anthropic-მა WIRED-თან — "ჩვენ არასწორი კომპრომისი გავაკეთეთ და ბოდიშს ვიხდით, რომ ბალანსი სწორად ვერ შევინარჩუნეთ".
Anthropic-მა Claude Fable 5 ამ კვირის დასაწყისში გამოუშვა, მოდელის ვერსია, რომელსაც ბოროტად გამოყენების თავიდან ასარიდებლად, დამატებითი უსაფრთხოების მექანიზმები ახლავს. ზოგიერთი მათგანი მოსალოდნელი იყო: კომპანიამ განაცხადა, რომ კიბერუსაფრთხოების, ბიოლოგიისა თუ ქიმიის შესახებ კითხვების დასმისას, მომხმარებელს ნაკლები შესაძლებლობის მქონე მოდელისკენ გადაამისამართებდა, რათა შემცირდეს რისკი, რომ ვინმე მოწინავე AI-ს კიბერშეტევის განსახორციელებლად ან ბიოლოგიური იარაღის შესაქმნელად გამოიყენებს.
თუმცა მოწინავე AI განვითარებაზე მომუშავე მკვლევრების შემთხვევაში, Anthropic-მა განსხვავებული მიდგომა გამოიყენა. კომპანია განზრახ და ფარულად აქვეითებდა მოდელის შესაძლებლობებს ისე, რომ მომხმარებელს ამის შესახებ არ აცნობებდა. ეს ფაქტობრივად ხელს უშლიდა მათ, ვინც Claude-ს კონკურენტი AI მოდელების სასწავლებლად იყენებდა, ამ პრაქტიკას Anthropic-ის სერვისის წესდება პირდაპირ კრძალავს.
Anthropic ახლა ამბობს, რომ კურსი შეცვალა და Claude Fable 5-ის დაცვის მექანიზმები AI განვითარების კუთხით მომხმარებლებისთვის ხილული გახდება. თუ კომპანია იეჭვებს, რომ მომხმარებელი Claude-ს მაღალი შესაძლებლობების AI-ის შესაქმნელად იყენებს, ამჯერად ღიად გააფრთხილებს მას, ან მოთხოვნას უარყოფს, ან ნაკლებად შესაძლებლიანი მოდელისკენ გადაამისამართებს.
კომპანიამ გადაწყვეტილება AI სამეცნიერო საზოგადოების მძაფრი კრიტიკის შემდეგ შეცვალა. Anthropic-მა უკვე გადადგა ნაბიჯები, რათა კონკურენტებს Claude-ის დახურული და ღია კოდის AI მოდელების შესაქმნელად გამოყენება შეუზღუდოს, თუმცა კრიტიკოსები ამბობენ, რომ გარკვეული მომხმარებლებისთვის მოდელის შესაძლებლობების ფარულად დაქვეითება ზღვარს გასცდა. Claude-ის კოდირების აგენტი დეველოპერებს შორის, მათ შორის ღია კოდის AI-ის სფეროში მომუშავეთა შორის, პოპულარულ ინსტრუმენტად იქცა. მკვლევრები WIRED-ს უყვებიან, რომ კომპანიის უახლეს პოლიტიკას შეეძლო შეექმნა შემაშფოთებელი მომავალი, სადაც მოწინავე AI კვლევის ჩატარება მხოლოდ რამდენიმე წამყვანი AI ლაბორატორიისთვის იქნებოდა შესაძლებელი.
Foundation for American Innovation-ის უფროსმა თანამშრომელმა და White House-ის ყოფილმა AI მრჩეველმა, დინ ბოლმა X-ზე დაწერა, რომ "მომხმარებლისთვის შეუტყობინებლად ML კვლევაზე მუშაობის ხარისხის შემცირება შოკისმომგვრელად მტრული და სამარცხვინო ნაბიჯია". სხვა პოსტში მან დასძინა, რომ "ფარული დივერსიის" ეს პოლიტიკა Anthropic-ის საერთო პოზიციას აზიანებს, ვინაიდან AI მკვლევრებს AI უსაფრთხოებაზე თანამშრომლობის საშუალებას უზღუდავს.
"თითქოს Anthropic საზოგადოებას ეუბნებოდა: 'ჩვენ არავის ვენდობით AI კვლევის ჩასატარებლად. მხოლოდ ჩვენ შეგვიძლია AI კვლევა'", — ამბობს ვილ ბრაუნი, ღია კოდის AI სტარტაპ Prime Intellect-ის კვლევის ხელმძღვანელი — "ისეთი შეგრძნებაა, თითქოს გზა გაიკვლიეს და ახლა სხვებს ამ გზას უკეტავენ".
ბრაუნი ამბობს, რომ ეს პოლიტიკა დეველოპერებს სიბნელეში ტოვებდა, რადგან მათ არ ეცოდინებოდათ, რომ Anthropic-ის წესებს არღვევდნენ, ვინაიდან კომპანია არც კი აფრთხილებდა. მან ასევე აღნიშნა, რომ შეზღუდვებს ფართომასშტაბიანი შედეგების გამოწვევა შეეძლო. მაგალითად, მიუთითა მესამე მხარის შეფასების კომპანიების მზარდ ეკოსისტემაზე, რომლებიც მოწინავე მოდელებს უსაფრთხოების, მუშაობის ხარისხისა და საიმედოობის კუთხით ამოწმებენ. ამ სამუშაოს, Anthropic-ის მიერ მოდელის შესაძლებლობების ფარულად დაქვეითება ხელს შეუშლიდა.
Anthropic-მა განაცხადა, რომ ეს ზომები იმიტომ გაატარა, რომ AI კვლევის დაჩქარებაში Claude სულ უფრო ეფექტიანი გახდა. ბოლო ბლოგ-პოსტში კომპანიამ შეშფოთება გამოხატა, რომ AI-ის საკუთარი შესაძლებლობების განვითარება იმაზე სწრაფად შეუძლია, ვიდრე საზოგადოება ადაპტაციას მოასწრებს. Anthropic-ის თქმით, "მსოფლიოსთვის სასარგებლო იქნებოდა მოწინავე AI განვითარების შენელება ან დროებით შეჩერება, რათა სოციალურმა სტრუქტურებმა და შესაბამისობის კვლევამ ამ ტემპს ფეხი აუწყოს".
"ეს დაცვის მექანიზმები გარე ძალებს ხელს უშლის ჩვენი ყველაზე მაღალი შესაძლებლობის მქონე მოდელების ისეთნაირად გამოყენებაში, რაც სერიოზულ უსაფრთხოების რისკებს შექმნიდა. აშშ-სა და მის მოკავშირეებს უპირატესობა აქვთ მოწინავე ჩიპებისა და მათ სრულ პოტენციალამდე ოპტიმიზებული პროგრამული უზრუნველყოფის სფეროში", — განაცხადა კომპანიამ WIRED-თან — "ეს მექანიზმები უზრუნველყოფს, რომ Claude არ იქნება გამოყენებული ამ უპირატესობის შესასუსტებლად, მაგალითად, მტრული ქვეყნების მიერ შემუშავებული ჩიპების ოპტიმიზაციისთვის. ვიდექით არჩევანის წინაშე, ხილულს გავხდიდით შეზღუდვებს თუ ფარულს. ფარული დაცვის მექანიზმის გამოვლენა და გვერდის ავლა უფრო რთულია, რაც საშუალებას გვაძლევდა, გაცილებით ზუსტად განგვესაზღვრა მისი გამოყენების შემთხვევები".
Anthropic ამბობს, რომ ახლა, როცა AI განვითარების ეს დაცვის მექანიზმი ხილულია, უფრო ფართო ქსელის აგება გახდა საჭირო, რაც ნიშნავს, რომ დაცვის მექანიზმის ამოქმედება უფრო მეტმა უვნებელმა მოთხოვნამაც შეიძლება გამოიწვიოს. კომპანია ამბობს, რომ რაც შეიძლება სწრაფად მუშაობს თავისი ფილტრების სიზუსტის გასაზრდელად.
- OpenEvidence — ჩატბოტი, რომელმაც ამერიკელი ექიმების გული მოიგო
- OpenAI საფონდო ბირჟაზე გადის — კომპანიამ განაცხადი უკვე გააკეთა
- OpenAI და Anthropic კონგრესს ბიოიარაღზე კონტროლის გამკაცრებას სთხოვს
კომენტარები