- Väidetavalt sai väike eraviisiline Discordi grupp loata juurdepääsu Claude Mythos Preview'le kolmanda osapoole töövõtja keskkonna kaudu.
- Mythos on tehisintellekti küberturvalisuse mudel, mis on reserveeritud käputäiele ettevõtetele ja institutsionaalsetele partneritele Project Glasswingi raames.
- Väidetavalt arvas grupp mudeli veebiasukoha ära nimekonventsioonide, lekkinud andmete ja töövõtjate õiguste abil.
- Anthropic uurib juhtumit ja väidab, et praegu puuduvad tõendid selle mõju kohta ettevõtte põhisüsteemidele, kuid juhtum tekitab muret tarneahela ja juurdepääsukontrolli osas.
Hiljutine avalikustamine väidetav volitamata juurdepääs Anthropici Claude Mythose mudelile Discordi kaudu on tehisintellekti maailmas taas keerulist arutelu tekitanud: kuidas jagada võimsaid küberturbetööriistu ilma ründajatele täpselt seda andmata, mida nad vajavad? Väike veebigrupp väidab, et neil õnnestus Mythost nädalaid kasutada, hoolimata sellest, et süsteem oli piiratud rangelt kontrollitud eelvaatega.
Mitme teate kohaselt ei olnud tegemist suurejoonelise Hollywoodi-stiilis häkkimisega, vaid pigem... töövõtjate lubade, veebipõhise detektiivitöö ja teadlike oletuste kombinatsioon kus Anthropic oma kõige tundlikumaid süsteeme majutab. Mudeli puhul, mis on loodud tarkvara haavatavuste leidmiseks ja ärakasutamiseks suures mahus, on juba ainuüksi idee, et kõrvalseisjad saaksid sellega katsetada, pälvinud nii turvaekspertide, ettevõtete kui ka valitsuste tähelepanu.
Mis on Claude Mythos ja miks see on oluline
Claude Mythos Preview on Anthropici uus küberturvalisusele keskendunud tehisintellekti süsteem, mida esitleti üldotstarbelise mudelina, millel on ebatavaliselt täiustatud võimalused operatsioonisüsteemide ja veebibrauserite vigade tuvastamiseks ja isegi ärakasutamiseks. Avalikkusele avaldamise asemel positsioneeris Anthropic Mythose piiratud tööriistana kriitilise infrastruktuuri kaitsmiseks.
Aprilli alguses avalikustas ettevõte Mythose osana algatusest, mida tuntakse nime all Projekt GlasswingSelle programmi raames kutsuti mudelit testima vaid lühike nimekiri usaldusväärsetest organisatsioonidest. Aruannetes mainitakse kontrollitud katseteks varajase juurdepääsu saavate seas suuri tehnoloogia- ja ettevõtlusettevõtteid, nagu Amazon, Microsoft, Apple, Cisco ja Nvidia, aga ka finantsasutusi, nagu Goldman Sachs.
Partnerid on Mythosele omistanud märkimisväärse hulga turvaprobleemide paljastamise. Üks silmapaistev näide, mida intsidendi kajastustes korduvalt mainitakse, on Mozilla, kes väidetavalt kasutas seda mudelit tuvastada ja parandada sadu Firefoxi haavatavusiAnthropic on samuti väitnud, et Mythos on aidanud paljastada tuhandeid väga tõsiseid vigu laialdaselt kasutatavas tarkvaras.
Need tulemused on toitnud nii optimismi kui ka rahutust. Ühelt poolt peente vigade ja valekonfiguratsioonide automatiseeritud tuvastamine See võib aidata kaitsjatel ründajatest ees püsida. Teisest küljest on süsteem, mis lihtsustab keerulisi rünnakutehnikaid, ohus muutuda küberkuritegevuse jõukordajaks, eriti kui selle kaitsepiirded või juurdepääsumudel ebaõnnestuvad.
Reguleerivad asutused on seda juba märganud. Ühendkuningriigi tehisintellekti ohutusinstituut hindas väidetavalt Mythost ja jõudis järeldusele, et see suudab... teostada mitmeastmelisi küberrünnakuid piiratud inimliku sekkumisega...mõnikord simuleerides rünnakuahelaid, mis tavaliselt võtaksid kogenud spetsialistidelt päevi tööd. See hindamine aitas kaasa arusaamale Mythost kui mudelist, mis nihutab küberriski osas väravaposte.

Kuidas Discordi grupp väidab, et see sisse sai
Selle taustal on a ilmumine lõdvalt organiseeritud Discordi grupp, mis nõuab juurdepääsu Mythosile on tekitanud mõistetavat muret. Bloombergi ja teiste väljaannete kogutud aruanded kirjeldavad stsenaariumi, kus uudishimu, siseringisidemed ja avatud lähtekoodiga uuringud ühendasid jõud väidetavalt piiratud juurdepääsupiirist möödahiilimiseks.
Rühma liikmed osalevad a-s Privaatne Discord kanal, mis on pühendatud avaldamata tehisintellekti mudelite jälgimiseleNende avalikult väljendatud eesmärk on katsetada tipptasemel süsteeme, mis pole veel üldsusele kättesaadavad. Asjaosaliste isikuid pole ametlikult tuvastatud, kuid ühe liikme kohta öeldakse, et ta töötab alltöövõtja heaks, kes osutab teenuseid ettevõttele Anthropic.
See töövõtja ühendus näib olevat olnud võtmetähtsusega. Aruanded näitavad, et isiku privilegeeritud juurdepääs välise tarnijana oli üks pusletükk. Lisaks siseringi tugipunktile toetusid liikmed Anthropicu infrastruktuuri kaardistamiseks levinud internetiuuringute tehnikatele ning eelnevatele teadmistele selle kohta, kuidas ettevõte oma mudeleid nimetab ja juurutab.
Hiljutine andmeleke eraldi tehisintellekti idufirmas Mercor andis väidetavalt lisavihjeid. Selle lekke teave koos varasemate antroopsete mudelite nimetamise konventsioonidega võimaldas Discordi grupil teha... „Hästi informeeritud oletus” Claude Mythose veebiasukoha kohtaSelle asemel, et jõuga sisse murda, arvasid nad sisuliselt ära õige ukse ja kõndisid seejärel sellest läbi töövõtja keskkonnaga seotud volitustega.
Kui nad said toimiva ligipääsu, kasutas grupp väidetavalt Mythost regulaarselt enam kui kahe nädala jooksul. Bloomberg väidab, et nad vaatasid üle ekraanipildid ja reaalajas demonstratsioon mis näis kinnitavat, et mudel tõepoolest töötas ja vastas volitamata kasutajate esitatud küsimustele. Samuti on väidetud, et sama lähenemisviisi abil oli võimalik ligi pääseda ka teistele avaldamata antropoloogilistele mudelitele, kuigi nende süsteemide kohta on üksikasjad endiselt napilt teada.
Mida grupp väidab, et tegi Mythosega
Avalikult on Discordi liikmed püüdnud distantseeruda ideest, et nad on küberkurjategijad. Üks episoodi kajastuses tsiteeritud liige ütles, et grupi huvi seisneb selles, et uute tehisintellekti mudelite proovimine rünnakute käivitamise asemelNende sõnul kasutati Müütost suhteliselt ohututeks katseteks, näiteks lihtsate veebisaitide loomiseks ja testimisülesannete jaoks.
Samuti väidavad nad, et nad vältisid riskantseid käitumisviise, mis võisid Anthropicu jälgimissüsteemides häireid käivitada. Väidetavalt hoidus grupp ilmselgelt pahatahtlikest päringutest ja silmatorkavatest tegevusmahtudest, püüdes selle asemel „lendama radari all“, uurides samal ajal mudeli võimeidOlemasolevate andmete põhjal puuduvad seni konkreetsed tõendid selle kohta, et rühmitus oleks Mythost reaalsete sihtmärkide ohtu seadmiseks kasutanud.
Isegi kui need enesekirjeldused on täpsed, on intsident turvatöötajate seas rahutust tekitanud. Kui on tõestatud toimiv tee piiratud süsteemi sisenemiseks, kopeerijad võivad proovida tehnikat kopeerida, potentsiaalselt väga erinevate motiividega. Asjaolu, et see esimene volitamata kasutajate laine väidab, et neil polnud pahatahtlikku kavatsust, ei rahusta kaitsjaid eriti selle üle, mis edasi saab.
See episood on toonud esile ka selle, kui palju tundlik juurdepääs võib sõltuda väikese arvu inimeste käitumisest. Ühest osaliste õigustega ja reegleid rikkuva töövõtjaga koos teatava järjekindlusega privaatses Discordis oli ilmselt piisav, et... rikkuda kõrge riskiga tehisintellekti mudeli kavandatud isolatsiooni.
Antroopilise vastus ja tarnijate ahela probleem
Anthropic on teateid tunnistanud ja ütleb, et viib läbi ametlikku läbivaatamist. Pressile jagatud avalduses märkis ettevõte: „Uurime teadet, mille kohaselt on ühe meie kolmanda osapoole tarnija keskkonna kaudu toimunud volitamata juurdepääs Claude Mythos Preview'le.“ Sõnastus on ettevaatlik, aga oluline.
Ettevõte rõhutab, et praegusel hetkel on tal puuduvad tõendid selle kohta, et tegevus laienes ettevõtte põhisüsteemidele või et selle sisemist infrastruktuuri oli otseselt ohustatud. Rajades probleemi tarnija keskkonnaga piirduvaks, tõmbab Anthropic sisuliselt piiri oma keskse tegevuse ja Discordi grupiga seotud töövõtja kasutatava keskkonna vahele.
See eristus on aga just see, mis paljudele vaatlejatele muret teeb. Kui müütini on võimalik jõuda kolmanda osapoole keskkonnast, siis iga välise partneri turvapositsioon saab rünnakupinna osaksOlukord illustreerib klassikalist tarneahela riski: isegi kui ettevõte tugevdab oma võrgustikke, võivad tarnijate nõrkused või valed konfiguratsioonid avada ootamatuid uksi.
See juhtum on vastuolus ka sellega, kuidas Project Glasswingi turustati. Programmi loogika oli järgmine: juurdepääsu rangelt piiramine käsitsi valitud organisatsioonide nimekirjaga hoidis Mythose vastastest eemal, võimaldades samal ajal kasulikku testimist ja tagasisidet. Eksklusiivsuse idee oli kesksel kohal: mudelit said uurida ainult suured ja kontrollitud üksused, vähendades väärkasutuse võimalust.
Kui mitteametlik Discordi grupp saaks hakata Müütost kasutama kohe selle väljakuulutamise päeval, muutuks see narratiiv raskemini säilitatavaks. Isegi kui pärismaailma rünnakute kohta, mis mudelile tagasi viitaksid, viitab episood. tundlike tehisintellekti süsteemide ümber olev perimeeter võib olla ettenähtust hapram, eriti kui tegemist on väliste töövõtjate ja partneritega.
Laiemad mured "liiga võimsa" küberjulgeoleku tehisintellekti pärast
Lisaks selle juhtumi konkreetsetele üksikasjadele annab Müütose lugu oma panuse laiemasse arutelusse teemal Tehisintellekti tööriistad, mis hägustavad piiri kaitse ja rünnaku vahelMythost on reklaamitud kui omamoodi „punast meeskonda kastis“, mis on võimeline simuleerima keerulisi ründajaid ja paljastama nõrkusi juba ammu enne, kui inimvastased nende otsa komistavad.
Turvalisuse uurijad on selle väite tõlgendamise osas lahkarvamusel. Mõned on skeptilised, et tehisintellekti süsteem, olgu see kui tahes arenenud, suudab usaldusväärselt avastada uusi haavatavusi turundusmaterjalides soovitatud kiirusega. Teised väidavad, et kui väited on kasvõi osaliselt täpsed, siis risk... Tehisintellekti abil toimuvad küberrünnakud muutuvad kiiremaks, odavamaks ja skaleeritavamaks on midagi, mida poliitikakujundajad peaksid regulatsioonide loomisel arvesse võtma.
Valdkonna tegelaste, sealhulgas pilveturbeettevõtete juhtide kommentaarid peegeldavad nii uudishimu kui ka muret. Ühelt poolt näevad kaitsjad võimalust automatiseerida tüütuid analüüse ja stressitesti tarkvara realistlike rünnakustsenaariumide korralTeisest küljest kujutavad nad ette, mis juhtub, kui sarnaseid mudeleid hakatakse tahtlikult rünnakuks häälestama ja laiemalt levitama või kui kahjuliku kasutamise vältimiseks mõeldud piirdeid on lihtne mööda hiilida.
Valitsusasutused hakkavad neid küsimusi käsitlema pigem strateegiliste kui puhtalt tehniliste küsimustena. Antroopiline valdkond on väidetavalt määratud USA kaitseministeeriumi „tarneahela risk”, kusjuures käimas on arutelud selle märgise sisu ja selle läbivaatamise võimalikkuse üle. Rahvusvahelised ohutusasutused näevad sarnaseid süsteeme nagu Mythos kahesuguse kasutusega tehisintellekti tehnoloogiate käsitlemise katsetustena.
Seega saabus Discordi juurdepääsu intsident delikaatsel hetkel. Reguleerivate asutuste jaoks võib see olla varajaseks näiteks politseitöö väljakutsetest, kes saavad kasutada võimsaid tehisintellekti mudeleid. kuidas nende juurdepääsu auditeeritakse ja millised on teenusepakkujate kohustused kui asjad lähevad valesti. Sarnaseid tööriistu kaaluvate ettevõtete jaoks tekitab see praktilisi küsimusi dokumenteerimise, logimise ja tundlike keskkondade eraldamise kohta.
Mida see tähendab ettevõtete, kasutajate ja tehisintellekti haldamise jaoks
Organisatsioonide jaoks, kes olid silma peal hoidnud Mythosel või sarnastel süsteemidel, ajendas see episood tõenäoliselt tegema uusi riskianalüüse. Põhiline pinge on lihtne: Samad omadused, mis muudavad mudeli kaitseks atraktiivseks, võivad valesti käsitsemisel muuta selle ohtlikuks.Kui isegi piiratud eelvaated võivad lekkida mitteametlikesse kogukondadesse, võib olla vaja ajakohastada oletusi selle kohta, kes neid tööriistu tegelikult kasutab.
Ettevõtte turvalisuse seisukohast rõhutab see juhtum vajadust uurida kogu juurdepääsuahel, sealhulgas töövõtjad ja väiksemad tarnijad ja tehisintellekti agentide meeskondade juurutamine tootmisesPaberil ranged näivad poliitikad võivad reaalsetes olukordades kokku kukkuda, kus inimesed taaskasutavad volitusi, teevad mugavuse huvides järeleandmisi või kohtlevad eelvaatekeskkondi väiksema panusega. Organisatsioonid võivad otsustada, et nad vajavad tehisintellekti süsteemide rangemat segmenteerimist, mis suhtlevad otse reaalajas koodi ja infrastruktuuriga.
Igapäevastele kasutajatele ja töötajatele tuletab see lugu meelde, et tehisintellekt ei ole lihtsalt järjekordne ettevõtte tarkvara. Süsteemid nagu Mythos suudavad lühendada nõrkade külgede uurimiseks vajalikku aega ja oskusteavet, mis võimendab mis tahes lekke või väärkasutuse mõju. See reaalsus võib ajendada uusi sisemisi koolitus- ja juhtimisraamistikke selle kohta, kes ja millistel tingimustel saavad kõrge riskiga mudeleid päringuid esitada.
Tehisintellekti haldamise rindel on üha suurem surve liikuda vabatahtlikest suunistest kaugemale. Sellised intsidendid õhutavad üleskutseid ametlikud standardid juurdepääsu kontrolli, intsidentide avalikustamise ja sõltumatu auditeerimise kohta kõige võimekamate mudelite puhul. Olenemata sellest, kas poliitikakujundajad valivad leebe järelevalve või rangema reguleerimise, osutavad nad tõenäoliselt õigustuseks juhtumitele, kus piiratud tööriistad libisesid mitteametlikesse kanalitesse.
Anthropicu enda jaoks sõltub palju sellest, mida käimasolev uurimine paljastab: kuidas ligipääsutee detailselt toimis, kui palju inimesi selles osales ja milliseid tehnilisi või protseduurilisi muudatusi hiljem rakendatakse. Olenemata tulemusest on Müütose episood juba saanud tugipunktiks aruteludes ... kuidas hoida täiustatud küberturvalisuse tehisintellekti piiratud rollidega, mille selle loojad selle loojad ette nägidja mis juhtub, kui see piirangud surve alla satuvad.
Kõiki neid niite kokku pannes näitab väidetav volitamata juurdepääs Discordi kaudu Claude Mythosele, kui kiiresti tipptasemel tehisintellekt võib libiseda üle turuletoomiste teadaannetes tõmmatud selgete piiride, paljastades lüngad müüjate turvalisuses, pannes proovile „kutsetega“ lubaduste usaldusväärsuse ning sundides ettevõtteid, regulaatoreid ja kasutajaid ümber mõtlema, kuidas nad haldavad tööriistu, mis saavad nii toetada kui ka potentsiaalselt õõnestada nende digitaalset kaitset.