- Mudeli kokkuvarisemine toimub siis, kui generatiivset tehisintellekti treenitakse korduvalt selle enda sünteetiliste väljundite põhjal, mis vähendab mitmekesisust ja täpsust.
- See isetoitev ahel ohustab disainis, kodeerimises ja konsultatsioonides kasutatavaid õigusteaduse magistere (LLM), võimendades eelarvamusi ning halvendades vähemus- ja ääremaa-asjade tulemuslikkust.
- Leevendamine nõuab inimkeskseid andmestrateegiaid, päritolu jälgimist, vesimärgistamist ja sünteetiliste andmete hoolikat kasutamist koos otsingu ja laiendatud genereerimisega.
- Reguleerimine ja vastutustundlik inimeste poolt kasutamine on üliolulised, et tehisintellekt püsiks kognitiivse võimendajana, selle asemel, et lasta mudelitel ja kasutajatel aja jooksul koos degradeeruda.

Generatiivsest tehisintellektist on saanud kodeerimise, kirjutamise, disaini ja otsuste langetamise peamine abiline, kuid kasvab oht, et peaaegu keegi väljaspool teadusringkondi ei arvesta sellega tegelikult: Mis juhtub, kui neid süsteeme treenitakse üha enam nende endi sünteetilise väljundi, mitte värske inimandmete põhjal? Seda aeglast ennasttoitvat tsüklit on teadlased nimetanud ... mudeli kokkuvarisemineja selle tagajärjed ulatuvad palju kaugemale kui paar halba vastust vestlusrobotis.
Kui mudeli kokkuvarisemine tabab suuri keelemudeleid (LLM-e) ja nende sees kasutatavaid generatiivseid süsteeme kujundamise tööriistad, kodeerimise ja teadmustöö tööriistade puhul ei ole probleem mitte ainult täpsuse kadu, vaid ka nende mudelite reaalsuse esitamise struktuuri halvenemine: Haruldased sündmused kaovad, eelarvamused võimenduvad, loovus kitseneb ja kogu digitaalne ökosüsteem hakkab omaenda moonutusi kordama. Selle toimimise, põhjuste ja selle ärahoidmise mõistmine on muutunud strateegiliseks küsimuseks tehisintellekti pakkujatele, regulaatoritele ja igale ettevõttele, kes panustab oma protsessides tehisintellektil põhinevatele disainivahenditele.
Mida teadlased mõtlevad „mudeli kokkuvarisemise” all
Masinõppes on pikaajaline mantra, et tehisintellekti süsteem on sama hea kui andmed, millest see õpib, ja mudeli kokkuvarisemine toimub siis, kui andmed lakkavad reaalset maailma peegeldamast ja hakkavad domineerima tehisintellekti loodud sisu poolt. Ilja Šumailovi, Zakhar Šumailovi, Yiren Zhao ning Ühendkuningriigi ja Kanada kaastöötajate juhitud hiljutine uuring näitab, et eelmiste põlvkondade väljunditel korduvalt peenhäälestatud generatiivsed mudelid tekitavad pöördumatuid defekte, mis muudavad need praktiliselt kasutuskõlbmatuks.
Mehhanism on petlikult lihtne: iga kord, kui uut mudelit treenitakse reaalsete andmete ja varasemate mudelite sünteetiliste andmete seguga, pärib see lisaks kasulikele mustritele ka nende vead ja eelarvamused.; seejärel lisab see oma vead peale. Iteratsioon iteratsiooni järel need moonutused kuhjuvad ja õpitud jaotus triivib eemale algsest andmejaotusest, mis pärines inimestelt ja reaalsest maailmast.
Oma katsetes täheldasid teadlased kahte erinevat faasi, mida nad nimetasid varajaseks ja hiliseks mudeli kokkuvarisemiseks: Alguses hakkab mudel „unustama“ jaotuse sabasid – ebatavalisi, madala sagedusega juhtumeid –, toimides samal ajal tavaliste mustrite korral siiski rahuldavalt; hiljem, kui sünteetilised andmed domineerivad, variseb jaotus nii järsult kokku, et see ei sarnane enam üldse algandmetega ja mudeli väljundid muutuvad ebajärjekindlaks või mõttetuks sisuks.
See dünaamika on eriti murettekitav avatud veebiandmetel treenitud suurte keelemudelite puhul: Praegu toidavad õigusteaduse magistriõppe programmid (LLM) peamiselt inimeste loodud teksti, mis on kraabitud veebisaitidelt, foorumitest, koodihoidlatest ja väljaannetest. Kuid kuna tehisintellekti kirjutatud ajaveebipostitused, artiklid, dokumentatsioon, koodijupid, pildid ja isegi uurimistööd ujutavad veebi üle, tarbivad tulevased koolitusprogrammid paratamatult üha suuremat osa sünteetilisest, masina loodud sisust.
Kui seda enesele viitavat suundumust hoolikalt ei kontrollita, õpib iga uus disainitööriistades, kodeerimiskoepilootides või sisusüsteemides kasutatavate mudelite põlvkond üha vähem inimestelt ja üha rohkem omaenda varasemate tulemuste ebatäiuslikest koopiatest. Aja jooksul väheneb järk-järgult mudelite võime maailma tõetruult kujutada ja äärmuslike juhtumitega toime tulla.
Miks sünteetilised andmed kahjustavad generatiivseid mudeleid
Generatiivsed mudelid ei reprodutseeri oma treeningandmeid sõna-sõnalt; nad tihendavad mustrid tõenäosusjaotuseks ja see tihendamine rõhutab olemuslikult seda, mis on tavaline, ja silub seda, mis on haruldane. Kui sellised mudelid genereerivad uusi andmeid, kipuvad väljundid koonduma pigem jaotuse keskse massi kui äärmuste ümber, seega on sünteetilised valimid vähem mitmekesised ja vähem rikkad kui algsed andmed, millest mudel õppis.
Šumailovi meeskond vormistas selle intuitsiooni ja näitas, et korduv sünteetiliste andmetega treenimine toob kaasa kolm veakihti, mis üksteist tugevdavad: statistiline lähendusviga, kuna mudelid näevad alati lõplikku reaalsuse valimit; ekspressiivsusviga, kuna arhitektuurid ei suuda keerulisi reaalse maailma jaotusi täiuslikult esitada; ja õppimisviga, kuna optimeerimismeetodid, näiteks gradiendi laskumine, annavad ideaalsele lahendusele ainult ligikaudse tulemuse.
Lihtsate tõenäosusmudelitega kontrollitud katsetes näitasid autorid, kuidas mudel põlvkond põlvkonna järel kaotab teavet väikese tõenäosusega sündmuste kohta ja koondub degenereerunud jaotuste poole: Diskreetsete jaotuste korral variseb mudel kokku ühe üleesindatud väärtuse (omamoodi delta-tippu) suunas, samas kui Gaussi jaotuste korral kahaneb dispersioon nulli suunas, kustutades varieeruvuse.
Seejärel laiendasid nad analüüsi keelemudelitele, treenides korduvalt OPT-125M mudelit Wikitext-2 peal, kus iga uus treeningkomplekt sisaldas eelmiste iteratsioonide abil genereeritud teksti: Jõudlus vähenes järk-järgult, mudel triivis liiga tõenäoliste, geneeriliste järjestuste poole ning hakkas kiirgama veidraid, statistiliselt ebatõenäolisi fragmente – teooria ennustatud akumuleerunud moonutuste sümptomeid.
Praktilisest vaatenurgast tähendab see, et isegi mõõdukas kogus sünteetilist sisu treeningsegus võib mudelit kallutada kallutatud või hapra käitumise poole juba ammu enne selle täielikku kokkuvarisemist. Haruldased keelevormid, vähemusmurded, ebatavalised teemad või nišitehnilised mustrid on esimesed, mis kaovad, asendudes sünteetilise andmevoo kõige levinumate nähtuste üleesindatusega.
Mõju disainitööriistadele, kodeerimisassistentidele ja professionaalsele tööle
Mudeli kokkuvarisemisega seotud mured ei piirdu abstraktsete võrdlusalustega; need mõjutavad otseselt disainitööriistu, programmeerimisabilisi ja professionaalseid teenuseid. Paljud organisatsioonid nõuavad juba tehisintellekti kasutamist vähemalt mõne kasutajaloo puhul sprindi kohta, tuginedes sellistele süsteemidele nagu GitHub Copilot või Databricksil põhinevad assistendid koodi mustandite loomiseks, moodulite ümberkujundamiseks või arhitektuuride visandamiseks.
Kohene tootlikkuse tõus on reaalne – arendajad säästavad tunde tänu mustritele, mis on õpitud miljonite inimeste loodud koodiridade abil –, aga küsimus on selles, mis juhtub siis, kui viie või kümne aasta pärast on tehisintellekt ise olulise osa sellest koodibaasist välja pakkunud. Kui tulevased mudelid treenivad suuresti tehisintellekti loodud koodijuppide, kommentaaride ja mallidega üha enam täidetud andmehoidlate peal, hakkab õppetsükkel planeedi tasandil meenutama põhimõtet „prügi sisse, prügi välja“.
Sarnane muster on tekkimas ka sisu ja disaini töövoogudes: Ettevõtete blogid, „ekspert“artiklid, tootekirjeldused, turundusvisuaalid ja isegi taskuhäälingusaadete skriptid luuakse nüüd sageli või neid toetavad tugevalt sellised tööriistad nagu ChatGPT, Kaksikute mudelid või spetsiaalse disaini tehisintellektid. Kuna need sünteetilised ressursid avaldatakse veebis ja hiljem lisatakse treeningkomplektidesse, õpivad mudelid juba silutud, keskmistatud ja kohati valedest artefaktidest.
Teadlased ja praktikud kirjeldavad seda sageli kui tehisintellekti kajakambrit või, nagu üks ekspert ütles, madu, mis sööb oma saba: Kui mudelid tarbivad enamasti tehisintellekti loodud sisu, võimendab iga uus põlvkond eelmise põlvkonna poolt sisse toodud eelarvamusi ja lihtsustusi ning süsteem kaotab jälje reaalse inimväljenduse segasest, kuid hindamatust mitmekesisusest.
Professionaalsetes teenustes on see tagasisideahel vastastikmõjus teise struktuurilise nihkega: klassikalise finantsvõimenduse püramiidi kokkuvarisemisega, millele konsultatsiooni-, õigus- ja audiitorfirmad on aastakümneid toetunud. Suure osa 20. sajandist kasutasid suured strateegia- ja professionaalsete teenuste ettevõtted ärimudelit, kus nooremate analüütikute armeed analüüsisid andmeid, ehitasid mudeleid ja koostasid aruandeid, samal ajal kui väike partnerite kiht haaras suurema osa väärtusest.
Kuidas genereeriv tehisintellekt lamendab konsultatsiooni „võimenduspüramiidi“
Konsultatsioonipüramiidi majanduslik alus oli lihtne: palju töömahukat analüütilist tööd õigustas suuri nooremate spetsialistide meeskondi ja tunnipõhist arveldamist, kusjuures kasumlikkust tingis klientide makstud summa ja nooremate spetsialistide kulude vahe. Sellised ülesanded nagu finantsmudelite loomine, turuülevaadete koostamine, SWOT-analüüside tegemine või kliendipakkumiste koostamine olid kõik aeganõudvad, korduvad ja skaleeritavad.
Generatiivne tehisintellekt ja täiustatud automatiseerimine purustavad selle loogika, neelates enda alla tohutu hulga kognitiivset tööd murdosa aja ja kuludega. MIT Sloani ja Harvardi Ärikooli analüütikud on näidanud, et generatiivsed tööriistad võivad struktureeritud analüütiliste ülesannete täitmiseks kuluvat aega lühendada kuni 80 protsenti, mis vähendab oluliselt vajadust suurte, püramiidi põhjas tegutsevate meeskondade järele.
Kommentaatorid nagu Joe Nocera on märkinud, et ülesanded, mis kunagi võtsid tervetelt meeskondadelt nädalaid või kuid aega, saab nüüd tugeva tehisintellekti assistendiga vanemkonsultant minutitega visandada, mis ajendas paljusid suurfirmasid vaikselt vähendama nooremate spetsialistide palkamist või algatama koondamisi analüütikute poolt domineeritud ametikohtadel. Kuigi kõik algtaseme ametikohad ei kao ära, nõrgeneb selgelt majanduslik põhjendus nooremate töötajate paksu kihi säilitamiseks.
Samal ajal pingutavad kliendid ja isegi valitsused, et loobuda aja- ja materjalipõhisest arveldusest ja minna üle väärtuspõhistele lepingutele, mis keskenduvad mõõdetavatele tulemustele. Kuna tehisintellekt suurendab tootlikkust, muutub tuhandete inimtundide eest tasu võtmise õigustamine palju raskemaks olukorras, kus suurt osa eeltööst saab automatiseerida, seega hakkab vana võimendusvalem pragunema.
Lõpptulemuseks on traditsioonilise püramiidstruktuuri järkjärguline kokkuvarisemine lihtsamate konfiguratsioonide kasuks: väikesed ekspertide butiigid, mikromeeskonnad, mis ühendavad kõrgema astme otsustusvõime tugeva tehisintellekti tööriistadega ja tehisintellekti agentide meeskonnadja sõltumatud vanemspetsialistid, kes suudavad pakkuda kvaliteetseid tulemusi ilma suure toetajaskonnata. Selles maastikus ei seisne ainulaadne väärtus enam võimes mobiliseerida nooremate analüütikute horde, vaid suutlikkuses esitada õigeid küsimusi, kavandada sekkumisi ja navigeerida keerukates, piirangutega keskkondades.
Eelarvamused, vähemuste andmed ja kokkuvarisemise eetika
Üks mudeli kokkuvarisemise kõige murettekitavamaid aspekte on selle ebaühtlane mõju: see kipub esmalt kustutama madalsageduslikke signaale, mis praktikas tähendab sageli vähemusi, äärejuhtumeid ja haruldasi stsenaariume. Kuna generatiivsed mudelid on tõenäosuslikud masinad, mis on kallutatud „ohutute” keskmiste poole, siis nende sünteetilised väljundid üleesindavad seda, mis on treeningandmetes tavaline, ja alaesindavad seda, mis on haruldane, kuid siiski oluline.
Nagu teadlane Emily Wenger on välja toonud, kaldub isegi lihtne piltide genereerimise ülesanne, näiteks „koerte joonistamine“, järk-järgult treeningkomplekti kõige levinumate tõugude, näiteks kuldsete retriiverite poole, samas kui haruldased tõud kaovad põlvkondade jooksul praktiliselt ära. Keele ja ühiskondlike andmete põhjal võib see dünaamika veelgi marginaliseerida juba niigi alaesindatud gruppe.
LLM-idega tehtud katsed näitavad, et varajastes kokkuvarisemise etappides halveneb jõudlus esmalt vähemus- või madala sagedusega andmete puhul, enne kui mudel täielikult kokku kukub. See tähendab, et õiglus ja kaasatus on ohus juba ammu enne, kui kokkuvarisemine lõppkasutajatele ilmseks muutub, ning disaini- või otsustusprotsessidesse sisseehitatud tööriistad võivad teatud populatsioonide puhul märkamatult läbi kukkuda.
Poliitika tasandil toob Euroopa Liidu tehisintellekti seadus need mured otse regulatiivsesse raamistikku, rõhutades andmete kvaliteeti, intellektuaalomandit, privaatsust, isikuandmete kaitset ja eelarvamuste leevendamist. Õigusakt tunnistab kaudselt, et ainuüksi sünteetilised andmed ei saa garanteerida kvaliteetseid mudeleid ning et tehisintellekti loodud sisu hooletu segamine koolituskorpustesse võib olla vastuolus nii eetiliste põhimõtete kui ka juriidiliste kohustustega.
Samuti on olemas kultuuriline ja kognitiivne mõõde: kui inimesed loodavad tehisintellektile, et see asendaks täielikult nende endi kirjutamise, analüüsi või loomingulise mõtlemise, siis mõlemad pooled lagunevad. Mudelid muutuvad inimlike nüansside suhtes vähem põhiseks ja inimesed riskivad kaotada just need oskused, mida nad vajavad nende süsteemide kriitiliseks kasutamiseks ja järelevalveks. Targalt kasutades saab tehisintellekt võimendada arutlusvõimet, loovust ja probleemide lahendamise oskust; karkuna kasutades võib see kiirendada vastastikust allakäiku.
Andmete nappus, Habsburgide tehisintellekt ja ennast sööv veeb
Hiljutises töös on korduvalt täheldatud, et kvaliteetne inimtekst, pildid ja kood ei ole lõputud ressursid. Mõned prognoosid viitavad sellele, et suurte mudelite treenimiseks sobiva puhta, mitmekesise ja seaduslikult kasutatava inimloodud teksti varud võivad mõne aasta jooksul ammenduda, mis sunnib teenusepakkujaid rohkem sünteetilistele andmetele toetuma, kui nad ei taga eksklusiivset juurdepääsu esmaklassilistele allikatele.
See on üks põhjus, miks tehisintellekti ettevõtete ja suurte kirjastajate, uudisteorganisatsioonide ning teiste õiguste valdajate vahel on tekkinud sisulitsentsilepingute laine. Sellised algatused nagu Hispaania avalikult rahastatav ALIA sihtasutuse mudeliperekond tunnistavad selgesõnaliselt, et esmaklassiliste ja hästi kureeritud inimandmestike hankimine on strateegiline prioriteet, kui nad soovivad vältida saastunud või madala kvaliteediga materjalile tuginemist.
Samal ajal küllastub internet kiiresti tehisintellekti loodud sisuga: ettevõtete blogid, sotsiaalmeedia postitused, SEO artiklid, pildipangad ja isegi akadeemilise ilmega tööd, mis on loodud või kirjutatud generatiivsete süsteemide abil. Kuna tulevased õigusteaduse magistriõppe programmid ja generatiivsed tööriistad kasutavad paratamatult sama võrgustikku, muutub inim- ja sünteetiliste allikate vaheline piir üha hägusemaks.
Teadlane Jathan Sadowski lõi termini „Habsburgide tehisintellekt”, et kirjeldada korduva enesesiirdamise tagajärjel deformeerunud süsteeme – nagu genealoogiline liin, mis kannatab liigse sugulusaretuse all – ning ekspertide ringkondades on see kontseptsioon muutunud mudeli kokkuvarisemise lühendiks. Lahtine küsimus on, kui palju sünteetilisi andmeid on liiga palju ja kus asub murdepunkt; praegused tõendid näitavad, et see sõltub suuresti mudeli suurusest, arhitektuurist, treeningretseptist ja nii reaalsete kui ka sünteetiliste valimite kvaliteedist.
Praegu ei ole üksmeel selles, et sünteetilised andmed on oma olemuselt halvad, vaid selles, et tehisintellekti väljundite filtreerimata ja ulatuslik ringlussevõtt treeningprotsessides ilma päritolu jälgimise, tasakaalustamise ja kvaliteedikontrollita on pikaajalise lagunemise retsept. Ettevaatlikult kasutatud ja tugevate inimandmetega segatud sünteetilised proovid võivad mõnikord aidata; reaalsuse odava asendajana kasutatud need aga põhjustavad kokkuvarisemist.
Tehnilised ja juhtimisstrateegiad kokkuvarisemise vältimiseks
Teadlased ja valdkonna praktikud uurivad aktiivselt võimalusi mudeli kokkuvarisemise leevendamiseks või edasilükkamiseks, eriti süsteemide puhul, mis on sügavalt integreeritud disainitööriistadesse ja ettevõtte töövoogudesse. Nii akadeemilistest töödest kui ka tööstuspraktikast on ilmnemas mitu üksteist täiendavat strateegiat.
Esimene sammas on range andmete päritolu ja sisu vesimärgistamine: Suured teenusepakkujad, nagu Google, OpenAI ja Meta, juba märgistavad või katsetavad oma genereeritud väljundite vesimärgistamist, et tulevased treeningkanalid saaksid sünteetilist sisu tuvastada ja filtreerida. Selleks, et see ökosüsteemi tasandil toimiks, tuleb neid vesimärke (või vähemalt nende tuvastusmeetodeid) jagada või standardiseerida, et teised mudelikoolitajad saaksid sünteetilist materjali usaldusväärselt välistada või selle kaalu vähendada.
Teine sammas on algupäraste inimandmete allikate säilitamine ja neile juurdepääsu laiendamine: Arhiive, uudistetoimetusi, kureeritud korpusi, valdkonnapõhiseid andmebaase ja kvaliteetseid koodihoidlaid tuleb hooldada, litsentseerida ja perioodiliselt värskendada. Ilma mitmekesiste inimandmete pideva sissevooluta ei suuda isegi heade kavatsustega leevendusmeetmed peatada nihkumist sünteetilise domineerimise poole.
Kolmandaks näitavad mitmed uuringud, et sünteetiliste ja originaalandmete hoolikas segamine võib kokkuvarisemise destruktiivset faasi nõrgestada või edasi lükata, kuigi see ei välista riski täielikult. Idee seisneb sünteetiliste andmete valikulises kasutamises – näiteks klasside tasakaalustamiseks, haruldaste stsenaariumide uurimiseks või alaesindatud struktuuride täiendamiseks –, hoides samal ajal inimandmeid jaotuse ankruna.
Otsingu-laiendatud genereerimine (RAG) lisab veel ühe võimsa kaitsekihi, lahutades mudeli parameetrid faktiteadmistest nii palju kui võimalik. RAG-seadistuses konsulteerib generatiivne mudel järelduse tegemise ajal välise, kontrollitud teadmusbaasi (dokumendid, andmebaasid, disainiteegid, koodibaasid) ja põhjendab oma vastuseid hangitud tõenditega, selle asemel et tugineda ainult treeningu käigus meelde jäetule.
Pilveteenuse pakkujad, näiteks Amazon, kirjeldavad RAG-i kui viisi LLM-i väljundite optimeerimiseks, sundides neid enne vastuse genereerimist viitama autoriteetsetele allikatele väljaspool oma treeningkorpust. Kuigi RAG ei kõrvalda generatiivsete mudelite ettearvamatust, saab see märkimisväärselt vähendada hallutsinatsioone ja leevendada kokkuvarisenud esituste mõju, ankurdades väljundid ajakohastesse inimteadmistesse.
Lõpuks pooldavad mõned eksperdid koolitusprotsesside perioodilisi „lähtestamisi“: uute sünteetiliselt saastunud segude lõputu peenhäälestamise asemel saavad organisatsioonid põhimudeleid perioodiliselt ümber õpetada või värskendada äsja kogutud, enamasti inimestest koosnevate andmekogumite põhjal. See lähenemisviis on kallim ja tehniliselt nõudlikum, kuid see aitab neutraliseerida kokkuvarisemist põhjustavaid kumulatiivseid moonutusi.
Regulatsioon, vastutus ja inimese ja tehisintellekti koostöö tulevik
ELi tehisintellekti seaduse avaldamine ja sarnased regulatiivsed jõupingutused rõhutavad, et mudeli kokkuvarisemine ei ole ainult tehniline, vaid ka juhtimisalane ja ühiskondlik väljakutse. Seadusandjad ootavad nüüd mudelipakkujatelt andmeallikate dokumenteerimist, intellektuaalomandi austamist, isikuandmete kaitsmist ning aktiivset eelarvamuste ja õigluse käsitlemist – nõudeid, mida on raskem täita, kui treeningkomplektid on täis jälgimatut sünteetilist sisu.
Ettevõtete jaoks, kes võtavad tehisintellekti kasutusele disainis, tarkvaraarenduses ja professionaalsetes teenustes, tähendab see, et tarnija hoolsuskohustus peab ulatuma mudeli kvaliteedinäitajatest kaugemale ning hõlmama küsimusi andmete haldamise, päritolu jälgimise ja sünteetiliste andmete poliitika kohta. Pimesi eeldamine, et „rohkem andmeid on alati parem“, võib tagasilöögi anda, kui need lisaterabaidid on suures osas ise tekitatud müra.
Individuaalsel tasandil kujundab see, kuidas professionaalid generatiivset tehisintellekti kasutavad, nii mudelite arengut kui ka nende endi oskusi. On oluline erinevus tehisintellekti kasutamise vahel kirjutamis-, analüüsi- või disainitöö täielikuks tellimiseks või selle kasutamise vahel mõtlemispartnerina loovuse arendamiseks, ideede testimiseks ja uurimise kiirendamiseks, säilitades samal ajal inimliku otsustusvõime lõpptulemuse üle.
Tehisintellekti kirjaoskuse eksperdid rõhutavad, et kui laseme mudelitel end järjekindlalt asendada, selle asemel et meid täiendada, riskime kahekordse allakäiguga: süsteemid, mis on treenitud üha sünteetilisema ja vähese pingutusega sisuga, ning inimesed, kes kaotavad harjumuse sügavalt arutleda, hoolikalt lugeda ja teadlikku loomingut luua. Inimeste kriitilise mõtlemise osas tööriistadest kindlalt „kõrval” hoidmine on oluline, kui tahame, et tehisintellekt jääks kasulikuks, selle asemel et meid allakäiguspiraali lohistada.
Lõppkokkuvõttes nõuab mudeli kokkuvarisemise vältimine – eriti disainitööriistadesse ja teadmustöö platvormidesse integreeritud tehisintellekti mootorites – tehniliste lahenduste, regulatiivse surve ja kultuuriliste muutuste kombinatsiooni digitaalse sisu loomisel ja tarbimisel. Kui andmete päritolu jälgitakse, inimeste loodud allikaid väärtustatakse ja kaitstakse, sünteetilisi andmeid kasutatakse vaoshoitult ning tehisintellekt jääb inimkognitiivsete võimete jaoks pigem jõukordajaks kui asendajaks, on siiski olemas selge tee mudeliteni, mis jäävad asjakohasteks, õiglasteks ja täpseteks, selle asemel et variseda enesele viitavaks ebaoluliseks.