Agentni AI je problem sistemskega načrtovanja, ne trik skaliranja

Te modne besede so zdaj vsepovsod. Natrpane so na vsako prodajno prezentacijo in poročilo o novostih, na vsak oglas za delovno mesto. Uporablja se jih na toliko načinov in v toliko kontekstih, da počasi izgubljajo ves smisel.

Navdih: ta članek. Spodnja perspektiva in analiza sta izvirni.

Za vodje tehnologije in inženiringe, ki vrednotijo podjetniške AI sisteme, je praktično sporočilo preprosto: agentni AI ni le večji model, temveč problem sistemskega načrtovanja, ki zajema avtonomijo, prilagodljivost, nadzor in upravljanje.

Začnite z definicijo, nato se premaknite onkraj hype-a

»Agent je vse, kar lahko razumemo kot zaznavanje svojega okolja prek senzorjev in delovanje na to okolje prek aktuatorjev.«

Poglobimo se v razširjeno definicijo, ki jo avtorji predlagajo za ločitev klasičnega AI od agentnega AI: Za razliko od klasičnega AI, ki navadno deluje znotraj tesno omejenih definicij nalog, se od agentnih AI sistemov pričakuje, da upravljajo cilje, ki so bodisi ohlapno opredeljeni bodisi zahtevajo dinamično reinterpretacijo glede na nove informacije. Za razliko od generativnega AI, ki zmore sintetizirati novo vsebino, a ostaja v veliki meri pasiven pri ustvarjanju izhodnih podatkov (odgovarja, ne sproži), so modeli agentnega AI usmerjeni k cilju. Začenjajo načrte, prerazporejajo vire in spreminjajo strategije, ne da bi na vsaki odločitveni točki potrebovali zunanje pozive.

Po čem se agentni AI razlikuje

Prispevek agentni AI loči od starejših paradigem s poudarkom na avtonomiji, prilagodljivosti in vedenju, usmerjenem k cilju. To je pomembno, ker se od sistemov ne pričakuje le odzivanje. Pričakuje se, da razlagajo cilje, načrtujejo ob omejitvah in se prilagajajo, ko se realnost spremeni.

Zato razprava odide stran od same velikosti modela in se premakne k sistemskemu načrtovanju. Osrednje inženirsko vprašanje postane, kako združiti načrtovanje, nadzor, pomnilnik, orodja in nadzor v nekaj dovolj trdnega za resnična okolja.

Trije tehnični stebri

  • Okrepljeno učenje: Prvi steber je okrepljeno učenje. Avtorji RL postavljajo kot temeljni substrat, ki agentnim sistemom omogoča dinamično udejstvovanje z okolji, sledenje kompleksnim strukturam nagrad in spreminjanje svojih politik skozi čas brez eksplicitnega reprogramiranja. Za razliko od nadzorovanega učenja, ki preslikava statične vhode na izhode, okrepljeno učenje podpira zanke s kontinuiranimi povratnimi informacijami, ki so bistvene za prilagajanje na spreminjajoče se cilje in operativne kontekste. V tem okviru RL ni zaželen optimizacijski pripomoček. Je predpogoj za vsak sistem, od katerega se pričakuje delovanje brez stalnega človeškega nadzora v okoljih, ki ne ostajajo mirna.
  • Arhitektura, usmerjena k cilju: Drugi steber je arhitekturno načrtovanje, usmerjeno k cilju. Agentni sistemi morajo delovati na strukturiranih hierarhijah ciljev, ne na ravnih, enofaznih nalogah. Ta arhitekturna zahteva pomeni, da morajo sistemi ne le slediti cilju, temveč znati razgraditi kompleksne cilje na podnaloge, določiti prioritete med njimi in dinamično sestaviti nove načrte, ko se konteksti razvijajo. Brez modularnega upravljanja ciljev AI zmore lokalno optimizacijo brez kakršnega koli koherentnega dolgoročnega vedenja. Ta zmogljivost dekompozicije in restrukturiranja ciljev je tisto, kar agentnemu AI omogoča preživetje v domenah, kjer okolje ni le dinamično, temveč pogosto nasprotniško ali nepopolno.
  • Prilagodljivi nadzor: Tretji steber so mehanizmi prilagodljivega nadzora. Agentni sistemi se ne morejo zanašati na statične modele sveta. Namesto tega morajo znati zaznati spremembe v okolju, oceniti, ali te spremembe vplivajo na njihove trenutne strategije, in se ustrezno rekalibrirati. Prilagodljivi nadzor tu ne zajema le nastavljanja parametrov znotraj nevronske mreže. Vključuje mehanizme za širšo vedenjsko prilagoditev, kot so spreminjanje razmerij med eksploracijo in izkoriščanjem, rekonfiguracija razporeditev virov in spreminjanje politik izbire dejanj na podlagi povratnih informacij konteksta v realnem času.

Arhitekture, ki v praksi dejansko štejejo

Prispevek podrobno analizira številne domene, kjer je agentni AI že v uporabi. Skupna nit v teh domenah je neprimernost statičnih ali ozko reaktivnih AI sistemov. Kjer se cilji razvijajo, konteksti hitro spreminjajo in je treba ukrepati v razmerah negotovosti, agentne arhitekture zagotavljajo operativni okvir, ki je bistveno bolje usklajen s kompleksnostjo resničnega sveta. V kompleksnih sistemih obstaja nekaj arhitekturnih vzorcev in oblik: sistemi z več agenti, hierarhično okrepljeno učenje in modularne arhitekture, usmerjene k cilju. Vsak pristop odraža drugačno strategijo za upravljanje kompleksnosti, avtonomije in prilagodljivosti v dinamičnih okoljih.

Mehanizmi pomnilnika predstavljajo drugo področje razvoja. Sistemi vključujejo tako epizodični pomnilnik za priklic preteklih specifičnih izkušenj kot semantični pomnilnik za vzdrževanje strukturiranega znanja o okolju. Te zmogljivosti podpirajo kontekstno zavedanje pri odločanju in agentom omogočajo izboljšanje dolgoročne zmogljivosti z akumuliranjem operativne zgodovine.

Z drugimi besedami, agentni AI najlaže razumemo kot plastoviti operativni model. Odvisno je od tega, kako so cilji reprezentirani, kako se odločitve revidirajo, kako se uporablja zunanja orodja in kako se kontekst ohranja skozi čas. To so arhitekturne odločitve, ne marketinške.

Kje morajo biti podjetniške ekipe previdne

Prva večja težava je usklajenost ciljev. V tradicionalnih AI sistemih so cilji zunanje opredeljeni in statični. Agentni sistemi morajo cilje sami oblikovati in revidirati skozi čas. Brez eksplicitnega poseganja se lahko pojavijo neusklajene ali nastajajoče strukture ciljev. Te neusklajenosti niso omejene na ekstremne primere, kot je vdiranje v nagrade. Pogosteje se kažejo kot subtilna odstopanja, kjer sistem optimizira posrednike, ki se odmikajo od pravega namena. Obstoječe tehnike, kot sta inverzno okrepljeno učenje in kooperativno inverzno okrepljeno učenje, zagotavljajo delno ublažitev, a se spopadajo s težavami, ko so strukture ciljev večdimenzionalne, kontekstualno občutljive ali podvržene kulturni in etični variabilnosti.

  1. Ne zamenjujte avtonomije z zanesljivostjo. Sistem, ki zmore delovati sam, se lahko tudi sam oddaljuje, če so cilji in nadzori šibki.
  2. Načrtujte za spreminjajoče se pogoje. Če se okolje, struktura nagrad ali omejitve premaknejo, sistem potrebuje mehanizme za rekalibriranje.
  3. Upravljanje obravnavajte kot del arhitekture. Nadzor, odgovornost, varnost in nadzor virov morajo biti zasnovani od samega začetka.

Zaključek

Najpomembnejši zaključek tega prispevka je, da je agentni AI treba obravnavati kot inženirsko disciplino. Zmagovalci ne bodo ekipe, ki to besedo najpogosteje uporabljajo. Biti bodo ekipe, ki znajo zgraditi sisteme, ki združujejo agentni AI, arhitekturo AI, avtonomne sisteme in upravljanje AI na nadzorovani način.

Prejšnja objava Naslednja objava

Sorodne objave

Article

Drift AI: Tacitni rizik v kritičnih sistemih

Read →

Article

Štirje načini, kako AI agenti odpovedo pri visokih tveganjih

Read →

Article

Vaš AI agent deluje v razvoju. V produkciji postane drag.

Read →

Sorodne storitve

Service

EU AI Akt – Pripravljenost in implementacija

Izvedi več →

Service

Razvoj modelov AI po meri

Izvedi več →
Miloš Cigoj
Miloš Cigoj Ustanovitelj, Excellence Consulting  ·  Operativna odličnost in strategija AI

Vas zanima ta tema?

Pomagamo organizacijam pri krmarjenju skozi zahtevne regulatorne in tehnološke izzive. Pogovorimo se.

Stopite v stik