Izveštaj o "Izvršavanju koda sa MCP" kompanije Anthropic
Kompanija Anthropic je predstavila novi obrazac pod nazivom "izvršavanje koda sa MCP" (Code Execution with MCP) kako bi rešila fundamentalni problem skaliranja sa kojim se suočavaju AI agenti koji koriste Model Context Protocol (MCP). Standardni pristup, gde se definicije alata i svi međurezultati prosleđuju kroz kontekstni prozor modela, dovodi do prekomerne potrošnje tokena, povećane latencije i visokih troškova, posebno u složenim radnim tokovima.
Rešenje kompanije Anthropic restrukturira ovaj proces transformišući MCP alate u API-je na nivou koda. Umesto direktnog pozivanja alata, modelu se nalaže da piše i izvršava TypeScript kod u izolovanom okruženju (sandboxed environment). Ovaj kod uvozi module koji predstavljaju MCP alate, omogućavajući obradu velikih količina podataka i složenu logiku van kontekstnog prozora modela.
Ključni rezultat ove promene je drastično smanjenje potrošnje tokena, demonstrirano na primeru gde je potrošnja smanjena za 98,7% (sa 150.000 na 2.000 tokena). Pored efikasnosti, ovaj pristup nudi značajne prednosti za programere, uključujući progresivno otkrivanje alata, efikasno rukovanje podacima, operacije koje čuvaju privatnost i mogućnost čuvanja stanja i veština za višekratnu upotrebu. Ovaj pomak efektivno transformiše MCP iz statične liste alata u dinamičnu, izvršnu API površinu, otvarajući nove mogućnosti za izgradnju sofisticiranijih i efikasnijih AI agenata.
Problem: Neefikasnost i ograničenja skaliranja kod standardnog MCP-a
Model Context Protocol (MCP) je otvoreni standard koji omogućava AI aplikacijama povezivanje sa spoljnim sistemima, kao što su baze podataka, API-ji ili fajlovi, putem jedinstvenog interfejsa. Međutim, podrazumevani obrazac korišćenja MCP-a suočava se sa ozbiljnim problemima skaliranja.
- Preopterećenje kontekstnog prozora: U standardnom modelu, agent učitava definicije svih dostupnih alata (uključujući njihove šeme i metapodatke) direktno u kontekstni prozor modela. Pored toga, rezultati svakog poziva alata se takođe vraćaju u kontekst kako bi model mogao da odluči o sledećem koraku.
- Visoka potrošnja tokena: Ovaj proces postaje izuzetno neefikasan kada se radi sa velikim radnim tokovima ili velikim količinama podataka. Model plaća cenu u tokenima za čitanje obimnih kataloga alata i za prenos velikih podataka između alata.
- Primer iz prakse: Anthropic navodi tipičan slučaj gde agent koristi MCP server za Google Drive da preuzme dugačak transkript sastanka, a zatim koristi drugi MCP server za Salesforce kako bi ažurirao zapis tim transkriptom. U ovom scenariju, kompletan transkript se prvo vraća kroz model, a zatim se ponovo šalje modelu prilikom poziva Salesforce alata. Za duži sastanak, ovo može dodati desetine hiljada dodatnih tokena koji ne menjaju logiku zadatka.
- Posledice: Kako se broj MCP servera i alata povećava, ovaj obrazac postaje neodrživ. Latencija raste, troškovi se uvećavaju, a ograničenja kontekstnog prozora postaju čvrsta prepreka za funkcionalnost sistema.
Rešenje: "Izvršavanje koda sa MCP" kao nova paradigma
Kao odgovor na identifikovane probleme, Anthropic predlaže promenu paradigme postavljanjem MCP-a unutar petlje za izvršavanje koda. Umesto da model direktno poziva alate, on generiše kod koji orkestrira te alate, čime se teški zadaci premeštaju iz kontekstnog prozora u namensko okruženje za izvršavanje.
Ovaj obrazac se sastoji od tri glavna koraka:
- Generisanje API-ja na osnovu fajl sistema: MCP klijent dinamički kreira strukturu direktorijuma (npr. servers/) koja preslikava dostupne MCP servere i alate.
- Kreiranje omotačkih funkcija: Za svaki MCP alat, klijent generiše tanku omotačku funkciju (wrapper function) implementiranu u izvornom fajlu (npr. servers/google-drive/getDocument.ts). Ove funkcije interno pozivaju odgovarajući MCP alat sa tipiziranim parametrima.
- Generisanje i izvršavanje koda od strane modela: Model dobija instrukciju da piše TypeScript kod koji uvozi i komponuje ove funkcije. Kod se izvršava u izolovanom okruženju, gde se upravlja tokom kontrole i prenosom podataka.
U ranije pomenutom primeru sa Google Drive-om i Salesforce-om, radni tok se transformiše u kratku skriptu. Skripta poziva omotačku funkciju za Google Drive, lokalno manipuliše podacima, a zatim poziva omotačku funkciju za Salesforce. Obiman transkript nikada ne prolazi kroz model; u kontekst se vraćaju samo konačni status i, po potrebi, mali uzorci ili sažeci.
Ovaj pristup je sličan ideji koju koristi Cloudflare u svojoj "Code Mode" funkcionalnosti na Workers platformi, gde se MCP alati takođe konvertuju u TypeScript API-je, a kod generisan od strane modela se izvršava u izolovanom okruženju.
Kvantitativni uticaj i merljivi rezultati
Promena ka izvršavanju koda donosi dramatična i merljiva poboljšanja u efikasnosti. Anthropic je pružio konkretan primer kako bi ilustrovao uticaj ovog pristupa:
| Metrika | Standardni MCP pristup | Pristup sa izvršavanjem koda | Smanjenje |
| Potrošnja tokena | ~150.000 tokena | ~2.000 tokena | 98,7% |
Ovo smanjenje potrošnje tokena za 98,7% u navedenom scenariju direktno dovodi do značajnog smanjenja troškova i latencije, čineći agente sposobnim za obavljanje složenijih zadataka koji su ranije bili neizvodljivi zbog ograničenja konteksta.
Dizajnerske prednosti za programere agenata
Pored kvantitativnih poboljšanja, pristup "izvršavanje koda sa MCP" uvodi nekoliko praktičnih prednosti za inženjere koji dizajniraju AI agente:
- Progresivno otkrivanje alata: Agent ne mora da ima definicije svih alata unapred učitane u kontekst. Umesto toga, može da istražuje generisani fajl sistem, izlista dostupne servere i čita module specifičnih alata samo kada su mu potrebni. Ovo premešta kataloge alata iz konteksta modela u kod, pa se tokeni troše samo na relevantne interfejse.
- Efikasno rukovanje podacima u kontekstu: Veliki skupovi podataka, kao što su obimne tabele, ostaju unutar okruženja za izvršavanje. TypeScript kod može pročitati podatke putem MCP alata, filtrirati redove, izračunati agregate i vratiti modelu samo male uzorke i statističke sažetke. Model dobija kompaktan pregled podataka dok se obrada velikih podataka dešava u kodu.
- Operacije koje čuvaju privatnost: Anthropic opisuje obrazac gde se osetljiva polja (npr. imejl, broj telefona) mogu tokenizovati unutar okruženja za izvršavanje. Model vidi samo zamenske oznake (placeholders), dok MCP klijent održava sigurno mapiranje i vraća stvarne vrednosti prilikom pozivanja drugih alata. Ovo omogućava prenos podataka između MCP servera bez izlaganja sirovih identifikatora modelu.
- Stanje i veštine za višekratnu upotrebu: Fajl sistem omogućava agentima da čuvaju međurezultate i skripte za višekratnu upotrebu. Pomoćna skripta koja transformiše tabelu u izveštaj može biti sačuvana u direktorijumu skills/ i uvezena u kasnijim sesijama. Anthropic povezuje ovu ideju sa konceptom "Claude Skills", gde kolekcije skripti i metapodataka definišu sposobnosti višeg nivoa.
Zaključak i strateške implikacije
Pristup "izvršavanje koda sa MCP" kompanije Anthropic predstavlja logičan i značajan korak napred u evoluciji agenata zasnovanih na MCP-u. Direktnim rešavanjem problema troškova tokena povezanih sa učitavanjem definicija alata i prenosom velikih međurezultata, ovaj obrazac čini agente znatno efikasnijim i skalabilnijim.
Ova inovacija suštinski menja prirodu MCP-a, transformišući ga iz pasivne liste alata u aktivnu, izvršnu API površinu. Iako ovo donosi ogromne prednosti u pogledu performansi i fleksibilnosti, takođe nameće timovima obavezu da ozbiljno shvate bezbednost izvršavanja koda, jer se modelu sada poverava generisanje koda koji se izvršava u produkcionom okruženju.
#AI #MCP #Claude #agenti
Komentari
Nema komentara. Šta vi mislite o ovome?