Vodič za razvoj i validaciju veština za AI agente
Ovo je tehnički vodič za razvoj visokokvalitetnih veština za AI agente uz optimizaciju korišćenja tokena. Autor naglašava važnost jasne strukture direktorijuma i preciznog imenovanja fajlova kako bi agenti lakše pronalazili i koristili alate. Ključni fokus je na progresivnom otkrivanju informacija, gde se opširni podaci izmeštaju u zasebne reference kako bi radni okvir ostao sažet. Dokument takođe nudi konkretne strategije za validaciju logike pomoću jezičkih modela, uključujući testiranje rubnih slučajeva i simulaciju izvršavanja zadataka. Primenom ovih uputstava, programeri mogu kreirati determinističke i pouzdane sisteme koji minimiziraju greške u radu veštačke inteligencije. Vodič insistira na korišćenju imperativnih komandi i standardizovane terminologije kako bi se osigurala maksimalna efikasnost AI asistenata.
Većina developera i dalje tretira LLM agente kao magične kutije, a ne kao precizne inženjerske sisteme. Rezultat? Skup "token debt", halucinacije i agenti koji su više trošak nego ušteda. Ako vaš agent ne uspeva da izvrši zadatak uprkos "detaljnim" instrukcijama, problem nije u modelu – problem je u arhitekturi vaših veština.
U profesionalnom ekosistemu, veština (skill) je most između namere i determinističke akcije. Da biste prešli sa amaterskog promptovanja na pro-grade inženjerstvo, morate prestati da pišete "uputstva" i početi da projektujete sisteme.
Pravilo br. 1: Prestanite da pišete za ljude (Agenti nisu vaša publika)
Najbrži put do trovanja konteksta (context poisoning) je tretiranje agenta kao kolege programera. Veštine su isključivo alat za AI modele. Svaki suvišni karakter direktno troši dragoceni kontekstualni prozor i povećava entropiju sistema.
Prvi korak u optimizaciji je nemilosrdno čišćenje. Izbrišite fajlove poput README.md, CHANGELOG.md ili uputstva za instalaciju unutar direktorijuma veštine. Oni su namenjeni ljudima, a agentu su samo šum. Takođe, veštine nisu mesto za bibliotečki kod. Dugačke, kompleksne skripte ne smeju biti "hardkodovane" unutar SKILL.md fajla; one pripadaju scripts/ folderu ili standardnim CLI direktorijumima repozitorijuma.
"Ako agent već pouzdano obavlja zadatak bez određene instrukcije, obrišite je."
Cilj je svesti veštinu na esenciju. Ako informacija ne doprinosi direktno izvršenju zadatka, ona je toksična za preciznost modela.
Pravilo br. 2: Frontmatter je vaš jedini marketing
Pre nego što agent uopšte aktivira veštinu, on vidi samo njene metapodatke. Ako frontmatter u SKILL.md fajlu nije hirurški precizan, vaša veština je za sistem nevidljiva.
Stroga pravila imenovanja nisu stvar estetike, već funkcionalnosti:
- Identitet: Ime mora imati 1–64 karaktera (mala slova, brojevi i crtice). Strogo su zabranjene uzastopne crtice (npr.
my--skillje neispravno). Ime mora do u karakter odgovarati imenu direktorijuma (npr.angular-testing/SKILL.mdzahtevaname: angular-testing). - Trigeri: Opis (do 1.024 karaktera) pišite u trećem licu. On služi za rutiranje. Profesionalni opisi obavezno sadrže i negativne trigere.
Loš primer: "React veštine." (Vodi ka nasumičnom aktiviranju i halucinacijama).
Pro-grade primer: "Kreira i gradi React komponente koristeći Tailwind CSS. Koristiti kada korisnik zahteva ažuriranje UI logike ili stilova. Ne koristiti za Vue, Svelte ili projekte koji koriste čisti CSS."
Pravilo br. 3: "Lean Brain" strategija i progresivno otkrivanje
SKILL.md je "mozak" vaše operacije, a mozak mora ostati "lean". Da biste izbegli preopterećenje modela, koristite Progressive Disclosure (progresivno otkrivanje) dizajn obrazac.
- Ograničenje koda: Glavni
SKILL.mdfajl mora imati manje od 500 linija. Sve ostalo je "token debt". - Pravilo jednog nivoa: Svu robusnu dokumentaciju i resurse smestite u poddirektorijume, ali uz strogo ograničenje – struktura mora biti plitka (flat). Fajlovi moraju biti tačno jedan nivo duboko.
references/schema.md(DA)references/db/v1/schema.md(NE – previše kompleksno za pouzdano rutiranje)
- Just-in-Time (JiT) učitavanje: Agent ne vidi resurse automatski. Eksplicitno mu naredite kada da ih pozove: "Pogledaj /references/auth-flow.md za specifične kodove grešaka". Uvek koristite relativne putanje sa kosom crtom napred (
/).
Pravilo br. 4: Proceduralne instrukcije umesto proze
Agenti su majstori za prepoznavanje obrazaca (pattern-matching), ne za interpretaciju književnih dela. Koristite proceduralni format koji forsira determinističko izvršenje:
- Imperativ u trećem licu: Komande kao što su "Ekstrahuj tekst..." su superiorne u odnosu na sugestije poput "Trebalo bi da...".
- Numerisani radni tok: Mapirajte odluke precizno. "Korak 2: Ako su potrebne izvorne mape, pokreni ng build --source-map. U suprotnom, pređi na korak 3."
- Terminološka rigidnost: Budite brutalno dosledni. U Angular okruženju koristite termin "template", a nikada "html" ili "view". Specifičnost smanjuje dvosmislenost.
- Šabloni iznad deskripcije: Umesto da objašnjavate strukturu JSON izlaza, stavite šablon u
assets/folder i naredite agentu da ga klonira.
Pravilo br. 5: Iskoristite LLM kao svog najstrožeg QA testera
Validacija veština se ne radi ručno. Koristite drugi LLM da "napadne" vašu logiku kroz tri nivoa:
- Discovery Validation: Testirajte da li opis veštine izaziva lažne pozitivne rezultate. Tražite od modela da generiše upite koji ne bi smeli da aktiviraju veštinu.
- Logic Validation: Naterajte LLM da simulira izvršenje korak-po-korak. Koristite konkretne, teške primere. Na primer: "Simuliraj migraciju Angular v17 aplikacije na Vite. Identifikuj tačnu liniju gde moraš da nagađaš kako da mapiraš Angular environment fajlove na Vite import.meta.env mape." Svako nagađanje je rupa u vašoj veštini.
- Edge Case Testing (Ruthless QA): Postavite LLM u ulogu nemilosrdnog testera. Neka traži ranjivosti: "Šta ako scripts/esbuild-optimizer.mjs padne zbog legacy CommonJS zavisnosti?" ili "Šta ako korisnik ima @angular-builders/custom-webpack koji Vite ne podržava?".
Zaključak: Budućnost je u preciznosti
Pisanje veština za agente je inženjerska disciplina, a ne kreativno pisanje. Uspeh se meri ušteđenim tokenima i determinizmom izvršenja. Svaki put kada vaš agent "pogodi" rešenje umesto da ga izračuna na osnovu vaših instrukcija, vi ste na korak od produkcione katastrofe.
Call to Action: Odmah uzmite svoj najkompleksniji SKILL.md fajl i podvrgnite ga Edge Case Testing promptu. Identifikujte gde vaša logika puca i primenite "Progressive Disclosure" dizajn obrazac. Izbacite masivne konfiguracije u references/ i naterajte agenta da ih koristi samo pod vašim uslovima. Preciznost je jedini standard koji se priznaje.
Izvor: github.com
Komentari
Nema komentara. Šta vi mislite o ovome?