Korišćenje veština agenata u nauci o podacima
Korišćenje veština agenata u nauci o podacima Kako sam svoju osmogodišnju naviku nedeljne vizualizacije pretvorio u višekratni AI tok posla
U mom prethodnom članku, pisao sam o tome kako koristiti MCP (Model Context Protocol) za integraciju velikih jezičkih modela (LLM) u vaš celokupni proces rada sa podacima (data science workflow). Takođe sam ukratko pomenuo još jedan koristan alat: veštine (skills).
Šta su veštine (skills)?
Veština je paket instrukcija i opcionih pratećih datoteka koji se može koristiti više puta. Ona pomaže veštačkoj inteligenciji da pouzdanije i doslednije upravlja radnim tokovima koji se ponavljaju. U najmanju ruku, potreban joj je SKILL.md fajl koji sadrži metapodatke (ime i opis) i detaljna uputstva o tome kako veština treba da funkcioniše. Često se pakuje zajedno sa skriptama, šablonima i primerima radi standardizacije i tačnosti.
Možda se pitate zašto koristimo veštine umesto da prosto napišemo sve to u samom kontekstu u alatima kao što su Claude Code ili Codex. Jedna od prednosti je ta što veštine pomažu da glavni kontekst ostane kraći. AI u početku učitava samo lagane metapodatke – a preostala uputstva i prateće resurse čita tek onda kada proceni da je ta veština relevantna.
Moj primer: Veština za nedeljne vizualizacije
Od 2018. godine svake nedelje pravim po jednu vizualizaciju. Ovaj proces je visokorepetitivan i obično mi oduzima oko sat vremena nedeljno. Zato je bio odličan kandidat za automatizaciju putem veština.
Radni proces bez AI-ja:
- Pronalaženje zanimljivog skupa podataka.
- Igranje sa podacima u Tableau-u, nalaženje uvida i pravljenje jedne vizualizacije koja intuitivno priča priču.
- Objavljivanje na mom ličnom veb-sajtu.
AI radni proces: Dok je prvi korak traženja skupa podataka ostao manuelan, napravio sam dve veštine da automatizujem korake 2 i 3:
- Storytelling-viz veština koja analizira skup podataka, identifikuje ključne uvide, predlaže tipove vizualizacije i generiše interaktivnu vizualizaciju usmerenu na pripovedanje (storytelling).
- Viz-publish veština koja objavljuje vizualizaciju na mom sajtu kao ugrađeni (embedded) HTML.
Kada sam dao Codex-u zadatak da napravi vizualizaciju iz Apple Health baze podataka koristeći ovu veštinu, proces je trajao manje od 10 minuta. AI je sam pronašao interesantan uvid, predložio grafikon, a rezultat je bila čista, interaktivna vizualizacija sa jasnim izvorom podataka.
Kako sam to zapravo napravio
Korak 1: Počnite sa planom
Započeo sam opisivanjem svog nedeljnog procesa i cilja automatizacije. Odlična stvar je što SKILL.md fajl ne morate da pravite ručno – samo zatražite od Claude Code-a ili Codex-a da kreira veštinu za vaš slučaj upotrebe i oni će postaviti početnu verziju umesto vas.
Korak 2: Testiranje i iteracija Prva verzija me je dovela tek do 10% idealnog procesa vizualizacije. Tipovi grafikona su bili suboptimalni, a stilovi nedosledni. Preostalih 90% zahtevalo je iterativna poboljšanja kroz tri strategije:
- Deljenje sopstvenog znanja: Podelio sam snimke ekrana svojih dosadašnjih vizualizacija i svoja uputstva za stil. AI je rezimirao uobičajene principe i ažurirao uputstva veštine.
- Istraživanje spoljnih resursa: Zatražio sam od AI-ja da istraži poznate onlajn izvore o dobrom dizajnu vizualizacije kako bi proces bio pouzdaniji i šire primenljiv.
- Učenje iz testiranja: Testirao sam veštinu sa više od 15 različitih skupova podataka. To mi je pomoglo da uočim šta treba popraviti (npr. standardizovanje fontova, proveravanje prikaza na mobilnom telefonu, uvek obavezno linkovanje izvora podataka, itd.).
Ključni zaključci za "Data Science" stručnjake
Veštine su izuzetno vredne kada imate zadatak koji se ponavlja, koji prati polu-strukturirani proces, zavisi od domenskog znanja i teško ga je rešiti jednim jedinim promptom.
- Tipični primeri: Istraživanje uzroka naglog pada određene metrike (segmentacija podataka i provera uzroka) ili prikupljanje izveštaja o prethodnim eksperimentima u kompaniji.
- Modularnost: Ako se vaš proces sastoji od nezavisnih komponenti, razdvojite ih u različite veštine (npr. generisanje grafika i objavljivanje grafika) kako biste ih kasnije lakše ponovo upotrebili.
- Sinergija sa MCP-om: MCP (Model Context Protocol) i veštine se savršeno dopunjuju. MCP omogućava modelu lak pristup spoljnim alatima (poput baze podataka), dok veština osigurava da model prati ispravan i dosledan proces pri radu sa tim alatima.
Završna misao
Sada kada automatizujem 80% svog nedeljnog procesa pravljenja vizualizacija, zašto to i dalje radim? Prvobitni cilj 2018. bio je da vežbam alat (Tableau). Danas se svrha promenila – koristim ovaj nedeljni ritual da istražujem nove skupove podataka, izoštravam svoju intuiciju i posmatram svet kroz prizmu podataka. Za mene tu nije reč o alatu, već o procesu otkrivanja. Zato planiram da sa ovim nastavim i u eri veštačke inteligencije.
Autor: Yu Dong
Izvor: towardsdatascience.com
Komentari
Nema komentara. Šta vi mislite o ovome?