Claudovi vizuali: Impresivno menjaju način na koji objašnjavam stvari
Imamo izbor kada su u pitanju LLM-ovi koji mogu da organizuju složene podatke, zaključe iz ograničenog konteksta i samostalno analiziraju informacije sa iznenađujućom autonomijom. Većina modela ipak zaostaje na polju dinamičke vizualizacije, pa ni vodeći modeli OpenAI-ja i Googla nisu izuzetak. Nedavna Claudova unapređenja trebalo bi da to promeni.
U nedavnom ažuriranju, Anthropic je dodao mogućnost da Claude kreira interaktivne vizuale za korisnike, tako da model može da generiše dinamičke grafikone i dijagrame radi boljeg razumevanja — na način koji ranije nije bio uobičajen. Odlučili smo da ih testiramo i odmah smo shvatili kolika je razlika između statičkih podataka i nečega što možete istinski da istražujete.
Šta su Claudovi interaktivni vizuali?
Dinamični, „istraživi“ vizuali ugrađeni direktno u odgovore
12. marta Anthropic je najavio novu beta funkciju koja ugrađuje interaktivne vizuale direktno u Claudovo ćaskanje. Model sada može da generiše dinamičke vizualizacije koje se prilagođavaju u realnom vremenu kako razgovor napreduje, tako da podaci deluju kao „živ“ deo diskusije. Vizualizacije rade na zahtev korisnika ili kada model proceni da su potrebne. Funkcija je uvedena i dostupna je svim korisnicima, bez obzira na tip plana.Rani korisnici na forumima uglavnom imaju vrlo pozitivne utiske; mnogi je opisuju kao „magičnu“, jer model često generiše uredne, interaktivne grafikone od unetih podataka, ponekad i bez eksplicitnog zahteva. Neki primećuju da vizuali skraćuju vreme potrebno da se informacija razume — zamenjujući sate ručnog crtanja grafikona nečim skoro trenutnim — što je upravo ono što je Anthropic želeo integracijom.
Da li su Claudovi vizuali samo lepi, ili stvarno korisni?
Podaci se kreću — ali da li i razumevanje prati?
Da proverimo da li fokus na „pomoć pri razumevanju“ zaista postoji, uporedili smo iskustvo glavnih LLM-ova. Pitali smo ChatGPT, Gemini i Claude za jednostavno vizuelno objašnjenje turbofan motora, namerno držeći prompt osnovnim da vidim kako svaki model obrađuje suštinu.
ChatGPT i Gemini nisu iznenadili: oba su, kao što se i očekivalo, dala neke infografike. Iako su razumno tačne i dobro označene, nosile su kognitivno opterećenje — razumevanje je zahtevalo napor da se prati protok vazduha, mapiraju komponente i mentalno simulira kretanje. Za nepoznate koncepte, lako je zamisliti trenje u razumevanju.
Claude je isporučio nešto bliže „istraživom“ sistemu nego statičkom dijagramu, što je značajno smanjilo taj teret. Umesto statičke slike, model Sonnet 4.6 generisao je interaktivni vizual sa dinamičkim oznakama koji ilustruje protok vazduha, usis i ključne delove kao što su HPC i HPT. Umesto da traži od korisnika da sam interpretira složenu unutrašnjost, model je pokazao kako to funkcioniše. Verovatno je upravo to kognitivno opterećenje Anthropic želeo da ukloni vizualizacijom — i delovalo je da radi.
Ipak, neki kompromisi se teško ignorišu
Limit poruka? Već?
Nema sumnje da smo ostali pod utiskom koliko izlazi mogu biti precizni i vizuelno upečatljivi. Ipak, iskustvo nije uvek trenutno — generisanje ovih vizuala može potrajati. Važno je napomenuti da na besplatnim nivoima česta upotreba funkcije često brzo troši limit poruka, što mnoge korisnike može odbiti.
Korisnici fokusirani na produktivnost često ostaju u jednoj konverzacijskoj niti, gde se kontekst vremenom gradi i postaje deo radnog toka. Udaranje u potrošnju usred sesije je neprijatan prekid, a na Claudu postoji obavezno čekanje pre nastavka.
Takva prekid može biti dovoljna da odvrati ljude od platforme. Šire posledice: ako je generisanje vizuala dovoljno zahtevno da ubrzava nailazak na limite, to suptilno odbija ljude da koriste funkciju. U tom smislu, opcija ostaje realnija za pretplatnike višeg nivoa nego za svakodnevne besplatne korisnike.
Vizuelni skok sa neosporivom cenom
Anthropicovi interaktivni vizuali predstavljaju značajan skok u tome kako LLM-ovi analiziraju, organizuju i predstavljaju informacije; sumnje nema da će funkcija naći primenu u učenju, obrazovanju i možda i u generisanju ideja ako se dalje razvije. Ipak, čini se da postoji usko grlo koje ograničava upotrebljivost — u ovom slučaju, kompromis izgleda kao pristup. Funkcija koja na besplatnom nivou toliko ubrzava dolazak do limita da dugotrajna korisnost postane teška nije idealna za besplatne korisnike, već više liči na pregled onoga što je moguće uz pretplatu.
Izvor: xda-developers.com, claude.com
Komentari
Nema komentara. Šta vi mislite o ovome?