Mali Samsungov model nadmašuje gigantske LLM-ove u rasuđivanju

U velikom razvoju koji dovodi u pitanje preovlađujuću filozofiju "što veće, to bolje" u veštačkoj inteligenciji, istraživač iz Samsung AI Lab (SAIL) Montréal predstavio je novi model koji postiže vrhunske rezultate u složenim zadacima rasuđivanja sa delićem veličine vodećih velikih jezičkih modela (LLM).

Model, nazvan Tiny Recursive Model (TRM), radi sa samo 7 miliona parametara. Da bi se to stavilo u perspektivu, to je manje od 0,01% veličine nekih od najvećih LLM-ova koji se trenutno koriste. Uprkos svojoj maloj veličini, TRM je pokazao superiorne performanse na ozloglašeno teškim testovima kao što je test inteligencije Abstraction and Reasoning Corpus (ARC-AGI).

Izazov paradigmi veličine

Tradicionalni LLM-ovi, iako odlični u generisanju teksta sličnog ljudskom, često se bore sa višestepenim, logičkim rasuđivanjem. Njihov proces generisanja token po token može dovesti do grešaka koje se nagomilavaju, što rezultira pogrešnim konačnim odgovorima. Tehnike poput "Chain-of-Thought" pomažu, ali su računarski skupe.

TRM nudi radikalno drugačiji pristup. Umesto da se oslanja na puku veličinu, koristi jednu, malu mrežu koja rekurzivno usavršava i svoje unutrašnje "rasuđivanje" i predloženi "odgovor". Ovaj proces se može ponoviti do 16 puta, omogućavajući modelu da progresivno ispravlja sopstvene greške na visoko efikasan način.

Impresivni rezultati

Rezultati su ubedljivi. Na ARC-AGI-2 testu, koji je dizajniran da meri pravu fluidnu inteligenciju, TRM je postigao tačnost od 7,8%. Ovo možda zvuči nisko, ali značajno nadmašuje mnogo veće modele, uključujući Google-ov Gemini 2.5 Pro, koji je postigao samo 4,9% na istom testu. Model je takođe pokazao masivna poboljšanja na drugim zadacima rasuđivanja, kao što je Sudoku-Extreme test.

Ovo istraživanje sugeriše održiviju i parametarski efikasniju budućnost za AI. Fokusiranjem na arhitektonsku inovaciju i iterativnu samokorekciju, umesto na masivne podatke i broj parametara, Samsungov rad otvara put za moćan, složen AI koji može da radi direktno na manjim uređajima, poput pametnih telefona i tableta, bez potrebe za stalnom vezom sa oblakom.

Izvor: artificialintelligence-news.com

Novi komentari

Kategorije

AI Alati

Tagovi

Kontakt

O sajtu AIZONA

Prijava

Registracija

Kategorije

AI alati

Tagovi

Kontakt

O sajtu AIZONA

Mali Samsungov model nadmašuje gigantske LLM-ove u rasuđivanju

Izazov paradigmi veličine

Impresivni rezultati

Komentari

KATEGORIJE

NOVA IZDANJA