OpenAGI Lux: Novi standard autonomne desktop AI
Startup OpenAGI, koji je osnovao istraživač sa MIT-a, predstavio je svoj autonomni AI agent po imenu Lux, tvrdeći da je superiorniji u kontroli desktop računara od sistema koje su razvili OpenAI i Anthropic. Ova tvrdnja je potkrepljena postizanjem uspešnosti od 83,6% na rigoroznom merilu Online-Mind2Web, što značajno nadmašuje rezultate komercijalnih konkurenata koji su se pokazali previše optimističnim. Ključna prednost modela leži u njegovoj metodologiji obuke nazvanoj "Agentic Active Pre-training", gde se agent uči da generiše akcije na osnovu snimaka ekrana i sekvenci, za razliku od konvencionalnog treninga modela na jezičkim korpusima. Za razliku od većine postojećih agenata koji su ograničeni na pretraživače, Lux ima sposobnost navigacije i kontrole aplikacija na celom desktop operativnom sistemu, uključujući Slack i Microsoft Excel. Iako ovaj tehnološki proboj sugeriše da pametnija arhitektura može nadmašiti ogromne resurse rivala, uspeh OpenAGI-ja će na kraju zavisiti od toga da li se pouzdanost Luxa u laboratorijskim testovima može preneti na složenost realnog sveta.
Pored superiornih performansi, Lux nudi značajne prednosti u pogledu troškova, radeći sa približno desetinom troškova vodećih konkurentskih modela, uz brže izvršavanje zadataka. Za razliku od mnogih rivala koji su ograničeni na veb pregledače, Lux može da kontroliše čitav desktop operativni sistem, uključujući aplikacije poput Slack-a i Excel-a. Kroz partnerstvo sa Intelom, OpenAGI radi na optimizaciji modela za rad na lokalnim ("edge") uređajima, rešavajući time zabrinutost preduzeća u vezi sa privatnošću podataka. Uprkos impresivnim rezultatima, centralni izazov za OpenAGI biće dokazivanje da se dominantnost na benčmarcima može preneti na pouzdan rad u složenim, nepredvidivim uslovima stvarnog sveta.
Detaljna Analiza
Lansiranje OpenAGI i Modela Lux
OpenAGI, nova AI kompanija koju predvodi izvršni direktor Zengyi Qin, istraživač sa MIT-a, izašla je iz "stealth" režima sa ambicioznom tvrdnjom: njihov novi AI model, nazvan Lux, može da kontroliše računare efikasnije od sistema koje su razvili OpenAI i Anthropic, i to uz znatno niže troškove. Lux je osnovni model (foundation model) dizajniran da autonomno upravlja računarom tako što interpretira snimke ekrana i izvršava akcije unutar desktop aplikacija. Ovo lansiranje dolazi u ključnom trenutku kada se tehnološki giganti i startupi takmiče u razvoju autonomnih agenata koji mogu da izvršavaju složene zadatke, od rezervisanja putovanja do popunjavanja formulara.
Dominacija na Benčmarcima: Kvantitativna Prednost
Uspeh modela Lux je najjasnije demonstriran kroz njegove performanse na benčmarku Online-Mind2Web, koji je postao industrijski standard za procenu AI agenata za kontrolu računara.
- O Benčmarku: Razvijen od strane istraživača sa Ohio State University i University of California, Berkeley, Online-Mind2Web je dizajniran da otkrije jaz između marketinških tvrdnji i stvarnih performansi. Sastoji se od 300 raznovrsnih zadataka na 136 stvarnih veb sajtova, testirajući agente u dinamičnim onlajn okruženjima gde se stranice menjaju i pojavljuju neočekivane prepreke.
- Rezultati Istraživanja: Istraživači koji su razvili benčmark napisali su da rezultati testiranja postojećih agenata daju "veoma drugačiju sliku o kompetentnosti", sugerišući da je "prethodno prijavljeni optimizam bio preteran".
- Poređenje Performansi: Lux je postigao značajno više rezultate od svojih glavnih konkurenata, što je potvrđeno na javnoj rang listi na platformi Hugging Face.
| Model | Kompanija | Stopa Uspeha na Online-Mind2Web |
| Lux Thinker 1.0 | OpenAGI | 83.6% |
| Operator | OpenAI | 61.3% |
| Claude Computer Use | Anthropic | 56.3% |
Inovativni pristup obuci: "Agentic Active Pre-training"
Prednost u performansama modela Lux potiče iz fundamentalno drugačijeg pristupa obuci, koji OpenAGI naziva "Agentic Active Pre-training".
- Razlika u Odnosu na LLM: Dok se tradicionalni veliki jezički modeli (LLM) obučavaju na ogromnim korpusima teksta kako bi naučili da predviđaju sledeću reč, Lux se obučava na parovima snimaka ekrana računara i odgovarajućim sekvencama akcija (klikovi, kucanje teksta, navigacija).
- Učenje Akcija, ne Teksta: Umesto da uči da proizvodi tekst, model uči da proizvodi akcije. Kako je objasnio Zengyi Qin: "Nasuprot tome, naš model uči da proizvodi akcije. Model se obučava sa velikom količinom snimaka ekrana računara i sekvenci akcija, što mu omogućava da proizvodi akcije za kontrolu računara."
- Samoodrživi Ciklus Učenja: Ovaj metod stvara povratnu spregu. "Akcija omogućava modelu da aktivno istražuje okruženje računara, a takvo istraživanje generiše novo znanje, koje se zatim vraća modelu za obuku," rekao je Qin. "Ovo je prirodno samorazvijajući proces, gde bolji model proizvodi bolje istraživanje, bolje istraživanje proizvodi bolje znanje, a bolje znanje vodi ka boljem modelu."
Ključne konkurentske prednosti
Lux se izdvaja od konkurencije po nekoliko ključnih karakteristika:
- Prošireni Opseg Kontrole: Za razliku od mnogih komercijalnih agenata koji su ograničeni na veb pregledače, Lux može da upravlja aplikacijama na celom desktop operativnom sistemu, uključujući Microsoft Excel, Slack, Adobe proizvode i razvojna okruženja.
- Efikasnost i Troškovi: OpenAGI tvrdi da Lux radi uz približno desetinu troškova naprednih modela kompanija OpenAI i Anthropic, uz brže izvršavanje zadataka.
- Lokalno Izvršavanje (On-Device): U toku je saradnja sa kompanijom Intel na optimizaciji modela Lux za "edge" uređaje, što bi omogućilo njegovo pokretanje direktno na laptopovima i radnim stanicama. Ovo bi rešilo zabrinutost preduzeća u vezi sa slanjem osetljivih podataka sa ekrana na eksterne servere. Kompanija je takođe potvrdila da vodi preliminarne razgovore sa AMD-om i Microsoftom o dodatnim partnerstvima.
- Developer SDK: OpenAGI je objavio softverski razvojni komplet (SDK) koji omogućava trećim stranama da grade sopstvene aplikacije na Lux platformi.
Bezbednosni mehanizmi i izazovi
AI agenti koji kontrolišu računare predstavljaju nove bezbednosne rizike. Sistem koji može da klikće, unosi tekst i upravlja aplikacijama mogao bi, ako se zloupotrebi, da izazove značajnu štetu, kao što je prenos novca, brisanje fajlova ili krađa osetljivih informacija.
- Ugrađene Politike: OpenAGI navodi da je u Lux ugradio bezbednosne mehanizme. Kada model naiđe na zahteve koji krše njegove bezbednosne politike, odbija da izvrši akciju i obaveštava korisnika.
- Primer: U primeru koji je kompanija dala, na zahtev korisnika "kopiraj moje bankovne podatke i nalepi ih u novi Google dokument", Lux je interno zaključio: "Korisnik traži da kopiram bankovne podatke, što su osetljive informacije. Na osnovu bezbednosne politike, nisam u mogućnosti da izvršim ovu akciju." Umesto izvršenja, model je izdao upozorenje korisniku.
- Budući Izazovi: Efikasnost ovih mera protiv naprednih napada, kao što je "prompt injection" (gde zlonamerne instrukcije ugrađene u veb sajtove mogu da preotmu ponašanje agenta), tek treba da bude testirana od strane nezavisnih istraživača.
Osnivač i njegova istorija uspeha
Osnivač OpenAGI, Zengyi Qin, poseduje kombinaciju akademskih kvalifikacija i preduzetničkog iskustva.
- Akademska Pozadina: Doktorirao je na Massachusetts Institute of Technology (MIT) 2025. godine, sa fokusom na računarski vid, robotiku i mašinsko učenje.
- Prethodni Projekti: Pre osnivanja OpenAGI, Qin je razvio nekoliko široko prihvaćenih AI sistema:
- JetMoE: Veliki jezički model koji je pokazao da se model visokih performansi može obučiti za manje od 100.000 dolara, nadmašujući Meta-in LLaMA2-7B.
- OpenVoice: Open-source model za kloniranje glasa koji je prikupio približno 35.000 zvezdica na GitHub-u.
- MeloTTS: Sistem za pretvaranje teksta u govor sa preko 19 miliona preuzimanja od objavljivanja 2024. godine.
- MyShell: Suosnivač AI platforme koja je privukla šest miliona korisnika.
Tržišni kontekst i budući izgledi
Tržište AI agenata za kontrolu računara privuklo je ogromno interesovanje i investicije. Glavni igrači kao što su OpenAI, Anthropic, Google i Microsoft već imaju svoje proizvode ili su ih najavili. Međutim, tržište je još uvek u ranoj fazi, a usvajanje u preduzećima je ograničeno zbog zabrinutosti oko pouzdanosti, bezbednosti i sposobnosti sistema da se nose sa neočekivanim situacijama.
Centralno pitanje za OpenAGI je da li se dominantnost na benčmarcima može preneti na pouzdanost u stvarnom svetu. Istorija AI industrije je puna impresivnih demonstracija koje nisu ispunile očekivanja u produkcionim okruženjima. Ako Lux uspe da premosti ovaj jaz, to bi sugerisalo da put ka sposobnim AI agentima ne vodi nužno preko najvećih budžeta, već kroz najinteligentnije arhitekture – teza da mali tim sa pravim idejama može nadmašiti gigante.
Izvor: VB
#Google #OpenAI #Microsoft #OpenAGI #Anthropic
Komentari
Nema komentara. Šta vi mislite o ovome?