Novi komentari

Kategorije

AI Alati

Tagovi

Kontakt

O sajtu AIZONA

Prijava

Registracija

Kategorija: Modeli

Gemini 3: Nezabeležena moć rezonovanja i multimodalnosti

Gemini 3: Nezabeležena moć rezonovanja i multimodalnosti

Već smo pisali o Gemini 3 OVDE. Gugl je svoj najinteligentniji i najmoćniji model veštačke inteligencije do sada, nazvao značajnim korakom ka Opštoj Veštačkoj Inteligenciji (AGI). Novi model, posebno Gemini 3 Pro i još napredniji režim Gemini 3 Deep Think, postavlja nove industrijske standarde za rezonovanje, multimodalno razumevanje i agentne sposobnosti [1].

Mali Samsungov model nadmašuje gigantske LLM-ove u rasuđivanju

Mali Samsungov model nadmašuje gigantske LLM-ove u rasuđivanju

U velikom razvoju koji dovodi u pitanje preovlađujuću filozofiju "što veće, to bolje" u veštačkoj inteligenciji, istraživač iz Samsung AI Lab (SAIL) Montréal predstavio je novi model koji postiže vrhunske rezultate u složenim zadacima rasuđivanja sa delićem veličine vodećih velikih jezičkih modela (LLM).

Metin AI modelu koji razume video: SAM 3

Metin AI modelu koji razume video: SAM 3

Da li ste se ikada zapitali kako bi računar mogao da izvrši zadatak koji zvuči jednostavno, a zapravo je neverovatno kompleksan? Na primer, kako bi mogao da pronađe i označi "svaki crveni kačket" u dugačkom video snimku, a ne samo onaj jedan na koji ste kliknuli? Ovo više nije samo teorijsko pitanje.

Sora i na Androidu: Era trenutnog AI videa je tu

Sora i na Androidu: Era trenutnog AI videa je tu

Moć generisanja videa iz teksta sada je u rukama miliona, jer je OpenAI nedavno lansirao svoju dugo očekivanu Sora aplikaciju za Android uređaje [1]. Nakon početnog izdanja na iOS-u, proširenje na Android označava značajnu prekretnicu, čineći mogućnost kreiranja zadivljujućih, realističnih video klipova iz jednostavnih tekstualnih upita dostupnijom nego ikada ranije.

Gemini 3: Pregled mogućnosti

Gemini 3: Pregled mogućnosti

Ovaj tekst pruža sveobuhvatnu analizu AI modela Gemini 3, zasnovanu na detaljnom testiranju predstavljenom u izvoru. Gemini 3 je pozicioniran kao superioran i najinteligentniji AI model dostupan u ovom trenutku, demonstrirajući izvanredne sposobnosti koje nadmašuju konkurente. Njegove ključne prednosti leže u naprednom kodiranju, gde je u stanju da iz jedne komande generiše kompleksne, funkcionalne aplikacije kao što su klonovi Windows 11 desktopa i Photoshopa. Model poseduje izuzetne multimodalne sposobnosti, uspešno rešavajući složene vizuelne zagonetke, analizirajući slike za identifikaciju lokacija i generišući 3D scene. U domenu analize podataka, Gemini 3 može da obradi više finansijskih izveštaja istovremeno i sprovede napredne Monte Karlo simulacije za predviđanje ...

Grok 4.1: Kreativnost, empatija i poboljšanja

Grok 4.1: Kreativnost, empatija i poboljšanja

Kompanija xAI je 17. novembra 2025. godine objavila Grok 4.1, novu verziju svog jezičkog modela, koja donosi značajna poboljšanja u pogledu upotrebljivosti u stvarnom svetu. Ovaj model je posebno unapređen u domenu kreativnih, emotivnih i kolaborativnih interakcija. Ključne performanse pokazuju da Grok 4.1 zauzima vodeću poziciju na LMArena Text Leaderboard-u, postižući Elo ocenu od 1483. U slepim uporednim testiranjima sprovedenim tokom perioda tihog uvođenja, korisnici su preferirali Grok 4.1 u 64,78% slučajeva u odnosu na prethodni produkcioni model.

Alibaba Qwen četbot i pad cena modela

Alibaba Qwen četbot i pad cena modela

Ovaj tekst pruža pregled najnovijih dešavanja u vezi sa kompanijom Alibaba i njenim AI modelom Qwen. Ključni događaji obuhvataju lansiranje ažurirane verzije Qwen četbota, značajno smanjenje cena za najnapredniji model Qwen3-Max, i eskalaciju kontroverzi vezanih za navodne veze sa kineskom vojskom. Alibaba sprovodi agresivnu strategiju kako bi se pozicionirala kao lider na kineskom AI tržištu, što je rezultiralo osmim uzastopnim kvartalom sa trocifrenim rastom prodaje AI proizvoda. Istovremeno, kompanija se suočava sa optužbama iznetim u memorandumu Bele kuće, koje je odlučno negirala, opisujući ih kao "zlonamernu PR operaciju". Ova dešavanja ukazuju na dinamično i konkurentno okruženje u Kini, ali i na rastuću geopolitičku tenziju koja prati uspon kineskih tehnoloških...

Pregled arhitektura velikih jezičkih modela (LLM) u 2025. godini

Pregled arhitektura velikih jezičkih modela (LLM) u 2025. godini

Analiza ključnih jezičkih modela objavljenih 2024. i 2025. godine otkriva da, iako fundamentalna Transformer arhitektura ostaje osnova, došlo je do značajne evolucije u ključnim komponentama. Tri dominantna trenda definišu trenutno stanje razvoja: 1. uspon Mixture-of-Experts (MoE) arhitektura, 2. potraga za efikasnijim mehanizmima pažnje i 3. oživljavanje linearne pažnje za obradu ekstremno dugih konteksta.

Misleći modle kompanije Baidu: ERNIE-4.5-VL-28B-A3B

Misleći modle kompanije Baidu: ERNIE-4.5-VL-28B-A3B

Kompanija Baidu je objavila ERNIE-4.5-VL-28B-A3B-Thinking, novi, kompaktan i open-source multimodalni model za rezonovanje iz ERNIE-4.5 familije. Ključna inovacija modela je njegova arhitektura Mešavine Eksperata (Mixture of Experts - MoE) koja sadrži približno 30 milijardi ukupnih parametara, ali aktivira samo 3 milijarde parametara po tokenu. Ovaj pristup omogućava modelu da postigne performanse na nivou znatno većih modela, dok zadržava računarski i memorijski profil modela klase 3B.

GPT-5.1: Šta je novo i zašto je važno?

GPT-5.1: Šta je novo i zašto je važno?

OpenAI je nedavno objavio značajnu nadogradnju pod nazivom GPT-5.1. Važno je napomenuti da ovo nije potpuno nova generacija, kao što bi bio skok sa GPT-4 na GPT-5, već ključno poboljšanje koje čini AI pametnijim, pouzdanijim i znatno prijatnijim za razgovor.

Novi kineski AI model tvrdi da je bolji od GPT-5 – i besplatan je

Novi kineski AI model tvrdi da je bolji od GPT-5 – i besplatan je

Dominacija američkih kompanija u trci za razvoj veštačke inteligencije ponovo je dovedena u pitanje, ovoga puta objavom iz kineske AI laboratorije Moonshot koja preti da poremeti čitavo tržište. Njihov novi model, Kimi K2 Thinking, dodatno komplikuje već složenu geopolitičku i tehnološku scenu.

Kimi 2: Vaš novi AI saradnik iz Moonshot AI-a

Kimi 2: Vaš novi AI saradnik iz Moonshot AI-a

Predstavljamo vam nešto specijalno – Kimi 2, naprednog veštačkog inteligentnog asistenta koji bi mogao da promeni način na koji radite, učite i kreirate. Za razliku od klasičnih AI alatki, Kimi 2 nije samo još jedan chatbot. To je kolega koji razume kontekst, prilagođava se vašem nivou znanja i ostaje uz vas kroz složene projekte.

Guglov AI Opal - alat sa kojim svako može da kreira aplikacije

Guglov AI Opal - alat sa kojim svako može da kreira aplikacije

Da li ste ikada želeli da napravite digitalni alat ili automatizujete neki zadatak, ali vas je zaustavio nedostatak znanja programiranja? Ovaj izazov je pokrenuo globalni "no-code" pokret, a Google sada podiže lestvicu uvođenjem veštačke inteligencije u jednačinu. Predstavljamo Opal, revolucionarni "no-code" alat koji je sada dostupan u preko 160 zemalja, čineći razvoj AI aplikacija dostupnim globalnoj publici.

Vrlo je moguće da veliki jezički modeli misle

Vrlo je moguće da veliki jezički modeli misle

Da li veliki jezički modeli (LLM), poput onih koji pokreću ChatGPT, zaista mogu da "misle"? Ili su samo izuzetno sofisticirani imitatori, majstori u prepoznavanju obrazaca bez ikakvog istinskog razumevanja? Ova debata dominira razgovorima o veštačkoj inteligenciji, a često se čuje argument da mašine ne poseduju pravu sposobnost rezonovanja.

Pet AI alata otvorenog koda

Pet AI alata otvorenog koda

Gde god da se okrenemo, timovi se utrkuju da isporuče funkcije zasnovane na veštačkoj inteligenciji, od solo osnivača koji prave četbotove do velikih kompanija koje automatizuju radne tokove. Zamah je ogroman, a veliki igrači (OpenAI, Google i Meta) ulažu milijarde u nove modele, stvarajući utisak da je za inovaciju potreban neograničen kapital.

MiniMax M2:Cloud

MiniMax M2:Cloud

MiniMax M2 je visokoefikasan veliki jezički model (LLM) specifično dizajniran za kodiranje i agentske radne tokove. Prema benčmarcima koje je sproveo Artificial Analysis, model pokazuje izuzetno konkurentnu opštu inteligenciju u oblastima matematike, nauke, praćenja instrukcija, kodiranja i upotrebe agentskih alata, pri čemu ga njegov kompozitni rezultat rangira kao prvi open-source model na globalnom nivou.

DeepSeek OCR i budućnost kompresije teksta

DeepSeek OCR i budućnost kompresije teksta

DeepSeek je predstavio revolucionarni rad i model pod nazivom DeepSeek OCR, koji uvodi novu metodu za kompresiju teksta predstavljanjem istog u formi slike. Ova tehnologija, nazvana "optička kompresija kroz vizuelne tokene", postiže impresivnu stopu kompresije od 10x, uz zadržavanje 97% tačnosti pri dekodiranju. Ključna inovacija leži u rešavanju jednog od najvećih ograničenja savremenih jezičkih modela (LLM): uskog grla kontekstnog prozora, gde se računarski troškovi eksponencijalno (kvadratno) povećavaju sa svakim dodatnim tokenom.

IBM Granite 4.0 Nano modeli

IBM Granite 4.0 Nano modeli

IBM je objavio četiri nova open-source AI modela, nazvana Granite 4.0 Nano, koji predstavljaju strateški pomak sa fokusa na ogromne modele ka manjim, visoko efikasnim alternativama. Ovi modeli, sa rasponom od 350 miliona do 1.5 milijardi parametara, dizajnirani su za lokalno izvršavanje na potrošačkom hardveru poput laptopova i edge uređaja, čak i unutar veb pregledača, čime se eliminiše zavisnost od cloud infrastrukture. Objavljeni pod permisivnom Apache 2.0 licencom, modeli su dostupni za komercijalnu upotrebu i sertifikovani su prema ISO 42001 standardu za odgovoran razvoj veštačke inteligencije. Uprkos svojoj veličini, Granite Nano modeli pokazuju izuzetne performanse na benčmarcima, nadmašujući veće konkurente u svojoj klasi u zadacima kao što su praćenje instrukcij...