Novi komentari

Kategorije

AI Alati

Tagovi

Kontakt

O sajtu AIZONA

Prijava

Registracija

Vesti: AI i robotka, 8.5.2026.

Oblast: Vesti |          
Petak, 8. maj 2026. 16:34
Autor: AIZona

Vesti: AI i robotka, 8.5.2026.
  1. Anthropic sada može da „čita misli” Claude-a – Anthropicovi Natural Language Autoencoderi (NLA) pretvaraju interne aktivacije modela u čitljiv tekst, otkrivajući šta Claude „misli”, ali ne izgovara. NLA su detektovali neizraženu svest o evaluaciji u 16–26% benchmark transkripata, povećali detekciju skrivenih motivacija sa manje od 3% na 12–15% u testovima revizije, i već su korišćeni za otkrivanje modela koji vara i za dijagnostiku baga u jezičkom izlazu kod Claude Opus 4.6.

  2. OpenAI dodaje rezonovanje, prevođenje i transkripciju u glas — OpenAI je objavio tri nova audio modela u svom Realtime API-ju, koji su sada zvanično dostupni. GPT-Realtime-2 donosi rezonovanje na nivou GPT-5, kontekst prozor od 128K i pet podesivih nivoa „napora” u rezonovanju za glasovne agente u realnom vremenu. GPT-Realtime-Translate omogućava prevođenje govora sa preko 70 ulaznih jezika na 13 izlaznih jezika. GPT-Realtime-Whisper pruža streaming pretvaranje govora u tekst sa kontrolisanom latencijom. Sva tri su dostupna već danas.

  3. Voxtral: Mistralov kompletan audio stack za glasovne agente — Voxtral TTS može da klonira bilo koji glas na 9 jezika iz uzorka od 3 sekunde uz latenciju od 90 ms, bez potrebe za dodatnim treniranjem. Nativno se integriše u vaš STT + LLM stack i podržava generisanje proizvoljno dugih izlaza. U kombinaciji sa Voxtral Transcribe omogućava end-to-end govor-u-govor. Dostupan je preko API-ja, Mistral Studija i na Hugging Face-u pod Apache 2.0 licencom. (promovisano)

  4. LightSeek TokenSpeed menja način agentnog inferenciranja — LightSeek Foundation je objavio TokenSpeed, open-source LLM inference engine pod MIT licencom, dizajniran za agentne workload-ove. Njegov C++ FSM scheduler obezbeđuje ispravnost KV cache-a već u fazi kompajliranja, dok sloj za modelovanje zasnovan na kompajleru (SPMD) automatizuje distribuiranu komunikaciju. Testiran na NVIDIA B200 u poređenju sa TensorRT-LLM koristeći Kimi K2.5, TokenSpeed postiže oko 9% manju latenciju i oko 11% veći throughput pri 100 TPS po korisniku. Trenutno u preview verziji.

  5. Genesis GENE-26.5 približava robote ljudskom nivou — Genesis AI je predstavio GENE-26.5, svoj prvi „foundation” model za robotiku koji cilja manipulaciju na nivou čoveka. Koristeći jedinstveni model sa deljenim težinama, sistem izvršava više od 20 zadataka iz stvarnog sveta — kuvanje, laboratorijsko pipetiranje, slaganje Rubikove kocke, rad sa kablovima i sviranje klavira. Sistem kombinuje biomimetičku šaku sa 20 stepeni slobode, data engine sa preko 200.000 sati snimaka i middleware za kontrolu sa latencijom od 3 ms kako bi smanjio jaz između čoveka i robota.

Izvor: Marktechpost AI

Komentari

Nema komentara. Šta vi mislite o ovome?