Google právě spustil svůj nejsilnější AI model a čísla jsou opravdu závratná. Gemini 3 Pro podle interních benchmarků drtí předchozí generaci 2.5 Pro prakticky ve všech disciplínách a na komunitním žebříčku LMArena získává 1501 Elo bodů, což ho řadí na absolutní špičku.
PhD úroveň uvažování a multimodální schopnosti
Co dělá Gemini 3 tak výjimečným? Model dosahuje 37,5 % v testu Humanity’s Last Exam (bez použití nástrojů), což představuje úroveň uvažování srovnatelnou s doktorandy. V náročném vědeckém benchmarku GPQA Diamond pak získává 91,9 % a v matematickém MathArena Apex stanovuje nový rekord s 23,4 %.
Ještě impozivnější jsou multimodální výsledky. Gemini 3 Pro chápe propojení textu, obrázků a videa mnohem lépe než jeho předchůdce – 81 % na MMMU Pro a 87,6 % na Video MMMU mluví za vše. Pro běžné uživatele to znamená třeba možnost nahrát video z tenisového zápasu a nechat si vygenerovat detailní analýzu techniky včetně tréninkového plánu.
Důležité je i zlepšení faktické přesnosti na 72,1 % v SimpleQA Verified. Google se zřejmě poučil z kritiky a model je nyní „méně podlézavý a více přímočarý“ – dává stručné, věcné odpovědi místo zdvořilostních frází.
Deep Think: když potřebujete maximální výkon
Pro nejtěžší úlohy Google připravil režim Gemini 3 Deep Think, který prodlužuje „dobu přemýšlení“ a dosahuje ještě lepších výsledků. V Humanity’s Last Exam se dostává na 41,0 %, v GPQA Diamond na 93,8 % a co je nejpozoruhodnější – na benchmarku ARC AGI 2 zaměřeném na řešení zcela nových problémů získává 45,1 %.
Deep Think je zatím dostupný jen pro testovací skupinu, ale předplatitelé Google AI Ultra se k němu dostanou v příštích týdnech. Google zde postupuje opatrně kvůli bezpečnostním úvahám – takto silný model s autonomními schopnostmi vyžaduje pečlivé testování.
Co to znamená pro běžné uživatele?
Gemini 3 se okamžitě objevuje ve všech Google produktech – v mobilní i webové aplikaci, v AI Mode při vyhledávání a pro předplatitele i jako Gemini Agent, který dokáže vykonávat složitější úkoly pod vaším dohledem.
Díky kontextovému oknu až 1 milion tokenů můžete nahrát celou knihu, dlouhé video nebo kompletní přednášku a nechat si vytvořit interaktivní studijní materiály. Pokud hledáte pokročilé AI nástroje a chcete být v obraze, určitě navštivte 1AI.cz, kde najdete přehled nejnovějších technologií.
Zajímavé jsou praktické ukázky – model dokáže digitalizovat ručně psané rodinné recepty, analyzovat sportovní videa s doporučeními nebo vysvětlit složité biologické procesy jako RNA polymeráza pomocí interaktivních vizualizací přímo v prohlížeči.
Revoluce pro vývojáře: Google Antigravity
Pro programátory je Gemini 3 skutečným průlomem. Model vede žebříček WebDev Arena s 1487 Elo body, dosahuje 54,2 % na Terminal Bench 2.0 a 76,2 % na SWE Bench Verified, což ukazuje jeho schopnosti jako plnohodnotného kódovacího agenta.
Největší novinkou je však Google Antigravity – zcela nové vývojářské prostředí postavené na principu „agent first“. Agenti s jádrem v Gemini 3 Pro mají přímý přístup k editoru, terminálu i prohlížeči a dokážou autonomně plánovat komplexní úkoly, migrovat kód, spouštět testy nebo auditovat rozsáhlé repozitáře.
Gemini 3 podporuje tzv. vibe coding – napíšete volný popis a model vygeneruje kompletní UI, herní svět nebo 3D vizualizaci. Vývojáři mohou pracovat v Google AI Studio, Vertex AI nebo přes nástroje třetích stran jako Cursor, GitHub či Replit.
Je to opravdu nový král AI?
Čísla jsou impozivní a Google evidentně udělal obrovský skok vpřed. Vedení Alphabetu označuje Gemini 3 za začátek nové éry kombinující inteligentnější modely, autonomnější agenty a hlubší personalizaci. Pokud se zajímáte o srovnání s konkurencí, podívejte se na 1AI.cz, kde průběžně testujeme všechny hlavní AI modely.
Jak rychle se tato vize promění v praxi, ukážou následující týdny. Wall Street, regulátoři v USA i Evropě a především komunita vývojářů budou pozorně sledovat, jestli Gemini 3 dokáže své slibné benchmarky přetavit v reálnou hodnotu pro miliony uživatelů.
Jedno je jisté – AI válka právě dostala novou dimenzi a konkurence bude muset výrazně zrychlit.
