Google právě nasadil do své aplikace Gemini nový nástroj pro úpravu obrázků s názvem Nano Banana, který vyvinul tým Google DeepMind. A podle prvních reakcí jde o velkou věc.
Konečně stabilní tváře i po úpravách
Hlavní předností nového modelu je schopnost zachovat identitu osob a domácích mazlíčků i při radikálních úpravách fotografie. Můžete změnit pozadí, oblečení, účes nebo celkové prostředí, ale charakteristické rysy tváře zůstanou stejné.
To je zásadní posun oproti předchozím generátorům, které při úpravách často zdeformovaly obličeje nebo úplně změnily podobu člověka. Každý, kdo zkoušel upravovat fotky blízkých lidí, ví, jak nepříjemně působí i drobné odchylky v rysech.
Zajímavým příkladem možností je třeba spojení dvou fotografií celebrit – Michaela Jacksona a Billie Eilish – do jednoho realistického snímku. Pokud chcete vyzkoušet podobné experimenty s vlastními fotkami, můžete si na 1AI.cz porovnat různé generátory obrázků.
Dominance v žebříčcích
Model Nano Banana okamžitě po spuštění ovládl žebříček LMArena.ai, kde se umístil na prvním místě hned ve dvou kategoriích – v generování obrázků z textových popisů (text-to-image) i v sekci úprav existujících fotografií (image edit).
Uživatelé sdílí na sociálních sítích působivé ukázky – například ženu vystupující z auta, kde celá scéna vznikla jen úpravou původní fotky pomocí textového příkazu.
Nové možnosti pro kreativní práci
Aktualizace přináší několik pokročilých funkcí. Můžete nahrát více fotografií a zkombinovat je do jedné scény – třeba sebe a svého psa umístit na basketbalové hřiště nebo do historické budovy.
Funkce postupných úprav (multi-turn editing) umožňuje pracovat s obrázkem ve vrstvách. Nejprve změníte barvu stěn v místnosti, pak přidáte nábytek a nakonec doplníte dekorační prvky. Každý krok staví na předchozím.
Zajímavá je také funkce přenosu stylu – vzor nebo texturu z jednoho objektu můžete aplikovat na jiný. Například vzor z motýlích křídel přenést na šaty nebo texturu dřeva na keramickou vázu.
Na 1AI.cz najdete přehled aktuálních AI nástrojů, které nabízejí podobné funkce pro práci s obrázky.
Transparentnost u AI obsahu
Google všechny obrázky vytvořené nebo upravené v aplikaci Gemini označuje viditelným vodoznakem. Navíc obsahují neviditelný digitální vodoznak SynthID, který identifikuje obsah vytvořený umělou inteligencí i po případných dalších úpravách nebo kompresi.
