Nový nástroj společnosti Google vytváří fotorealistické obrázky během několika sekund. Od svého veřejného spuštění již vytvořil více než 500 milionů obrázků.
Společnost Google integrovala do Gemini nástroj Nano Banana, který vyvolává na sociálních sítích velký rozruch. Funguje poměrně jednoduše: nahrajete fotografii nebo popíšete, co chcete, zadáte instrukce a obrázek se během několika sekund vygeneruje. AuronPlay použil nástroj, aby se objevil po boku Ibaie ve zcela fiktivní scéně, zatímco Ibai vytvořil srovnání své proměny po zhubnutí 65 kilogramů.
Co se skrývá za hyperrealistickými obrázky
Technologie vychází z modelu Image 3 společnosti Google, který se v systému Android objevil v říjnu loňského roku. Tento systém dokáže nativně generovat obrázky až do velikosti 1024×1024 pixelů a při práci s existujícími fotografiemi zachovává pozoruhodnou přesnost při zachování rysů obličeje. Image 3 využívá pokročilé neuronové sítě k interpretaci textových popisů a jejich převodu na detailní obrázky, což umožňuje řadu kreativních a komerčních aplikací.
Jednou z výhod Nano Banana je možnost konverzačních úprav. Pokud vás první výsledek nepřesvědčí, můžete požádat o konkrétní změny, aniž byste museli začínat od začátku. Chcete-li například změnit pozadí již vygenerovaného obrázku, jednoduše mu to řeknete a nástroj upraví pouze tento prvek. Tato funkce je užitečná zejména pro tvůrce obsahu, kteří chtějí rychle a efektivně přizpůsobit své obrázky.
Proces zahrnuje bezpečnostní filtry, které Google zavedl po kontroverzích z února 2024, kdy musel pozastavit generování obrázků lidí kvůli problémům s historickou zaujatostí. Systém nyní analyzuje obsah před vygenerováním finálního obrázku. Tyto filtry jsou navrženy tak, aby zabránily vytváření urážlivého nebo zavádějícího obsahu a zajistily, že vygenerované obrázky budou v souladu s normami komunity.
Pokud jde o dobu zpracování, generování jednoduchého obrázku trvá přibližně 8 sekund, zatímco složitější kompozice mohou trvat až 15 sekund. To není špatné, uvážíme-li, že součástí je automatická aplikace neviditelného vodoznaku SynthID, který identifikuje obsah jako syntetický. SynthID je technologie vyvinutá společností Google, která dokáže identifikovat obrázky vytvořené umělou inteligencí, a to i po jejich úpravě nebo komprimaci.
Co všechno umí Nano Banana
Nástroj nabízí několik stylů vykreslování: fotorealistický, ilustrační, olejomalba, akvarel a anime. Každý z nich používá specifické parametry základního modelu, aby byla zachována konzistence v rámci jeho kategorie, jak je podrobně popsáno v kompletních průvodcích generováním Gemini. Uživatelé tak mohou zkoumat různé umělecké styly a přizpůsobovat je svým specifickým potřebám.
Nedávné vylepšení umožňuje volbu výstupního formátu (čtverec, na výšku nebo na šířku), což uživatelé požadovali již od uvedení na trh. Tato funkce se objevila v říjnu a vyřešila jednu z hlavních stížností komunity, zejména těch, kteří vytvářejí obsah pro různé sociální sítě. Možnost upravit formátování obrázků usnadňuje vytváření obsahu optimalizovaného pro konkrétní platformy, jako je Instagram, TikTok nebo YouTube.

Zdroj: Youtube.com
Všechny obrázky nesou dva typy identifikace: viditelnou značku v pravém dolním rohu a SynthID, neviditelnou digitální značku vloženou do pixelů. Ta odolává kompresi JPEG a změně velikosti a zachovává sledovatelnost i po drobných úpravách. To má zásadní význam pro zachování integrity a autorství obrázků v digitálním prostředí, kde je manipulace s obrázky běžná.
Google slaví s novou AI úspěch
Čísla mluví sama za sebe: Gemini má 23 milionů registrovaných uživatelů a od svého veřejného spuštění vytvořil více než 500 milionů obrázků. Nástroj je k dispozici zdarma na systémech Android a iOS, ačkoli společnost Google neobjasnila, zda tento bezplatný model zachová vzhledem k vysokým výpočetním nákladům modelu Image 3. Bezplatná dostupnost byla klíčovým faktorem jeho rychlého přijetí, ale o budoucnosti tohoto obchodního modelu se teprve rozhodne.
Chcete-li Nano Banana používat, stačí si stáhnout aplikaci Gemini a začít experimentovat. Můžete nahrát svou fotografii a požádat o umístění vedle libovolné celebrity nebo vytvořit zcela nové scény od začátku. Klíčem k úspěchu je být konkrétní v pokynech: čím podrobnější budete, tím lepších výsledků dosáhnete. Přesné textové popisy jsou klíčem k získání snímků, které splní očekávání uživatele.