Stačí nahrát video a Gemini s ním dokáže komunikovat: dokáže ho shrnout nebo odpovědět na otázky k němu a ušetřit vám tak čas.
Společnost Google svého asistenta s umělou inteligencí stále zdokonaluje a s každou aktualizací je Gemini komplexnější a užitečnější. Nejnovější přírůstek přišel v tichosti, ale má velký potenciál: nyní můžete nahrávat videa a ptát se ho přímo na jejich obsah. Už žádné ruční procházení nebo vyhledávání minutu po minutě, abyste našli část, která vás zajímá. Gemini ji vidí, rozumí jí a odpoví vám.
Tento nový krok je výrazným vylepšením funkcí, které nástroj již nabízí, a navíc je dostupný všem. Nezáleží na tom, zda používáte bezplatnou nebo placenou verzi, ani na tom, zda používáte systém Android, iOS nebo prohlížeč. Nyní je k dispozici i vám.
Funkce, která hodně přidává a málo komplikuje
Dosud Gemini uměla analyzovat dokumenty a fotografie a odpovídat na otázky k nim. Velmi užitečné, to ano, ale videa byla stále neprobádaným územím. To se změnilo, protože Google rozšířil schopnosti asistenta tak, že dokáže zpracovávat i audiovizuální obsah.
K čemu je dobrý? Prakticky ke všemu, na co si vzpomenete. Můžete nahrát vysvětlující video, ukázku z online kurzu, recept nebo pracovní prezentaci. Pak se ho zeptáte, kde je něco zmíněno, nebo ho požádáte, aby to shrnul. A to je vše, Gemini vám poskytne odpověď, aniž byste museli sledovat celé video.
Jak jej používat krok za krokem
Používání této nové funkce s umělou inteligencí Google je zcela intuitivní. Stačí postupovat podle několika jednoduchých kroků:
- Otevřete aplikaci Gemini v mobilním telefonu nebo k ní přistupte z webu.
- Klepněte na pole, do kterého chcete napsat zprávu.
- Stiskněte symbol + a vyberte možnost Galerie nebo Soubory.
- Vyberte video, které chcete analyzovat.
- V chatu se zobrazí náhled videa.
- Napište, co potřebujete vědět (shrnutí videa, co je řečeno na začátku, výčet klíčových bodů atd.), a stiskněte tlačítko Odeslat.
Během několika sekund Gemini analyzuje obsah, interpretuje zvuk a poskytne vám jasnou odpověď. Můžete pokračovat v pokládání otázek ke stejnému videu, aniž byste ho museli znovu nahrávat, protože konverzace zachovává kontext.
Přestože Gemini dokáže zpracovat širokou škálu videí, nejpřesnějších výsledků dosáhnete s krátkým, ostrým obsahem a kvalitním zvukem. Video nemusí mít titulky ani nemusí být speciálně sestříhané: pokud zní dobře a má určitou souvislost, umělá inteligence bude vědět, co má dělat.
Navíc maximální doba, kterou prozatím akceptuje, je pět minut. Předpokládáme, že v budoucích aktualizacích bude tato doba prodloužena.
Budoucnost interakce s videem
Schopnost Gemini porozumět videu představuje nejen významný pokrok v technologii umělé inteligence, ale otevírá také nové možnosti vzdělávání a zábavy. Například studenti mohou tento nástroj používat k rychlému prohlížení nahraných přednášek, zatímco tvůrci obsahu mohou optimalizovat svůj pracovní postup díky rychlému shrnutí svých nahrávek.
Z profesionálního hlediska může být tato technologie cenným zdrojem pro společnosti, které chtějí analyzovat velké objemy audiovizuálního obsahu, jako jsou nahrané schůzky nebo prezentace produktů. Zkrácením času potřebného ke zpracování těchto informací mohou organizace přijímat rychlejší rozhodnutí založená na datech.
Časem Google pravděpodobně rozšíří možnosti Gemini o delší videa a případně integruje další funkce, jako je detekce emocí nebo identifikace objektů ve videích. Díky těmto vylepšením by se nástroj mohl stát ještě cennějším pro celou řadu uživatelů.