
Gemini konečně přichází s revoluční funkcí, kterou všichni očekávali!
2025-09-09
Autor: Ondřej
Dlouho očekávaná funkce nahrávání audií je tu!
Aplikace Gemini konečně splnila tajný sen svých uživatelů - nyní umožňuje nahrávat audio soubory! Jaký překvapivý obrat, když tato funkce už byla k dispozici v API celých dva roky a v AI Studiu fungovala od vydání modelu 2.5 Pro. Přesto se dlouho nedočkala svého místa v aplikaci.
Podle Googlu šlo o nejžádanější funkci vůbec. Kdo by nechtěl, aby mu AI přepsala hodinu řeči z meetingu nebo rozebrala podcast?
Jak to funguje?
Používání je velmi snadné. Stačí kliknout na ikonu plus v mobilní aplikaci a vybrat „Soubory“, nebo na webu zvolit „Nahrát soubory“. Gemini zvládne prakticky jakýkoliv audio formát – MP3, M4A, WAV a další. Pak jen stačí napsat, co s nahrávkou zamýšlíte.
Ale pozor! Bezplatní uživatelé mohou nahrávat maximálně 10 minut audia. S předplatným Google AI Pro nebo Ultra to už je 3 hodiny! Rozdíl, který byste měli zvážit, jestli pravidelně pracujete s delšími nahrávkami.
Co všechno můžete nahrávat?
Nahrávání audio souborů není jedinou novinkou. Gemini již dříve podporovalo nahrávání videí – 5 minut zdarma nebo hodinu s předplatným, maximálně do 2 GB. Zajímavé možnosti čekají také vývojáře:
- Složenky s kódem nebo GitHub repozitáře – až 5000 souborů do 100 MB.
- ZIP soubory – maximálně 10 souborů uvnitř.
- Ostatní formáty – jednotlivé soubory do 100 MB.
Celkem můžete do jednoho chatu nahrát až 10 souborů jakéhokoli formátu. Není to špatné, i když konkurence někdy nabízí víc.
Proč to trvalo tak dlouho?
Na Redditu se uživatelé právem ptají - proč byla funkce dostupná v API celé dva roky, ale nikdo se o ní nedozvěděl v aplikaci? Odpověď je pravděpodobně prostá – Google potřeboval zajistit dostatečnou výpočetní kapacitu pro miliony uživatelů. Zatímco vývojářům nabízíte novost v API, je daleko složitější ji zprovoznit pro masy.
Jak poznamenal jeden z uživatelů, problémy nenastávaly v modelu samotném, ale v uživatelském rozhraní aplikace. Google prostě potřeboval čas na implementaci, což je poněkud ostudné pro firmu, která neustále vychvalován své AI schopnosti.
Co říkají první dojmy?
Podle prvních ohlasů funkce překvapivě dobře funguje. Jeden uživatel zkusil analyzovat píseň s výrazným zkreslením a Gemini bez problémů rozpoznalo nástroje i text, i když občas s vtipnými přehlédnutími. Pro transkripci běžných nahrávek nebo analýzu podcastů by to mělo být více než dostatečné.
Samozřejmě ne vše funguje na 100% - někteří uživatelé hlásí problémy se zpracováním souborů. To je bohužel standardní problém u postupného zavádění nových funkcí od Google.
Hlavním pozitivem je, že funkce konečně existuje, byť s dvouletým zpožděním.
Kdy využijete novou funkci nahrávání v Gemini?
Přestože na redakčním Pixelu 10 Pro nebylo v době psaní článku možné funkci vyzkoušet, očekává se, že se to změní během několika hodin. Je jasné, že možnosti nahrávání audio souborů do Gemini udělají z této aplikace nepostradatelného pomocníka pro mnohé uživatele!