ElevenLabs v3: Když vygenerovaný hlas zní tak, jako by mluvil opravdový člověk
ElevenLabs posouvá syntetický hlas blíž k tomu, co známe z lidské řeči. Výsledky překvapí i cyniky.

Jan Kudláček
Aktuality
6. června 2025

V ElevenLabs strávili poslední měsíce laděním něčeho, co na první pohled vypadá jako další update. Nový hlasový model „v3“, který aktuálně spustili v alpha režimu, ale není o vyšší kvalitě zvuku. Je o změně tónu, rytmu, výrazů. Nečte text, ale snaží se ho interpretovat. Drobnosti jako nepatrné ticho mezi větami, změna tempa, nebo úsměv ve větě, která si o něj říká – tohle všechno začíná v3 zvládat s až nepříjemnou přirozeností.
Vyzkoušej si nový model hned teď a přehraj si tento článek! 🤩

Klikni nahoře u autora pod názvem článku na tlačítko PLAY a poslechni si celý článek
Kontext, emoce, nuance, to je oč tu běží
Autoři přidali možnost zadávat výrazy pomocí tagů jako „laughs
“, „shouting
“, nebo „sighs
“, které systém chápe nejen technicky, ale i v kontextu celého textu. Když si tedy poslechneš generovanou pasáž, neslyšíš
robotický přednes. Spíš to připomíná dabéra, který čte scénář a chápe, co tím chtěl autor říct. A přesně tady to začíná být zajímavé. Nejen pro podcasty nebo audioknihy, ale třeba i pro reklamní voiceovery, trailery nebo videoeseje.
Multi-jazyková plynulost nového modelu v3
Co se ElevenLabs daří držet, je věrohodnost napříč jazyky. Více než 70 jazyků
a možnost plynulého
přepínání hlasů v rámci jednoho výstupu nejsou novinkou, ale teprve teď to působí, jako by si spolu ty hlasy opravdu „hrály“. To usnadní
práci hlavně tam, kde se dřív stříhalo a skládalo ručně. Dialogy, dramatizace, hry a interaktivní obsah.
Prioritní je obsah, ne reakce v reálném čase
Alpha verze je zatím dostupná jen přes jejich webové rozhraní. Na API si vývojáři musí
chvíli počkat. ElevenLabs navíc upozorňuje, že pokud potřebuješ rychlou odezvu (např. pro voice chatboty), jsou pořád lepší jiné
jejich modely – Flash nebo Turbo. V3 míří spíš na ty, kdo tvoří obsah, kde má
mluvené slovo váhu. Ne jako funkce, ale jako médium.
Prostě hlas, který doopravdy něco říká a vtáhne tě do děje
V redakci jsme z toho trochu nesví. Ne proto, že bychom se báli o svoje hlasy, ale protože přichází moment, kdy i „umělý“ hlas dokáže něco sdělit. A to je výzva
. Protože pak už se neptáš, jestli to je AI. Ale jestli tě to zajímá.