ElevenLabs v3: Když vygenerovaný hlas zní tak, jako by mluvil opravdový člověk

ElevenLabs posouvá syntetický hlas blíž k tomu, co známe z lidské řeči. Výsledky překvapí i cyniky.

Jan Kudláček | Nexus Mag

Jan Kudláček

Aktuality

6. června 2025

ElevenLabs, ElevenLabs v3, AI voice, syntetický hlas, generování hlasu, umělá inteligence, AI voice model, voiceover AI, kreativní technologie, audio AI, nový model ElevenLabs, přirozený hlas AI, AI dabing, AI přednes, technologie hlasu, syntetizátor řeči, audioknihy AI, voice model 2025, AI v marketingu, budoucnost zvuku, nexus mag

V ElevenLabs strávili poslední měsíce laděním něčeho, co na první pohled vypadá jako další update. Nový hlasový model „v3“, který aktuálně spustili v alpha režimu, ale není o vyšší kvalitě zvuku. Je o změně tónu, rytmu, výrazů. Nečte text, ale snaží se ho interpretovat. Drobnosti jako nepatrné ticho mezi větami, změna tempa, nebo úsměv ve větě, která si o něj říká – tohle všechno začíná v3 zvládat s až nepříjemnou přirozeností. Vyzkoušej si nový model hned teď a přehraj si tento článek! 🤩

nexus mag, AI hlas, syntetický hlas, elevenlabs, elevenlabs v3

Klikni nahoře u autora pod názvem článku na tlačítko PLAY a poslechni si celý článek

Kontext, emoce, nuance, to je oč tu běží

Autoři přidali možnost zadávat výrazy pomocí tagů jako „laughs“, „shouting“, nebo „sighs“, které systém chápe nejen technicky, ale i v kontextu celého textu. Když si tedy poslechneš generovanou pasáž, neslyšíš robotický přednes. Spíš to připomíná dabéra, který čte scénář a chápe, co tím chtěl autor říct. A přesně tady to začíná být zajímavé. Nejen pro podcasty nebo audioknihy, ale třeba i pro reklamní voiceovery, trailery nebo videoeseje.

Multi-jazyková plynulost nového modelu v3

Co se ElevenLabs daří držet, je věrohodnost napříč jazyky. Více než 70 jazyků a možnost plynulého přepínání hlasů v rámci jednoho výstupu nejsou novinkou, ale teprve teď to působí, jako by si spolu ty hlasy opravdu „hrály“. To usnadní práci hlavně tam, kde se dřív stříhalo a skládalo ručně. Dialogy, dramatizace, hry a interaktivní obsah.

Prioritní je obsah, ne reakce v reálném čase

Alpha verze je zatím dostupná jen přes jejich webové rozhraní. Na API si vývojáři musí chvíli počkat. ElevenLabs navíc upozorňuje, že pokud potřebuješ rychlou odezvu (např. pro voice chatboty), jsou pořád lepší jiné jejich modely – Flash nebo Turbo. V3 míří spíš na ty, kdo tvoří obsah, kde mluvené slovo váhu. Ne jako funkce, ale jako médium.

Prostě hlas, který doopravdy něco říká a vtáhne tě do děje

V redakci jsme z toho trochu nesví. Ne proto, že bychom se báli o svoje hlasy, ale protože přichází moment, kdy i „umělý“ hlas dokáže něco sdělit. A to je výzva. Protože pak už se neptáš, jestli to je AI. Ale jestli tě to zajímá.

Lucie Zitterbartová, Nexus Mag, banner

Doporučujeme přečíst: