ElevenLabs wprowadził nowy model generacji głosu, który obsługuje 30 języków

Dodane:

Informacja prasowa Informacja prasowa

ElevenLabs wprowadził nowy model generacji głosu, który obsługuje 30 języków

Udostępnij:

Nowy model generacji gÅ‚osu umożliwi firmom medialnym, twórcom gier, wydawcom oraz niezależnym twórcom z caÅ‚ego Å›wiata poprawienie dostÄ™pnoÅ›ci swoich treÅ›ci dziÄ™ki „bogatemu emocjonalnie” dźwiÄ™kowi sztucznej inteligencji w 30 jÄ™zykach. Nowe funkcje, wprowadzone od czasu uruchomienia platformy w styczniu, oznaczajÄ… również oficjalne zakoÅ„czenie fazy beta platformy.

Najnowsza funkcjonalność – Eleven Multilingual v2 – umożliwi tworzenie treści dźwiękowych na rynki międzynarodowe w Europie, Azji i na Bliskim Wschodzie. ElevenLabs przez ostatnie 18 miesięcy analizował wskaźniki ludzkiego mówienia, budując nowe mechanizmy do rozumienia kontekstu i wyrażania emocji w generowaniu mowy, a także syntezując nowe, unikalne głosy.

Jednocześnie, niezależnie od tego, czy używany jest głos syntetyczny czy sklonowany, unikalne cechy głosowe mówcy są zachowywane we wszystkich językach, włącznie z ich pierwotnym akcentem. Oznacza to, że ten sam głos można wykorzystać do ożywienia treści w 30 różnych językach.

Aktualizacja produktu, udostępniona wraz z dodatkowymi funkcjami zwiększającymi bezpieczeństwo, umożliwia użytkownikom stworzenie cyfrowej kopii swojego własnego głosu; takiej, która jest praktycznie nie do odróżnienia od oryginału. 

Jakie języki są dostępne w Eleven Multilingual v2?

Wspierane języki obejmują teraz: koreański, holenderski, turecki, szwedzki, indonezyjski, wietnamski, filipiński, ukraiński, grecki, czeski, fiński, rumuński, duński, bułgarski, malajski, węgierski, norweski, słowacki, chorwacki, klasyczny arabski, tamilski, angielski, polski, niemiecki, hiszpański, francuski, włoski, hindi i portugalski.

Koniec fazy beta

Po niedawnych wprowadzeniach funkcji i trwających udoskonaleniach platformy, ElevenLabs potwierdziło także dzisiaj, że platforma oficjalnie wychodzi z fazy beta. 

Patrząc w przyszłość, ElevenLabs planuje wprowadzić mechanizm, który umożliwi użytkownikom dzielenie się głosami na platformie i czerpanie korzyści z rozwoju nowych dźwięków, sprzyjając możliwościom współpracy między ludźmi a sztuczną inteligencją.

– ElevenLabs powstało z marzeń o uczynieniu wszystkich treści powszechnie dostępnymi w dowolnym języku i w dowolnym głosie. Dzięki wydaniu Eleven Multilingual v2, zbliżamy się krok bliżej do spełnienia tego marzenia i udostępnienia głosów sztucznej inteligencji o jakości ludzkiej w każdym dialekcie. Nasze narzędzia do generowania mowy z tekstu przynoszą twórcom z całego świata zdolności do tworzenia wysokiej jakości dźwięków mówionych. Te korzyści teraz rozciągają się na zastosowania wielojęzyczne obejmujące prawie 30 języków. Ostatecznie mamy nadzieję, że dzięki pomocy sztucznej inteligencji dołączymy jeszcze więcej języków i głosów, eliminując bariery językowe treści. W ElevenLabs wierzymy, że te skoki w dostępności w ostatecznym rozrachunku sprzyjać będą większej kreatywności, innowacyjności i różnorodności – mówi Mati Staniszewski, CEO i współzałożyciel ElevenLabs.

Kto korzysta z rozwiÄ…zania?

Instytucje edukacyjne mają teraz możliwość dostarczenia uczącym się dokładnych treści dźwiękowych w docelowych językach w czasie rzeczywistym, wzmacniając zrozumienie języka oraz umiejętności wymowy, a także dostosowując się do różnych stylów nauczania i potrzeb edukacyjnych międzynarodowych studentów.

Twórcy wszelkiego rodzaju mogą korzystać z narzędzia ElevenLabs, aby poprawić dostępność treści dla osób z zaburzeniami wzroku lub dodatkowymi potrzebami edukacyjnymi, uzupełniając treść wizualną mową dostępną w wielu językach.

Technologia ta została już zaakceptowana w wielu dziedzinach twórczych i sektorach, w tym umożliwiając niezależnym autorom tworzenie audiobooków, dubbingowanie drugoplanowych postaci w grach wideo, wspieranie osób niewidomych w dostępie do treści pisanych online oraz tworzenie pierwszego na świecie kanału radiowego z wykorzystaniem sztucznej inteligencji. ElevenLabs nawiązał także współpracę z różnymi twórcami treści i studiami, w tym z generatorem wideo AI D-ID, jednym z największych na świecie wydawców audiobooków Storytel, platformą wideo naukowym ScienceCast, której narzędzie do generowania wideo skraca artykuły naukowe publikowane na arXiv, czołową globalną platformą twórców treści TheSoul Publishing, twórcami gier takimi jak Embark Studios i Paradox Interactive oraz platformą medialną MNTN.

 

ElevenLabs zbiera 19 mln dolarów w rundzie A i pomija seed. Wśród inwestorów Andreessen Horowitz