Krok ten stanowi ważny sygnał na rynku: znane dotychczas ze swoich translatorów tekstu przedsiębiorstwo z Kolonii wchodzi znacznie głębiej w obszar tłumaczeń głosowych realizowanych w czasie rzeczywistym. Dzięki nowej technologii DeepL zamierza jeszcze skuteczniej obsługiwać wydarzenia masowe, sportowe oraz konferencyjne, dostarczając uczestnikom błyskawiczny przekaz audio na niespotykaną wcześniej skalę.
Od potęgi tekstu do rozwoju w formatach głosowych
Firma DeepL, która podczas ostatnich działań rynkowych i rund inwestycyjnych osiągnęła wycenę na poziomie około 2 mld dolarów, zbudowała swoją początkową pozycję w oparciu o dostarczanie narzędzi AI do translacji oraz redagowania tekstu. Obecnie z jej korporacyjnych usług korzysta globalnie ponad 200 tysięcy klientów biznesowych. Najnowsze komunikaty spółki wskazują jednak niezwykle wyraźnie, że ambicje przedsiębiorstwa odważnie sięgają innowacyjnego segmentu tłumaczeń voice-to-voice: wchłonięcie podmiotu pochodzącego z zachodniego wybrzeża Stanów Zjednoczonych idealnie wpisuje się w ten plan rozwoju.
Dla branżowych obserwatorów rynku czas tej głośnej operacji jest szczególnie interesujący. Przejęcie Mixhalo następuje ledwie miesiąc po tym, jak w DeepL przeprowadzono trudny proces wewnętrznej restrukturyzacji, w wyniku którego z firmą zmuszonych było pożegnać się około 250 pracowników. Pomimo tych głośnych zwolnień, najnowsza gigantyczna inwestycja pokazuje chęć szybkiego otwaria na zupełnie nowe rynki. Co niezwykle ważne z perspektywy infrastrukturalnej: dzięki tej konkretnej akwizycji technologiczna marka z Niemiec stworzy swoje pierwsze oficjalne biuro, które będzie zlokalizowane w kalifornijskim San Francisco.
Sieć dźwiękowa wykorzystywana na masowych imprezach
Amerykański startup Mixhalo został powołany do życia w 2016 roku przez trio założycieli, na które składało się dwóch muzyków oraz jeden przedstawiciel świata technologii. Od samego początku funkcjonowania tego zespołu ich głównym celem biznesowym było stworzenie zaawansowanego i opartego na sztucznej inteligencji systemu, bezproblemowo dostarczającego krystaliczny dźwięk w czasie rzeczywistym uczestnikom wszelkich masowych imprez odbywających się na żywo, operującego również w wielu różnych językach jednocześnie.
Cały proces obsługi dedykowanej aplikacji z punktu widzenia fizycznego uczestnika zaprojektowano z ogromnym naciskiem na wygodę. Widz lub słuchacz instaluje odpowiednie, lekkie oprogramowanie na prywatnym smartfonie, bezprzewodowo łączy się z przygotowaną siecią wybranego koncertu czy konferencji, po czym po prostu wkłada własne słuchawki. Otrzymuje przez to absolutną gwarancję uzyskania wysokiej jakości dźwięku bez najmniejszego względu na to, w którym oddalonym sektorze wielkiej areny jest aktualnie usadowiony. Nowoczesne rozwiązania dostarczane przez Mixhalo były na przestrzeni lat wielokrotnie wykorzystywane podczas głośnych koncertów tak uznanych na świecie marek i twórców jak: formacja Metallica oraz muzyk Sting. System ten regularnie wdrażano także na wielkich wydarzeniach sportowych obsługiwanych przez amerykańską ligę MLB, a także stowarzyszenie NASCAR. Poza tym elastyczna platforma szybko przyciągnęła uwagę potężnych i bogatych korporacji, ponieważ do zaszczytnego grona jej stałych klientów należą takie globalne marki komercyjne jak: telekomunikacyjny operator Verizon oraz popularna sieć T-Mobile.
Innowacyjny potencjał kalifornijskiej spółki już na wiele lat przed akwizycją bardzo mocno docenili liczni inwestorzy. Startup sprawnie zebrał wieloetapowe fundusze na łączną kwotę blisko 40 mln dolarów. Pierwszą wczesną rundę obficie wsparł swoim prywatnym kapitałem znany muzyk Pharrell Williams. W następnych, równie dynamicznych latach obiecujące przedsięwzięcie stabilnie finansowały technologiczne fundusze inwestycyjne o bardzo rozpoznawalnej rynkowej marce, do których zaliczają się między innymi takie solidne organizacje jak: podmiot Founders Fund, fundusz Fortress Investment oraz kalifornijska instytucja Cowboy Ventures.
Integracja infrastruktury i komunikacja bez opóźnień
Sensownie motywując wielką chęć dokonania tego przejęcia, oficjalni przedstawiciele firmy DeepL zwracają szczególną uwagę na zbieżność dotychczasowych dróg obu firm. Amerykański zespół programistyczny tuż przed szeroko komentowaną fuzją niezwykle aktywnie polegał na szybkich algorytmach niemieckiego gracza, w pełni świadomie traktując aplikację rodem z Kolonii jako swojego podstawowego i całkowicie głównego zewnętrznego dostawcę translacji. Publicznie ogłoszona transakcja sprawi w konsekwencji, że pionierskie DeepL wkrótce na stałe i bardzo głęboko zintegruje obcą infrastrukturę audio o tak zwanych ultra-niskich opóźnieniach bezpośrednio ze swoją globalną ofertą dedykowaną dla największych światowych wydarzeń. Zgodnie z tym co otwarcie przekazano: odważne wdrożenie to pozwoli na całkowicie jasne i bezbłędne cyfrowe przekazywanie tłumaczonej na bieżąco mowy, a także tworzonych automatycznie napisów. Nowy inteligentny i połączony organizacyjnie system będzie można powszechnie stosować zarówno na dyskretnych, kameralnych spotkaniach na żywo, jak i gigantycznych imprezach gromadzących naraz dziesiątki tysięcy podekscytowanych uczestników. Kluczowym inżynieryjnym wyróżnikiem przejętej technologii pozostaje jednak udowodnione w praktyce doskonałe zachowanie w pełni naturalnego tempa komunikacji międzyludzkiej i niezbędnej leksykalnie płynności mowy.
Kluczową rynkową informację tę bardzo optymistycznie komentuje bezpośredni założyciel oraz główny dyrektor generalny DeepL, Jarek Kutylowski. W swoim szeroko cytowanym oficjalnym komunikacie prasowym stanowczo podkreśla imponujący sukces swoich nowych, amerykańskich współpracowników: wskazuje on dobitnie, że zespół ze Stanów Zjednoczonych zdołał niezwykle skutecznie i kreatywnie rozwiązać wreszcie jeden z odwiecznie najtrudniejszych problemów dręczących dotychczas całą profesjonalną obsługę sprzętu audio wykorzystywanego na żywo. Spektakularnym technicznym dokonaniem tym stało się błyskawiczne dostarczanie wysoce wiernego, czystego dźwięku do wielu tysięcy osób naraz przy równoległym zachowaniu wskaźnika poziomu równego w zasadzie całkowicie zerowemu opóźnieniu technologicznemu.
Wpływowy CEO niemieckiego potężnego przedsiębiorstwa zarazem pewnie i otwarcie kreśli bardzo precyzyjną wizję świetlanej technologicznej przyszłości dla obydwu świeżo połączonych korporacyjnymi więzami firm. Kutylowski szczegółowo i analitycznie tłumaczy nową koncepcję: te połączone ze sobą wyspecjalizowane struktury zyskały niezwykle istotne i doniosłe zadanie polegające na szybkim zbudowaniu w czasie rzeczywistym potężnej i zaawansowanej warstwy sztucznej inteligencji służącej bezpośrednio i na stałe ogólnoświatowej komunikacji międzyludzkiej. Wielowymiarowe rozwiązanie to w założeniach pozwoli poszczególnym ludziom pochodzącym ze wszystkich oddalonych od siebie stron tego świata po prostu wspaniale rozumieć się wzajemnie w wysoce elastyczny i naturalny sposób, bez najmniejszego względu na niesprzyjające lub zmienne środowisko ich biznesowych czy prywatnych interakcji. Ulepszone programistyczne narzędzia sprawdzą się wkrótce chociażby podczas standardowych, codziennych narad przeprowadzanych w zamkniętych przestrzeniach w trakcie rutynowych spotkań zespołowych, na odbywających się zdalnie sprzedażowych połączeniach audio z docelowymi firmowymi klientami, a ostatecznie także: na absolutnie wszystkich liczących się gigantycznych i masowych imprezach oraz prestiżowych, kluczowych międzynarodowych zjazdach branżowych czy głośnych wydarzeniach kulturalno-rozrywkowych.