DeepL: twórcy programu tłumaczeniowego, którzy postawili wyzwanie Google

Dodane: 22.04.2022

Hanna Baster

Udostępnij:

Jak w przeciągu czterech lat zespołowi DeepL udało się zbudować tak konkurencyjny produkt? O czynnikach, które złożyły się na sukces spółki, opowiedział nam jej CEO, Jarosław Kutyłowski.

DeepL to przykład dużego startupowego sukcesu: obecni w UE, Stanach Zjednoczonych, Kanadzie i Japonii, zbierający świetne recenzje, m.in. takiej od TechCrunch: „Giganci technologiczni tacy jak Google, Microsoft czy Facebook wykorzystują proces uczenia maszynowego do tłumaczenia, ale niewielka firma DeepL przebiła ich wszystkich i wysoko podniosła poprzeczkę w tej dziedzinie. Jej narzędzie do tłumaczenia jest równie szybkie jak u konkurencji, ale o wiele dokładniejsze i bardziej szczegółowe od tych, które próbowaliśmy”.

Jak (twierdzenie zgodnie z opiniami zamieszczonymi na Waszej stronie) osiągnęliście lepsze wyniki niż Google Translate? Jak to się robi bez zasobów, którymi rozporządza potężna korporacja?

W DeepL mamy naprawdę świetny zespół i kulturę, która skupia się na osiąganiu najlepszych możliwych wyników w tłumaczeniu. Ta koncentracja jest tym, co zwykle pozwala startupom pokonać graczy o ugruntowanej pozycji na rynku, a także jest kluczem do sukcesu naszej spółki – mamy bardzo jasną wizję i staramy się dbać o to, aby wszystkie nasze wysiłki zmierzały do jej urzeczywistnienia. Tak więc skupienie, determinacja i posiadanie najlepszych możliwych ludzi pomaga konkurować nawet z bardzo zasobnymi graczami.

Drugą ważną kwestią jest czas: kiedy uruchamialiśmy stronę DeepL, technologiczny krajobraz tłumaczeń maszynowych znajdował się w punkcie zwrotnym. W momencie kiedy wchodziliśmy na rynek, stare rozwiązania (takie jak statystyczne tłumaczenie maszynowe) właśnie zaczęły ustępować miejsca rozwiązaniom opartym na sieciach neuronowych – w ten sposób wyrównały się szanse.

W tym momencie macie ugruntowaną pozycję na rynku, jednak na początku, jak każdy startup, musieliście walczyć o środki. W jaki sposób finansowaliście swoje działania w początkowym okresie funkcjonowania?

Serwis DeepL jest obecnie dochodowy, jesteśmy już poza punktem, w którym musimy szukać zewnętrznego finansowania. W skali globalnej jest to jednak dość rzadka sytuacja: nie znam zbyt wielu firm, które przeszły przez taki gwałtowny wzrost i tak wcześnie osiągnęły rentowność. Można to osiągnąć tylko dzięki bardzo ścisłej dyscyplinie budżetowej i … szczęściu, że ma się produkt, który rozwija się wiralnie bez zbyt dużych nakładów na marketing i sprzedaż. Ponadto bardzo szybko staraliśmy się zweryfikować naszą ofertę na rynku: zaledwie kilka miesięcy po wprowadzeniu darmowej usługi, uruchomiliśmy płatne DeepL Pro, tak abyśmy mogli jak najszybciej zacząć generować przychody.

Przekładając nasze doświadczenia na porady dla startupów powiedzielibyśmy: po pierwsze minimalizuj koszty na początku tak bardzo, jak tylko możesz, i staraj się zajść jak najdalej bez finansowania zewnętrznego, bo posiadanie produktu tak dojrzałego, jak to tylko możliwe, pozwoli Ci na lepszy dostęp do rynku finansowania. Po drugie utrzymuj dyscyplinę budżetową i jak najwcześniej wprowadź swój produkt na rynek oraz rozpocznij badanie dopasowania produktu do rynku. To pozwoli na jak najszybsze generowanie przychodów, ale także na sprawdzenie, co działa, a co nie – zmniejszasz ryzyko, że nie uda się znaleźć rynku dla danego rozwiązania.

W czym tkwi główna trudność w tworzeniu programów tłumaczeniowych, czy chodzi o wieloznaczność wyrazów?

Nie chodzi tu tylko o różne znaczenia poszczególnych słów, ale o cały proces tłumaczenia. Tłumacząc samemu, a nie chcąc, aby tłumaczenie było dosłowne i „słowo po słowie”, trzeba najpierw uchwycić ogólny sens zdania i zastanowić się, jak przetłumaczyć to znaczenie na inny język (co może wymagać zupełnie innej gramatyki, dzielenia zdania lub użycia wielu innych metod lingwistycznych). Dopiero potem należy skupić się na poszczególnych słowach i spróbować dokończyć tłumaczenie, od czasu do czasu wracając do oryginalnego zdania, aby sprawdzić poszczególne pojęcia. I to tutaj właśnie metody oparte na sztucznej inteligencji (z wykorzystaniem sieci neuronowych) ujawniają swoją przewagę: modele, których obecnie używamy, potrafią uczyć się i abstrahować do tego stopnia, że pozwala im to podążać za naturalnym modelem, a nie tylko tłumaczyć sekwencyjnie. W rezultacie znacznie poprawia się zdolność do formułowania tłumaczeń, które są nie tylko poprawne, ale także dobrze i naturalnie brzmią w języku docelowym.

Możemy nawet pójść dalej w tym myśleniu (co robi DeepL) i nie tylko brać pod uwagę jedno zdanie, ale całe akapity naraz. Pozwala to na poprawę jakości tłumaczenia, ponieważ rozwiązuje niejednoznaczności, których nie można rozwiązać na poziomie zdań – ale stanowi też wyzwanie pod względem złożoności obliczeniowej.

Ile różnych możliwości musi „rozważyć” program tłumaczeniowy, zanim zdecyduje się na wyświetlenie ostatecznego tłumaczenia, jaki to rząd wielkości?

Trudno jednoznacznie stwierdzić, ponieważ sieci neuronowe nie działają w ten sposób. Można jednak powiedzieć, że tłumaczenie jest bardzo wymagającym obliczeniowo zadaniem: mimo że nasza baza użytkowników jest duża i w każdej sekundzie wykonujemy ogromną liczbę tłumaczeń, nasze zapotrzebowanie na energię do zasilania serwerów jest rzędu megawatów – są to liczby typowe raczej dla zakładów przemysłowych, a nie dla firm startupów z branży IT. Pokazuje to, jak wiele obliczeń (a więc i mocy) potrzeba do wykorzystania rozwiązań opartych na sztucznej inteligencji. Do zasilania naszych silników tłumaczeniowych używamy w 100% energii odnawialnej.

Jakie rodzaje dokumentów nie mogą być jeszcze w tym momencie tłumaczone przez programy, a muszą przez fizycznego tłumacza?

To zależy bardzo mocno od wymagań użytkownika. W zależności od dalszego przeznaczenia dokumentu, dokument przetłumaczony maszynowo może być od razu wykorzystany lub może wymagać korekty przez specjalistę z danej dziedziny, a nawet odpowiedniego poświadczenia. Dotyczy to zarówno dokumentów prawnych, jak i medycznych. W praktyce jednak wielu naszych użytkowników, którzy mieszkają za granicą, tłumaczy teksty prawne i medyczne na swój język ojczysty, aby móc lepiej zrozumieć te dokumenty.

Swoją siedzibę macie w Niemczech, wykorzystam więc okazję i spytam Cię o porady dla startupów, które chciałyby poszerzyć swoją działalność o ten rynek. Dwie główne rzeczy o których powinni pamiętać, to …?

Trudno jest napisać „przepis” na sukces, ponieważ każda firma, każdy rynek i każdy produkt są zupełnie inne. Ale gdybym miał wymienić dwie rzeczy, na które warto zwrócić uwagę, opierając się na naszym doświadczeniu, powiedziałbym:

  • Skup się na produkcie! Myśl rozsądnie o tym, czego będzie potrzebował rynek i nie daj się rozproszyć przez indywidualnych klientów. Jeśli chcesz osiągnąć prawdziwy sukces, ważne jest, by zbudować skalowalny produkt, który sam w sobie przemówi do dużej grupy klientów.
    Buduj swój zespół i inwestuj w kluczowe wartości oraz ludzi, którzy z tobą pracują. Musisz znaleźć najlepszych ludzi i zainwestować w ich rozwój oraz wspaniałe środowisko pracy.
  • To, co znacznie ułatwia start, to zbudowanie produktu, który najpierw przemawia do indywidualnych użytkowników: tak zaczynały firmy o strategii bottom-up (jak DeepL, Dropbox, Figma). Uzyskanie pierwszych przychodów od indywidualnych użytkowników (a nie od dużych firm) jest o wiele łatwiejsze, a ci użytkownicy stają się na dłuższą metę twoimi zwolennikami w firmach. Choć oczywiście nie jest to jedyna możliwa strategia, znacznie ułatwia ona rozpoczęcie działalności bez zbyt dużych funduszy i bez kontaktów z klientami korporacyjnymi.

Ostatnia uwaga: ogólnie rzecz biorąc, dobrze ugruntowane gospodarki w Europie (jak Niemcy) są nieco bardziej skomplikowanymi rynkami dla rozwiązań B2B, ponieważ firmy mają większą niechęć do „podejmowania ryzyka” i prawdopodobnie skłaniają się ku uznanym graczom na rynku (którymi ty na początku nie będziesz). Dlatego stawianie pierwszych kroków może być łatwiejsze w krajach, które są bardziej otwarte na nowych graczy.

Jakie Waszym zdaniem są perspektywy wdrożenia rozwiązań takich jak DeepL przy obsłudze uchodźców w Polsce?

Kwestia barier językowych zawsze była jednym z największych wyzwań dla ludzkości – nie tylko w ekstremalnych sytuacjach, takich jak wojna na Ukrainie. Pokonywanie tych barier jest tym, co nas motywuje – dlatego też udostępniamy darmowy serwis. Wierzę wiec, że DeepL może pomóc w komunikacji z uchodźcami: albo poprzez darmowy serwis, albo poprzez DeepL Pro, gdy wymaga tego sytuacja. Chciałbym jednak zaznaczyć, że DeepL nie obsługuje obecnie języka ukraińskiego. Pracujemy nad tym, ale zapewnienie takiej jakości, jaką chcemy zaoferować naszym użytkownikom, nie jest łatwe i może zająć jeszcze trochę czasu.