Polska jest kopalnią talentów dla branży AI

– Wszystkie wielkie mocarstwa inwestują w AI. To jest coś, w co jeśli nie zainwestujemy teraz, to bardzo wiele stracimy. Zostaniemy w tyle. To jest właściwie wyścig zbrojeń – komentuje Krzysztof Sopyła, współwłaściel firmy Ermlab.

Podczas tegorocznego Infoshare mieliśmy okazję porozmawiać z Krzysztofem Sopyłą, współwłaścicielem firmy Ermlab oraz współtwórcą takich projektów jak codoczytania.pl (Literacka sp. z o.o.) , czy GoodWrite.it (Ermlab Software). Krzysztof jest specjalistą w zakresie uczenia maszynowego, obronił również doktorat z zakresu sztucznej inteligencji.

Zapytaliśmy go o projekty, nad którymi obecnie pracuje oraz o to, czy powinniśmy się obawiać tego, że roboty zdominują świat i dlaczego strategia związana ze sztuczną inteligencją jest dla Polski ważna.

Projekty, które współtworzysz to CoDoCzytania.pl, czyli narzędzie do rekomendacji książek i i GoodWrite.it dodatek do poprawy błędów . Myślisz, że sztuczna inteligencja zastąpi kiedyś krytyków i recenzentów?

Nie zastąpi. W ramach GoodWrite, pracujemy nad narzędziami, które mają wspierać dziennikarzy, blogerów i osoby piszące. To narzędzie ma za zadanie wyłapać błędy, poprawić styl, przeredagować skomplikowane zdania, określić stopień przyswajalności tekstu dla potencjalnego czytelnika. Tak więc na pewno sztuczna inteligencja nie zastąpi dziennikarzy, a raczej wspomoże i ułatwi im pracę.

Czyli GoodWrite to coś więcej niż spell checker, a CoDoCzytania (Literacka)?

W Literackiej robimy narzędzia typowo do rekomendacji. Bazujemy na tekście książek, czyli wyłapujemy z tekstu wydźwięk książki i oceniamy na ile jest ona romantyczna, fantastyczna, historyczna, poważna, erotyczna i tak dalej. Na tej podstawie tworzymy algorytmy rekomendacji. Użytkownik naszego rozwiązania może dzięki temu dostać spersonalizowaną rekomendację, w zależności od tego, na jaką książkę ma ochotę w danym momencie.

Skąd w ogóle pomysł, żeby wejść akurat w tę branżę?

To były dwie osobne historie. Jestem zaangażowany w dwóch firmach, jedna to Ermlab Software, gdzie pracujemy nad uczeniem maszynowym, a druga to właśnie Literacka. Pomysł na GoodWrite narodził się z własnych problemów. Pisze bloga tak więc męczę się przy pisaniu, wielokrotnie prosiłem żonę żeby sprawdzała mi literówki, styl i to jak dany tekst się czyta. Żona również pisze bloga. W związku z czym obydwoje mieliśmy podobne problemy. Pomyśleliśmy, że skoro i tak pracujemy z tekstem i robimy w ramach firmy różnego rodzaju analizy tekstów, czy algorytmy, które coś z tego tekstu wyciągają, to może w końcu sami zrobimy produkt, który będzie pomagał dobrze pisać.

Natomiast w Literackiej i projekcie CoDoCzytania.pl założycielkami są Małgorzata Sieniewicz i Urszula Witkowska i to one przygarnęły mnie pod swoje skrzydła. One mają duże doświadczenie literackie, w prowadzeniu księgarni, pracy z bibliotekami i ogólnie z czytelnictwem. Spotkaliśmy się na początku na gruncie biznesowym, to znaczy my jako firma Ermlab dostarczaliśmy im pewne oprogramowanie. Współpraca ta na tyle się zacieśniła, że postanowiliśmy zrobić coś wspólnie.

Czyli Ty wniosłeś do projektu tę część związaną ze sztuczną inteligencją?

Kiedy dołączyłem do projektu dziewczyny już pracowały nad takim systemem, ale starały się to robić siłami społeczności. Natomiast kiedy się spotkaliśmy, doszliśmy do wniosku, że spróbujemy to zrobić półautomatycznie z wykrozystaniem uczenia maszynowego. Pamiętam, że Gosia mnie wtedy zaskoczyła takim faktem, że rocznie w Polsce wychodzi ponad 30 tys. tytułów. Nie ma szans, żeby zebrać tylu ludzi, którzy zdołaliby to ocenić. Poza tym kiedy wychodzi nowa książka, musi minąć trochę czasu, żeby społeczność zdążyła ją przeczytać i sensownie ocenić. A wiadomo, że księgarniom zależy na tym, żeby nowości były jak najszybciej zarekomendowane.

Kto jest odbiorcą tego rozwiązania?

Z jednej strony konsumenci końcowi, czyli osoby, które lubią czytać i szukają rekomendacji. Druga grupa docelowa to księgarnie, wydawcy, wydawnictwa oraz biblioteki. Misją naszego projektu jest podnoszenie jakości czytelnictwa poprzez wyciąganie perełek, które wychodzą, a nie mają dużego nakładu na marketing, więc nie mają szans wejść na uznane listy bestsellerów.

Wrócę do Twojej pierwszej firmy, Ermlab. W jednym z wywiadów mówiłeś, że kiedy zaczynaliście zniszczył was Microsoft i Google. Jak to było?

Kiedy zaczynaliśmy z Przemysławem Góreckim Ermlab, byliśmy typowym startupem. Tworzyliśmy narzędzie do data science, które nazwaliśmy Plon.io. Polegało ono na tym, że można było uruchamiać modele uczenia maszynowego w chmurze. Kiedy z tym startowaliśmy to był 2013 rok, a spółkę oficjalnie otworzyliśmy w 2014 roku. Próbowaliśmy się z tym wybić, byliśmy z tym rozwiązaniem 1,5 roku wcześniej przed Microsoftem czy Googlem, ale nie mieliśmy doświadczenia biznesowego i takiego budżetu jak giganci. W którymś momencie podobne produkty zaczęły wychodzić na rynek. Zrobili dokładnie to, co my i to nas zabiło.

I co było dalej?

Zamknęliśmy ten projekt.

Ale firmę kontynuujecie

Tak. Startując w 2014 roku dostaliśmy dofinansowanie na wspomniany projekt i przez dwa lata intensywnie nad nim pracowaliśmy. Gdy zdecydowaliśmy, że go zamykamy, postanowiliśmy nasze umiejętności wyniesione z uczelni, bo i ja i Przemek robiliśmy doktoraty związane ze sztuczna inteligencją, wykorzystać biznesowo.

Nie marzyła się Wam kariera naukowców?

Nie. Postanowiliśmy naszą wiedzę aplikować do biznesu. W pewnym momencie na uczelni zaczęło nam brakować pewnej decyzyjności i swobody tego co chcieliśmy robić. Okazało się, że to był bardzo dobry czas, bo sztuczna inteligencja zaczęła się wtedy pojawiać na rynku.

Jaki był Wasz najciekawszy projekt?

Ten teraz z Literacką, jest tam bardzo dużo wyzwań, z którymi musimy sobie radzić. Mamy bardzo fajną, ścisłą współpracę. Mamy okazję pracować nad czymś zupełnie nowym.

Nowym? Były już podobne projekty…

Tak, ale programy, które zajmują się analizą tekstu, a które obecnie są na rynku analizują tylko krótkie teksty, tweety, posty, notatki czy wpisy na forach, a nie całą książkę. I to jest to wyzwanie.

Jesteś specjalistą od sztucznej inteligencji pozwól, że zapytam o te kwestie. W jednym z wywiadów radiowych wspominałeś o Strategii Państwa Polskiego w kwestii sztucznej inteligencji. Możesz coś o tym opowiedzieć?

Powstała mapa drogowa AI w Polsce. Taką strategię przygotowuje Ministerstwo. Uważam, że jest to bardzo dobry czas na to, żeby taką strategię stworzyć. Polska ma na prawdę bardzo dobrych programistów, matematyków i bardzo dobre kształcenie. W związku z tym taka strategia jest niezbędna. Sam się wywodzę z uczeni i wiem jak ważne jest, by o tych rzeczach mówić, pisać, edukować. Ta strategia z jednej strony związana jest z edukacją, a z drugiej z łączeniem biznesu i nauki i promowaniu tych projektów, które korzystają z tego. To jest bardzo dobry kierunek. Co prawda jeśli popatrzymy na pieniądze, które są inwestowane w Polsce i porównamy te kwoty z tymi, które są inwestowane na zachodzie, to są to duże dysproporcje, jednak uważam, że mamy tutaj to, czego obecnie brakuje na rynku, czyli podaż talentów. Polska jest, zaryzykuję stwierdzenie, kopalnią talentów. Właśnie dlatego większość firm przenosi się do nas. Z jednej strony to dobre, bo ludzie łapią niesamowite doświadczenie, ale z drugiej strony fajnie gdyby oni zostawali i pracowali dla polskich firm, żeby tutaj tworzyć kapitał, tu zbierać doświadczenia i tutaj próbować.

Uważasz, że ta strategia jest sensowna?

Przyznam się szczerze, że nie czytałem jej w całości, bo ona ma ponad sto stron. Natomiast część aspektów, które dla mnie były ważne, czyli aspekt edukacji i połączenia nauki z biznesem jest dobrze ujęty. Każdy może mieć trochę inną wizję, ale ogólnie kierunek jest bardzo dobry, więc z mojej strony jakiejś wielkiej krytyki do tego dokumentu nie ma. Znam też cześć osób, które nad tym pracowały i wiem, że to są bardzo mądre osoby, którym zależy na przyszłości Polski.

Jak sprawa sztucznej inteligencji ma się na zachodzie?

Wszystkie wielkie mocarstwa inwestują w rozszerzoną rzeczywistość. To jest coś, w co jeśli nie zainwestujemy teraz, to bardzo wiele stracimy. Zostaniemy w tyle. To jest właściwie wyścig zbrojeń. Te AI o którym ja mówię może nam usprawnić wiele żmudnych, długich procesów chociażby pisanie artykułu, czy sprawdzenie go. Wyobraź sobie, że masz asystenta, który pozwala Ci o 20 – 30 proc. skrócić Twoją pracę. Jeżeli popatrzymy na to w kontekście całego kraju i świata, to okazuje się, że są to ogromne, globalne oszczędności w jednym, drugim, trzecim sektorze.

A czy są jakieś branże, które jeszcze nie sięgają po sztuczną inteligencję, a uważasz, że powinny?

Jeszcze ze dwa, trzy lata temu mógłbym tak powiedzieć. Zwłaszcza w branżach związanych z ciężkim przemysłem, bo tam cały proces jest dość powolny. Ja pochodzę z Olsztyna, jest tam uniwersytet, który jest mocno związany z rolnictwem i w tym rolnictwie te trzy lata temu pamiętam, że nie było żadnych rozwiązań z AI, natomiast teraz już się w to inwestuje. Dlatego na dzień dzisiejszy powiem, że w mojej ocenie nie ma takich branż. Wszystkie osoby decyzyjne zaczęły dostrzegać wartość i rolę sztucznej inteligencji. Oczywiście samych wdrożeń jest jeszcze mało, ale z tego co rozmawiam z ludźmi, to widzę, że cały przekrój branż o tym myśli.

Czyli to już nie jest tylko nowinka technologiczna?

Nie, już nie jest. To jest taki „must have”. Może jeszcze nie wszyscy zaczęli nad tym pracować, ale na pewno wszyscy już o tym myślą i szukają zespołów. Do nas zgłaszają się firmy począwszy od agro przez firmy marketingowe, przemysł ciężki po retail.

Mamy się obawiać? Roboty przejma kontrolę nad światem?

Tego bym się nie obawiał. Jestem bardzo daleki od takiego skrajnego podejścia. Choć oczywiście pewne zagrożenia są.

Jakie?

To w czym ja bym się upatrywał zagrożeń, to rozwiązania związane z przemysłem wojskowym. Bo automaty potrafią być bardzo skuteczne, czas reakcji jest szybszy niż człowieka, rozpoznawanie jest lepsze i tak dalej. Teraz wyobraźmy sobie, że taki automat przez przypadek zapędzi się za daleko, albo nie będzie na czas wyłączony…

Inne zagrożenia o których myślę, to kwestia łatwiejszej możliwości oszukiwania ludzi, chociażby fake newsy, różnego rodzaju spam, który już jest bardzo dobrze naśladujący ludzi. Myślę, że w pewnym momencie nie będziemy w stanie odróżnić tego co wygenerowała maszyna od tego co stworzył człowiek i to może budzić takie realne, etyczne zagrożenia. Siła, którą można wykorzystać do manipulowania ludźmi.

Natomiast tego, że roboty przejmą kontrolę nad światem i będziemy tak jak w Terminatorze skazani na to, żeby z nimi walczyć nie obawiałbym się (śmiech). Do takiej silnej sztucznej inteligencji jeszcze nam daleko, więc jeśli nawet, to nie prędko.

Rozmawiacie o tych zagrożeniach w środowisku?

Główne osoby, które pracują nad sztuczna inteligencja wspominają o etycznych aspektach z nią związanych. Chociażby ostatnio został wydany model do generowania tekstu. Twórcy udostępnili algorytm, ale nie udostępnili tego modelu w taki sposób, żeby ludzie mogli go zaimplementować, bo był za dobry. Bali się, że ludzie będą go wykorzystywać do manipulacji. Tak więc gdzieś na takim wysokim poziomie mówi się o tym.

Tylko na tym wysokim poziomie?

Mogę powiedzieć z własnego doświadczenia, kiedy rozmawiam z firmami, które do nas przychodzą, widzę, że mało kto na tym etapie o tym myśli. Powiem szczerze, że i my nie zawsze się nad tym zastanawiamy. Na uczelni w moim otoczeniu również się nie spotkałem z tym, żeby się ludzie jakoś mocniej nad tym zastanawiali. Bardziej jest to myślenie, że mamy duże możliwości i możemy dużo zrobić, więc próbujmy kolejnych badań, spróbujmy jak najwięcej zrobić. Myślę, że przyjdzie taki moment, że wszyscy się zatrzymają na chwilę i zaczną się zastanawiać jak to uregulować.

Na koniec powiedz jakie macie teraz plany

Będziemy teraz w ramach Co Do Czytania uruchamiać wersje dla ludzi, mamy już 65 tys. pozycji książkowych, które możemy udostępnić do rekomendacji. Czekamy na wynik konkursu Szybka Ścieżka, w którym braliśmy udział z projektem GoodWrite. Mam nadzieję, że to pchnie projekt do przodu. Stoimy też przed decyzją, czy chcemy iść dalej w kwestii rozbudowywania zespołu, bo teraz jest nas 10 osób i to jest bardzo fajnie, bo komunikacyjnie bardzo dobrze pracuje się w takim zespole. Z jednej strony podoba nam się taki mały zespół, a z drugiej strony chciałoby się rosnąć (śmiech). Jeszcze nie podjęliśmy decyzji. Życie pokaże.

Polska jest kopalnią talentów dla branży AI – Krzysztof Sopyła (Ermlab)

Marta Wujek

Nie przegap

Polska jest kopalnią talentów dla branży AI – Krzysztof Sopyła (Ermlab)

Marta Wujek

Nie przegap

Sukcesy, inwestycje, pivoty i porażki. Polski rynek startupów w jednym e-mailu