Transkrypcja nagrania w cenie jednej kawy? Polska platforma rzuca wyzwanie SaaSom

Dodane:

Kasia Krogulec Kasia Krogulec

Transkrypcja nagrania w cenie jednej kawy? Polska platforma rzuca wyzwanie SaaSom

Udostępnij:

Rozmawiam z Wojtkiem Gilewskim oraz Radkiem Baczyńskim, twórcami Transkryptomatu, platformy, która nie tylko poddaje transkrypcji nagrania, ale także za pomocą sztucznej inteligencji przygotowuje streszczenia tych nagrań, artykuły na bloga oraz wpisy do social mediów.

Dlaczego zdecydowaliście się stworzyć kolejną platformę do transkrypcji?

Wojtek: Pracujemy nad technologią transkrypcji od dobrych paru lat. Pierwotnie wykorzystywaliśmy ją do analizy i monitoringu YouTube’a. Na tamtą chwilę nie było dostępnych usług monitoringu YouTube’a, treści wideo i audio – uznaliśmy to za istotną niszę do eksploracji.

Okazało się, że YouTube sam w sobie w treściach tekstowych udostępnia tak wiele informacji, że analiza audio nie wykazuje wiele więcej. Natomiast zostaliśmy przez rynek skierowani w stronę podcastów – były one na owy czas niezbadanym medium.

Uznaliśmy, że będziemy bazą informacji o podcastach i stworzyliśmy technologię transkrypcji do masowego analizowania podcastów. W trakcie prac nad podcastami pojawiło się też zapytanie o rynek telewizji czy radia i w konsekwencji musieliśmy zbudować własną, dużą, szybką, skalowalną infrastrukturę do dokonywania wysokojakościowych transkrypcji.

Trochę osób z naszego środowiska słyszało o tym, że robimy transkrypcję, że mamy własny silnik i podrzucało nam swoje transkrypcje do analizy. Stwierdziliśmy, że skoro tyle próśb o transkrypcję trafia do nas, to warto byłoby im wystawić taki poboczny projekt, w którym mogliby sami sobie to zlecać i to działałoby się automatycznie. I tak powstał pomysł side projektu – Transkryptomatu.

Uruchomiliśmy go bardzo szybko, bo w parę dni. To miał być projekt typowo w naszym stylu, czyli proste MVP jak z elementarza Lean Startup. Landing page na Webflow, domena, wpięcie Stripe, Google Analytics; do tego podpięcie naszego API do transkrypcji, i już byliśmy gotowi do sprzedaży. (Cała usługa opiera się na mailach bez zbędnych interfejsów). Po jakimś czasie okazało się, że ludzie z tego korzystają. Włączyliśmy dodatkowe reklamy i tak Transkryptomat stał się dla nas ważnym projektem.

Radek, czy chcesz coś dodać?

Radek: Ważne jest to, że mieliśmy to rozgryzione, więc budowa samego finalnego produktu była szybka. Mieliśmy po prostu już te klocki gotowe. Musieliśmy po prostu z nich złożyć jakiś zupełnie nowy produkt. I to jest przykład budowy produktu – coś już masz i testujesz na tym zupełnie nowe koncepcje. Okazało się, że to fajnie wypaliło. 

Wojtek: Tak, no i mimo tego, że to absolutnie czerwony ocean – jest bardzo dużo narzędzi do transkrypcji, bardzo dużo firm się tym zajmuje – to znaleźliśmy niszę, w której udało nam się odnaleźć klientów, więc dla nas to było podwójnie ciekawe doświadczenie.

Co dokładnie oferuje Transkryptomat?

Wojtek: Na okoliczność naszego wywiadu wymyśliłem takie sformułowanie, że Transkryptomat magicznie oszczędza ludziom czas. Na podstawie nagrania audio lub wideo przygotowuje treści tekstowe. Są to m.in. transkrypcja z diaryzacją, czyli transkrypcja z podziałem na osoby, które mówią. Dzięki temu łatwiej nam potem ten tekst obrabiać. Generujemy streszczenie na bazie nagrania, artykuł na bloga, posty na Instagram, Facebook, Twitter czy Linkedin oraz podsumowanie pod SEO dla naszych użytkowników. No i wszystko to oferujemy za stosunkowo niewielką opłatą bez abonamentów.

Z Transkryptomatu korzystają bardzo różni klienci: od detektywów aż po dziennikarzy i media. Grupa naszych odbiorców jest bardzo, bardzo szeroka.

Ktoś jeszcze?

Wojtek: Podcasterzy, youtuberzy, działy PR i marketingu firm, a także agencje, bo na przykład przetwarzają webinary, konferencje prasowe. Korzystają z nas prawnicy, którzy otrzymują od swoich klientów różne nagrania, które są potem potrzebne do postępowań procesowych. A także detektywi, których się kompletnie nie spodziewaliśmy – realizują przy pomocy Transkryptomatu jakieś czynności wywiadowcze (uśmiech).

Zdarzają się filmowcy i producenci potrzebujący napisów, oraz materiałów, które pomogą im w promocji filmów. Dużą grupę stanowią też fokusownie, badacze robiący eksperymenty i wywiady. Naszymi klientami są także studenci – generują swoje własne notatki głosowe.

W jaki sposób działa Transkryptomat? Wspomagacie się na przykład czatem GPT?

Radek: Transkryptomat wpisuje się w trend narzędzi sztucznej inteligencji czy też machine learningowych. Przy jego budowie skorzystaliśmy z najnowszych dostępnych rozwiązań. Nasze rozwiązanie składa się z dwóch modułów, pierwszy to transkrypcja.
A drugi to model językowy, podobny do chata GPT. Plik wpada do nas i maksymalnie po dwóch godzinach transkrypcja oraz dodatkowe treści są gotowe. Najdłuższa długość pliku, jaką możemy jednorazowo przetworzyć to trzy godziny.

Najczęściej taki plik jest gotowy po kilkunastu minutach, jeśli nie mamy dużego obłożenia od klientów. Transkrypcja jest wysyłana automatycznie na maila.

To, co jest ciekawe i co wspomniał Wojtek – nie mamy dashboardu i konta klienta. Od początku zależało nam na prostocie i unikaniu zbędnych rozpraszaczy dla użytkownika takich jak rejestracja, podpinanie karty itp. Chcieliśmy zbudować bardziej e-commerce niż usługę subskrypcyjną. Dlatego całą wymianę informacji i treści opieramy na mailach, gdzie dostajesz linki oraz pliki z transkrypcją w kilku różnych formatach – PDF, Word, csv czy srt.

Usługa jest przez to bardzo prosta, wystarczy wypełnić formularz dodać pliki lub wskazać link z YouTuba i to wszystko. W ciągu parunastu minut otrzymujemy zrealizowane zamówienie na emaila. 

Jakie języki obsługuje Transkryptomat? Na pewno polski i angielski – to już wiem.

Wojtek: Wczoraj mieliśmy pierwszy przypadek, w którym klient na naszej zagranicznej wersji, która nazywa się transcriptmate.com (jest to dokładnie bliźniacza kopia Transkryptomatu) zlecił nam transkrypcję po hebrajsku. Nie usłyszeliśmy od klienta narzekań, więc wydaje nam się, że jakość była dla niego odpowiednia (uśmiech). Faktycznie działamy w modelu multijęzycznym i radzimy sobie z większością najpopularniejszych języków, czyli: polski, angielski, hiszpański, niemiecki, francuski, hebrajski, ukraiński, arabski, rosyjski, portugalski.

Jak pozyskaliście wiedzę potrzebną do zaprojektowania Transkryptomatu?

Wojtek: Zaczęliśmy z Radkiem pracować nad transkrypcjami dwa i pół roku temu i na samym początku jakość modeli językowych dostępnych w internecie zarówno za opłatą jak i bezpłatnych była bardzo słaba. I tak naprawdę trzy lata temu taka usługa w ogóle nie miałaby sensu, bo efekt byłby zbyt słaby żeby faktycznie komuś do czegoś to miało służyć.

Radek:  Wiedzę, która się przydała miałem na studiach, oczywiście nie przekłada się to jeden do jednego, bo jednak już trochę lat minęło. Po prostu wiedza na studiach daje tam pewne podstawy, jeśli chodzi o inżynierię programowania. To, co mi pomogło, to jest taka naturalna ciekawość i sprawdzenie, jak to działa, czyli robienie researchów wśród rozwiązań open source’owych i komercyjnych. Trochę nauczyłem się też potrzebnych rzeczy, kiedy pracowałem w innych firmach.

Transkryptomat, w przeciwieństwie do innych platform tego typu, nie pobiera opłaty abonamentowej. Więc powiedzmy, w jaki sposób zarabiacie.

Wojtek: Naszym kluczem do tej wczesnej trakcji było właśnie to, że nie rozliczamy się w modelu abonamentowym, tylko klienci płacą per plik, per żądanie. Dostaliśmy bardzo dużo opinii od użytkowników, że taki model współpracy im się bardzo podoba. Mają dosyć abonamentów, nie chcą płacić co miesiąc 200 zł za usługę, z której korzystają raz czy dwa razy na 30 dni. I to wpłynęło na to, że pozyskaliśmy pierwszych klientów. Co ciekawe, mimo tego, że nie pobieramy miesięcznych opłat abonamentowych, to i tak duża część klientów do nas powraca.

To jest zabawne odkrycie, że mimo tego że nie oferujemy abonamentów to i tak mamy pewnego rodzaju abonament bo klienci po prostu wracają co miesiąc.

I to jest coś czym się wyróżniamy spośród konkurencji. Wydaje mi się, że to nie jest najłatwiejszy model, no bo w zasadzie musimy się starać każdego dnia o to, żeby generować transakcje. Natomiast na koniec miesiąca widzimy, że faktycznie mamy taki MRR na niektórych klientach, którzy powracają. Więc to jest taki ciekawy eksperyment.

Mamy też już paru klientów, którzy rozliczają się z nami cyklicznie i mają udostępnione swoje dyski, na które wrzucają pliki – więc taki model dla niektórych też już wdrożyliśmy, głównie z racji optymalizacji ich procesów.

Jaka jest cena za jeden plik?

Wojtek: Podstawowa transkrypcja pliku kosztuje u nas 15 złotych. Do tego można dobrać różne dodatkowe opcje takie jak diaryzacja, czyli transkrypcja z podziałem na role i z podziałem na mówców. Efektem tego jest transkrypcja, w której dokładnie widzimy kto co powiedział, czyli jakbyśmy mieli transkryptować naszą rozmowę (co właśnie zrobiliśmy!) to będziemy wiedzieli co powiedział Wojtek, co powiedziała Kasia i Radek.

Drugą dodatkową opcją są streszczenia. Do każdego nagrania jesteśmy w stanie takie streszczenie przygotować. Trzecia – treści generowanymi przez AI i to jest paczka, w ramach której klient otrzymuje transkrypcję, artykuł na bloga, posty na social media czy porady SEO.

Rozbudowaliśmy trochę ten cennik z racji feedbacku naszych klientów, którzy sami nam wskazali: “Biorę waszą transkrypcję, potem wrzucam w Chat GPT, czy nie byłoby sensownie, gdybyście mi w tym po prostu pomogli?”. Stwierdziliśmy oczywiście, że to zrobimy.

W stosunkowo niskiej cenie jesteśmy w stanie pomóc ludziom, zaoszczędzić im mnóstwo czasu.

A jak obecnie się finansujecie?

Wojtek: Z miesiąca na miesiąc mamy coraz większe przychody. Pierwsze dwa, trzy miesiące eksplorowaliśmy mocno polski rynek i różne przypadki wykorzystania transkrypcji. Teraz uruchomiliśmy wersję anglojęzyczną, która dedykowana jest na globalne wody. Zaczęliśmy od prostych kampanii reklamowych, które okazały się nam przynosić zwrot. To było dla nas duże zaskoczenie, że faktycznie generujemy przychody od samego początku. Jeszcze są to za małe kwoty, żebyśmy mieli swobodę i pewność co do naszej przeszłości. Ale rośniemy sukcesywnie.

Portfolio klientów też mocno się dywersyfikuje geograficznie, bo wspomniana transkrypcja po hebrajsku była zrealizowana przez klienta z Nowego Jorku. Bardzo się z tego cieszymy, że nareszcie po 20 różnych eksperymentach pozyskiwania klientów z zagranicy, udało nam się nareszcie stworzyć kanał marketingowy, z którego nam trochę tych klientów dochodzi.

Generalnie to jest projekt który się bootstrapuje. W ramach reinwestycji tych zysków staramy się uruchamiać nowe eksperymenty marketingowe i produktowe oraz cały czas poszerzamy portfolio klientów.

Wydaje nam się, że na polskim rynku już dosyć dużo zdziałaliśmy. Bardzo nas kusi globalny rynek i udaje nam się zdobywać wiedzę jak tam pozyskiwać klientów. Natomiast nie ma co ukrywać, tam konkurencja jest jeszcze chyba bardziej zażarta, więc trudne wyzwanie, ale nie niemożliwe – możesz trzymać kciuki.

Okej, będę (uśmiech). Możemy powiedzieć w jaki sposób pozyskujecie klientów?

Wojtek: Mamy taki własny framework, wzorzec działania, zresztą to nie jest jakiś rocket science, my po prostu prowadzimy eksperymenty. Eksperymenty są mierzone i wyciągamy wnioski, które potem nam służą do dostosowania kolejnych kreacji reklamowych, czy też kolejnych zmian produktowych. 

Wasz obecny model biznesowy jest dosyć specyficzny, ale przez to może niezbyt atrakcyjny dla funduszy Venture. Czy macie w planach pozyskiwanie kapitału? Jeśli tak, to skąd? Od funduszy Venture, aniołów czy może z jakiegoś innego miejsca?

Wojtek:  Na razie na 95% jesteśmy skoncentrowani na pracy z klientami i to jest nasz główny fokus. Nasz model, póki co, nie jest bardzo atrakcyjny pod fundusze Venture, natomiast to, co zrobiliśmy było odpowiedzią na problemy rynkowe, które zdiagnozowaliśmy, więc przecieramy szlak dla usług, które nie chcą być kolejnym SaaSem z subskrypcją.

Mamy już pewne doświadczenia i wiemy, że realnie dobre i korzystne  finansowanie możemy uzyskać tylko w momencie, kiedy będziemy mieli przyzwoitą trakcję, przychody i perspektywy rozwoju na rynkach zagranicznych. I właśnie to, co teraz robimy jest
próbą zweryfikowania tych dwóch hipotez, czyli właśnie uzyskanie stabilnych rosnących przychodów oraz otwarcie się na inne rynki zagraniczne. Na tym etapie mamy właściwie postawione priorytety, a są nimi klienci i ich feedback, więc na tym się na razie koncentrujemy. Ale jakby ktoś chciał w nas zainwestować to zapraszam.

W jaki sposób chcecie dalej rozwijać platformę?

Wojtek: Naszym marzeniem jest to, aby młodszy brat Transkryptomatu, czyli transcriptmate.com, wypłynął na globalny ocean i żeby udało nam się zwiększyć liczbę zagranicznych klientów. To jest nasz obecny cel i to jest plan krótkoterminowy i średnioterminowy. My wiele dalej nie planujemy, na razie jesteśmy bardzo mocno na tym zafiksowani, bo to nam pozwoli rozwinąć skrzydła. 

Udało nam się też zwiększyć średnią wartość koszyka poprzez wprowadzenie dodatkowych funkcji, więc pewne parametry biznesowe, które uznaliśmy jako kluczowe do dalszego rozwoju udało nam się spełnić. Teraz marzeniem jest zwiększenie tej skali tak, żeby mieć pieniądze na dalszy rozwój, na marketing i sprzedaż.

Co do celów produktowych, to będziemy się skłaniali ku kolejnym testom innych form treści. Cały czas zbieramy informację zwrotną, jaka forma treści mogłaby być interesująca dla poszczególnych grup klientów.

Docelowo chcielibyśmy żeby np. podcaster miał idealnie dopasowane formy treści, które otrzymuje z danego nagrania; youtuber – osobną paczkę, która jest dla niego bardziej dostosowana, a dziennikarze – własną paczkę lepiej adresującą ich potrzeby. 

To już wszystkie moje pytania. Może coś chcecie dodać?

Wojtek: Chciałbym tylko dodać, że bardzo się cieszymy, że korzystacie jako redakcja z naszego rozwiązania. 

Transkryptomat ostatnio mi uratował życie. Nie miałam czasu sama spisać rozmowy i wrzuciłam do Was plik z nagraniem. Po kilku minutach była już gotowa transkrypcja i streszczenie, które troszkę poprawiłam – 5 minut roboty i miałam gotowy artykuł, więc to jest super!

Wojtek: Bardzo się cieszę i widzimy, że coraz więcej dziennikarzy z tego korzysta. Wrzuciliśmy ostatnio przetranskrybowaną debatę polityczną i nawet się trochę poniosła po Twitterze (uśmiech). 

Dzięki za rozmowę.

Wojtek i Radek: Dzięki!

 

🤖 Artykuł powstał przy pomocy Transkryptomat.pl.

 

Transkryptomat streścił nam także ten podcast: Jak tworzy się akcelerator dla startupów impactowych? Opowiada Aleksandra Reinert (ĀRYA Foundry)