Nikola Mrkšić, Srbin koji uči kompjutere da razgovaraju: „Bićemo bolji od Amazona i Epla“

Pre tridesete Nikola Mrkšić uspeo je sa partnerima da skupi 30 miliona dolara od investitora koju veruju da će njegova kompanija naučiti kompjutere da razgovaraju sa ljudima. Koliko su uspešni u tome svedoči to što ga je magazin Forbs prepoznao kao jednog od trideset mlađih od trideset godina u IT svetu čiji napredak treba pratiti. (Na ovogodišnjoj listi je i novosađanka Marina Ivanović.)

Pre toga je doktorirao na Kembridžu na koji je otišao iz Matematičke gimnazije u Beogradu, neko vreme je radio u Eplu gde je učio Siri da komunicira ("bio sam jedan u timu od hiljadu" kaže skromno). 

Procenivši da može bolje i više pre četiri godine u Londonu je sa dva partnera osnovao
firmu PolyAI koja se bavi vokalnom komunikacijom sa mašinama. O tome govori u video razgovoru za RTS.

Nikola, da bih snimio ovaj
intervju morao sam da obavim sigurno dvadesetak radnji na ovim aparatima koje
koristim. Da li je Vama zamislivo da samo izgovorim kako hoću da snimim video
intervju sa Nikolom Mrkšićem i da aparati sve sami pripreme. Koliko smo daleko
od toga da kompjuteru usmeno naređujemo i složene radnje?

Apsolutno je moguće i to je nešto na čemu mi radimo, na čemu velike
tehnološke firme rade. Možda neće biti baš
u jednoj rečenici, možda će sistem da postavi potpitanje koji program za
pozivanje želite da koristite ili u koje vreme, ako niste rekli na početku. Ali
taj razgovor sa kompjuterom može da bude tečan i jednostavan. I da bude mnogo lakši od svih tih
integracija koje sada morate da obavite.

Čime se tačno bavi vaša
kompanija PolyAI?

PolyAI je firma od pedesetak ljudi sa sedištem u Londonu i
kancelarijama u SAD i Singapuru. Mi pravimo konverzacione sisteme, voice assistant, ne znam kako se to kaže
na srpskom, recimo govorni automat mada to zvuči kao nešto već prevaziđeno.

To su sistemi koji se javljaju na telefon kada zovete
korisničku podršku, bilo da zovete telekomunikacionu firmu ili banku ili
ugostiteljski objekat i pravite rezervaciju ili se žalite na uslugu. Ili imate
problem sa povezivanjem na internet i treba vam pomoć. U svakom od tih scenarija
naš sistem se javi i razgovara sa vama potpuno isto kao što bi i veoma dobro
obučeni operater u kol centru to radio.

Kako je to moguće kada znamo
da ljudi imaju akcenat, govorne mane, ne govore svi čisto da bi kompjuter to
lako razlučio?

U pravu ste. U opštem slučaju ako bi vi pričali u
dijalektu ili o nečem vrlo specifičnom, to nije problem koji je potpuno rešen.
Ali ako razgovarate sa sistemom koji zna otprilike šta vi pokušavate da
postignete, taj sistem zna šta da očekuje. Pa ako rezervišete mesto u restoranu, sledeće što ide je datum ili
broj ljudi koji dolaze ili neko pitanje oko parkinga.

Samo u Britaniji ima 67 poddijalekata engleskog jezika.
Kada se to pretoči u tekst to izgleda drugačije i sistemu nije baš jasno šta se
traži. Ali ako istrenirate veštačku inteligenciju koja je specijalizovana da
odradi upravo taj jedan zadatak ona zna šta koja reč znači u tom kontekstu.

Mi se kao ljudi dobro razumemo zato što smo celi život
učili kako da se razumemo, kako da koristimo kontekst. Tako i naši sistemi
imaju pristup tom kontekstu pa su u mogućnosti da uvek izvuku pravu nameru
korisnika. Čak i ako ne zapišu tačno ono što treba.

Mogu li kompjuteri da razumeju
moju emociju? Istu rečenicu mogu da izgovorim i ljutito i blago. Kako to
kompjuter razlikuje?

To je jedan od težih problema čak i sa akademske strane.
Razlučiti kada jedna rečenica ima iste reči, da li je pozitivna ili negativna,
jer različiti ljudi imaju različite temperamente i govore na različite načine.

Moguće je to detektovati, ali ono što mi sada radimo što
je bitniji korak u razvoju veštačke inteligencije je da znamo kada nam ne ide
preterano dobro. I ako nam ne ide preterano dobro i sistem se muči mi prebacimo
korisnika na radnika u kol
centru, ne želimo da trošimo njegovu
dobru volju.

Ipak postoji neki živ čovek
koji preuzme posao od kompjutera kada stvari ne idu kako treba?

Da, i to je ideja. Naši sistemi mogu da automatizuju 80 pa
i 90 odsto saobraćaja koji ide u kol centar. Ali u deset odsto slučajeva ili
kada je reč o korisnicima koji pitaju neko veoma retko pitanje ili premijum
korisnicima, njih čuvate za razgovor sa nekim od vaših najboljih operatera.

Ali za repetitivne razgovore možda su korisnici mogli da
odu na vebsajt i nađu odgovor na to pitanje, za to ovaj sistem može da bude
rešenje. Nama je ideja da sve više i više automatizujemo da bi na kraju možda
došli do sto odsto automatizacije.

Nije ideja zameniti ljude, ideja
je da ti kol centri koji nikada nemaju dovoljno ljudi…interesantno je da dva
odsto populacije u Britaniji ili SAD radi u kol centrima i pored svog
autsorsinga koji oni rade u trećim zemljama…velika je potreba za ljudskim
kapitalom u tim kol centrima koji jednostavno nije tu. Tehnologija nam je
potrebna jer to ono što koristimo postaje sve komplikovanije pa potreba za
korisničkom podrškom raste.

Hoćete da kažete da vi  nikome ne otimate posao?

Naši najuspešniji projekti do sada bili su sa firmama u
kojima nije bilo dovoljno ljudi da urade neki posao. Daću vam primer. Recimo,
radimo sa ugostiteljskim firmama gde su se konobari javljali na sve pozive pre
nego što su naši sistemi primenjeni. I sad, pošto ljudi zovu u vreme ručka ili večere kada su
konobari zauzeti i nemaju vremena da se jave, na trideset odsto poziva niko se
nije javljao. Posle primene našeg sistema ljudi zovu, sistem se javi svaki put i
oko osam odsto više rezervacija se ostvari kada to radi veštačka inteligencija
nego kada to radi osoblje u restoranu.

Mi nikome ne oduzimamo posao nego tim konobarima dajemo
šansu da svoj posao rade mnogo opuštenije jer ne moraju svako malo da trče na
telefon.

Ljudi nekada umeju da se
iznerviraju kada im živ čovek odgovara mehanički…

Itekako.

Šta se dešava kada shvatim da
razgovaram sa mašinom? Reaguju li ljudi negativno?

Mi na početku razgovara kažemo „ja sam digitalni agent,
kako mogu da vam pomognem". Mada to kažemo vrlo brzo da ne bismo skretali
previše pažnju na to. Vrlo je zanimljivo da kada ljudi nešto kažu i vide da su
dobili odgovor kao što bi ga dobili od čoveka, brzo, efikasno i bez čekanja,
onda se gradi to poverenje. Ako sve ide kako treba ljudi rado vode taj razgovor.

Ima ljudi koji kažu, ah mašina, neću da pričam sa mašinom,
operator, operator, operator! U tom slučaju mi ih prebacimo, nema smisla siliti
ih.

Ali to je između 4 i 5 odsto ljudi. Ostali rado pričaju sa
digitalnim agentom, a mi ako osetimo da razgovor ne ide kako treba i da nemamo
odgovor kažemo kako nemamo odgovor na to pitanje i da ćemo ih prebaciti na nekog
od ljudskih kolega.

Treba li da budemo ljubazni sa
vašim mašinama, robotima ili možemo da budemo i grubi prema njima? Kako će
reagovati ako sam ja besan?

Verovatno će raditi malo slabije jer uglavnom pričaju sa
ljudima koji koriste blaži ton. Zanimljivo je i da što duže rečenice koristite,
mašina bolje radi. Tako je tehnologija podešena, što više signala dobije od vas
bolje će da vas razume.

Mnogi ljudi misle da treba pričati kratkim rečenicama.
Troje ljudi. Sutra. Dva popodne. A mnogo bolje je reči „pa mislili smo da dođemo
sutra u dva popodne". Jedan prijatan razgovor je najbolji način da dođete do
uspešnog kraja razgovora sa mašinom.

Ali ona nema osećanja. Ako želite da je psujete pri svakom
koraku, možete to da radite.

Neće se naljutiti i reći „ja
sam programirana da sa ljudima koji su grubi ne razgovaram"?

Za sada ne. U budućnosti, možda. U svakom slučaju mi bi
vaše psovanje razumeli kao neprijatnost i znak da ne uživate u razgovoru i
prebacili bismo vas ljudskom operateru.

Zar nije logičnije da će
mašina lakše da me smiri jer kod ljudskog operatera mogu da izazovem negativnu
emociju, a mašini to ne može da se desi?

To je tačno. Ali ja sam puno vremena proveo po kol
centrima širom Britanije i neverovatno je koliko su to prijatni i dobri ljudi. A
danonoćno ih zovu i viču na njih kao da su oni krivi za problem zbog koga se
javljaju.

Kakva je reakcija tih ljudi
kada im kažete, ovo što vi radite može da radi mašina koju ja pravim?

Kada operaterima koji su na višem nivou i obučavaju niže
rangirane operatere kažete da postoji neki interfejs kojem možete da kažete da
se promenio odgovor na neko pitanje njima to deluje kao udobniji način da rade
svoj posao. Što se tiče agenata koji su novi u poslu, mislim da je svima
interesantno. Očigledno je da se to neće desiti preko noći. Ali tehnologija je
uvek eliminisala one najjednostavnije poslove.

Postoji rizik da ovo može negativno uticati na tržište
rada, ali…

Šta je krajnji cilj vašeg rada,
u šta biste da se PolyAI razvije?

Vidite, ja sam radio za Epl. Projekat Siri ima dve hiljade ljudi. Amazonov
Aleksa ima 14 hiljada ljudi i dalje raste. To su komplikovani sistemi koji u odnosu na
uloženi novac nisu postigli neki rezultat. Nama je cilj da napravimo sisteme
koji će stvarno dodati neku vrednost. Koji će poboljšati iskustvo i onog ko zove
i onog ko treba na poziv da se javi.

Cilj je da napravimo što više dobrih
iskustava i da dokažemo da ova tehnologija ima budućnost. Za sada nam ide jako
dobro. Imamo puno klijenata kojima smo pomogli da povećaju prihode, da smanje
troškove. Cilj nam je da validiramo ovu tehnologiju.

Smeli biste da kažete da vam
je cilj da budete veći od Alekse i Siri?

Da. Da. S tim da mi naš proizvod prodajemo velikim
firmama, a oni prodaju konzumentima. Tako da nam oni nisu konkurencija, ne
takmičimo se sa njima.

Sve te pare koje je Džef Bezos upumpao u Aleksu su za nas
jako dobre zato što su podigle nivo interesovanja za ono što mi radimo, zato što su tim firmama koje
kupuju našu tehnologiju rekle da ta budućnost dolazi i da su navike potrošača
promenjene. Svaka druga kuća u Americi sada ima Aleksu ili Guglov houm uređaj.

Navike se menjaju. Deca odrastaju razgovarajući sa
tehnologijom. Budućnost je tu iza ćoška.

Je li to dobro ili loše što
neko odrasta razgovarajući s tehnologijom? Takođe, jeste li i vi razmišljali da
ipak uđete u to tržište, da zagrabite nešto i od konzumentske tehnologije?

Kada pravite startap jako je važno da budete fokusirani.
Mi smo B2B kompanija, prodajemo tehnologiju drugim firmama. Kada radite za
konzumente onda su vam ponuda i distribucija drugačiji. Za sada ne. Veoma smo
skoncentrisani da velikim firmama pomognemo u ovome, a ako budemo jako uspešni
i privučemo još više kapitala i izgradimo poziciju na tržištu, videćemo.

Je li Vam opterećenje taj
kapital, ako sam dobro razumeo 12 miliona dolara? Neko ima očekivanja…

Do sada smo digli blizu 30 miliona dolara finansiranja. I
to od nekih vrlo ozbiljnih američkih i britanskih venture kapital firmi. To jeste jedno očekivanje i pritisak, ali je
za nas bilo isključivo pozitivno. Nemate više to opterećenje da li ova firma
treba da ima prihode koji rastu, šta da uzmem sebi, šta da dam zaposlenima,
koliko da uložim u rast, a koliko u nešto drugo.

Kada dignete tako puno novca i uložite u taj rast, onda
vam ambicija postane krajnje megalomanska i idete na to da napravite najbolju
moguću i najuspešniju firmu. To je za mene do sada bilo jedno neverovatno
iskustvo koje bih svakome preporučio.

Malopre nisam dobio savršen
odgovor na moje pitanje, možda bih se bolje razumeo s robotom…

Možda.

Pitanje je bilo koja bi to bila
vaša megalomanska ambicija, ako je imate a smete da je podelite?

Nama je cilj da od ove kompanije napravimo ogromnu
kompaniju koja će izaći na berzu koja će biti deo vašeg svakodnevnog života.
Zovete frizera, restoran, avio kompaniju, gde god pričate sa korisničkom
podrškom mi želimo da budemo deo tog razgovora. Da nemate tu svakodnevnu
frustraciju sa kompjuterom. I da oslobodimo ljudski kapital koji je trenutno
zarobljen u tim kol centrima.

Malopre sam se našalio oko
onog razgovora sa robotom, ali sada se ne šalim. Da li bi bilo moguće napraviti
robota koji bi bio Nikola Mrkšić. Koji bi odgovarao na pitanja u ovom intervjuu
sa velikom verovatnoćom da će reći ono što Vi mislite?

Apsolutno. Ako ste zainteresovani, u polušali smo moj
drug Ivan i ja napravili sistem u kojem ja pričam na srpskom, a njegov glas smo
sintetizovali, mogu da vam pustim deo razgovora.

Dakle moguće je da razgovaram
sa robotom i da mi on da dosta dobar intervju?

Naravno.

To nije slučaj u ovom
razgovoru?

Nije, ne radi nam taj video deo, a i ne izgledam toliko impresivno.
Još nismo došli do tog stadijuma.

Otkud Vi u ovoj priči, uopšte u priči
sa kompjuterima, a onda i u ovom vokalno instrumentalnom sastavu?

Završio sam Matematičku gimnaziju u Beogradu, dobio
stipendiju za Kembridž, otišao tamo. Svašta me je zanimalo, umalo da odem u
investiciono bankarstvo u jednom trenutku. Ali bukvalno dve nedelje pre nego što
bih to uradio upoznao sam jednu grupu ljudi koji su pravili našu prethodnu firmu
VocalIQ. Oni su bili osnivači te firme i pokazali su mi par ovih sistema i bio
sam frapiran koliko je to bilo futuristički.

Odmah sam im rekao da idem s njima u tu priču, bila je to
divna grupa ljudi.

Našu firmu je na žalost ili na sreću godinu i po dana
kasnije kupio Epl. Tako da sam radio za Epl Siri u Kembridžu dve godine.

U isto vreme sam doktorirao i upoznao svoje suosnivače
koji su obojica Tajvanci i čudo od ljudi i zajedno smo radili na tehnologijama
koje su bile potpuno nova oblast, duboko učenje, primena neuronskih mreža za
razumevanje ljudi i planiranje razgovora, sintezu govora. Pošto smo sva trojica
radili na razvoju tih sistema znali smo da imamo ozbiljnu tehnologiju koju nema
niko drugi. U tom trenutku smo odlučili, okej, to je to, pravimo firmu, dižemo
investicije, ceo tim sa Kembridža prebacujemo u firmu i rastemo.

Nakon dve godine imali smo prve klijente iz
ugostiteljstva, onda smo dobili neke banke kao klijente, pa telekomunikacione
firme, firme koje rade dostavu. Kazino nam je najnoviji klijent. To je postala
ozbiljna priča sada.

Ovako kako ste ispričali zvuči
kao da je bilo bez problema, sve je teklo glatko.

Pa, jeste.

Ne znam šta bi rekli drugi startaperi, da li se kod vas možda našao jedan broj izuzetnih
ljudi kojima je sve išlo?

Naravno da imamo neverovatan tim bez kog nikada ne bi do
ovde stigli. Mogu da jadikujem, pa da kažem da sve to zahteva danonoćni rad,
mnogo odricanja, truda, panike, sve je to deo toga. Ali ako ste spremni da se
iscimate oko toga, iskustvo je neverovatno. Ja sa trideset godina sam video
toliko stvari u prodaji i u razvoju proizvoda i programiranju, dizanju novca. Sve
je to neverovatno iskustvo.

I mnogo, mnogo sreće.

Radite li i na srpskom jeziku?

Radimo sve jezike, firma se zove PolyAI zato što je
poliglota, polymath, dakle radi preko
različitih aplikacija.

Pitam jer ste upotrebili izraz
iscimati se. Da li bi mašina razumela
nekoga ko kaže da neće da se cima jer ne
bi da se smori. Ja ne razumem kada mi mlađi ljudi kažu takve stvari, a tek
robot kako to shvata?

Ono što je interesantno u tim najnovijim tehnologijama je
da one u stvarima koje se zovu pretrening čitaju mnogo teksta. Tako radi naš
model. Kada radimo port jezika za srpski mi uzmemo sve materijale sa srpskog sa
interneta gde se koristi dosta tih kolokvijalnih izraza. I pošto ih koriste to
znači da će ih razumeti kada ih susretnu u razgovoru.

Koji biste savet dali nekom učeniku
Matematički gimnazije u koju ste išli, šta treba da radi ako želi da bude dobar
kao Nikola Mrkšić?

Ne znam koliko sam dobar…

Za sada ste dobri 30 miliona
dolara koliko vam je neko poverio za posao.

Pred učenike Matematičke gimnazije se stavlja mnogo
očekivanja, to je veoma, veoma takmičarska sredina. Mislim da treba da stanu na
sekund, pogledaju šta njih stvarno zanima i da umesto da se, možda, fokusiraju
na plasman na neko od međunarodnih takmičenja što je tamo Sveti gral i što sam i
ja radio, ne preterano uspešno, mislim da je bitno da se malo stane i razmisli
šta to želi da se radi i da se onda dugoročno isplaniraju koraci kako da se
tamo stigne.

Pomenuo bih Petnicu kao instituciju koja pomaže ljudima da
izbiju malo iz tog kalupa oštro takmičarskog i da malo prošire vidike.

Srbija ima u odnosu na
veličinu neproporcionalno dobre košarkaše i tenisere, a često kažemo i da ima
mnogo IT stručnjaka. Slažete li se sa time? Da li je Srbija talentovanija ili
manje talentovana od drugih, recimo kad gledate koga biste zaposlili?

Mislim da smo tehnički veoma nadareni, ali ne mislim da
odudaramo od okruženja. Cela istočna Evropa potencira tu rusku školu matematike
gde je obrazovanje jako dobro. Tako da tehnički jesmo vrlo jaki.

Naš temperament ume da bude problem kad već pitate o
zapošljavanju. Prgavi smo, temperamentni, malo dinaroidni i to ume da bude
problem u komunikaciji.

Na nižem nivou, ulaznica
vam je da ste  IT
stručnjak. Ali na višem nivou, da biste postali menadžer i napredovali u karijeri
jako je bitno da ste dobar komunikator i da vam je engleski perfektan.

Mi često verujemo da ako smo tehnički superiorni sve će
nam služiti na tacni, a nije tako. Pa se naši ljudi iznenade kada to ne bude
tako na Zapadu.

A šta biste savetovali nekog
startaperu u Srbiji?

Mislim da u Srbiji ima puno dobrih IT kompanija, taj sektor je uspešan i dobar. Nisam ja tu
pozvan da dajem bitne savete, ti ljudi rade u težim uslovima nego ja ovde. Te su
kompanije stvorene u teškim uslovima, nemaju pristup enormnoj količini kapitala
koji investicione firme investiraju ovde ili u Americi gde ima još više para.

Nije zgoreg kada se radi prodaja da odmah budu
ambiciozni. Izraelci su dobar primer s ove strane okeana. Sales office, čim imate malo kapitala, pravite u Americi jer to je
jedino tržište na kome se prave enormno velike firme.

Možete da imate najbolji proizvod na svetu, kupiće vas pet
godina kasnije daleko manje tehnički sposoban američki kompetitor, takmac, koji
će rasti brže jer ima bolje tržište.

Ne treba to odlagati i fokusirati sa na domaće tržište.
Razvijajte proizvod u Srbiji, ljudi su sjajni, ali prodaja mora da bude u
Americi da bi se napravile globalno bitne firme.

Jeste li razmišljali o otvaranju
ogranka u Srbiji?

Voleo bih to da uradim i voleo bih da provodim više
vremena u Srbiji. Nadam se da će me život za još jednu deceniju vratiti u
Srbiju. Za sada je firma prilično koncentrisana ovde.

Ako bih pozvao vašu firmu telefonom ko bi mi se javio,
sekretarica ili robot?

Mi smo nova firma da i nemamo neki određeni broj na koji
treba da nas zovete.

Mislio sam da pitam da li to
što pravite koristite i za sebe?

Naš osnovni kriterijum za svakog klijenta je da ima pola
miliona poziva. Na žalost još nemam pola miliona klijenata koji me zovu
godišnje, ali čim budem imao i tu će se naći PolyAI.

Šta vam znači to što ste na
Forbsovoj listi 30 ispod 30 u IT-ju?

Ništa posebno.

Je li bilo više poziva nego
inače, dobro, možda ne baš pola miliona?

Jeste, bilo je više interesovanja, ali ne razmišljam o
tome.

(Radio-televizija Srbije)

Напишите коментар