Poznając tę historię, dowiemy się, jak uczenie maszynowe wygląda od kuchni.
fot. unsplash.com
Pewnego razu naukowiec nazywający się Dan Steinberg odebrał telefon z największego amerykańskiego banku, który zmagał się z nowym poziomem ryzyka. Aby sobie z nim poradzić, bank postanowił zaufać specjaliście od nauki maszynowej.
Był to początek owocnej znajomości, gdyż Dan miał właściwe środki i metody, by pomóc bankowi. Jako przedsiębiorczy naukowiec stworzył komercyjny system prognostyczny, którzy przenosił wyniki badań z laboratorium w obszar korporacyjny. Bank jako wiano wniósł elektroniczne zasoby: niekończące się ciągi zer i jedynek.
Bank dawał dane, Dan miał maszynę. Był to związek zaplanowany w niebiosach. Marząc na jawie, często gryzmolę na marginesach:
Dojrzalszy profesjonalista otworzyłby swoje serce w bardziej formalny sposób, przedstawiając to tak, jak to zrobiłem w poprzednim rozdziale:
Bank zmaga się z ryzykiem
W przypadku każdej organizacji ryzyko finansowe pełza niepostrzeżenie, doskonale zamaskowane. Duże straty są wypadkową wielu małych strat, które same w sobie wydają się nieszkodliwe. Drobne, niezwracające uwagi niepowodzenia nie są dostrzegane przez radar. Praktycznie są niewidoczne.
Wkrótce po megapołączeniu w 1996 roku, które uczyniło z Chase największy krajowy bank, zespół finansowy dostrzegł nowe ryzyko – portfel kredytów hipotecznych znacząco wzrósł. Obecnie składał się z tego, co pierwotnie stanowiło własność sześciu banków; były to miliony hipotek. Każda z nich oznaczała jakiś stopień ryzyka. To dlatego zadzwonił telefon Dana.
Jak na ironię istnieją dwa przeciwstawne, niekorzystne dla banku zachowania kredytobiorcy − klient może nie spłacać zobowiązań lub może je spłacić w całości, lecz zbyt szybko.
- Mikroryzyko A: klient nie spłaca rat.
- Mikroryzyko B: klient spłaca szybko cały kredyt hipoteczny dzięki refinansowaniu konkurencyjnego banku lub dlatego, że sprzedał dom. Taka płatność przynosi stratę, ponieważ bank nie inkasuje zaplanowanych odsetek.
Takie straty są określane jako „mikro”, gdyż dla banku jeden kredytobiorca nie stanowi problemu. Jednak mikrostraty składają się na większą całość. W świecie finansów słowo ryzyko najczęściej odnosi się do ryzyka kredytowego, czyli mikroryzyka A, gdy zaległość nie jest odzyskana i bank traci ją na zawsze. Jeśli jednak źródłem masła na chlebie są odsetki, mikroryzyko B to także nie żarty. Mówiąc wprost, bank nie chce, żebyś się oddłużył.
Prognozowanie walczy z ryzykiem
– W większości dyskusji dotyczących podejmowania decyzji zakłada się, że podejmują je tylko menedżerowie wyższego szczebla lub że tylko ich decyzje mają znaczenie. Jest to niebezpieczny błąd – Peter Drucker, amerykański ekspert w dziedzinie zarządzania i pisarz, urodzony w 1909 roku.
Portfel kredytów hipotecznych Chase był narażony na ryzyko liczone w setkach milionów dolarów. Każdy dzień na plaży jest taki sam, a każde ziarenko piasku na plaży jest mikroryzykiem. Gdy wniosek o kredyt hipoteczny otrzymuje status „niskie ryzyko”, proces zarządzania dopiero się rozpoczyna. Portfela kredytów hipotecznych trzeba pilnować jak stada krów na farmie mlecznej. Dlaczego? Ryzyko jest niewidoczne. Miliony hipotek czekają na decyzje, które z nich sprzedać innym bankom, które zatrzymać, a które refinansować z mniejszym oprocentowaniem.
Analityka predykcyjna (AP) jest antidotum na szkodliwe nara- stanie mikroryzyka. AP czuwa i oznacza każde zagrożenie, by organizacja mogła z nim coś zrobić.
Nie jest to nic nowego. Metoda jest powszechna i sięga początków AP. Prognozowanie ryzyka związanego z danym klientem jest dobrze znane jako klasyczny rating kredytowy; usługi tego typu świadczy FICO i inne firmy, jak na przykład Experian. Początki tej metodologii to rok 1941, a jej nazwa funkcjonuje w języku potocznym. Jej wdrożenie było bardzo istotne dla AP, a sukces pomógł kształtować wizerunek analizy predykcyjnej. Współczesne ratingi często są budowane na podstawie metod prognostycznego modelowania wykorzystywanych w AP.
Bardzo łatwo jest zaprezentować korzyści wynikające z zastosowania AP do walki z ryzykiem. Choć samo stworzenie modelu może nie być proste, to gdy on już działa, potrzebna jest tylko podstawowa matematyka, by wyliczyć niezbędne wartości. Wyobraź sobie, że kierujesz bankiem, który ma portfel tysięcy pożyczek, z których 10 procent nigdy nie zostanie spłaconych. Jeden na dzie- sięciu klientów nie wywiąże się ze zobowiązań, lecz przyszłość jak zwykle jest nieodgadniona – nie wiesz obecnie, kto to będzie.
Załóżmy, że oceniasz każdą pożyczkę pod kątem ryzyka, wykorzystując do tego efektywny model prognostyczny. Niektórzy klienci zostają ocenieni jako bardzo ryzykowni, a inni jako mało ryzykowni. Jeśli rating przeprowadzony jest prawidłowo, w grupie klientów ocenionych jako najbardziej ryzykowni (połowa portfela) liczba niespłacających może być dwukrotnie większa od średniej, jednak bardziej realne będzie przyjęcie założenia, że będzie ich o 70 procent więcej niż wynosi średnia. Brzmi to jak muzyka dla twoich uszu. Nieco matematyki i podzieliłeś portfel na dwie połowy; w jednej z nich liczba niespłacających wyniesie 17 procent (70 procent więcej od średniej wynoszącej 10 procent), a w drugiej 3 procent (17 procent i 3 procent uśrednia się do 10).
- Pożyczki o wysokim stopniu ryzyka: nie zostanie spłaconych 17 procent.
- Pożyczki o niskim stopniu ryzyka: nie zostanie spłaconych 3 procent.