Jak się uczą maszyny?
Proces uczenia się maszyn można porównać do poznawania świata przez małe dziecko. Jest ono w stanie podejmować własne trafne decyzje dopiero wtedy, gdy nabędzie pewną liczbę doświadczeń, z których będzie potrafiło wyciągać wnioski. W wypadku algorytmów funkcję doświadczeń spełniają dane – mając dostęp do dziesiątek tysięcy case studies ludzkich zachowań, jesteśmy w stanie „nauczyć” maszynę umiejętności wyboru ścieżki, którą poszedłby człowiek. Jakie kompetencje są potrzebne do rozwijania technologii związanych z machine learning? Czy posiadamy je na Pomorzu?
Rozmowę prowadzi Marcin Wandałowski – redaktor publikacji Kongresu Obywatelskiego.
Jakiego typu rozwiązania oparte na sztucznej inteligencji (AI) są rozwijane w firmie AirHelp?
W AirHelp wykorzystywane są zalążki sztucznej inteligencji, które właściwie można określić mianem machine learning (ML). Bez rozwiązań w tym zakresie bardzo trudno byłoby zapanować nad olbrzymią ilością spraw, którymi zajmuje się spółka – co miesiąc zgłasza się do niej ponad 400 tys. osób z zapytaniami dotyczącymi tego, czy od linii lotniczej należy im się odszkodowanie w związku z np. opóźnieniem czy odwołaniem lotu. Jako że AirHelp działa globalnie – w 30 krajach, obsługując klientów w 16 językach, bez automatyzacji nie można byłoby prowadzić tej działalności w opłacalny biznesowo sposób.
Na czym polega ML stosowane w AirHelp?
Automatyzacje wykorzystywane w AirHelp wynikają nie tylko z prostego algorytmu, na zasadzie: „Jeśli wydarzyło się X, zrób Y”. Mechanizmy te „uczą się” na podstawie decyzji podejmowanych wcześniej przez ludzi i bazując na nich, podejmują własne decyzje. Aby decyzje podejmowane przez robota były słuszne, musi mieć on dostęp do bardzo dużej ilości spraw obsługiwanych wcześniej przez człowieka. Istnieje bowiem wiele zmiennych, które wpływają na wybory dokonywane przez prawdziwych ludzi – czy to prawników, czy agentów operacyjnych zajmujących się obsługą klienta – których nie da się w prosty sposób sparametryzować. Algorytm analizuje, w jaki sposób dany proces kilkadziesiąt tysięcy razy wykonywał człowiek, i na tej podstawie wyciąga wniosek, że w sprawie X podjąłby on najprawdopodobniej decyzję Y.
W wypadku rozwiązań ML kluczowy jest zatem dostęp do wielkich baz danych?
Aby ML miało sens, maszyna musi mieć dostęp do dużej liczby przypadków – tak, by była zachowana istotność statystyczna. Im mniej przypadków przeanalizuje robot, tym większe prawdopodobieństwo, że jego decyzja nie będzie w danej sprawie optymalna. Można to porównać do prawdziwej, ludzkiej inteligencji, która formuje się u dzieci – wiedza i decyzje, które podejmują one już jako dorośli, bazują na tym, co zobaczyły i czego doświadczyły w dzieciństwie. Skoro coś jest czerwone, może być gorące, więc lepiej tego nie dotykać – jeśli raz się sparzę, następnym razem dwa razy się zastanowię, czy tego dotykać. Ta wiedza kształtuje się na podstawie wcześniejszych doświadczeń, których musi być odpowiednio dużo – gdy dziecko ma dwa lata i tych doświadczeń jest jeszcze niewiele, wielu rzeczy często jeszcze nie wie i popełnia błędy.
Jeśli po lewej stronie osi znajduje się powtarzalna automatyzacja, a po prawej – sztuczna inteligencja, w którym miejscu należałoby umieścić ML? Czy nie opiera się ona na powtarzalności, tyle że po prostu w wielkiej skali?
Moim zdaniem ML jest wstępem do sztucznej inteligencji. Nie zgadzam się bowiem ze stwierdzeniem, że AI nie bazuje na powtarzalności. Kiedy dziecko uczy się samo, w pewnym momencie jest w stanie podejmować własne trafne decyzje właśnie dzięki bardzo dużej liczbie sytuacji (danych), których już doświadczyło. Bez tej wiedzy inteligencja nie zadziała – jej kształtowanie i rozwój bazują na coraz lepszym wykorzystywaniu danych, które są dookoła nas. I to dzięki właściwemu ich doborowi jesteśmy w stanie podjąć właściwą decyzję. Tak działa ludzka inteligencja, a AI to kwestia zaprogramowania tego, by maszyna robiła to w miarę samodzielnie. Za pomocą kilkudziesięciu tysięcy A (zdarzeń) i kilkudziesięciu tysięcy B (decyzji) algorytm wybiera ścieżkę, którą poszedłby człowiek. Bez wielkich baz danych nie ma mowy o rozwijaniu AI.
Nie zgadzam się ze stwierdzeniem, że AI nie bazuje na powtarzalności. Kiedy dziecko uczy się samo, w pewnym momencie jest w stanie podejmować własne trafne decyzje właśnie dzięki bardzo dużej liczbie sytuacji, które już doświadczyło. Bez tej wiedzy inteligencja nie zadziała – podobnie jest w wypadku maszyn.
Jaki jest zakres obowiązków, które w AirHelp obsługują maszyny?
AirHelp wykorzystuje wiele botów, w tym – Larę oraz Agę. Pierwszy dokonuje oceny, czy dany wniosek o odszkodowanie ma szanse na wygraną w sądzie, a jeśli tak wskazuje w którym. Spółka działa bowiem w kilkudziesięciu jurysdykcjach i w sytuacji, gdy dana linia lotnicza odmawia wypłaty odszkodowania, które zdaniem AirHelp się należy, kieruje ona sprawę do tego sądu, w którym ma największe szanse na wygraną. Może się on znajdować w jurysdykcji siedziby linii lotniczej, jurysdykcji wylotu pasażera, bądź też jego przylotu. Wybór miejsca rozstrzygania sporu jest dokonywany przy uwzględnieniu przeszłych spraw wygranych w sądach, a także m.in. czasu oraz kosztów postępowania. Są to pewnego rodzaju niuanse – w różnych jurysdykcjach różni sędziowie różnie interpretują pewne zdarzenia. Lara ma to wszystko „wyłapać”.
Czym natomiast zajmuje się Aga?
Aga działa na wcześniejszym etapie, wspierając agentów operacyjnych. Stanowią oni największy, ponad 300‑osobowy zespół firmy i odpowiadają za kontakt z klientami we wstępnej ocenie wniosku i zbieranie dokumentów potrzebnych do rozstrzygnięcia danej sprawy. Jako że AirHelp współpracuje z ponad 400 liniami lotniczymi, wachlarz tych formalności bywa naprawdę różny. Do zadań Agi należy m.in. sprawdzanie, czy dokumenty zostały wypełnione poprawnie – np. gdy ktoś w miejscu podpisu postawi krzyżyk czy kropkę, robot widzi, że to nie wygląda jak podpis i przekazuje tę informację agentowi z prośbą o sprawdzenie. Do takiego wniosku dochodzi po uprzednim przeanalizowaniu tysięcy innych formularzy – na tym właśnie polega technologia machine learning. To bardzo przyspiesza proces obsługi klienta.
Jakich kompetencji potrzeba, by udoskonalać technologie związane z ML?
Na ML składa się przynajmniej kilka sfer, w każdej organizacji może to wyglądać inaczej. W AirHelp bardzo ważnym działem jest data science – specjaliści z tej dziedziny wskazują programistom modelującym boty miejsca, gdzie istnieją pewne korelacje, które warto, by robot analizował w pierwszej kolejności. Nie można tego zrobić na zasadzie: masz tu całą bazę i zobacz, co w niej widzisz. Proces uczenia maszyny to kodowanie jej inteligencji, umiejętności, to nakierowywanie jej na pewne ścieżki.
W całym procesie bardzo ważne jest też podejście stricte projektowe – łączenie świata inżynierii i oprogramowania ze światem realnym. Trzeba mieć kontakt z żywym klientem, wiedzieć, czego oczekuje, jak przedstawia swoje racje i swój punkt widzenia, a następnie potrafić przeobrazić to w kod, w robota, będącego później w stanie spełnić te oczekiwania. Uważam, że akurat tego doświadczenia jest w Gdańsku oraz – szerzej – w Polsce najmniej. Trudno w naszym kraju znaleźć osobę z 10‑ czy 15‑letnim doświadczeniem zakresie produkcji internetowej. Nie ma co się dziwić – na początku XXI w. takie produkty w naszym kraju nie istniały, wtedy biznesy internetowe dopiero zaczynały się u nas budować, nie były tak zaawansowane jak na Zachodzie. Choć mamy więc bardzo dużo świetnych programistów, brakuje nam osób o szerszym spojrzeniu na użytkownika, na budowę produktu. Między innymi dlatego część zespołu produktowego AirHelp mieści się w Berlinie, a nie w Gdańsku.
Choć mamy na Pomorzu bardzo dużo świetnych programistów, brakuje nam osób o szerszym spojrzeniu na użytkownika, na budowę produktu. Osób potrafiących zrozumieć oczekiwania klienta i przeobrazić je w kod.
Jak duża część pracy związanej z doskonaleniem ML odbywa się w Gdańsku?
AirHelp ma trzy lokalizacje – Gdańsk jest największą, kolejne miejsca to Kraków oraz Berlin. Na Pomorzu znajduje się cały dział data science, a także mniej więcej połowa działu inżynierii. Można powiedzieć, że 70% działalności R&D spółki powstaje w Gdańsku. Tu też jest najwięcej pracowników – prawie 500.
Artykuł ukazał się w regionalnym thinkletterze „Idee dla Pomorza” nr 2/2020. Kompletne wydanie w postaci pliku pdf można pobrać tutaj.
Wydawca
Partnerzy