Wiadomość o pojawieniu się polskiej wersji asystenta Google jest trochę ważniejsza niż nam się wydaje. Z racji tego, że nasz język jest jednym z trudniejszych na świecie, a i Polska nie jest super wielkim rynkiem dla Google, byliśmy nieco dalej w kolejce i ominęłaby nas ta mała rewolucja – a mianowicie sterowanie głosowe. I tu celowo zostawiam brak rzeczownika. Bo czym możemy sterować głosowo? Właściwie to … wszystkim co ma możliwość bycia podpiętym do Internetu lub zasilanie tegoż może być podpięte do Internetu i spięte z usługami Google. Mieliśmy okazję stworzyć POC (Proof of Concept) rozwiązania, które z wykorzystaniem asystenta Google wspiera procesy zarządzania pracownikami w firmie i jest parę wniosków, które przedstawię w tym artykule.

 

Wyobraź sobie, że wchodzisz do domu i rzucasz do telefonu komendę ‘Ok, Google. Jestem!’ i zapala się światło, włącza telewizor, mikrofalówka podgrzewa obiad. To są rzeczy, które możemy sobie sami skonfigurować, ale co w przypadku gdybyśmy chcieli podejść do trochę poważniejszych tematów? Jednym z nich jest na przykład wykorzystanie najnowszych technologii cyfrowych w dziedzinie zdominowanej przez człowieka – zarządzaniu zasobami ludzkimi.

Dla jednego z naszych klientów (duża międzynarodowa korporacja) zrealizowaliśmy POC, który miał na celu sprawdzenie czy asystenta głosowego można stosować w warunkach biurowych do optymalizacji procesów HRowych w firmie.

Przed POCem postawione były następujące zadania:

  • określenie technologicznych barier rozwiązania, na przykład lista wspieranych urządzeń (konieczność korzystania z dwóch różnych technologii na iOS i Androidzie), wydajność rozwiązania, określenie niedoskonałości technologii w relacji do kosztów, tzn. korzystanie z API Google jest darmowe, ale z racji tego, że ono nie jest w stanie zrobić wszystkiego, część pracy musi wykonać developer.
  • określenie innych barier, np. dojrzałości technologicznej grupy docelowej, np. większość użytkowników smartfonów nie wie, że ma możliwość korzystania z asystenta głosowego, nie mówiąc już o tym, żeby robić to efektywnie. Tego samego rodzaju bariery ludzkość przekraczała, kiedy wchodziły na rynek komputery sterowane myszką i smartfony sterowane dotykiem.
  • zasadność użycia rozwiązania, np. czy w organizacji takie rozwiązanie przyniesie faktycznie wymierną korzyść czy też wygeneruje więcej problemów. Niektóre organizacje mają świadomość konieczności testowania różnych rozwiązań, bo być może jedno z nich stanie się w przyszłości obowiązującym standardem. W tym konkretnym przypadku klient sugerował się rosnącą popularnością głośników i asystentów głosowych w zastosowaniach domowych.

Samo rozwiązanie oparte było o Dialogflow w wersji pierwszej, które wykorzystywane jest jako mechanizm kategoryzowania wypowiadanych przez użytkownika zdań. Jego celem było zapewnienie pracownikom firmy komunikacji głosowej z wirtualnym asystentem.  W ten sposób możliwe było zadanie pytania min. o warunki  zatrudnienia, przysługujące benefity czy też informacje dotyczące urlopu macierzyńskiego lub wypoczynkowego.  Za rozpoznawanie głosu oraz transkrypcję do tekstu odpowiada silnik rozpoznawania mowy na Androidzie oraz Siri na iOSie.

Ciekawostka – jeżeli chodzi o skuteczność rozpoznawania mowy to niekwestionowanym liderem pozostanie narzędzie Google, w dalszej kolejności  Alexa od Amazona, Cortana Microsoftu, która mimo braku wsparcia w postaci smartfonów wypada lepiej niż Siri od Apple’a pod względem liczby poprawnych odpowiedzi. Dialogflow od Google w wersji 1.0 (użyliśmy akurat starszej wersji ze względu na to, że 2.0 wspiera tylko Androida) odpowiada za  wstępne przetwarzanie i kategoryzowanie odpowiedzi, natomiast nasze autorskie rozwiązanie, umieszczone w chmurze Amazonu, za dopasowanie konkretnych kategorii do treści dostępnych w sieci wewnętrznej klienta. Na przykład wypowiadamy pytania do telefonu, a w zamian otrzymujemy konkretne akapity dotyczące interesującej nas kwestii z regulaminu firmowego.

 

Wnioski:

  • mamy do czynienia z całkowicie nową metodą sterowania oprogramowaniem, co niesie ze sobą całkowicie nowe wyzwania w dziedzinie UX – znajomość ograniczeń technologii poważnie wpływa na to czy w ogóle i w jakim stopniu użytkownik jest w stanie skorzystać z rozwiązania,
  • systemy rozpoznawania mowy, jak się okazuje, są bardzo wrażliwe na akcent danej osoby; np. osoby pochodzenia irlandzkiego czy szkockiego, w ogóle nie były zrozumiane przez asystenta, który był nastawiony na odbiór angielskiego w odsłonie londyńskiej,
  • Dialogflow dzięki temu, że jest w stanie przechowywać kontekst wątku, umożliwia głębszą analizę przetwarzanego dokumentu,
  • model rozpoznawania i kategoryzowania w Dialogflow oparty jest o słowa kluczowe, z czego wynikają dość poważne ograniczenia w funkcjonalności – należy świadomie i oszczędnie gospodarować słowami kluczowymi, żeby uniknąć pułapek niejednoznaczności. Wiem, brzmi to skomplikowanie, bo takie jest – na przykład pytamy asystenta Google o urlop wypoczynkowy. Tych jest parę rodzajów – wypoczynkowych, macierzyńskich, na żądanie, etc. – o urlopie możemy mówić w kontekście przysługujących dni, ekwiwalentów, praw, a te informacje są umieszczone w kilku miejscach w regulaminie firmy. Musimy podać Google kontekst, o jaki nam chodzi. „Ok Google, ile urlopu wypoczynkowego mi zostało, chcę wyjechać na wakacje”, Google będzie w stanie z kontekstu wskazać liczbę dni wolnych, która nam przysługuje, ewentualnie podpowie o „wczasach pod gruszą”.

 

 

Należy mieć na uwadze, że główni gracze, tj. Google, Apple, Microsoft i Amazon nie ustają w wysiłkach, by poprawiać swoje produkty w związku z tym, opisane wyżej problemy mogą się już za miesiąc okazać historią.

Mam nadzieję, że materiał okaże się przydatny. Jeśli chcesz wdrożyć asystenta Google w swojej organizacji i w ten sposób zoptymalizować procesy biznesowe w firmie, skontaktuj się z nami.

Oceń ten wpis
(4)
MakoLab korzysta z plików cookie w celu realizacji usług zgodnie z Polityką prywatności. Możesz określić warunki przechowywania lub dostępu do cookie w Twojej przeglądarce lub konfiguracji usługi.
Obserwuj MakoLab na portalach społecznościowych
Chcesz być na bieżąco z MakoNewsami? Zapisz się na nasz newsletter.