Słyszymy już o tekstyliach, które zabijają wirusa, o aplikacjach, które mają nas informować, czy...
“Powinniśmy inwestować w technologie, które w centrum stawiają człowieka, użyteczność i dbałość o prywatność”
Przeczytaj
W minionym tygodniu, na zaproszenie marki Mercedes-Benz, miałem możliwość udziału w pierwszej polskiej konferencji me Convention, która miała miejsce podczas targów Poznań Moto Show. Me Convention to format spotkań Mercedesa, skupiony wokół wystąpień i rozmów na tematy dotyczące nowych technologii i wizji przyszłości. Event zadebiutował we Frankfurcie, we wrześniu minionego roku, swoją kontynuację miał w ramach tegorocznego SXSW, a kolejna jego edycja odbędzie się jesienią w Sztokholmie. W Poznaniu, wspólnie z Pawłem Pilarczykiem z PCLab.pl, rozmawialiśmy o inteligentnych asystentach, technologiach głosowych oraz ich zastosowaniu w naszym codziennym życiu i motoryzacji.
Całość naszej dyskusji w formie video znajdziecie poniżej. Dla tych z Was, którzy chcą mocniej zgłębić trend Voice Interfaces – w moim przekonaniu jeden z kluczowych w niedalekiej przyszłości w kontekście komunikacji na linii człowiek-technologia – przygotowałem zestawienie najważniejszych informacji z rynku wraz z moimi predykcjami.
* Interfejsy głosowe uwolnią nasze dłonie i wzrok od ekranów. Nastąpić może powrót do ery przedsmartfonowej z uwagi na to, że technologia staje się dyskretna. Będzie obecna wokół nas, ale jej fizyczny udział w naszym życiu będzie mniejszy.
* Komunikacja głosowa z urządzeniami stanie się oknem na świat dla osób niewidzących oraz tych, dla których korzystanie z telefonu czy komputera jest znaczącym utrudnieniem.
* Polska nie jest jeszcze w pełni beneficjentem trendu Interfejsów Głosowych, głównie dlatego, że kluczowi dostawcy technologii inteligentnych asystentów nie wspierają polskiego języka. Z tego względu komunikacja z urządzeniami typu Google Home czy Amazon Alexa jest nie tyle utrudniona, co mało naturalna. Polski startup Kogifi planuje premierę asystenta głosowego z polskim interfejsem głosowym w lecie tego roku.
* Urządzenia z segmentu asystentów głosowych będą rywalizowały ze smartfonami o miano urządzeń centralnych w naszym domach, gdy usprawniony zostanie sposób komunikacji z nimi, co nastąpi w najbliższych latach.
* Największe firmy technologiczne inwestują ogromne budżety w obszar interfejsów głosowych. Dopracowany asystent w naszym domu to także realizacja procesu zakupowego znacznie szybciej niż poprzez telefon komórkowy. Zakupy dokonywane będą głosem, wygodnie, szybciej i bez użycia ekranu.
* Na dzień dzisiejszy nadal poznajemy i oswajamy technologię głosową, zauważamy również jej niedoskonałości. Jako klienci jesteśmy zainteresowani nowymi technologiami, gdy jest ona dla nas przyjazna i działa bez zarzutów.
* TERAZ: proces wczesnej adaptacji i 1 kontaktu z urządzeniami sterowanymi głosem. Intensywne prace nad samą technologią i poprawą płynnej komunikacji człowiek – urządzenie.
* W PRZYSZŁOŚCI: Głos będzie pilotem do sterowania naszym otoczeniem. Mniej ekranów, mniej przycisków w ich miejsce sterowanie gestami i mową.
* Aktualny Word Error Rate: w okolicach 5% (Google deklaruje 4,9%). WER – to miara postępu prac nad technologią głosową. Im mniejszy wskaźnik Word Error Rate, tym lepiej maszyny rozumieją i przetwarzają ludzki głos.
* Dynamika zmiany w obszarze skuteczności rozpoznawania ludzkiego głosu przez urządzenia: 70% poprawnego rozpoznania w 2010r., 96% skuteczności w 2017r.
* 66% posiadaczy urządzeń Amazon Alexa nigdy nie kupiło jeszcze niczego poprzez komendy głosowe, 60% z nich nawet tego nie próbowało.
* Technologii głosowych najczęściej używamy: w domu (43% wskazań), w samochodzie (36%), w komunikacji miejskiej (19%) – ostatnia liczba mnie osobiście mocno dziwi, ponieważ tylko 6% badanych deklaruje, że w miejscu publicznym używałoby głosu jako sposobu komunikacji z urządzeniem przenośnym.
* Globalnym liderem technologii głosowych jest Amazon (ok. 70% rynku). Co ciekawe, w Q4 2017 roku Amazon odnotował wzrost aktywacji urządzeń z jego technologią o 137% (rok do roku), a Google w tym samym okresie zaliczył wzrost o ponad 1500% (sic!).
* Według firmy Gartner w 2020 roku 50% wyszukiwań w internecie będzie dokonywanych przy użyciu głosu.
* 12 mld USD to prognozowana wartość sprzedanych dóbr przy użyciu głosu w 2021r.
* Amazon Alexa i rozwój jej umiejętności: z 1000 do 7000 umiejętności w 7 miesięcy (umiejętności to aplikacje zainstalowane w asystencie głosowym, zwiększające jego możliwości. Przykładowo umiejętnością jest możliwość słuchania utworów ze Spotify na urządzeniu Amazon Echo).
* 50% użytkowników Alexy chce głębszego dialogu z nią i chętnie poda więcej danych osobistych, by uzyskać bardziej dokładną odpowiedź.
* Największe zastosowanie technologia głosowa znajdzie w: domach, samochodach, kontroli urządzeniami mobilnymi.
* Dlaczego korzystamy z technologii głosowej? Jest wygodna, prosta w użyciu, działa szybciej niż pisanie.
* IBM wypuścił własnego asystenta głosowego Watson Assistant w formie white label. Nie jest on przypisany do konkretnego, pojedynczego urządzenia od IBM. Z technologii skorzystać będą mogli partnerzy firmy, integrując rozwiązanie głosowe Watson Assistant z własną technologią. W ten sposób IBM chce odebrać kawałek tortu rynku asystentów głosowych Amazonowi.
* Baidu zaprezentował kilka dni temu translator językowy, który w czasie rzeczywistym tłumaczy płynnie bardziej złożone zdania, umożliwiając rozmowę dwójki osób mówiących w różnych językach. Główne i pierwsze jego zastosowania – lotniska i przestrzeń miejska. Projekt nadal w wersji testowej.
* Organizacja non-profit Consumer Watchdog, dbająca o prawa konsumentów, przeanalizowała patenty Google’a i Amazona związane z technologiami głosowymi i w obu przypadkach dopatrzyła się funkcjonalności, które w przyszłości mogłyby przekazywać potencjalnym reklamodawcom wrażliwe dane użytkowników.
* Google uruchomiło niedawno płatności głosowe przy użyciu jednej komendy. Z kolei Amazon dał użytkownikom Alexy możliwość przekazania w ten sam sposób darowizny na jedną z niemal 50 organizacji dobroczynnych.
* 56% użytkowników asystentów głosowych korzysta z nich do odsłuchiwania informacji w domu – to dobry znak dla branży automotive oraz świetne zastosowanie i synergia z systemami rozrywki w pojazdach. Nawyk odsłuchiwania informacji łatwo będzie przenieść z domu do samochodu.
* Rozmowa z samochodem może stać się normą już stosunkowo niedługo – w ciągu 7-8 lat.
* Interfejsy głosowe to – moim zdaniem – technologia niemal na miarę pasów bezpieczeństwa. Ich dopracowanie w obszarze zaawansowanej komunikatywności z człowiekiem znacząco wpłynie na bezpieczeństwo kierowców i pasażerów (np. zniknie odruch sięgania po telefon komórkowy lub potrzeba zmiany ustawień samochodu na ekranie dotykowym).
* “Różnica pomiędzy 95% a 99% rozumienia ludzkiej mowy przez urządzenia jest kolosalna. Decyduje o tym, czy z technologii głosowej będziemy korzystać nieustannie, czy też w ogóle” – Andrew Y. Ng.
* Mercedes-Benz w swoim własnym systemie głosowym MBUX wprowadzi język polski. Początkowo mają być to tylko proste komendy, w przyszłości, bardziej zaawansowana wymiana zdań kierowcy z pojazdem.