Eksperci cyberbezpieczeństwa: voice hacking po smartfonach

Groźna luka w wybieraniu głosowym. Smartfon "usłyszy" komendę hakera

Wyobraź sobie, że słuchasz audycji w internetowym radiu, albo oglądasz film zyskujący na popularności w YouTube. W tle dźwięku z głośników pojawił się na moment jakiś zgrzyt. Odgłos, któregoż nie umiesz zidentyfikować. Sądzisz: to pewnie jakieś zakłócenie po stronie dostawcy. Jak i również dobrze. Masz tak mniemać.

To był treść podprogowy adresowany do waszych telefonów. Komenda nakazująca mu przeprowadzić rozmowę telefoniczną na policję, albo rozewrzeć stronę z wirusem.

Autorzy Business Insidera odrzucić zabrali się za pisanie scenariuszy do filmów science-fiction. Powyższa sytuacja nie wydaje się zmyślona. Ktoś tego dokonał. Należy się bać? Naprawdę. Na razie to nowo odkryta podatność, aczkolwiek stosowana na szerszą miarę może poczynić olbrzymie spustoszenie.

Komenda głosowa zaszyta w transmisji

Naukowcy z zagranicznego University of California, Berkeley i Georgetown Univeristy opublikowali bardzo ciekawą pracę. Jest niejako uzupełnieniem, rozwinięciem roboty innych naukowców badających maszyneria rozpoznawania mowy przez jednostki i maszynę.

Programy komputerowe jak ludzie potrafią „słyszeć”, choć słyszą kompletnie inaczej. Zatem badacze postawili sobie pytanie: Czy da się stworzyć komputerową komendę głosową słyszalną dla aplikacji, ale niezrozumiałą lub chociażby niesłyszalną dla człowieka?

Innymi słowy, czy trochę, co dla człowieka jest hałasem, telefon zrozumie jako komendę i posłusznie ją wykona?

Odpowiedź brzmi „tak”, z kilkoma „ale”.

Badano asystentów głosowych w dwóch modelach iphoneów: Samsungu Galaxy S4 w Androidzie z preinstalowaną funkcją wybierania głosowego Google Now, a także iPhone 6 z asystentem głosowym Siri oraz aplikacją Google Now.

Autorzy badania zniekształcając komputerową komendę głosową „Ok Google, call 911” zmusili telefon, by zadzwonił w policję. Byli również w stanie zmusić jego, by przełączył się w tryb samolotowy. Brzmi ma możliwość i ciekawie, ale niegroźnie.

Jednak zdołali też skłonić telefon, by otworzył określoną przez nich witrynę. I teraz łatwo przedstawić sobie następstwa, jeśli będzie w niej zaszyte szkodliwe oprogramowanie.

Autorzy zaznaczyli, że Siri charakteryzowała się selektywną głuchotą – Google Now był znacznie bardziej podatny na zniekształcone przy pomocy komputera komendy głosowe.

Efekt naturalnie uzależniony był od momentu szeregu czynników, jak typ głośnika, odległość od telefonu, techniki użytej przy zniekształcaniu dźwięku. Asystent rozumiał komendy płynące z głośnika oddalonego o ok. 3 metry, ale gubił się obok większej odległości.

Asystent głosowy też się myli

Co nie znaczy, że telefony były nieomylne. Asystent głosowy Google zapytany „jaka wydaje się moja aktualna lokalizacja" zrozumiał jako ociąganie się. To wynik gry słów po języku angielskim: pytanie „what is my current location” Google Now zrozumiał jako „procrastination” [ang. zwłoka, odwlekanie, ociąganie się].

Próbkę zniekształconych komend znajdziesz w filmie poniżej.

Choinki online - zamów albo wypożycz - nowy biznes na święta