Смартфоны умели все это время подслушивать без спроса

 

nEJpW29d4eo1

Ученые показали возможность использования мобильных гироскопов для записи и распознавания речи.

 

 

Гироскоп для мобильных устройств по технологии MEMS. Изображение: digikey.com

Гироскопы, которые встраиваются в большинство современных смартфонов, можно использовать в качестве примитивного микрофона, причем качества звука достаточно для распознавания речи. К таким выводам пришли ученые из Стэндфордского университета и Центра имени Рафаэля в Израиле. О работе можно прочитать в препринте авторов.

Небольшие электронные гироскопы в паре с акселерометрами позволяют мобильному устройству с большой точностью определять свое местоположение в пространстве. Это используется во многих функциях, таких как автоматический переворот экрана, а также в приложениях и играх. Гироскопы измеряют угловую скорость устройства во всех трех осях. Обычно эти устройства состоят из массивного диска, вращающегося вокруг некой оси. Из-за закона сохранения момента импульса при попытке повернуть гироскоп вокруг другой оси возникает сила сопротивления, измерив которую, можно судить об угловой скорости. В 80 процентах мобильных гироскопов используется система из двух пар колеблющихся грузиков. При вращении такой системы вокруг любой из осей на грузики начинает действовать сила Кориолиса — инерциальная сила, аналог центробежной, возникающая в неинерциальной вращающейся системе отсчета и действующая на тело вдоль радиуса поворота. Измерив эту силу, можно получить значение угловой скорости.

Небольшой вес грузиков, использующихся в таких гироскопах, приводит к тому, что они оказываются чувствительными даже к звуковым колебаниям. Этот факт был известен и ранее: громкие звуки вблизи мобильного устройства сильно затрудняли работу гироскопов, а иногда и вовсе делали их нечувствительными к любым поворотам. Ученым пришла идея использовать эту чувствительность к звукам в качестве примитивного микрофона. На всех мобильных устройствах установлено искусственное ограничение на частотный диапазон, воспринимаемый гироскопом, — 200 герц, в некоторых случаях ниже, что лежит в пределах звукового диапазона. Это сделано с целью экономии батареи, так как сложно себе представить, что мобильное устройство будут вращать со скоростью больше 200 оборотов в секунду.

При помощи технических уловок, таких как использование эффекта наложения звуковых спектров, удалось расширить воспринимаемый диапазон до 280 герц. Звуковой чувствительности оказалось достаточно для записи звуков силой от 67 децибел, что соответствует уровню обычного разговора. Расположение смартфона относительно говорящего не влияло на распознавание — гироскопы оказались одинаково чувствительными к звукам ото всех направлений. Так как гироскопы могут записывать лишь звуки из очень низких регистров (диапазон человеческого голоса составляет 20-1100 герц), то сигнал, записанный с их помощью, на слух воспринять невозможно, он кажется просто низкочастотным шумом. Однако при помощи алгоритмов машинного обучения его можно распознать и даже разобрать отдельные слова.

В результате эксперимента ученым в 50 процентах случаев удавалось идентифицировать одного говорящего. Максимальная точность распознавания речи для для одного человека составила 65 процентов, средняя — 26 процентов. В случае использования нескольких устройств одновременно (к примеру, во время конференции) удалось повысить эту отметку до 77 процентов. Для распознавания речи использовалось открытое приложение Sphinx.

Интерес ученых к этому исследованию вызван следующим: почти во всех мобильных устройствах приложения и браузер могут получать доступ к микрофону, однако для этого они запрашивают авторизацию у пользователя. В случае же с гироскопом этого не требуется: к этому устройству есть прямой доступ у любого приложения. Таким образом, как показали авторы, злоумышленники, знакомые с описанной технологией, могут прослушивать разговоры вблизи мобильного устройства и даже потенциально похищать такую информацию, как номера кредитных карт, так как чувствительность к ограниченному набору слов (цифры, к примеру) у программ обычно выше.