Ок!, Я СЛУШАЮ
Статьи сообщества Август 6, 2022
НОВАЯ ТЕХНОЛОГИЯ GOOGLE VOICE НАУЧИТСЯ РАСПОЗНАВАТЬ АЛЬТЕРНАТИВНЫЕ МОДЕЛИ РЕЧИ
Для людей с заиканием, использование цифрового голосового помощника на вашем телефоне или умной колонке может быть затруднительным. То же самое верно и для использования автоматических голосовых подсказок на горячих линиях поддержки клиентов. Но последние разработки в техническом сообществе во главе с Google быстро развиваются, чтобы удовлетворить различные потребности пользователей по всему миру.
По словам Боба Макдональда, технического менеджера программы в Google, достигнут значительный прогресс, благодаря которому людям с нетипичными речевыми моделями будет намного проще быть услышанными и понятыми программами искусственного интеллекта, которые интегрируются во все больше устройств, которые мы используем каждый день.
«Наша цель — помочь устройствам понимать людей, которые заикаются, так же, как и членов их семей», — сказал Макдональд. «Все началось с проекта Euphonia».
Проект Euphonia
Project Euphonia — это исследовательская инициатива Google, направленная на то, чтобы помочь научиться понимать лучше людей с нетипичной речью. Подход основан на анализе речевых записей для лучшего обучения моделей распознавания речи.
Для миллионов людей во всем мире, чью речь трудно понять другим, общение лицом к лицу с технологиями может быть очень сложным. Использование голосовых технологий тоже может быть неприятно. Хотя такие инструменты, как Google Home или Google Assistant, могут помочь людям позвонить кому-то, отрегулировать освещение или воспроизвести любимую песню, они могут не сработать для людей с нарушениями речи.
По словам Макдональда, проект Euphonia первоначально был начат, чтобы помочь определить прогрессирование бокового амиотрофического склероза (БАС), широко известного как болезнь Лу Герига, но исследования в Google продолжают расширяться, поскольку усилия показывают большой прогресс в распознавании команд от людей с атипичными заболеваниями. Речевые паттерны, возникающие в результате инсульта, черепно-мозговой травмы, глухоты, синдрома Дауна, глухоты, церебрального паралича, рассеянного склероза и заикания.
НУЖНА ВАША ПОМОЩЬ
Исследования Google нуждаются в голосовых образцах, чтобы повысить эффективность задач для всех типов речевых моделей. По словам Макдональда, чем больше паттернов мы сможем записать от людей, которые заикаются, тем лучше может стать общая модель Google для понимания различий в речевых паттернах и успешного понимания словесных команд от разных пользователей.
Хотя алгоритмы распознавания речи слышали миллионы примеров слов и фраз от людей, чей голос звучит «типично», алгоритмы не слышали почти столько же примеров от людей с нетипичной речью.
В настоящее время модели заикания составляют всего 5% от общего числа голосовых записей, и исследователи Google приветствовали бы возможность добавить в свою модель больше моделей речи с заиканием.
Если вам 18 лет или больше, и ваш голос может показаться трудным для понимания (но не из-за акцента), вы можете помочь Google в его исследовании, записав набор фраз. Посетите https://sites.research.google/euphonia/about/ и нажмите синюю кнопку «ЗАПИСАТЬ ФРАЗЫ» в правом верхнем углу страницы, чтобы заполнить форму заинтересованности.
По словам Макдональда, «каждый голос пользователя, который мы собираем в облаке, делает всю модель лучше для всех пользователей».
Твой голос важен
