Country not specified
Unknown website Share

Apps4all

Страна: -
Город: -
Был онлайн: -
О себе:
 
08-07-2016, 10:58
Apps4all

Акмал Артиков (Яндекс.Разговор): «Всё хотелось опробовать и внедрить уже в первый релиз, но надо уметь вовремя говорить "нет"»

По данным Всемирной организации здравоохранения, 10% жителей Земли имеют проблемы со слухом, 1,5-2% из них страдают тяжелыми нарушениями. Такие люди часто испытывают трудности в общении. Чтобы понять собеседника, приходится читать по губам или держать под рукой ручку и бумагу. Кроме того, у глухих и слабослышащих людей часто затруднена речь. 

Сегодня редакция Apps4All пообщалась с Акмалом Артиковым, менеджером проекта Яндекс.Разговор - экспериментальное приложение, которое частично снимает эту проблему.

Акмал, добрый день. Это приложение вы запустили совсем недавно, расскажите подробнее, как оно работает?

Экспериментальное приложение Яндекс.Разговор — это карманный помощник для глухих и слабослышащих в общении со слышащими. Вся функциональность приложения строится вокруг организации коммуникации — разговора между пользователем и его собеседником. Речь собеседника распознаётся в режиме реального времени и выводится текстом на экране. При этом каждая реплика публикуется отдельно, также как и в любом мессенджере, что намного удобнее сплошного текста.

У многих глухих и слабослышащих есть проблемы с речью. В таком случае с помощью Разговора можно ответить собеседнику, просто набрав ответ текстом. Набранную фразу можно озвучить телефоном или увеличить на весь экран, кому как удобнее. Для озвучивания в Разговор встроены женский и мужской голоса.

Мы стараемся сделать процесс общения с помощью нашего приложения максимально удобным и быстрым, поэтому добавили функцию стартовых фраз. Это предложения, с которых можно начать разговор. Мы подумали о наиболее частых жизненных ситуациях, где такие фразы были бы полезны и подготовили дефолтный список, поэтому можно быстро начать диалог в один клик, выбрав, например "Что происходит? Пожалуйста, объясните. Я не слышу". Пользователь может редактировать список и добавлять свои фразы. Например, имя и приветствие.

Вся история разговоров сохраняется в приложении — любой диалог можно открыть и перечитать. Важные диалоги или отдельные фразы можно помечать, так чтобы к ним было быстро и удобно вернуться. При открытии сохраненного диалога можно его продолжить, что может быть удобно для постоянных собеседников на работе или дома.

Как возникла идея создать такое приложение?

В Яндексе много разных технологий: MatrixNet, компьютерное зрение, лингвистика, распознавание речи. Часть из них открыта для разработчиков из других компаний. Мы увидели нерешённую потребность людей с потерей слуха, связанную с общением с миром слышащих, и поняли, что можем предложить решение на основе технологий распознавания речи Yandex SpeechKit.

У проекта интересная история. Сама идея была придумана в рамках практического предмета «Создание интернет-продуктов» на четвертом курсе бакалавриата МФТИ на базовой кафедре Яндекса. Затем был создан прототип, и мы пошли его тестировать на обычных людях. По их отзывам мы поняли, что нашли важную проблему и проект действительно нужен глухим. Идею решили развивать в Яндексе, и я стал менеджером проекта.

Команда у нас небольшая: мы с моей коллегой Соней Терпуговой думаем над развитием продукта. У нас есть несколько мобильных разработчиков и тестировщиков. Также нам помогают дизайнеры. А вообще над речевыми технологиями в Яндексе работает большая команда — технология очень сложная зрения с точки зрения разработки.

Какой язык программирования вы использовали в приложении?

Приложение у нас на Android, поэтому писали на Java.

Расскажите подробнее о технологии, которую вы используете?

Мы используем речевые технологии Yandex SpeechKit Mobile SDK. Вообще, это не одна технология, а целый комплекс: распознавание и синтез речи, голосовая активация и выделение смысловых объектов. В нашем приложении мы использовали распознавание и синтез речи. Пока что они работают только при наличии интернета.

В основе технологии распознавания речи находятся акустические и языковые модели, построенные с использованием нейронных сетей. Нейронные сети обучаются на больших массивах данных из сервисов и приложений Яндекса, что позволяет обеспечить высокое качество распознавания речи даже в условиях внешнего шума.

Технология синтеза речи Яндекса построена на базе скрытых марковских моделей. За счет применения статистического подхода в акустическом моделировании удается достичь естественных плавных интонаций. Технология позволяет достаточно быстро создавать новые голоса (как женские, так и мужские) и синтезировать различные эмоции.

Речевые технологии открыты для доступа — любой разработчик может опробовать их. Когда мы начинали проект в рамках курса в университете, мы как раз такими внешними разработчиками и выступали, никаких проблем с получением доступов или освоением документации не было.

С какими сложностями вы столкнулись при разработке?

Конкретно в разработке сложности были стандартные: что-то не успеваем и что-то надо срочно подправлять.

С одной стороны, нам очень сильно хотелось поскорее запуститься и начать работу с реальными пользователями. С другой, было очень много идей — все хотелось опробовать и внедрить уже в первый релиз, но надо уметь вовремя говорить «нет», иначе можно сильно затянуть с релизом.

Выделите особенности разработки и продвижения социально-значимых приложений

При работе над проектом мы вскоре осознали одну простую истину: ни на минуту нельзя забывать о целевой аудитории приложения. Надо всегда ставить себя на место глухих при тестировании каждой сборки.

Приведу пример. В приложении, как я уже говорил, есть функция синтеза набранной глухим фразы. Когда мы ее внедрили, я сидел в офисе и тестировал обновление. Вокруг были коллеги, поэтому на телефоне стоял бесшумный режим. Я нажал на кнопку синтеза, ничего, естественно, не услышал, осознал, что надо включить звук на телефоне и уже после этого успешно протестировал новую фичу. Но тут я подумал, а как глухой понял бы, что синтез не работает? Анимация синтеза ведь работает — пользователь просто мог бы не понять, что звук из устройства не выходит. Для пользователя ситуация могла бы получиться очень некомфортной.

Очень важный этап работы — общение с людьми, которые будут пользоваться приложением. Мы искали, где глухие и слабослышащие чаще общаются в интернете, потом готовились к каждой встрече, старались как можно больше узнать о том, как они живут, с какими сложностями сталкиваются. Мы провели много интервью, продолжали задавать вопросы в интернете и узнали очень много о мире глухих.

Сколько средств потребовалось на запуск?

Самый первый прототип мы сделали за одну ночь на внутреннем хакатоне. А чтобы дойти от идеи до первого релиза в Google Play нам потребовалось 4 месяца. Соответственно, все средства были потрачены на разработку.

Какое количество человек на данный момент пользуются приложением?

Пока что наше приложение скачало чуть больше 5 тысяч человек. По меркам других приложений Яндекса это не так много, однако, мы и не ориентируемся на широкую аудиторию. По нашим оценкам (точной статистики по России не существует) людей с полной потерей слуха в России около 300 тысяч, это включая всех пользователей Android, iOS и других телефонов.

Какой резонанс вы получили после запуска среди общественности?

Про нас вышло довольно много публикаций в массовых изданиях и профильных СМИ для глухих людей. Люди восприняли приложение тепло, было довольно много репостов в социальных сетях. Глухие и слабослышащие, а нам было важнее всего их мнение, восприняли приложение хорошо. Пока оно не всегда идеально работает, но многие рады даже тому факту, что на их проблему обратили внимание, что такая компания, как Яндекс, начала им помогать.

Вот один из отзывов в Google Play «Спасибо за приложение! Поможет многим людям с ограниченными слуховыми возможностями!»

Я с удивлением обнаружил видеоролики в сетях, где глухие на жестовом языке рассказывают о Разговоре другим глухим. Они начали появляться буквально через несколько часов после релиза, а в комментариях идут оживленные обсуждения приложения. Видеоблогеры первые опробовали Разговор и сразу же начали рекомендовать остальным людям с потерей слуха.

Планируются ли обновления функционала? Какие?

Планов много, мы активно смотрим на отзывы от пользователей и будем реагировать на то, что нравится и не нравится в текущей версии. Могу сказать точно, что в планах интегрировать автономную систему распознавания речи — она будет чуть похуже работать, зато без интернета, который не всегда может быть под рукой. Мы вообще сильно зависим от технологий, чем лучше они становятся, тем проще и удобнее становится пользоваться Разговором, так что в этом смысле мы смотрим в будущее.

Есть ли аналоги проекта в России и в мире? Приведите примеры похожих приложений.

Да, идея оказалась не нова, мы это поняли практически сразу при анализе рынка. В России есть приложение Сурдофон на Android, которое умеет распознавать речь и выводить ее на жестовом языке. Похожееприложениеитожена Android — The Deaf and Hearing Impaired. Базовая функциональность похожа на нашу, однако интерфейсы не ориентируются на диалог, в этом наше отличие. Есть еще приложение Roger Voice из Европы, анонсированное, но не запущенное. Основная идея — распознавание речи собеседника по телефону.

Планируется ли монетизировать проект?

Нет, как и все приложения Яндекса, Разговор бесплатный.

Как продвигаете приложение?

Мы рассказали о нем в блоге Яндекса, новость подхватили журналисты и информация начала распространяться. Пообщались с изданиями для глухих — предложили им поделиться новостью с читателями. Много кому писали и в социальных сетях, там новость тоже быстро подхватили и стали публиковать сами. Надо понимать, что мир глухих закрытый — такие люди много общаются друг с другом, и информация в их круге разлетается очень быстро.

В конце сентября будет проходить Международная неделя глухих, которая завершается 26 сентября Днем русского жестового языка и 27-го — Международным днем глухих. Будет много мероприятий, в которых планируем поучаствовать.

Вы нацелены на глобальный рынок?

Мы готовим украинскую версию, про глобальные рынки пока говорить рано.

Какие планы развития проекта?

Сейчас мы выпустили приложение на Android, это наиболее популярная платформа среди глухих и слабослышащих. Однако многие просят выпустить версию на iOS. Пока Разговор— экспериментальное приложение, для начала мы хотим собрать отзывы, посмотреть, как люди пользуются приложением, а после этого подумаем о других платформах.

А вообще планов и идей у нас много, есть даже такие, которые опережают возможности технологий распознавания речи, но мы работаем и над такими задачами.

Каковы в конкретно вашем случае критерии успеха приложения?

Мы надеемся, что глухие и слабослышащие люди будут пользоваться приложением всякий раз, когда испытывают трудности при общении со слышащими, поэтому мы смотрим на на возвращаемость. Она будет говорить нам о том, что Разговор и правда помогает, это и есть наша главная цель.

Также нам важно охватить как можно больше пользователей с нарушением слуха, поэтому мы смотрим на дневную и недельную активные аудитории.

Какие 5 советов вы дадите мобильному разработчику социально-значимой тематики?

В первую очередь, надо погрузиться в предметную область, в случае социально-значимых приложений это особенно важно, ведь разработчик не всегда знает особенностей целевой аудитории. Чтобы понять специфику быта, менталитета, проблем тех, для кого предназначено приложение, надо много общаться с ними, читать форумы и специальную литературу.

Во время разработки надо всегда ставить себя на место пользователя. Но для социально-значимых приложений это надо делать особенно чутко и аккуратно. Вышеупомянутая история с синтезом речи при бесшумном режиме очень показательна. И далеко не факт, что мы сейчас что-то не упускаем. В том числе и для этого надо обязательно проводить юзабилити-тестирования. Результаты могут быть неожиданными.

Очень важно изучить этический вопрос, ведь какие-то слова могут задеть людей. Например, мы с удивлением узнали, что язык жестов и жестовый язык — абсолютно разные понятия в мире глухих. Первое — язык тела, а второе — язык, на котором общаются люди с потерей слуха.

Надо внимательно смотреть на каналы распространения информации. К конечному пользователю надо "пробиться" — использовать все возможные инструменты распространения информации и понять специализированный круг ресурсов, которые посещает ваша аудитория.

Ну и главный совет. Не надо бояться изменить устоявшееся поведение своей целевой аудитории, надо экспериментировать. Аудитория социально-значимых приложений довольно часто имеет привычки, сформированные годами, поэтому им не всегда просто освоить новый тип коммуникации. Тут надо быть смелее и предлагать свое решение, ведь оно может кому-то упростить жизнь.

Акмал, благодарим вас, успехов!

 
Яндекс
приложение
разговорник
коммуникация
здоровье
Продвижение
разработка
создание
0 0 0

Чтобы оставлять комментарии вам необходимо зарегистрироваться