Country not specified
Unknown website Share

Apps4all

Страна: -
Город: -
Был онлайн: -
О себе:
 
08-07-2016, 11:12
Apps4all

Борис Тихомиров (PROMT): «При работе со словарями невозможно поставить точку»

Рады представить нашим читателям очередное интервью. На этот раз вместе с директором мобильных и интернет-проектов компании PROMT, Борисом Тихомировым мы постарались разобраться в современных технологиях перевода, влиянии Mobile и будущем сегмента, которое уже не за горами!

Какова история развития PROMT? С чего начинали и как развивались?

В конце 80-х годов у нас появился рынок персональных компьютеров. Практически весь пользовательский интерфейс ПК был на английском. О локализации программного обеспечения еще и не думали, а уровень знания иностранного языка у программистов и тем более пользователей был очень низким. Поэтому потребность в автоматическом переводе компьютерной документации была огромной.

542285a65609e3.48364500.png

Изменить ситуацию решили сотрудники Лаборатории инженерной лингвистики при Ленинградском педагогическом институте им. А. И. Герцена. Этой лабораторией руководил профессор Р. Г. Пиотровский, а под его началом работали будущие создатели PROMT, в том числе Светлана Соколова, затем основавшая компанию. Идея была такова: на основе теоретических наработок в области машинного перевода, которым занимались в лаборатории, сделать прикладную систему, способную перевести документацию к ПК. Первая версия переводчика PROMT появилась без всякого финансирования, на энтузиазме и твердой уверенности в том, что таким образом можно заработать.

Компания начинала с перевода с английского языка на русский и обратно, а сегодня PROMT по силам 16 языков. Теперь это не просто перевод документации – мы работаем со сложным форматированием, информацией в интернете, электронной почтой, сообщениями Skype и разного рода usergenerated content.

На что сейчас основная нацеленность?

Есть два основных рынка, на которые нацелены наши продукты: розничный – для массового потребителя – и корпоративный. Корпоративный продукт – это в первую очередь серверные решения, PROMT Cloud, API для интеграции, перевод документов и тонкая лингвистическая настройка. Среди серверных продуктов выделю отраслевую линейку: полтора года назад мы начали выпускать специализированные решения для предприятий энергетики, IT, банковской сферы, нефтегазовой отрасли и других. В них перевод уже настроен на отраслевую терминологию и стиль документации.

Что касается продукта для массового пользователя, то это, конечно, Translate.Ru с его многомиллионной аудиторией и стремительно растущий mobile. В последние годы мы особенно активно развиваем мобильные приложения. И несмотря на высокую конкуренцию в этом сегменте, достигли значительных успехов.

В чем измеряются успехи?

В количестве клиентов, в деньгах, в размере аудитории, в размере бренда – для разных направлений есть свои показатели. Вообще слово ПРОМТ давно стало нарицательным в русскоязычном сегменте, обозначая машинный перевод вообще.

Если брать сайт Translate.Ru, это 40 миллионов уников в год и миллиард просмотров страниц. Этот проект развивается, привлекая огромную аудиторию, как рекламная площадка и как ресурс, где мы продвигаем собственный бренд и технологии.

Мобильные приложения PROMT и Translate.Ru установили на свои устройства уже 5 200 000 пользователей, и мы видим в качестве обратной связи достаточно высокие оценки в маркетах и положительные отзывы.

В данный момент каков штат сотрудников? В том числе тех, кто занимается мобильными продуктами? Расскажите о коллективе!

В компании работает более 80 человек, из них в разработку, маркетинг и продвижение мобильных продуктов вовлечено около 15 человек. У наших специалистов-разработчиков очень высокая квалификация и огромный опыт в области программирования на всех популярных платформах, включая Windows, Unix, MacOS, iOS, Android. Они обладают уникальными знаниями в компьютерной лингвистике, обработке естественных языков и создании интеллектуальных технологий.

Как подходите к подбору новых кадров?

Есть несколько составляющих: квалификация, мотивация и светлая голова. :)

Квалификация может быть не самой высокой, но есть определенный уровень и у программиста, и у лингвиста для продуктивного старта в компании. Ну а мотивация и сообразительность помогают достичь поставленных целей.

Отдаёте часть работы на фриланс или предпочитаете иметь в составе всех необходимых специалистов?

Все зависит от задачи. Есть работы, которые ведутся в компании постоянно, и в них у нас компетенция всегда выше или на уровне. Это в первую очередь все, что касается лингвистической стороны разработки и исследований. В остальном возможны варианты. Так, например, разработку для платформы NokiaS40 мы полностью отдавали на аутсорс, поскольку готовых специалистов в компании не было, а нанимать ради одного проекта – не самое эффективное решение.

Когда решили, что мобильная платформа является отличным направлением, в котором стоит развивать свои продукты?

Когда появился первый телефон, умеющий выходить в интернет. Это было в 1999 году. А уже в 2000-ом мы сделали свой первый WAP-сайт. И в течение долгого времени мобильные продукты развивались исключительно как специальная версия сайтов под те или иные экраны.

С того момента увеличились приоритеты по отношению к мобильным продуктам?

Приоритеты, конечно, выросли, когда появились смартфоны и мы увидели, как огромная аудитория Translate.Ru начинает постепенно перетекать в mobile.

С начала 2012 года доля нашей мобильной аудитории (включая и сайт, и приложения для всех платформ) выросла с 3,5% до 34,5%. Это рост почти в 10 раз за 2,5 года. Удивительная динамика.

Каким был первый продукт и на какой платформе он был запущен? (имеется в виду мобильное приложение)

У нас были разработки для платформ Palm или WindowsCE, но мы ведь говорим не об этом? Те продукты были вполне себе инновационными в свое время, но о коммерческом успехе сложно говорить. Где теперь все эти платформы?

Переводчик Translate.Ru для платформы Android – первая по-настоящему успешная версия новой мобильной эпохи. Он вышел в самом конце 2011 года.

Какой получили опыт, связанный с этим запуском?

Учились быстро реагировать на отзывы пользователей в магазинах приложений. Это совсем новый спорт, которого нет при развитии других каналов продаж.

Сейчас у вас уже несколько активно развивающихся проектов, скажите, сильно ли отличается запуск, обслуживание и развитие приложений на мобильных платформах от привычных для вас решений?

С точки зрения продуктового цикла не отличается вообще. Мобильная разработка от идеи до релиза проходит все те же стадии, что и любая другая. Отличаться может лишь круг лиц и компетенций внутри компании, которые участвуют в процессах.

А вот с точки зрения продвижения, продаж и работы с пользователем магазины приложений показали нам картину мира, несколько отличную от старой схемы дистрибуции софта. В этой схеме есть много плюсов. Например, налаженная площадка, на поддержку и продвижение которой сами вендоры не тратят усилий. Есть магазины приложений, например Google Play или iTunes, вендор размещает там свои продукты и рекламирует их. С другой стороны, рынок сбыта монополизируется – у нас фактически нет других площадок.

Расскажите немного о процессе разработки мобильных решений. Вы портировали уже созданные продукты или производились какие-то общие изменения одновременно с запуском приложений в маркеты?

В первых версиях мы ничего не портировали, поскольку это были исключительно клиенты к сервису Translate.Ru для мобильных платформ. Портировать там нечего, поскольку все происходит на сервере, а на устройстве – только интерфейс.

А вот дальше началась работа по развитию мобильного направления, в которую вошли серьезные проекты по переносу существующего кода направлений перевода на все мобильные платформы, что позволило нам создать переводчики, работающие в офлайн.

Такой подход позволил быстро сделать бесплатную онлайн-версию, чтобы встать в магазины и набирать там аудиторию, пока ведется кропотливая работа по подготовке и выходу офлайновой составляющей.

Случались ли какие-нибудь курьезы или необычные ситуации?

Курьезы зачастую связаны с пользователями. Бывают отличные положительные отзывы, а бывают – наоборот, причем претензия имеет отношение не к нам, а, допустим, к платежной системе или платформе. Звонит, к примеру, пользователь и спрашивает, как наш переводчик для Android перенести на его iPhone.

Но бывают ситуации, связанные непосредственно с магазинами приложений и с работой их службы по проверке приложений. Речь об Apple в первую очередь…

В начале этого года мы выпустили платную offline-версию продукта для этой платформы и добавили туда очень удобную функцию – перевод скопированного текста на лету: вы читаете текст (новость или email) на иностранном языке, выделяете непонятный фрагмент и нажимаете «Скопировать», результат перевода тут же всплывает в области уведомлений. Очень удобно, никуда не нужно переключаться, чтобы посмотреть перевод.

После того как приложение с этой опцией пожило в AppStore несколько месяцев и собрало множество отличных оценок, к нам вдруг пришли из Apple и сказали, что нужно отключить, поскольку нарушаются несколько правил для приложений в их магазине. Было очень неприятно, но пришлось это сделать. Переговоры ни к чему не привели – при чисто формальном подходе нарушения, действительно, можно разглядеть. Пострадали в первую очередь пользователи.

Кроме обычных пользователей ваше ПО используют крупные компании и другие представители бизнес-сегмента. Скажите, что наиболее важно учитывать в том и другом случае?

Бизнес-сегмент – это такие же обычные пользователи, просто решают они другие задачи. Или те же задачи, но несколько по-другому.

А если серьезно, то среди наших клиентов действительно много крупных компаний. Для бизнеса главным в наших продуктах является возможность настройки и безопасность: наш перевод происходит в офлайне, и решение может быть полностью развернуто на инфраструктуре клиента, что гарантирует конфиденциальность. Вопросы безопасности, кстати, становятся все актуальнее для частных пользователей, озабоченных privacy.

Ваши переводчики славятся обильным количеством различных тематик перевода. Как собиралась эта база? Как совершенствуется и поддерживается?

При работе со словарями невозможно поставить точку, как в шутке про ремонт, который невозможно закончить – его можно только прекратить. :) Словарная база собирается и перерабатывается по всем доступным источникам, в том числе в интернете. Работа с клиентами, пилотные проекты (когда заказчик просит настроить систему на ту или иную тематику) также существенно обогащают базу данных. Мы внедряем статистические технологии и активно используем так называемые корпуса параллельных текстов. Это могут быть любые тексты на разных языках, например субтитры к фильмам.

542285e88debb1.06049103.png

Поговорим немного о конкретных продуктах. Сейчас вами развивается два переводчика: офлайн – PROMT и переводчик с использованием интернета – Translate.Ru. Почему решили развивать два бренда параллельно?

Так было всегда. Translate.Ru – это онлайн-бренд, у него говорящее интернетовское название, сервис бесплатен и предназначен для массового пользователя. PROMT – решение для десктопов и для корпоративного сегмента, его можно поставить на баланс и настроить на свои конкретные задачи.

С точки зрения мобильных приложений логично было назвать клиента к сервису Translate.Ru тем же именем. Мы таким образом получили лояльных пользователей, которые установили приложение и подняли нам оценки и рейтинги, что в свою очередь дало возможность конкурировать с другими монстрами в этом сегменте.

Какие еще отличия у этих программ? Они по-разному позиционируются?

Основное отличие, как вы правильно отметили, в том, что платная версия приложения умеет работать без интернета. Есть и еще несколько приятных возможностей, которые имеются только в платной версии, например перевод буфера обмена «на лету».

В общем, в чем-то позиционирование отличается, но в целом приложения решают схожие задачи: перевод с одного языка на другой, но в разных ситуациях.

5422865a8e6902.02630760.png

Они рассчитаны на разную аудиторию?

Не совсем… Просто каждый выбирает, платить ли за дополнительные возможности и удобство или будет достаточно функциональности онлайн-версии. Хотя предполагаю, что бизнес-аудитория предпочитает офлайновый перевод по причинам, о которых я уже говорил.

Весьма разумный подход. А какие передовые и, если можно так сказать, инновационные технологии применены в этих продуктах? Как продвинулись технологии перевода в последние годы?

В технологиях перевода наблюдаются интересные тенденции. С одной стороны, рост серверных мощностей и объемов параллельных текстов на разных языках позволяют развивать статистические технологии и получать приемлемые результаты. Мы здесь, кстати, не отстаем от трендов и с 2011 года развиваем так называемую гибридную технологию, позволяющую делать настройку на конкретную задачу в короткие сроки, что дает заметный прирост в качестве.

С другой стороны, требуется те же самые алгоритмы и базы данных делать более компактными для того, чтобы они быстро и не занимая места работали на мобильных платформах. И здесь у нашего алгоритмического подхода есть серьезное преимущество.

Мы не единственные, кто предлагает офлайн перевод на мобильных, но только у нас при этом не происходит ухудшение в качестве перевода. Если пользователь переведет предложение, воспользовавшись Google переводчиком, в онлайн и офлайн режиме, то его может ожидать неприятный сюрприз. Например, простое предложение «A young girl was attacked by a pair of lions» Google переводчиком в одном случае (онлайн) переводится как «Молодая девушка была атакована парой львов», а в другом случае (офлайн) – «В молодая девушка подвергся нападению на пару львов.» Таким образом, вместо перевода получился почти подстрочник. Про львов мы, скорее всего, по такому переводу догадаемся, кто на кого напал :), но вообще смысл может сильно искажаться. Для перевода предложений и целых текстов это совершенно неприемлемо. Неприемлемо это также и при изучении языков, так как не дает представления о грамматике. Переводчик PROMT offline таких неприятных особенностей не имеет и переводит фразы, тексты с учетом грамматики соответствующего языка.

542286757666f8.91644796.jpg

Есть ли в будущем предпосылки к значительному улучшению качества перевода вследствие освоения чего-то принципиально нового? Скажем, внедрению нейронных сетей или облачных технологий. :)

Значительно улучшить качество перевода можно с помощью специализации. Сравню с человеком. Один умеет лечить людей, другой – делать чертежи; один переводчик переводит медицинскую литературу, другой – документацию к программному обеспечению. И эти специалисты не взаимозаменяемы, т.е. мы не хотели бы, чтобы нас оперировал инженер. :)

Это относится и к программам-переводчикам. Например, мы уже второй год подряд побеждаем с англо-русской языковой парой на международном конкурсе по автоматическому переводу. Конкурс проводится на новостных текстах. Это и есть специализация. Мы много работает над тем, чтобы такой тип текста, такая лексика хорошо переводились.

У нас также есть успешный проект по переводу отзывов пользователей на сайте TripAdvisor. И в том, и в другом случае речь идет не о переводе «на раз», а о проектной работе, где специалисты изучают часть будущих материалов для перевода, делают настройку – у нас богатый инструментарий и квалифицированные специалисты под такие задачи. Важно и то, что благодаря подобным проектам поднимается качество перевода в целом.

Какие ближайшие планы по обновлению существующих (и, возможно, запуску новых) приложений? Планируете осваивать новые платформы?

Мы работаем в первую очередь над тем, чтобы расширить офлайновые возможности новыми направлениями перевода. Если всего у нас в компании есть 64 направления перевода, то в мобильных приложениях пока доступно только 28. Есть еще над чем потрудиться!

Кроме этого, мы хотим выйти на рынок Windows-планшетов. Он не очень большой, если сравнивать с iOS или Android, но перспективный с точки зрения продаж, особенно если ориентироваться на бизнес-сегмент.

54228694cd7cf8.03435341.JPG

Также мы работаем над тем, чтобы наши приложения были не только текстовыми, но и голосовыми переводчиками. Развитие мобильных платформ самих по себе уже дает огромные возможности, связанные с обработкой голоса, что в сочетании с нашими технологиями позволяет строить решения для перевода не только text-to-text, но и voice-to-voice. Все это уже есть в продукте, но впереди еще огромная работа над повышением качества. 

Борис, спасибо, что уделили время на беседу, было очень интересно, успехов!

 
интервью
разработка
словарь
0 0 0

Чтобы оставлять комментарии вам необходимо зарегистрироваться