3 400 000 слов за 10 дней: пример постобработки Localex

Updated February 6, 2020
3 400 000 slov za 10 dney localex post editing case study - Smartcat blog
Smartcat covers all your language needs with AI translation, AI content generation and AI human workflows.

Еще несколько лет назад история о небольшой лингвистической компании, выполнившей проект объемом в несколько миллионов слов за пару недель, показалась бы абсурдной. Сегодня это становится реальностью благодаря технологиям и командной работе.

Localex — это языковая компания, основанная в 2015 году группой профессионалов в области локализации, работающих удаленно. Хотя компания никогда не уклонялась от сложных проектов, запрос на постредактирование 6 500 000 слов менее чем за три месяца был бы сложной задачей даже по их меркам. К тому же заказчиком была одна из ведущих технологических компаний в мире, поэтому на карту была поставлена не только финансовая сторона, но и репутация.

LSP решила взяться за этот проект. Несмотря на препятствия, с которыми они столкнулись по пути, им удалось добиться успеха. С какими трудностями они столкнулись и как их преодолели? Давайте узнаем.

Но сначала давайте посмотрим на цифры:

Весь проект

6 500 000 слов

3 месяца

32 языка

Критическая партия

3 400 000 слов

10 дней

6 языков

Общий размер команды для критически важной партии

130 лингвистов

Самая большая команда по языку для критически важного пакета

27 лингвистов

Использованные технологии

Нейронный машинный перевод, переводческие памяти,
глоссарий, CAT, C#

Теперь перейдем к проблемам.

Аспект: Размер

Задача: Где найти столько людей?

Localex сотрудничает как со штатными, так и с проверенными внештатными лингвистами. Однако для проекта такого масштаба им потребовалось расширить свои команды до более чем 20 лингвистов для некоторых языков и до более чем 100 лингвистов в целом.

Localex необходимо было расширить свои команды до более чем 20 лингвистов для некоторых языков и до более чем 100 в целом.

Решение: Маркетплейс Smartcat

Благодаря 250 000 участников на платформе Smartcat, Localex смогла быстро найти новых постредакторов и добавить их в процесс перевода — все это с помощью интерфейса Smartcat, без отправки единого электронного письма или просмотра внешних досок объявлений о вакансиях.

Задача: как управлять всем этим?

В обычных условиях для управления 130 лингвистами потребовалось бы 10–15 менеджеров проектов. Это больше, чем есть в штате Localex. Кроме того, это неизбежно привело бы к увеличению стоимости проекта. И тогда понадобился бы менеджер, который бы управлял всеми менеджерами проектов.

Примечание: в обычных условиях для управления всеми проектными менеджерами потребуется 10–15 проектных менеджеров, а также менеджер, который будет руководить всеми проектными менеджерами.

Решение: автоматизация рабочих процессов Smartcat

В основе Smartcat лежит мощная платформа для автоматизации рабочих процессов, которая позволяет отслеживать ход работы, общаться с участниками проекта и управлять ресурсами проекта — и все это в одном месте. Благодаря этому Localex смогла справиться со всем проектом, задействовав всего четырех своих внутренних менеджеров проектов.

«Smartcat обеспечил нам бесперебойную коммуникацию, что крайне важно при работе с такой большой командой постредакторов, корректоров, специалистов по контролю качества и менеджеров проектов». — Чигдем Тура, операционный менеджер Localex

Задача: Как обеспечить качество?

Когда вы работаете над проектом такого масштаба, возникает соблазн пойти на определенные «уступки» в отношении стандартов качества и использовать только автоматизированные инструменты контроля качества. Однако Localex не хотела идти по этому пути.

«Мы не хотели «прятаться» за большим объемом работы и сжатыми сроками и использовать их в качестве оправдания для предоставления услуг низкого качества».

Решение: Командная работа

Хотя Localex и назначил специальных сотрудников для обеспечения качества с технической и лингвистической точек зрения, дополнительный и часто упускаемый из виду импульс к повышению качества был дан благодаря совместной работе Smartcat.

«Когда кто-то оставляет комментарий, его могут увидеть все лингвисты, работающие со всеми языками. Таким образом, лингвисты предупреждали друг друга о неоднозначностях, обсуждали возможные недоразумения и делились полезными ссылками. Во многих случаях мы замечали, как между лингвистами зарождались дружеские и продуктивные связи».

«Когда кто-то оставляет комментарий, его могут увидеть все лингвисты, работающие со всеми языками. Мы заметили, что между лингвистами завязываются продуктивные связи».

Аспект: Постредактирование

С самого начала заказчик просил использовать для этого проекта постредактирование. Основной причиной, очевидно, была цена: PEMT стоит как минимум в два, а иногда и в три раза дешевле «обычного» перевода. Это повлекло за собой ряд особых сложностей.

Задача: Что такое PEMT?

Хотя PEMT далеко не новое понятие в отрасли, многие компании и, в особенности, переводчики до сих пор не до конца понимают его суть. Многие пытаются слишком сильно редактировать исходный текст машинного перевода, стремясь к «совершенству» (что бы это ни значило). С другой стороны, есть люди, которые уделяют слишком мало внимания и пропускают тексты машинного перевода, которые звучат естественно, но фактически неверны.

Решение: Образование

Localex поделилась рекомендациями TAUS со всеми пост-редакторами. Благодаря функции комментирования Smartcat они могли делать это прямо в документе и в контексте, поэтому не было необходимости отправлять бесконечные потоки писем.

Задача: какой механизм машинного перевода лучше?

Различные механизмы машинного перевода по-разному обрабатывают разные типы контента, и заранее никогда не знаешь, какой из них будет лучшим для твоего проекта. Для такого крупного проекта цена ошибки может быть слишком высокой.

Решение: Тест

К счастью, Smartcat поддерживает различные механизмы машинного перевода, которые можно протестировать, просто установив соответствующие флажки. Это можно сделать индивидуально для каждого языка:

Проблема: что делать, если машинный перевод не сработал?

Хотя нейронный машинный перевод делает МП все более подходящим для «достаточно хороших» переводов, иногда он не справляется даже с этой задачей. Обычные причины включают неправильное форматирование исходного текста, опечатки — случайные или преднамеренные — и т. п. В одном конкретном подпроекте результат машинного перевода был настолько неточным, что переводчику пришлось все делать с нуля.

Решение: Пересмотреть условия

Localex обратился к заказчику с объяснением ситуации и, к счастью, встретил полное понимание и согласие с его стороны. И Localex, и переводчик смогли работать по более высокой ставке, чем было первоначально согласовано. Соответствующие суммы были добавлены к счетам с помощью функции автоматизации платежей Smartcat.

Аспект: Технические детали

Задача: Форматы файлов

Проект, состоящий из нескольких миллионов слов, часто включает в себя различные форматы, каждый из которых требует своего подхода. Например, Localex пришлось работать с дюжиной различных форматов, каждый из которых имел свои особенности.

Решение: Правильный CAT

Хотя большинство CAT-инструментов поддерживают различные форматы файлов, степень поддержки у разных инструментов различается. Localex смог использовать Smartcat для большинства из них, хотя некоторые требовали предварительной обработки — об этом подробнее пойдет речь позже.

Проблема: контент, не подходящий для локализации

Когда речь идет об ИТ-проектах, документы могут быть в нестандартных форматах, которые не распознаются CAT-инструментами из коробки. Например, одним из форматов, с которым приходилось работать Localex, был XLF, который, хотя и был основан на XML, имел ряд проблем, делающих его неудобным для локализации. К ним относились чрезвычайно длинные сегменты, сложные структуры тегов и нестандартные заполнители.

Решение: Предварительная и последующая обработка

Localex выполнил некоторые задачи по нормализации исходного контента, удалив ненужные разрывы строк, скрыв теги, пересегментировав текст и добавив заполнители для непереводимых фрагментов. Это упростило работу пост-редакторов с текстом и в конечном итоге повысило производительность.

Задача: Платежи

Когда вам нужно оплатить работу 130 лингвистов, разбросанных по всему миру, платежи становятся гораздо более сложной проблемой, чем в случае с десятком человек в одной стране. В каждой стране действуют свои правила в отношении входящих платежей, а некоторые страны не поддерживают привычные для вас методы, не говоря уже о том, что транзакционные издержки могут варьироваться от приемлемых до абсурдных.

Решение: использовать решение для автоматизации платежей

Localex использовала решение Smartcat для автоматизации платежей двумя способами. Во-первых, для оплаты услуг фрилансеров, нанятых через Smartcat. В этом случае процесс полностью автоматизирован, и Smartcat автоматически рассчитывает все расходы по каждому заказу. Во-вторых, Localex добавила индивидуальные платежи за работы, не связанные с переводом, и включила их в те же счета-фактуры.

Компании не нужно было заниматься никакой бумажной волокитой при оплате услуг фрилансеров, она сэкономила на транзакционных издержках и не задумывалась о юридических и налоговых вопросах, потому что всем этим занималась Smartcat.

Результаты

В итоге Localex выполнил проект в срок и к удовлетворению заказчика. Конкретные результаты включают:

  • Увеличение производительности на 30–40%

  • В среднем каждый пост-редактор переводит 5000–8000 слов в день

  • Экономия на затратах по проекту в размере 40%

  • Отзывы от более чем 100 лингвистов

  • Новые данные для обучения машинного перевода

  • Отзывы, предоставленные Smartcat для дальнейшего улучшения

Выводы

Размер

  • Найдите новых пост-редакторов на маркетплейсе Smartcat

  • Используйте автоматизацию рабочего процесса Smartcat для общения и отслеживания прогресса

  • Поощряйте командную работу лингвистов для обеспечения качества

Пост-редактирование

  • Поделитесь рекомендациями TAUS с пост-редакторами

  • Протестируйте различные системы машинного перевода, чтобы выбрать наиболее подходящую

  • Согласуйте с заказчиком «план обхода МП»

Технические аспекты

  • Убедитесь, что ваш инструмент CAT поддерживает все или большинство ожидаемых форматов файлов

  • Выполните предварительную обработку и нормализацию файлов, чтобы упростить их перевод

  • Используйте платформу автоматизации платежей Smartcat, чтобы избежать бумажной волокиты

Почему крупные клиенты нуждаются в небольших лингвистических агентствах

Может показаться нелогичным, что крупная технологическая компания решила поручить такой масштабный проект небольшому агентству, а не транснациональной MLV. Но если присмотреться к этому кейсу повнимательнее, причины становятся очевидными.

Прежде всего, небольшое агентство может посвятить все или почти все свои ресурсы этому клиенту, фактически став «компанией-партнером» на время реализации проекта. «Каждое утро мы проводили ежедневные встречи с нашим клиентом, делились информацией о ходе работы и решали возможные проблемы, а также были доступны для запросов 24/7», — говорит Бекир Дири, менеджер по международным продажам в Localex.

Во-вторых, это позволяет сделать процесс гораздо более прозрачным. Скорее всего, MLV в рамках такого проекта найдет десять небольших LSP и передаст им часть проектов. Все, что происходит на более глубоких уровнях, полностью скрыто от клиента, поэтому отслеживать ход работы в режиме реального времени невозможно.

И, наконец, что не менее важно, MLV имеют гораздо более высокие накладные расходы. К ним относятся:

  • Армия вспомогательного персонала, в котором они нуждаются,

  • Рекламные расходы, которые так или иначе включены в цену проекта, и

  • Маржа от каждого поставщика языковых услуг в цепочке поставок.

Если учесть все это, становится понятно, почему клиенты, которые действительно понимают, как работает отрасль, все чаще отказываются работать с «гигантами» и предпочитают более мелкие и гибкие агентства в качестве поставщиков.

К сожалению, многие клиенты не знают, как работает эта отрасль. Как выйти из этой ситуации? Поделитесь с ними этой историей и помогите им сделать правильный выбор.

💌

Подписывайтесь на нашу новостную рассылку

Электронная почта *