Мастер-класс по инжинирингу Smartcat AI

Теперь стало проще оптимизировать Smartcat для повышения качества и производительности, используя разнообразные инструменты генеративного ИИ, встроенные прямо в платформу.

Название

В этом интерактивном практическом занятии команда разработчиков Smartcat:

➡️ Ознакомьтесь с основными возможностями Gen AI, которые теперь доступны на платформе Smartcat AI
➡️ Подробно изучите основы оптимизации Smartcat для различных сценариев
➡️ Ответьте на вопросы и предоставьте подробные инструкции, которые помогут вам использовать эти инструменты ИИ с вашим собственным контентом.

➡️ Поделитесь примерами подсказок OpenAI для Smartcat

Узнайте, как ваша организация может применить Smartcat AI

Вебинар: вопросы и ответы

В: Это доступно только при подписке на тарифный план Unite?

A: Я бы посоветовал вам связаться с вашим контактным лицом по работе с клиентами и спросить о вашей подписке.


В: Если вы хотите перевести файл XLIFF, дает ли использование подсказок ИИ дополнительную ценность? Или нам следует придерживаться нынешней модели?

О: Это может быть дополнительной ценностью, как показал Энди, если вы хотите создать какую-то очень специфическую терминологию или стиль. Чуть позже мы покажем вам, что еще можно сделать.


В: Есть ли список доступных доменов?

A: Степень магистра права охватывает большинство областей. Их обучают с использованием миллиардов документов.


В: Можно ли будет в какой-то момент связать подсказку по глоссарию с конкретными глоссариями, а не со всеми глоссариями, доступными в данном проекте? Моя цель — сократить количество ложных срабатываний, попросив модель использовать определенный глоссарий, но при этом сохранить справочные глоссарии в редакторе, чтобы редакторы могли проверять другую терминологию, например, многозначные термины, общие термины, синонимы и т. д., которые я не хочу, чтобы модель использовала для перевода во всех случаях.

О: Хороший вопрос. В настоящее время мы используем глоссарии, связанные с проектом. Одним из вариантов в вашем случае может стать тонкая настройка двигателя с использованием ваших данных. Но мы можем рассмотреть ваше предложение.


В: Есть ли какие-либо ограничения по длине подсказки, если я хочу быть предельно конкретным в плане стиля, терминологии, стандартных фраз и т. д.?

A: Технически нет. Но это может замедлить процесс перевода. Если вы хотите повлиять на общую производительность, то лучшим вариантом может стать тонкая настройка двигателя.


В: Можно ли добавлять параллельные тексты в качестве ссылок, чтобы ИИ выбирал стиль из них?

A: Вы можете настроить движок так, чтобы он предоставлял пары предложений в качестве справочного материала, а движок постарается соответствовать вашему стилю.


В: Когда мы запускаем перевод с помощью подсказки/LLM, учитывается ли количество слов в нашей подписке? Или как это работает?

A: Да, слова, сгенерированные с помощью подсказки LLM, будут использовать Smartwords.


В: Можете ли вы объяснить значение использования фигурных скобок? Будут ли эти системные термины работать только в том случае, если вы введете слово точно так, как показано?

A: Как рассказал Жан-Люк, у нас есть небольшая библиотека предварительно настроенных подсказок, которую вы можете найти в правой части пользовательского интерфейса генерации подсказок.


В: На данный момент в наших проектах предустановка GPT с подсказками не работает для строк, имеющих теги (желтые теги для разметки, когда в исходном тексте есть форматирование). В этих случаях предустановка автоматически возвращается к другой машине перевода. Знаете ли вы обходной путь и как предустановка GPT работает также и со строками с тегами?

A: Как сказал Жан-Люк, давайте рассмотрим некоторые конкретные примеры тегов и посмотрим, сможем ли мы усовершенствовать подсказку об игнорировании тегов в строках.


В: Работает ли это так же, если мы работаем с языками с падежами?

О: Да. Итак, существуют так называемые малоресурсные языки. Итак, модели, обычно модели, когда они пытаются получить данные, и, очевидно, большую часть. Подавляющее большинство данных — данные на английском языке. Вот почему языковые модели лам показывают наилучшие результаты на английском языке. Но если вы попробуете разные другие языки. Вы увидите, как ухудшается качество и чем более редкий язык вы пытаетесь перевести. Вероятно, наихудшие результаты были бы, но языки с регистром не обязательно являются языками с низкими ресурсами. Так что да, это работает хорошо. Но если говорить об одном из языков с низким уровнем ресурсов, то следует упомянуть армянский язык, один из самых сложных языков. Вы бы это сделали. Вероятно, вы увидите некоторые неожиданные результаты. Но обычно вы так и делаете. Вы увидите хорошие результаты для этих случаев.