Действия

TTS. UPS руководство по работе с интерфейсом

Материал из Флора AI

Версия для печати больше не поддерживается и может содержать ошибки обработки. Обновите закладки браузера и используйте вместо этого функцию печати браузера по умолчанию.

TTS Синтез

Рис.1 Главный экран UPS

В главном меню UPS (Universal Proxy Server) расположены кнопки для перехода в блоки (см. рис. 1):

  1. SMC Классификатор,
  2. SEE Сущности,
  3. SPR Распознавание,
  4. SBS Биометрия,
  5. TTS Синтез,
  6. QAS ЧаВО,
  7. SES Сценарная машина,
  8. CLS Информатор,
  9. Выход.

Переключаться между продуктами можно двумя способами:

  1. Воспользоваться кнопкой на панели управления «На главную» Меню пользователя new.png .
  2. Воспользоваться кнопкой в виде линии, которая находится снизу в центе экрана (см. рис. 2).
    Рис. 2 Интерфейс TTS Синтез

Сервис предназначен для конвертации текста в речь. Он принимает на вход текст, а затем преобразует его в аудиофайл формата *.wav. Перейти в раздел «Синтез» можно кликнув по соответствующей кнопке на главном экране UPS (см.рис. 1).

Интерфейс раздела включает в себя (см.рис. 2):

Панель управления сервиса Синтез

Панель управления находится в правом верхнем углу экрана и содержит 2 кнопки: переход на главный экран и пользовательское меню. Подробное описание каждой функции можно найти в таблице 1.

Табл.1 Описание функционала панели управления
Иконка кнопки Наименование кнопки Описание
Экспорт нов.png
Экспорт экспортирует словарь ударений в формате csv
Импорт нов.png
Импорт импортирует готовый словарь ударений в формате csv
Сохранить.png
Сохранить отправляет на главный экран (рис. 1).
Меню пользователя.png
Меню пользователя отображает меню пользователя (имя, смена пароля, выход из системы). Есть возможность выбора набора данных*, но данная опция не затрагивает функциональность приложения.

*права на создание наборов данных есть у администраторов или у ролей, где эти права прописаны.

Рис. 3 Интерфейс блока синтез речи

Блок «Синтез речи»

Блок синтеза речи позволяет синтезировать речь и выгрузить результат в формате wav файла. Для этого необходимо:

  1. выбрать модель для синтеза;
  2. ввести текст;
  3. задать параметры для синтеза: скорость, тональность, громкость и частота;
  4. если необходимо, перед синтезом вы можете воспользоваться кнопкой «Нормализовать». Эта кнопка преобразует цифровой ввод в буквенный (номера телефонов, даты, время), с правильным ударением, например, 115 → ст+о пятн+адцать. Эта функция также может быть полезна для аббревиатур. Она позволяет привести аббревиатуру в нормализованный вид и, если есть необходимость, исправить её транскрипцию, чтобы ударение и произношение были правильными.

Например, если ввести аббревиатуру СЗФО и нажать на кнопку «Нормализовать», система предложит следующую транскрипцию: «+эсъ-з+э-ф-+о». Однако это произношение неверно. В таких случаях можно скорректировать произношение и добавить его как исключение в словарь ударений: «с+э-зэ-фэ-+о».

5. нажать кнопку Синтезировать.

Расшифровки узкоспециализированных терминов следует либо включить в словарь, либо отправить текст на синтез вместе с расшифровками.

Результатом отработки будет – wav файл с возможностью его прослушать и выгрузить (рис. 3).


Рис. 4. Интерфейс блока «Словарь для синтеза речи».

Блок «Словарь ударений для синтеза»

В этом разделе вы можете настроить произношение определенных слов с помощью моделей синтеза речи. Есть только один общий словарь для всех моделей.

Если вы столкнулись с проблемами в произношении определенных слов, вы можете добавить их в словарь (рис. 4) для коррекции синтезированной речи:

  1. в поле Фраза внести нужное слово или фразу,
  2. в поле Измененная фраза – вариант корректного проговаривания,
  3. нажать кнопку Добавить,
  4. зайти в блок Синтеза речи,
  5. внести слово добавленное в словарь,
  6. проверить результат исправления.

В словаре синтеза – есть возможность отфильтровать по фразе, по измененной фразе.