Действия

TTS. UPS руководство по работе с интерфейсом: различия между версиями

Материал из Флора AI

Строка 58: Строка 58:
#ввести текст;
#ввести текст;
#задать параметры для синтеза: скорость, тональность, громкость и частота;
#задать параметры для синтеза: скорость, тональность, громкость и частота;
#Если необходимо, перед синтезом вы можете воспользоваться кнопкой '''«Нормализовать»'''. Эта кнопка преобразует цифровой ввод в буквенный (номера телефонов, даты, время), с правильным ударением, например, ''115 → ст+о пятн+адцать.''
#если необходимо, перед синтезом вы можете воспользоваться кнопкой '''«Нормализовать»'''. Эта кнопка преобразует цифровой ввод в буквенный (номера телефонов, даты, время), с правильным ударением, например, ''115 → ст+о пятн+адцать.'' Эта функция также может быть полезна для аббревиатур. Она позволяет привести аббревиатуру в нормализованный вид и, если есть необходимость, исправить её транскрипцию, чтобы ударение и произношение были правильными.
#нажать кнопку '''Синтезировать'''.
<blockquote>Например, если ввести аббревиатуру СЗФО и нажать на кнопку «Нормализовать», система предложит следующую транскрипцию: «+эсъ-з+э-ф-+о». Однако это произношение неверно. В таких случаях можно скорректировать произношение и добавить его как исключение в словарь ударений: «с+э-зэ-фэ-+о».</blockquote>5. нажать кнопку '''Синтезировать'''.
Результатом отработки будет – wav файл с возможностью его прослушать и выгрузить (рис. 3).
Результатом отработки будет – wav файл с возможностью его прослушать и выгрузить (рис. 3).



Версия от 10:09, 27 февраля 2025

TTS Синтез

Рис.1 Главный экран UPS

В главном меню UPS (Universal Proxy Server) расположены кнопки для перехода в блоки (см. рис. 1):

  1. SMC Классификатор,
  2. SEE Сущности,
  3. SPR Распознавание,
  4. SBS Биометрия,
  5. TTS Синтез,
  6. QAS ЧаВО,
  7. SES Сценарная машина,
  8. Выход.

Переключаться между продуктами можно двумя способами:

  1. Воспользоваться кнопкой на панели управления «На главную» Меню пользователя new.png .
  2. Воспользоваться кнопкой в виде линии, которая находится снизу в центе экрана (см. рис. 2).
    Рис. 2 Интерфейс TTS Синтез

Сервис предназначен для конвертации текста в речь. Он принимает на вход текст, а затем преобразует его в аудиофайл формата *.wav. Перейти в раздел «Синтез» можно кликнув по соответствующей кнопке на главном экране UPS (см.рис. 1).

Интерфейс раздела включает в себя (см.рис. 2):

Панель управления сервиса Синтез

Панель управления находится в правом верхнем углу экрана и содержит 2 кнопки: переход на главный экран и пользовательское меню. Подробное описание каждой функции можно найти в таблице 1.

Табл.1 Описание функционала панели управления
Иконка кнопки Наименование кнопки Описание
Экспорт нов.png
Экспорт экспортирует словарь ударений в формате csv
Импорт нов.png
Импорт импортирует готовый словарь ударений в формате csv
Сохранить.png
Сохранить отправляет на главный экран (рис. 1).
Меню пользователя.png
Меню пользователя отображает меню пользователя (имя, смена пароля, выход из системы)
Рис. 3 Интерфейс блока синтез речи

Блок «Синтез речи»

Блок синтеза речи позволяет синтезировать речь и выгрузить результат в формате wav файла. Для этого необходимо:

  1. выбрать модель для синтеза;
  2. ввести текст;
  3. задать параметры для синтеза: скорость, тональность, громкость и частота;
  4. если необходимо, перед синтезом вы можете воспользоваться кнопкой «Нормализовать». Эта кнопка преобразует цифровой ввод в буквенный (номера телефонов, даты, время), с правильным ударением, например, 115 → ст+о пятн+адцать. Эта функция также может быть полезна для аббревиатур. Она позволяет привести аббревиатуру в нормализованный вид и, если есть необходимость, исправить её транскрипцию, чтобы ударение и произношение были правильными.

Например, если ввести аббревиатуру СЗФО и нажать на кнопку «Нормализовать», система предложит следующую транскрипцию: «+эсъ-з+э-ф-+о». Однако это произношение неверно. В таких случаях можно скорректировать произношение и добавить его как исключение в словарь ударений: «с+э-зэ-фэ-+о».

5. нажать кнопку Синтезировать.

Результатом отработки будет – wav файл с возможностью его прослушать и выгрузить (рис. 3).


Рис. 4. Интерфейс блока «Словарь для синтеза речи».

Блок «Словарь ударений для синтеза»

В этом разделе вы можете настроить произношение определенных слов с помощью моделей синтеза речи. Есть только один общий словарь для всех моделей.

Если вы столкнулись с проблемами в произношении определенных слов, вы можете добавить их в словарь (рис. 4) для коррекции синтезированной речи:

  1. в поле Фраза внести нужное слово или фразу,
  2. в поле Измененная фраза – вариант корректного проговаривания,
  3. нажать кнопку Добавить,
  4. зайти в блок Синтеза речи,
  5. внести слово добавленное в словарь,
  6. проверить результат исправления.

В словаре синтеза – есть возможность отфильтровать по фразе, по измененной фразе.