Действия

TTS. UPS руководство по работе с интерфейсом: различия между версиями

Материал из Флора AI

Строка 23: Строка 23:
*блок с моделями - позволяет выбрать модель для синтеза;
*блок с моделями - позволяет выбрать модель для синтеза;
*блок синтеза речи;
*блок синтеза речи;
*блок словаря для синтеза;
*блок словаря ударений для синтеза;
*и панель управления.
*и панель управления.
[[Файл:TTS новый интерфейс.png|центр|мини|453x453пкс|Рисунок 2 - Интерфейс TTS Синтез]]
[[Файл:TTS новый интерфейс.png|центр|мини|453x453пкс|Рисунок 2 - Интерфейс TTS Синтез]]
Строка 37: Строка 37:
!'''Описание'''
!'''Описание'''
|-
|-
|[[Файл:На главную.png|слева|безрамки|59x59пкс]]
|[[Файл:Экспорт нов.png|безрамки|67x67пкс]]
|На главную
|Экспорт
|экспортирует словарь ударений в формате csv
|-
|[[Файл:Импорт нов.png|безрамки|63x63пкс]]
|Импорт
|импортирует готовый словарь ударений в формате csv
|-
|[[Файл:Сохранить.png|слева|безрамки|59x59пкс]]
|Сохранить
|отправляет  на главный экран (рисунок 1).
|отправляет  на главный экран (рисунок 1).
|-
|-
Строка 45: Строка 53:
|отображает  меню пользователя (имя, смена пароля, выход из системы)
|отображает  меню пользователя (имя, смена пароля, выход из системы)
|}
|}
[[Файл:Синтез речи.png|мини|326x326пкс|Рисунок 3 - Интерфейс блока синтез речи]]
===Блок «Синтез речи»===
===Блок «Синтез речи»===
Блок синтеза речи позволяет синтезировать речь и выгрузить результат в формате wav файла. Для этого необходимо:
Блок синтеза речи позволяет синтезировать речь и выгрузить результат в формате wav файла. Для этого необходимо:
Строка 50: Строка 60:
#ввести текст;
#ввести текст;
#задать параметры для синтеза;
#задать параметры для синтеза;
#Если необходимо, перед синтезом вы можете воспользоваться кнопкой '''«Нормализовать»'''. Эта кнопка преобразует цифровой ввод в буквенный, с правильным ударением, например, ''115 → ст+о пятн+адцать.''
#нажать кнопку '''Синтезировать'''.
#нажать кнопку '''Синтезировать'''.
Результатом отработки будет – wav файл с возможностью его прослушать и выгрузить.
Результатом отработки будет – wav файл с возможностью его прослушать и выгрузить (рисунок 3).
 
 


===Блок «Словарь для синтеза»===
===Блок «Словарь для синтеза»===
Строка 64: Строка 77:
#проверить результат исправления.
#проверить результат исправления.
В словаре синтеза – есть возможность отфильтровать по фразе, по измененной фразе.
В словаре синтеза – есть возможность отфильтровать по фразе, по измененной фразе.
[[Файл:Блок Словарь для синтеза.png|центр|мини|416x416пкс|Рисунок 4 - Интерфейс блока Словарь для синтеза речи]]

Версия от 15:26, 17 октября 2024

TTS Синтез

В главном меню UPS (Universal Proxy Server) расположены кнопки для перехода в блоки (см. рисунок 1):

  1. SMC Классификатор,
  2. SEE Сущности,
  3. SPR Распознавание,
  4. SBS Биометрия,
  5. TTS Синтез,
  6. QAS ЧаВО,
  7. SES Сценарная машина,
  8. Выход.

Переключаться между продуктами можно двумя способами:

  1. Воспользоваться кнопкой на панели управления «На главную» Меню пользователя new.png .
  2. Воспользоваться кнопкой в виде линии, которая находится снизу в центе экрана (см. рисунок 2).


Сервис предназначен для конвертации текста в речь. Он принимает на вход текст, а затем преобразует его в аудиофайл формата *.wav. Перейти в раздел «Синтез» можно кликнув по соответствующей кнопке на главном экране UPS (см.рисунок 1).

Рисунок 1 - Главный экран UPS.

Интерфейс раздела включает в себя (см.рисунок 2):

  • блок с моделями - позволяет выбрать модель для синтеза;
  • блок синтеза речи;
  • блок словаря ударений для синтеза;
  • и панель управления.
Рисунок 2 - Интерфейс TTS Синтез

Панель управления сервиса Синтез

Панель управления находится в правом верхнем углу экрана и содержит 2 кнопки: переход на главный экран и пользовательское меню. Подробное описание каждой функции можно найти в таблице 1.

Таблица 1 - Описание функционала панели управления
Иконка кнопки Наименование кнопки Описание
Экспорт нов.png Экспорт экспортирует словарь ударений в формате csv
Импорт нов.png Импорт импортирует готовый словарь ударений в формате csv
Сохранить.png
Сохранить отправляет на главный экран (рисунок 1).
Меню пользователя.png
Меню пользователя отображает меню пользователя (имя, смена пароля, выход из системы)
Рисунок 3 - Интерфейс блока синтез речи

Блок «Синтез речи»

Блок синтеза речи позволяет синтезировать речь и выгрузить результат в формате wav файла. Для этого необходимо:

  1. выбрать модель для синтеза;
  2. ввести текст;
  3. задать параметры для синтеза;
  4. Если необходимо, перед синтезом вы можете воспользоваться кнопкой «Нормализовать». Эта кнопка преобразует цифровой ввод в буквенный, с правильным ударением, например, 115 → ст+о пятн+адцать.
  5. нажать кнопку Синтезировать.

Результатом отработки будет – wav файл с возможностью его прослушать и выгрузить (рисунок 3).


Блок «Словарь для синтеза»

В этом разделе вы можете настроить произношение определенных слов с помощью моделей синтеза речи. Есть только один общий словарь для всех моделей.

Если вы столкнулись с проблемами в произношении определенных слов, вы можете добавить их в словарь для коррекции синтезированной речи:

  1. в поле Фраза внести нужное слово или фразу,
  2. в поле Измененная фраза – вариант корректного проговаривания,
  3. нажать кнопку Добавить,
  4. зайти в блок Синтеза речи,
  5. внести слово добавленное в словарь,
  6. проверить результат исправления.

В словаре синтеза – есть возможность отфильтровать по фразе, по измененной фразе.

Рисунок 4 - Интерфейс блока Словарь для синтеза речи