TTS. UPS руководство по работе с интерфейсом: различия между версиями
Материал из Флора AI
E.Elagina (обсуждение | вклад) |
E.Elagina (обсуждение | вклад) |
||
| (не показаны 2 промежуточные версии этого же участника) | |||
| Строка 11: | Строка 11: | ||
# [[QAS. UPS руководство по работе с интерфейсом|QAS ЧаВО]], | # [[QAS. UPS руководство по работе с интерфейсом|QAS ЧаВО]], | ||
# [[SES. UPS руководство по работе с интерфейсом|SES Сценарная машина]], | # [[SES. UPS руководство по работе с интерфейсом|SES Сценарная машина]], | ||
# [[CLS. UPS руководство по работе с интерфейсом#%D0%A0%D0%B0%D0%B1%D0%BE%D1%82%D0%B0%20%D1%81%20%D1%81%D0%B5%D1%80%D0%B2%D0%B8%D1%81%D0%BE%D0%BC%20%D0%B8%D1%81%D1%85%D0%BE%D0%B4%D1%8F%D1%89%D0%B8%D1%85%20%D0%BE%D0%B1%D0%B7%D0%B2%D0%BE%D0%BD%D0%BE%D0%B2%20%C2%AB%D0%98%D0%BD%D1%84%D0%BE%D1%80%D0%BC%D0%B0%D1%82%D0%BE%D1%80%C2%BB|CLS Информатор]], | |||
# Выход. | # Выход. | ||
| Строка 49: | Строка 50: | ||
|[[Файл:Меню пользователя.png|безрамки|41x41px|центр]] | |[[Файл:Меню пользователя.png|безрамки|41x41px|центр]] | ||
|Меню пользователя | |Меню пользователя | ||
|отображает меню пользователя (имя, смена пароля, выход из системы) | |отображает меню пользователя (имя, смена пароля, выход из системы). Есть возможность выбора набора данных*, но данная опция не затрагивает функциональность приложения. | ||
<small>*права на создание наборов данных есть у администраторов или у ролей, где эти права прописаны.</small> | |||
|} | |} | ||
[[Файл:2025-02-12 14-26-50.png|мини|''<small>Рис. 3 Интерфейс блока синтез речи</small>'']] | [[Файл:2025-02-12 14-26-50.png|мини|''<small>Рис. 3 Интерфейс блока синтез речи</small>'']] | ||
| Строка 59: | Строка 61: | ||
#задать параметры для синтеза: скорость, тональность, громкость и частота; | #задать параметры для синтеза: скорость, тональность, громкость и частота; | ||
#если необходимо, перед синтезом вы можете воспользоваться кнопкой '''«Нормализовать»'''. Эта кнопка преобразует цифровой ввод в буквенный (номера телефонов, даты, время), с правильным ударением, например, ''115 → ст+о пятн+адцать.'' Эта функция также может быть полезна для аббревиатур. Она позволяет привести аббревиатуру в нормализованный вид и, если есть необходимость, исправить её транскрипцию, чтобы ударение и произношение были правильными. | #если необходимо, перед синтезом вы можете воспользоваться кнопкой '''«Нормализовать»'''. Эта кнопка преобразует цифровой ввод в буквенный (номера телефонов, даты, время), с правильным ударением, например, ''115 → ст+о пятн+адцать.'' Эта функция также может быть полезна для аббревиатур. Она позволяет привести аббревиатуру в нормализованный вид и, если есть необходимость, исправить её транскрипцию, чтобы ударение и произношение были правильными. | ||
<blockquote>Например, если ввести аббревиатуру СЗФО и нажать на кнопку «Нормализовать», система предложит следующую транскрипцию: «+эсъ-з+э-ф-+о». Однако это произношение неверно. В таких случаях можно скорректировать произношение и добавить его как исключение в словарь ударений: «с+э-зэ-фэ-+о».</blockquote>5. нажать кнопку '''Синтезировать'''.<blockquote> | <blockquote>Например, если ввести аббревиатуру СЗФО и нажать на кнопку «Нормализовать», система предложит следующую транскрипцию: «+эсъ-з+э-ф-+о». Однако это произношение неверно. В таких случаях можно скорректировать произношение и добавить его как исключение в словарь ударений: «с+э-зэ-фэ-+о».</blockquote>5. нажать кнопку '''Синтезировать'''.<blockquote>Расшифровки узкоспециализированных терминов следует либо включить в словарь, либо отправить текст на синтез вместе с расшифровками.</blockquote>Результатом отработки будет – wav файл с возможностью его прослушать и выгрузить (рис. 3). | ||
Текущая версия от 10:49, 5 декабря 2025
TTS Синтез
В главном меню UPS (Universal Proxy Server) расположены кнопки для перехода в блоки (см. рис. 1):
- SMC Классификатор,
- SEE Сущности,
- SPR Распознавание,
- SBS Биометрия,
- TTS Синтез,
- QAS ЧаВО,
- SES Сценарная машина,
- CLS Информатор,
- Выход.
Переключаться между продуктами можно двумя способами:
- Воспользоваться кнопкой на панели управления «На главную»
. - Воспользоваться кнопкой в виде линии, которая находится снизу в центе экрана (см. рис. 2).
Сервис предназначен для конвертации текста в речь. Он принимает на вход текст, а затем преобразует его в аудиофайл формата *.wav. Перейти в раздел «Синтез» можно кликнув по соответствующей кнопке на главном экране UPS (см.рис. 1).
Интерфейс раздела включает в себя (см.рис. 2):
- блок с моделями - позволяет выбрать модель для синтеза, находится слева на рабочей области;
- блок синтеза речи;
- блок с моделью искажения голоса;
- блок словаря ударений для синтеза;
- и панель управления.
Панель управления сервиса Синтез
Панель управления находится в правом верхнем углу экрана и содержит 2 кнопки: переход на главный экран и пользовательское меню. Подробное описание каждой функции можно найти в таблице 1.
| Иконка кнопки | Наименование кнопки | Описание |
|---|---|---|
| Экспорт | экспортирует словарь ударений в формате csv | |
| Импорт | импортирует готовый словарь ударений в формате csv | |
| Сохранить | отправляет на главный экран (рис. 1). | |
| Меню пользователя | отображает меню пользователя (имя, смена пароля, выход из системы). Есть возможность выбора набора данных*, но данная опция не затрагивает функциональность приложения.
*права на создание наборов данных есть у администраторов или у ролей, где эти права прописаны. |
Блок «Синтез речи»
Блок синтеза речи позволяет синтезировать речь и выгрузить результат в формате wav файла. Для этого необходимо:
- выбрать модель для синтеза;
- ввести текст;
- задать параметры для синтеза: скорость, тональность, громкость и частота;
- если необходимо, перед синтезом вы можете воспользоваться кнопкой «Нормализовать». Эта кнопка преобразует цифровой ввод в буквенный (номера телефонов, даты, время), с правильным ударением, например, 115 → ст+о пятн+адцать. Эта функция также может быть полезна для аббревиатур. Она позволяет привести аббревиатуру в нормализованный вид и, если есть необходимость, исправить её транскрипцию, чтобы ударение и произношение были правильными.
Например, если ввести аббревиатуру СЗФО и нажать на кнопку «Нормализовать», система предложит следующую транскрипцию: «+эсъ-з+э-ф-+о». Однако это произношение неверно. В таких случаях можно скорректировать произношение и добавить его как исключение в словарь ударений: «с+э-зэ-фэ-+о».
5. нажать кнопку Синтезировать.
Расшифровки узкоспециализированных терминов следует либо включить в словарь, либо отправить текст на синтез вместе с расшифровками.
Результатом отработки будет – wav файл с возможностью его прослушать и выгрузить (рис. 3).
Блок «Словарь ударений для синтеза»
В этом разделе вы можете настроить произношение определенных слов с помощью моделей синтеза речи. Есть только один общий словарь для всех моделей.
Если вы столкнулись с проблемами в произношении определенных слов, вы можете добавить их в словарь (рис. 4) для коррекции синтезированной речи:
- в поле Фраза внести нужное слово или фразу,
- в поле Измененная фраза – вариант корректного проговаривания,
- нажать кнопку Добавить,
- зайти в блок Синтеза речи,
- внести слово добавленное в словарь,
- проверить результат исправления.
В словаре синтеза – есть возможность отфильтровать по фразе, по измененной фразе.