Действия

TTS. UPS руководство по работе с интерфейсом: различия между версиями

Материал из Флора AI

 
(не показано 14 промежуточных версий этого же участника)
Строка 1: Строка 1:


=='''TTS Синтез'''==
=='''TTS Синтез'''==
В главном меню UPS (Universal Proxy Server) расположены кнопки для перехода в блоки (см. рисунок 1):
[[Файл:TTS UPS.png|мини|''<small>Рис.1 Главный экран UPS</small>'']]
В главном меню UPS (Universal Proxy Server) расположены кнопки для перехода в блоки (см. рис. 1):


# [[SMC. UPS руководство по работе с интерфейсом|SMC Классификатор]],
# [[SMC. UPS руководство по работе с интерфейсом|SMC Классификатор]],
Строка 10: Строка 11:
# [[QAS. UPS руководство по работе с интерфейсом|QAS ЧаВО]],
# [[QAS. UPS руководство по работе с интерфейсом|QAS ЧаВО]],
# [[SES. UPS руководство по работе с интерфейсом|SES Сценарная машина]],
# [[SES. UPS руководство по работе с интерфейсом|SES Сценарная машина]],
# [[CLS. UPS руководство по работе с интерфейсом#%D0%A0%D0%B0%D0%B1%D0%BE%D1%82%D0%B0%20%D1%81%20%D1%81%D0%B5%D1%80%D0%B2%D0%B8%D1%81%D0%BE%D0%BC%20%D0%B8%D1%81%D1%85%D0%BE%D0%B4%D1%8F%D1%89%D0%B8%D1%85%20%D0%BE%D0%B1%D0%B7%D0%B2%D0%BE%D0%BD%D0%BE%D0%B2%20%C2%AB%D0%98%D0%BD%D1%84%D0%BE%D1%80%D0%BC%D0%B0%D1%82%D0%BE%D1%80%C2%BB|CLS Информатор]],
# Выход.
# Выход.


Переключаться между продуктами можно двумя способами:
Переключаться между продуктами можно двумя способами:


# Воспользоваться кнопкой на панели управления «На главную» [[Файл:Меню пользователя new.png|безрамки|36x36пкс]] .
# Воспользоваться кнопкой на панели управления «На главную» [[Файл:Меню пользователя new.png|безрамки|20x20px]] .
# Воспользоваться кнопкой в виде линии, которая находится снизу в центе экрана (см. рисунок 2).
# Воспользоваться кнопкой в виде линии, которая находится снизу в центе экрана (см. рис. 2).[[Файл:TTS + искажение.png|мини|''<small>Рис. 2 Интерфейс TTS Синтез</small>'']]


Сервис предназначен для конвертации текста в речь. Он принимает на вход текст, а затем преобразует его в аудиофайл формата *.wav. Перейти в раздел '''«Синтез»''' можно кликнув по соответствующей кнопке на главном экране UPS (см.рис. 1).


Сервис предназначен для конвертации текста в речь. Он принимает на вход текст, а затем преобразует его в аудиофайл формата *.wav. Перейти в раздел '''«Синтез»''' можно кликнув по соответствующей кнопке на главном экране UPS (см.рисунок 1).
Интерфейс раздела включает в себя (см.рис. 2):
[[Файл:TTS UPS.png|центр|мини|407x407пкс|Рисунок 1 - Главный экран UPS.]]
*блок с моделями - позволяет выбрать модель для синтеза, находится слева на рабочей области;
Интерфейс раздела включает в себя (см.рисунок 2):
*блок с моделями - позволяет выбрать модель для синтеза;
*[[TTS. UPS руководство по работе с интерфейсом#Блок «Синтез речи»|блок синтеза речи]];
*[[TTS. UPS руководство по работе с интерфейсом#Блок «Синтез речи»|блок синтеза речи]];
*[[TTS. UPS руководство по работе с интерфейсом#Блок «Словарь для синтеза»|блок словаря ударений для синтеза]];
*блок с моделью искажения голоса;
*[[TTS. UPS руководство по работе с интерфейсом#Блок «Словарь ударений для синтеза»|блок словаря ударений для синтеза]];
*и [[TTS. UPS руководство по работе с интерфейсом#Панель управления сервиса Синтез|панель управления]].
*и [[TTS. UPS руководство по работе с интерфейсом#Панель управления сервиса Синтез|панель управления]].
[[Файл:TTS новый интерфейс.png|центр|мини|453x453пкс|Рисунок 2 - Интерфейс TTS Синтез]]
===Панель управления сервиса Синтез===
===Панель управления сервиса Синтез===


Панель управления находится в правом верхнем углу экрана и содержит 2 кнопки: ''переход на главный экран'' и ''пользовательское меню''. Подробное описание каждой функции можно найти в таблице 1.
Панель управления находится в правом верхнем углу экрана и содержит 2 кнопки: ''переход на главный экран'' и ''пользовательское меню''. Подробное описание каждой функции можно найти в таблице 1.
{| class="wikitable"
{| class="wikitable"
|+Таблица 1 - Описание функционала панели управления
|+''<small>Табл.1 Описание функционала панели управления</small>''
!'''Иконка кнопки'''
!'''Иконка кнопки'''
!'''Наименование кнопки'''
!'''Наименование кнопки'''
!'''Описание'''
!'''Описание'''
|-
|-
|[[Файл:Экспорт нов.png|безрамки|67x67пкс]]
|[[Файл:Экспорт_нов.png|центр|безрамки|40x40пкс]]
|Экспорт
|Экспорт
|экспортирует словарь ударений в формате csv
|экспортирует словарь ударений в формате csv
|-
|-
|[[Файл:Импорт нов.png|безрамки|63x63пкс]]
|[[Файл:Импорт_нов.png|центр|безрамки|40x40пкс]]
|Импорт
|Импорт
|импортирует готовый словарь ударений в формате csv
|импортирует готовый словарь ударений в формате csv
|-
|-
|[[Файл:Сохранить.png|слева|безрамки|59x59пкс]]
|[[Файл:Сохранить.png|безрамки|40x40px|центр]]
|Сохранить
|Сохранить
|отправляет  на главный экран (рисунок 1).
|отправляет  на главный экран (рис. 1).
|-
|-
|[[Файл:Меню пользователя.png|слева|безрамки|58x58пкс]]
|[[Файл:Меню пользователя.png|безрамки|41x41px|центр]]
|Меню пользователя
|Меню пользователя
|отображает  меню пользователя (имя, смена пароля, выход из системы)
|отображает  меню пользователя (имя, смена пароля, выход из системы). Есть возможность выбора набора данных*, но данная опция не затрагивает функциональность приложения.
<small>*права на создание наборов данных есть у администраторов или у ролей, где эти права прописаны.</small>
|}
|}
[[Файл:Синтез речи.png|мини|326x326пкс|Рисунок 3 - Интерфейс блока синтез речи]]
[[Файл:2025-02-12 14-26-50.png|мини|''<small>Рис. 3 Интерфейс блока синтез речи</small>'']]


===Блок «Синтез речи»===
===Блок «Синтез речи»===
Строка 58: Строка 59:
#выбрать модель для синтеза;
#выбрать модель для синтеза;
#ввести текст;
#ввести текст;
#задать параметры для синтеза;
#задать параметры для синтеза: скорость, тональность, громкость и частота;
#Если необходимо, перед синтезом вы можете воспользоваться кнопкой '''«Нормализовать»'''. Эта кнопка преобразует цифровой ввод в буквенный, с правильным ударением, например, ''115 → ст+о пятн+адцать.''
#если необходимо, перед синтезом вы можете воспользоваться кнопкой '''«Нормализовать»'''. Эта кнопка преобразует цифровой ввод в буквенный (номера телефонов, даты, время), с правильным ударением, например, ''115 → ст+о пятн+адцать.'' Эта функция также может быть полезна для аббревиатур. Она позволяет привести аббревиатуру в нормализованный вид и, если есть необходимость, исправить её транскрипцию, чтобы ударение и произношение были правильными.
#нажать кнопку '''Синтезировать'''.
<blockquote>Например, если ввести аббревиатуру СЗФО и нажать на кнопку «Нормализовать», система предложит следующую транскрипцию: «+эсъ-з+э-ф-+о». Однако это произношение неверно. В таких случаях можно скорректировать произношение и добавить его как исключение в словарь ударений: «с+э-зэ-фэ-+о».</blockquote>5. нажать кнопку '''Синтезировать'''.<blockquote>Расшифровки узкоспециализированных терминов следует либо включить в словарь, либо отправить текст на синтез вместе с расшифровками.</blockquote>Результатом отработки будет – wav файл с возможностью его прослушать и выгрузить (рис. 3).
Результатом отработки будет – wav файл с возможностью его прослушать и выгрузить (рисунок 3).






[[Файл:Блок Словарь для синтеза.png|мини|''<small>Рис. 4. Интерфейс блока «Словарь для синтеза речи».</small>'']]
===Блок «Словарь ударений для синтеза»===
===Блок «Словарь ударений для синтеза»===
В этом разделе вы можете настроить произношение определенных слов с помощью моделей синтеза речи. Есть только '''один общий словарь''' для всех моделей.
В этом разделе вы можете настроить произношение определенных слов с помощью моделей синтеза речи. Есть только '''один общий словарь''' для всех моделей.


Если вы столкнулись с проблемами в произношении определенных слов, вы можете добавить их в словарь для коррекции синтезированной речи:
Если вы столкнулись с проблемами в произношении определенных слов, вы можете добавить их в словарь (рис. 4) для коррекции синтезированной речи:
#в поле '''Фраза''' внести нужное слово или фразу,
#в поле '''Фраза''' внести нужное слово или фразу,
#в поле '''Измененная фраза''' – вариант корректного проговаривания,
#в поле '''Измененная фраза''' – вариант корректного проговаривания,
Строка 76: Строка 77:
#проверить результат исправления.
#проверить результат исправления.
В словаре синтеза – есть возможность отфильтровать по фразе, по измененной фразе.
В словаре синтеза – есть возможность отфильтровать по фразе, по измененной фразе.
[[Файл:Блок Словарь для синтеза.png|центр|мини|416x416пкс|Рисунок 4 - Интерфейс блока Словарь для синтеза речи]]

Текущая версия от 10:49, 5 декабря 2025

TTS Синтез

Рис.1 Главный экран UPS

В главном меню UPS (Universal Proxy Server) расположены кнопки для перехода в блоки (см. рис. 1):

  1. SMC Классификатор,
  2. SEE Сущности,
  3. SPR Распознавание,
  4. SBS Биометрия,
  5. TTS Синтез,
  6. QAS ЧаВО,
  7. SES Сценарная машина,
  8. CLS Информатор,
  9. Выход.

Переключаться между продуктами можно двумя способами:

  1. Воспользоваться кнопкой на панели управления «На главную» Меню пользователя new.png .
  2. Воспользоваться кнопкой в виде линии, которая находится снизу в центе экрана (см. рис. 2).
    Рис. 2 Интерфейс TTS Синтез

Сервис предназначен для конвертации текста в речь. Он принимает на вход текст, а затем преобразует его в аудиофайл формата *.wav. Перейти в раздел «Синтез» можно кликнув по соответствующей кнопке на главном экране UPS (см.рис. 1).

Интерфейс раздела включает в себя (см.рис. 2):

Панель управления сервиса Синтез

Панель управления находится в правом верхнем углу экрана и содержит 2 кнопки: переход на главный экран и пользовательское меню. Подробное описание каждой функции можно найти в таблице 1.

Табл.1 Описание функционала панели управления
Иконка кнопки Наименование кнопки Описание
Экспорт нов.png
Экспорт экспортирует словарь ударений в формате csv
Импорт нов.png
Импорт импортирует готовый словарь ударений в формате csv
Сохранить.png
Сохранить отправляет на главный экран (рис. 1).
Меню пользователя.png
Меню пользователя отображает меню пользователя (имя, смена пароля, выход из системы). Есть возможность выбора набора данных*, но данная опция не затрагивает функциональность приложения.

*права на создание наборов данных есть у администраторов или у ролей, где эти права прописаны.

Рис. 3 Интерфейс блока синтез речи

Блок «Синтез речи»

Блок синтеза речи позволяет синтезировать речь и выгрузить результат в формате wav файла. Для этого необходимо:

  1. выбрать модель для синтеза;
  2. ввести текст;
  3. задать параметры для синтеза: скорость, тональность, громкость и частота;
  4. если необходимо, перед синтезом вы можете воспользоваться кнопкой «Нормализовать». Эта кнопка преобразует цифровой ввод в буквенный (номера телефонов, даты, время), с правильным ударением, например, 115 → ст+о пятн+адцать. Эта функция также может быть полезна для аббревиатур. Она позволяет привести аббревиатуру в нормализованный вид и, если есть необходимость, исправить её транскрипцию, чтобы ударение и произношение были правильными.

Например, если ввести аббревиатуру СЗФО и нажать на кнопку «Нормализовать», система предложит следующую транскрипцию: «+эсъ-з+э-ф-+о». Однако это произношение неверно. В таких случаях можно скорректировать произношение и добавить его как исключение в словарь ударений: «с+э-зэ-фэ-+о».

5. нажать кнопку Синтезировать.

Расшифровки узкоспециализированных терминов следует либо включить в словарь, либо отправить текст на синтез вместе с расшифровками.

Результатом отработки будет – wav файл с возможностью его прослушать и выгрузить (рис. 3).


Рис. 4. Интерфейс блока «Словарь для синтеза речи».

Блок «Словарь ударений для синтеза»

В этом разделе вы можете настроить произношение определенных слов с помощью моделей синтеза речи. Есть только один общий словарь для всех моделей.

Если вы столкнулись с проблемами в произношении определенных слов, вы можете добавить их в словарь (рис. 4) для коррекции синтезированной речи:

  1. в поле Фраза внести нужное слово или фразу,
  2. в поле Измененная фраза – вариант корректного проговаривания,
  3. нажать кнопку Добавить,
  4. зайти в блок Синтеза речи,
  5. внести слово добавленное в словарь,
  6. проверить результат исправления.

В словаре синтеза – есть возможность отфильтровать по фразе, по измененной фразе.