TTS. Руководство пользователя: различия между версиями

Версия от 10:19, 22 ноября 2024

Общее описание

Сервис предназначен для преобразования текста в речь. Входными данными для сервиса является текст, результатом работы будет аудио файл в формате *.wav.

Термины и определения

Text To Speech Server (TTS)– сервис синтеза речи.

Модель (голос) - модель нейронной сети, отвечающую за синтез спектрограммы из текста. От модели зависит каким голосом будет синтезирован текст.

Вокодер - модель нейронной сети, отвечающую за синтез аудиоданных из спектрограммы

Swagger UI – интерактивная веб-консоль с кратким описанием методов АPI и возможностью выполнять запросы к сервису TTS в реальном времени

Описание методов API

Запросы осуществляются по протоколу HTTP 1.1 на адрес сервера с доступным сервисом TTS. По умолчанию используется порт 6186/tcp.

Авторизация запросов не требуется. HTTP-запросы должны содержать заголовок "accept: application/json"

Ответ сервиса представляет собой JSON или текстовый документ в кодировке UTF-8, или двоичный файл.

Содержимое документа зависит от результата выполнения запроса. При наличии ошибки в качестве ответа вернется переменная error=1 и описание в переменной message. Для удобства проверки методов по ссылке http://АДРЕС:6186 будет отображен интерфейс swagger со всеми методами с возможностью их проверки.

*Описание методов API*
GET/tts/	Вывод списка моделей (голосов синтеза).
Входные параметры отсутствуют		`{ models: [model1,...,modelN] }`
GET/tts/dictionary/export	Выгрузка пользовательского словаря ударений.
Входные параметры отсутствуют		простой текст - строки с словом и его интерперетацией с ударением
GET/tts/dictionary/get	Выгрузка пользовательского словаря ударений в виде json.
Входные параметры отсутствуют		`[` `[ "слово", "замена слова с удар+ением"],` `[ "слово2", "замена слова2 с удар+ением"],` `...` `]`
POST/tts/dictionary/import	Загрузка пользовательского словаря ударений. Текущий словарь будет переписан.
csv file - файл строк со словом и его интерперетацией с ударением		`{` `"error": 0,` `"message": "сообщение о статусе результата"` `}`
POST/tts/dictionary/put	Загрузка пользовательского словаря ударений в виде json. Текущий словарь будет переписан.
json -строка json следующего вида: `[` `[ "слово", "замена слова с удар+ением" ],` `[ "слово2", "замена слова2 с удар+ением" ],` `...` `]`		`{` `"error": 0,` `"message": "сообщение о статусе результата"` `}`
POST/tts/normalize	Нормализация текста - перевод цифр в слова и расстановка ударений (ударения только в нормализованной части фразы), например "в понедельник 10.10.2025" -> "в понедельник дес+ятого октябр+я дв+е т+ысячи дв+адцать п+ятого г+ода".
text - фраза для нормалимзации		`{` `"error": 0,` `"message": "success",` `"text": "нормализованный текст"` `}`
POST/tts/revoice/{revoicer}	заголовок
Вход		выход
GET/tts/revoicers	заголовок
Вход		выход
POST/tts/synthesize/{id}	Синтез звукового файла из текста для фраз большого размера - тип запроса "POST" позволяет отправку больших текстов.
ID - имя модели text - текст синтезируемой фразы rate - скорость речи pitch - высота (тон) volume - громкость		wav файл с синтезированой фразой
GET/tts/synthesize/{id}	Синтез звукового файла из текста небольшого размера - для совместимости с предыдущими версиями.
ID - имя модели text - текст синтезируемой фразы rate - скорость речи pitch - высота (тон) volume - громкость		wav файл с синтезированой фразой

@@ Строка 102: / Строка 102: @@
 <small><code>}</code></small>
 |-
-! style="color:green;width: 15%" |'''POST'''
+! style="color:green;width: 15%" |'''POST/tts/revoice/{revoicer}'''
 ! colspan="3" style="width: 85%" |<small>заголовок</small>
 |-
@@ Строка 108: / Строка 108: @@
 | colspan="2" style="width: 50%" |<small>выход</small>
 |-
-! style="color:blue;width: 15%" |'''GET'''
+! style="color:blue;width: 15%" |'''GET/tts/revoicers'''
 ! colspan="3" style="width: 85%" |<small>заголовок</small>
 |-

TTS. Руководство пользователя: различия между версиями

Материал из Флора AI

Версия от 10:19, 22 ноября 2024

Общее описание

Термины и определения

Описание методов API