TTS. Руководство пользователя: различия между версиями
Материал из Флора AI
(Новая страница: «===== '''Общее описание''' ===== Сервис предназначен для преобразования текста в речь. Входными данными для сервиса является текст, результатом работы будет аудио файл в формате *.wav. ====='''Термины и определения'''===== Text To Speech Server (TTS)– сервис синтеза речи. Модель...») |
Нет описания правки |
||
| Строка 9: | Строка 9: | ||
Вокодер - модель нейронной сети, отвечающую за синтез аудиоданных из спектрограммы | Вокодер - модель нейронной сети, отвечающую за синтез аудиоданных из спектрограммы | ||
Swagger UI – интерактивная веб-консоль с кратким описанием методов АPI и возможностью выполнять запросы к сервису TTS в реальном времени | |||
===== '''Описание методов API''' ===== | |||
Запросы осуществляются по протоколу HTTP 1.1 на адрес сервера с доступным сервисом TTS. По умолчанию используется порт 6186/tcp. | |||
Авторизация запросов не требуется. HTTP-запросы должны содержать заголовок <code>"accept: application/json"</code> | |||
Ответ сервиса представляет собой JSON-документ в кодировке UTF-8 или двоичный файл. Содержимое документа зависит от результата выполнения запроса. При наличии ошибки в качестве ответа вернется переменная error=1 и описание в переменной message. Для удобства проверки методов по ссылке http://АДРЕС:6186 будет отображен интерфейс swagger со всеми методами с возможностью их проверки. | |||
{| class="wikitable" | |||
|+ | |||
!Метод | |||
!Тип | |||
!Описание | |||
!Входные параметры | |||
!Ответ | |||
|- | |||
|/tts/ | |||
|GET | |||
|Вывод списка моделей | |||
| - | |||
|<code>{ models: [model1,...,modelN] }</code> | |||
|} | |||
Версия от 17:37, 11 июля 2023
Общее описание
Сервис предназначен для преобразования текста в речь. Входными данными для сервиса является текст, результатом работы будет аудио файл в формате *.wav.
Термины и определения
Text To Speech Server (TTS)– сервис синтеза речи.
Модель (голос) - модель нейронной сети, отвечающую за синтез спектрограммы из текста. От модели зависит каким голосом будет синтезирован текст.
Вокодер - модель нейронной сети, отвечающую за синтез аудиоданных из спектрограммы
Swagger UI – интерактивная веб-консоль с кратким описанием методов АPI и возможностью выполнять запросы к сервису TTS в реальном времени
Описание методов API
Запросы осуществляются по протоколу HTTP 1.1 на адрес сервера с доступным сервисом TTS. По умолчанию используется порт 6186/tcp.
Авторизация запросов не требуется. HTTP-запросы должны содержать заголовок "accept: application/json"
Ответ сервиса представляет собой JSON-документ в кодировке UTF-8 или двоичный файл. Содержимое документа зависит от результата выполнения запроса. При наличии ошибки в качестве ответа вернется переменная error=1 и описание в переменной message. Для удобства проверки методов по ссылке http://АДРЕС:6186 будет отображен интерфейс swagger со всеми методами с возможностью их проверки.
| Метод | Тип | Описание | Входные параметры | Ответ |
|---|---|---|---|---|
| /tts/ | GET | Вывод списка моделей | - | { models: [model1,...,modelN] }
|