TTS. Руководство администратора: различия между версиями

Текущая версия от 14:48, 2 апреля 2025

Общее описание

Сервис предназначен для преобразования текста в речь. Входными данными для сервиса является текст, результатом работы будет аудиофайл в формате *.wav.

Термины и определения

Text-to-speech server (TTS) – сервис синтеза речи.

Модель (голос) – модель нейронной сети, отвечающая за синтез спектрограммы из текста. От модели зависит, каким голосом будет синтезирован текст.

Вокодер – модель нейронной сети, отвечающая за синтез аудиоданных из спектрограммы. Модели и вокодеры поставляются в составе дистрибутива, дополнительных действий для их установки не требуется.

Расчет нагрузки

Для нормальной работы сервиса на каждый канал синтеза требуется 1 CPU >= 2.20 GHz. Оперативной памяти необходимо не менее 8 GB.

Установка/обновление TTS

Дистрибутив распространяется в виде установочных пакетов для окружения и сервиса. Загрузите установочные пакеты на сервер и выполните команды для Вашей системы в каталоге с пакетом.

Перед установкой непосредственно сервиса необходимо установить сервисный пакет окружения.

Установка/обновление TTS осуществляется скриптом chmod +x ./tts-<версия>-<релиз>.sh && ./tts-<версия>-<релиз>.sh -i с правами администратора. Список всех ключей инсталлятора можно посмотреть, запустив инсталлятор ./tts-<версия>-<релиз>.sh без ключей.
Загрузить последнюю версию продукта curl -s "https://repo.connect2ai.net/api/tts/new" --user '[user]:[pass]' 2>&1 | bash или в интерактивном режиме bash -c "$(curl -s https://repo.connect2ai.net/api/tts --user '[user]:[pass]' 2>&1)".
Обновить TTS /opt/tts/inupdate в интерактивном режиме. Или запустить с ключом:
- /opt/tts/inupdate -b – обновить до последней beta версии;
- /opt/tts/inupdate -r – обновить до последней release версии;
- /opt/tts/inupdate -n – обновить до последней версии (неважно beta или release).
Проверить актуальную версию продукта curl -s "https://repo.connect2ai.net/api/tts/version.
Посмотреть лог изменений curl -s "https://repo.connect2ai.net/api/tts/changelog" --user '[user]:[pass]'.
Полное описание всех команд API репозитория можно найти по ссылке https://repo.connect2ai.net/api. [user]:[pass] – это тот же логин и пароль, что и от Nextcloud.
В папке с продуктом можно добавить 2 файла конфигурации (допускается один общий файл на все продукты в папке с окружением /opt/pve/):
- echo -n "[user]:[pass]" > /opt/tts/.userapi (это файл авторизации в API, нужен для обновления и загрузки моделей)
- echo -n "http://example.com:3128 [user] [password]" > /opt/tts/.proxy (это файл конфигурации proxy, необходим для обновления и загрузки моделей, при отсутствующем прямом подключении к интернету)

При обновлении следующий список файлов и папок сохраняется: .userapi, .proxy, logs, nnets, config.json, cache, pretrained, pve, data. Сервис не требует остановки и возвращается в актуальное состояние после обновления.

Не забудьте запустить сервис и включить в автозапуск в системе:

sudo systemctl enable tts.service && sudo systemctl start tts.service

Удостоверьтесь, что сервис стартовал:

systemctl status tts.service

Разрешите доступ к порту 6186 на нужном интерфейсе по протоколу tcp.

Конфигурирование параметров сервиса TTS

Настройка параметров сервиса tts производится в файле /opt/spr/params.json

Описание параметров приведено в таблице


Параметр	По умолчанию	Назначение
gpu	true	Флаг использования видеокарты при ее наличии
logs.path	logs/	Путь к папке логов.
logs.backups	10	Максимальное количество логфайлов.
logs.maxSize	5242880	Максимальный размер одного логфайла.

Сбор данных об ошибках

Для увеличения информативности журналов можно выполнить от суперпользователя команду:

sed -i 's/log-level error/log-level debug/g' /etc/systemd/system/tts.service && systemctl daemon-reload && systemctl restart tts.service

При возникновении проблем в работе сервиса и недостаточной информативности журналов, можно запустить сервис вручную с привилегиями суперпользователя и выводом информации в stdout:

systemctl stop tts.service && source /opt/pve/bin/activate && cd /opt/tts/ && python3 api.py && deactivate

или

systemctl stop tts.service

source /opt/pve/bin/activate

cd /opt/tts/ && python3 api.py

deactivate

Удаление

Для удаления выполните команду: /opt/tts/uninstall. Команда деинсталлирует сервис и удалит рабочий каталог, включая все установленные модели и вокодер.

@@ Строка 1: / Строка 1: @@
 ===== '''Общее описание''' =====
-Сервис предназначен для преобразования текста в речь. Входными данными для сервиса является текст, результатом работы будет аудио файл в формате *.wav.
+Сервис предназначен для преобразования текста в речь. Входными данными для сервиса является текст, результатом работы будет аудиофайл в формате *.wav.
+====='''Термины и определения'''=====
+Text-to-speech server (TTS) – сервис синтеза речи.
+Модель (голос) – модель нейронной сети, отвечающая за синтез спектрограммы из текста. От модели зависит, каким голосом будет синтезирован текст.
-====='''Термины и определения'''=====
+Вокодер – модель нейронной сети, отвечающая за синтез аудиоданных из спектрограммы. '''''Модели и вокодеры поставляются в составе дистрибутива, дополнительных действий для их установки не требуется.'''''
-Text To Speech Server (TTS)– сервис синтеза речи.
-Модель (голос) - модель нейронной сети, отвечающую за синтез  спектрограммы из текста. От модели зависит каким голосом будет синтезирован текст.
-Вокодер - модель нейронной сети, отвечающую за синтез аудиоданных из спектрограммы
 ====='''Расчет нагрузки'''=====
-Для нормальной работы сервиса на каждый канал синтеза требуется 1 CPU  >= 2.20GHz. Оперативной памяти необходимо не менее 8Gb.
+Для нормальной работы сервиса на каждый канал синтеза требуется 1 CPU >= 2.20 GHz. Оперативной памяти необходимо не менее 8 GB.
@@ Строка 21: / Строка 21: @@
 Перед установкой непосредственно сервиса необходимо [[PVE. Установка сервисного пакета окружения|установить сервисный пакет окружения]].
-* Установка/обновление QAS осуществляется скриптом <code>chmod +x ./qas-<версия>-<релиз>.sh && ./qas-<версия>-<релиз>.sh -i</code> с правами администратора. Список всех ключей инсталлятора можно посмотреть, запустив инсталлятор <code>./qas-<версия>-<релиз>.sh</code> без ключей.
+* Установка/обновление TTS осуществляется скриптом <code>chmod +x ./tts-<версия>-<релиз>.sh && ./tts-<версия>-<релиз>.sh -i</code> с правами администратора. Список всех ключей инсталлятора можно посмотреть, запустив инсталлятор <code>./tts-<версия>-<релиз>.sh</code> без ключей.
-* Загрузить последнюю версию продукта  <code>curl -s "<nowiki>https://repo.connect2ai.net/api/qas/new</nowiki>" --user '[user]:[pass]' 2>&1 | bash</code> или в интерактивном режиме <code>bash -c "$(curl -s <nowiki>https://repo.connect2ai.net/api/pve</nowiki> --user '[user]:[pass]' 2>&1)"</code>.
+* Загрузить последнюю версию продукта  <code>curl -s "<nowiki>https://repo.connect2ai.net/api/tts/new</nowiki>" --user '[user]:[pass]' 2>&1 | bash</code> или в интерактивном режиме <code>bash -c "$(curl -s <nowiki>https://repo.connect2ai.net/api/tts</nowiki> --user '[user]:[pass]' 2>&1)"</code>.
-* Обновить QAS <code>/opt/qas/inupdate</code> в интерактивном режиме. Или запустить с ключём:
+* Обновить TTS <code>/opt/tts/inupdate</code> в интерактивном режиме. Или запустить с ключом:
-** <code>/opt/qas/inupdate -b</code> - обновить до последней beta версии;
+** <code>/opt/tts/inupdate -b</code> – обновить до последней beta версии;
-** <code>/opt/qas/inupdate -r</code> - обновить до последней release версии;
+** <code>/opt/tts/inupdate -r</code> – обновить до последней release версии;
-** <code>/opt/qas/inupdate -n</code> - обновить до последней версии (не важно beta или release).
+** <code>/opt/tts/inupdate -n</code> – обновить до последней версии (неважно beta или release).
-* Установить модели  <code>/opt/qas/inmodel</code> в интерактивном режиме.
+* Проверить актуальную версию продукта <code>curl -s "<nowiki>https://repo.connect2ai.net/api/tts/version</nowiki></code>.
-* Проверить актуальную версию продукта <code>curl -s "<nowiki>https://repo.connect2ai.net/api/qas/version</nowiki></code>.
+* Посмотреть лог изменений  <code>curl -s "<nowiki>https://repo.connect2ai.net/api/tts/changelog</nowiki>" --user '[user]:[pass]'</code>.
-* Посмотреть лог изменений  <code>curl -s "<nowiki>https://repo.connect2ai.net/api/qas/changelog</nowiki>" --user '[user]:[pass]'</code>.
+* Полное описание всех команд API репозитория можно найти по ссылке '''https://repo.connect2ai.net/api'''. <code>[user]:[pass]</code> – это тот же логин и пароль, что и от [https://cloud.connect2ai.net '''Nextcloud'''.]
-* Полное описание всех команд API репозитория можно найти по ссылке '''https://repo.connect2ai.net/api'''. <code>[user]:[pass]</code> - это тот же логин и пароль, что и от [https://cloud.connect2ai.net '''Nextcloud'''.]
 * В папке с продуктом можно добавить 2 файла конфигурации (допускается один общий файл на все продукты в папке с окружением /opt/pve/):
-** echo -n <code>"[user]:[pass]"</code>  > /opt/qas/.userapi (это файл авторизации в API, нужен для обновления и загрузки моделей)
+** echo -n <code>"[user]:[pass]"</code>  > /opt/tts/.userapi (это файл авторизации в API, нужен для обновления и загрузки моделей)
-** echo -n <code>"<nowiki>http://example.com:3128</nowiki> [user] [password]"</code>  > /opt/qas/.proxy (это файл конфигурации proxy необходим для обновления и загрузки моделей, при отсутсвующем прямом подключение к интернету)
+** echo -n <code>"<nowiki>http://example.com:3128</nowiki> [user] [password]"</code>  > /opt/tts/.proxy (это файл конфигурации proxy, необходим для обновления и загрузки моделей, при отсутствующем прямом подключении к интернету)
-При обновление следующий список файлов и папок сохранияется: .userapi, .proxy, logs, nnets, config.json, cache, pretrained, pve, data.
+При обновлении следующий список файлов и папок сохраняется: .userapi, .proxy, logs, nnets, config.json, cache, pretrained, pve, data. Сервис не требует остановки и возвращается в актуальное состояние после обновления.
 Не забудьте запустить сервис и включить в автозапуск в системе:
@@ Строка 46: / Строка 45: @@
 Разрешите доступ к порту 6186 на нужном интерфейсе по протоколу tcp.
-'''ВНИМАНИЕ''' - скрипт установки сервиса не устанавливает вокодер и модель голоса, для их установки потребуются дополнительные действия.
-Без вокодера и модели голоса сервис стартует но синтез не выполняет.
-===== '''Установка моделей TTS'''=====
-Установка [https://cloud.connect2ai.net/index.php/apps/files/?dir=/tts/voices&fileid=5239 моделей]  возможна прямым копирование файлов в соответствующие каталоги.
-Модели располагаются в каталоге /opt/tts/nnets/. Для '''установки модели''' необходимо создать каталог /opt/tts/nnets/<название модели>/ и скопировать в него файл c моделью (голосом), после чего перезагрузить сервис командой systemctl restart tts. Папок моделей и соответственно, голосов может быть больше одного.
-'''Вокодер''' располагается в каталоге  /opt/tts/vocoders/, и устанавливается автоматически при установке или обновлении '''tts'''.
-Чтобы убедиться, что модели доступны, выполните запрос
-<code>curl -H "accept: application/json" -X GET "<nowiki>http://АДРЕС_СЕРВЕРА:6186/tts/</nowiki>"</code>
-В ответе должно содержаться название новой модели или перечень названий моделей в формате json.
-Проверить корректность работы модели можно запросом к API с текстом для синтеза, заменив в примере адрес сервера модель и текст для синтеза:
-<code>curl -G -X GET "<nowiki>http://АДРЕС_СЕРВЕРА:6186/tts/synthesize/МОДЕЛЬ?rate=100&pitch=100&volume=100</nowiki>" -H "accept: application/json" --data-urlencode "text=текст для синтеза"  --output out.wav</code>
-out.wav должен содержать синтезированный голос озвучивший текст из запроса.
 ===== '''Конфигурирование параметров сервиса TTS''' =====
@@ Строка 80: / Строка 56: @@
 !Назначение
 |-
-|max_gpu_memory
+|gpu
-|0.6
+|true
-|Лимит использования ОЗУ видеокарты.
+|Флаг использования видеокарты при ее наличии
 |-
-|balcklist
+|logs.path
-|[]
+|logs/
-|Список моделей распознавания в папках nnets и vocoders, которые не должны быть загружены при старте сервиса TTS.
+|Путь к папке логов.
+|-
+|logs.backups
+|10
+|Максимальное количество логфайлов.
+|-
+|logs.maxSize
+|5242880
+|Максимальный размер одного логфайла.
 |}
 ====='''Сбор данных об ошибках'''=====
@@ Строка 108: / Строка 91: @@
 <code>deactivate</code><br>
 ====='''Удаление'''=====
 Для удаления выполните команду: <code>/opt/tts/uninstall</code>. Команда деинсталлирует сервис и удалит рабочий каталог, включая все установленные модели и вокодер.
-===== '''Часто задаваемые вопросы''' =====
-{| class="wikitable"
-|+
-!Вопрос
-!Ответ
-|-
-|
-|
-|-
-|
-|
-|-
-|
-|
-|}