TTS. Руководство администратора: различия между версиями
Материал из Флора AI
Нет описания правки |
|||
| (не показано 12 промежуточных версий 4 участников) | |||
| Строка 1: | Строка 1: | ||
===== '''Общее описание''' ===== | ===== '''Общее описание''' ===== | ||
Сервис предназначен для преобразования текста в речь. Входными данными для сервиса является текст, результатом работы будет | Сервис предназначен для преобразования текста в речь. Входными данными для сервиса является текст, результатом работы будет аудиофайл в формате *.wav. | ||
====='''Термины и определения'''===== | |||
Text-to-speech server (TTS) – сервис синтеза речи. | |||
Модель (голос) – модель нейронной сети, отвечающая за синтез спектрограммы из текста. От модели зависит, каким голосом будет синтезирован текст. | |||
Вокодер – модель нейронной сети, отвечающая за синтез аудиоданных из спектрограммы. '''''Модели и вокодеры поставляются в составе дистрибутива, дополнительных действий для их установки не требуется.''''' | |||
====='''Расчет нагрузки'''===== | ====='''Расчет нагрузки'''===== | ||
Для нормальной работы сервиса на каждый канал синтеза требуется 1 CPU | Для нормальной работы сервиса на каждый канал синтеза требуется 1 CPU >= 2.20 GHz. Оперативной памяти необходимо не менее 8 GB. | ||
| Строка 21: | Строка 21: | ||
Перед установкой непосредственно сервиса необходимо [[PVE. Установка сервисного пакета окружения|установить сервисный пакет окружения]]. | Перед установкой непосредственно сервиса необходимо [[PVE. Установка сервисного пакета окружения|установить сервисный пакет окружения]]. | ||
* Установка/обновление | * Установка/обновление TTS осуществляется скриптом <code>chmod +x ./tts-<версия>-<релиз>.sh && ./tts-<версия>-<релиз>.sh -i</code> с правами администратора. Список всех ключей инсталлятора можно посмотреть, запустив инсталлятор <code>./tts-<версия>-<релиз>.sh</code> без ключей. | ||
* Загрузить последнюю версию продукта <code>curl -s "<nowiki>https://repo.connect2ai.net/api/ | * Загрузить последнюю версию продукта <code>curl -s "<nowiki>https://repo.connect2ai.net/api/tts/new</nowiki>" --user '[user]:[pass]' 2>&1 | bash</code> или в интерактивном режиме <code>bash -c "$(curl -s <nowiki>https://repo.connect2ai.net/api/tts</nowiki> --user '[user]:[pass]' 2>&1)"</code>. | ||
* Обновить | * Обновить TTS <code>/opt/tts/inupdate</code> в интерактивном режиме. Или запустить с ключом: | ||
** <code>/opt/ | ** <code>/opt/tts/inupdate -b</code> – обновить до последней beta версии; | ||
** <code>/opt/ | ** <code>/opt/tts/inupdate -r</code> – обновить до последней release версии; | ||
** <code>/opt/ | ** <code>/opt/tts/inupdate -n</code> – обновить до последней версии (неважно beta или release). | ||
* Проверить актуальную версию продукта <code>curl -s "<nowiki>https://repo.connect2ai.net/api/tts/version</nowiki></code>. | |||
* Проверить актуальную версию продукта <code>curl -s "<nowiki>https://repo.connect2ai.net/api/ | * Посмотреть лог изменений <code>curl -s "<nowiki>https://repo.connect2ai.net/api/tts/changelog</nowiki>" --user '[user]:[pass]'</code>. | ||
* Посмотреть лог изменений <code>curl -s "<nowiki>https://repo.connect2ai.net/api/ | * Полное описание всех команд API репозитория можно найти по ссылке '''https://repo.connect2ai.net/api'''. <code>[user]:[pass]</code> – это тот же логин и пароль, что и от [https://cloud.connect2ai.net '''Nextcloud'''.] | ||
* Полное описание всех команд API репозитория можно найти по ссылке '''https://repo.connect2ai.net/api'''. <code>[user]:[pass]</code> | |||
* В папке с продуктом можно добавить 2 файла конфигурации (допускается один общий файл на все продукты в папке с окружением /opt/pve/): | * В папке с продуктом можно добавить 2 файла конфигурации (допускается один общий файл на все продукты в папке с окружением /opt/pve/): | ||
** echo -n <code>"[user]:[pass]"</code> > /opt/ | ** echo -n <code>"[user]:[pass]"</code> > /opt/tts/.userapi (это файл авторизации в API, нужен для обновления и загрузки моделей) | ||
** echo -n <code>"<nowiki>http://example.com:3128</nowiki> [user] [password]"</code> > /opt/ | ** echo -n <code>"<nowiki>http://example.com:3128</nowiki> [user] [password]"</code> > /opt/tts/.proxy (это файл конфигурации proxy, необходим для обновления и загрузки моделей, при отсутствующем прямом подключении к интернету) | ||
При | При обновлении следующий список файлов и папок сохраняется: .userapi, .proxy, logs, nnets, config.json, cache, pretrained, pve, data. Сервис не требует остановки и возвращается в актуальное состояние после обновления. | ||
Не забудьте запустить сервис и включить в автозапуск в системе: | Не забудьте запустить сервис и включить в автозапуск в системе: | ||
| Строка 46: | Строка 45: | ||
Разрешите доступ к порту 6186 на нужном интерфейсе по протоколу tcp. | Разрешите доступ к порту 6186 на нужном интерфейсе по протоколу tcp. | ||
===== '''Конфигурирование параметров сервиса TTS''' ===== | ===== '''Конфигурирование параметров сервиса TTS''' ===== | ||
| Строка 80: | Строка 56: | ||
!Назначение | !Назначение | ||
|- | |- | ||
| | |gpu | ||
| | |true | ||
| | |Флаг использования видеокарты при ее наличии | ||
|- | |- | ||
| | |logs.path | ||
| | |logs/ | ||
| | |Путь к папке логов. | ||
|- | |||
|logs.backups | |||
|10 | |||
|Максимальное количество логфайлов. | |||
|- | |||
|logs.maxSize | |||
|5242880 | |||
|Максимальный размер одного логфайла. | |||
|} | |} | ||
====='''Сбор данных об ошибках'''===== | ====='''Сбор данных об ошибках'''===== | ||
| Строка 108: | Строка 91: | ||
<code>deactivate</code><br> | <code>deactivate</code><br> | ||
====='''Удаление'''===== | ====='''Удаление'''===== | ||
Для удаления выполните команду: <code>/opt/tts/uninstall</code>. Команда деинсталлирует сервис и удалит рабочий каталог, включая все установленные модели и вокодер. | Для удаления выполните команду: <code>/opt/tts/uninstall</code>. Команда деинсталлирует сервис и удалит рабочий каталог, включая все установленные модели и вокодер. | ||
Текущая версия от 14:48, 2 апреля 2025
Общее описание
Сервис предназначен для преобразования текста в речь. Входными данными для сервиса является текст, результатом работы будет аудиофайл в формате *.wav.
Термины и определения
Text-to-speech server (TTS) – сервис синтеза речи.
Модель (голос) – модель нейронной сети, отвечающая за синтез спектрограммы из текста. От модели зависит, каким голосом будет синтезирован текст.
Вокодер – модель нейронной сети, отвечающая за синтез аудиоданных из спектрограммы. Модели и вокодеры поставляются в составе дистрибутива, дополнительных действий для их установки не требуется.
Расчет нагрузки
Для нормальной работы сервиса на каждый канал синтеза требуется 1 CPU >= 2.20 GHz. Оперативной памяти необходимо не менее 8 GB.
Установка/обновление TTS
Дистрибутив распространяется в виде установочных пакетов для окружения и сервиса. Загрузите установочные пакеты на сервер и выполните команды для Вашей системы в каталоге с пакетом.
Перед установкой непосредственно сервиса необходимо установить сервисный пакет окружения.
- Установка/обновление TTS осуществляется скриптом
chmod +x ./tts-<версия>-<релиз>.sh && ./tts-<версия>-<релиз>.sh -iс правами администратора. Список всех ключей инсталлятора можно посмотреть, запустив инсталлятор./tts-<версия>-<релиз>.shбез ключей. - Загрузить последнюю версию продукта
curl -s "https://repo.connect2ai.net/api/tts/new" --user '[user]:[pass]' 2>&1 | bashили в интерактивном режимеbash -c "$(curl -s https://repo.connect2ai.net/api/tts --user '[user]:[pass]' 2>&1)". - Обновить TTS
/opt/tts/inupdateв интерактивном режиме. Или запустить с ключом:/opt/tts/inupdate -b– обновить до последней beta версии;/opt/tts/inupdate -r– обновить до последней release версии;/opt/tts/inupdate -n– обновить до последней версии (неважно beta или release).
- Проверить актуальную версию продукта
curl -s "https://repo.connect2ai.net/api/tts/version. - Посмотреть лог изменений
curl -s "https://repo.connect2ai.net/api/tts/changelog" --user '[user]:[pass]'. - Полное описание всех команд API репозитория можно найти по ссылке https://repo.connect2ai.net/api.
[user]:[pass]– это тот же логин и пароль, что и от Nextcloud. - В папке с продуктом можно добавить 2 файла конфигурации (допускается один общий файл на все продукты в папке с окружением /opt/pve/):
- echo -n
"[user]:[pass]"> /opt/tts/.userapi (это файл авторизации в API, нужен для обновления и загрузки моделей) - echo -n
"http://example.com:3128 [user] [password]"> /opt/tts/.proxy (это файл конфигурации proxy, необходим для обновления и загрузки моделей, при отсутствующем прямом подключении к интернету)
- echo -n
При обновлении следующий список файлов и папок сохраняется: .userapi, .proxy, logs, nnets, config.json, cache, pretrained, pve, data. Сервис не требует остановки и возвращается в актуальное состояние после обновления.
Не забудьте запустить сервис и включить в автозапуск в системе:
sudo systemctl enable tts.service && sudo systemctl start tts.service
Удостоверьтесь, что сервис стартовал:
systemctl status tts.service
Разрешите доступ к порту 6186 на нужном интерфейсе по протоколу tcp.
Конфигурирование параметров сервиса TTS
Настройка параметров сервиса tts производится в файле /opt/spr/params.json
Описание параметров приведено в таблице
| Параметр | По умолчанию | Назначение |
|---|---|---|
| gpu | true | Флаг использования видеокарты при ее наличии |
| logs.path | logs/ | Путь к папке логов. |
| logs.backups | 10 | Максимальное количество логфайлов. |
| logs.maxSize | 5242880 | Максимальный размер одного логфайла. |
Сбор данных об ошибках
Для увеличения информативности журналов можно выполнить от суперпользователя команду:
sed -i 's/log-level error/log-level debug/g' /etc/systemd/system/tts.service && systemctl daemon-reload && systemctl restart tts.service
При возникновении проблем в работе сервиса и недостаточной информативности журналов, можно запустить сервис вручную с привилегиями суперпользователя и выводом информации в stdout:
systemctl stop tts.service && source /opt/pve/bin/activate && cd /opt/tts/ && python3 api.py && deactivate
или
systemctl stop tts.service
source /opt/pve/bin/activate
cd /opt/tts/ && python3 api.py
deactivate
Удаление
Для удаления выполните команду: /opt/tts/uninstall. Команда деинсталлирует сервис и удалит рабочий каталог, включая все установленные модели и вокодер.