UMS. Руководство администратора: различия между версиями
Материал из Флора AI
E.Elagina (обсуждение | вклад) |
E.Elagina (обсуждение | вклад) |
||
| Строка 1: | Строка 1: | ||
===== '''Общее описание''' ===== | ===== '''Общее описание''' ===== | ||
Сервис | Сервис UMS — это серверная реализация протокола MRCP, предназначенная для работы с сервисом SPR. | ||
====='''Термины и определения'''===== | ====='''Термины и определения'''===== | ||
UMS | UMS — Universal MRCP Server (расширенная реализация MRCP-сервера для обработки речи) ↵ MRCP — Media Resource Control Protocol (протокол управления медиа-ресурсами) ↵ SRP — Short Phrase Recognized (продукт для распознавания речи) | ||
MRCP | |||
SRP | VAD — Voice Activity Detection (обнаружение голосовой активности во входном акустическом сигнале для отделения активной речи от фонового шума или тишины) | ||
====='''Установка пакета UMC'''===== | ====='''Установка пакета UMC'''===== | ||
[https://cloud.connect2ai.net/index.php/apps/files/?dir=/ums&fileid=508 Дистрибутив] распространяется в виде универсального установочного пакета. | [https://cloud.connect2ai.net/index.php/apps/files/?dir=/ums&fileid=508 Дистрибутив] распространяется в виде универсального установочного пакета. ↵ Пакет может быть установлен в ''онлайн''-режиме (при наличии доступа к репозиториям) или оффлайн (с предварительно собранными пакетами). ↵ Для установки в оффлайн-режиме сперва нужно запустить экземпляр скрипта на копии целевой системы (версия и ядро ОС) с доступом к репозиториям. ↵ Для установки пакета запустить инсталлятор с требуемыми ключами. При запуске без ключей инсталлятор выдаст короткую справку. ↵ Например. | ||
Пакет может быть установлен в ''онлайн'' режиме (при наличии доступа к репозиториям) или | |||
Для установки в оффлайн режиме сперва нужно запустить экземпляр скрипта на копии целевой системы (версия и ядро ОС) с доступом к репозиториям. | |||
Для установки пакета запустить инсталлятор с требуемыми ключами. При запуске без ключей инсталлятор выдаст короткую справку. | |||
Например | |||
-Установить сервис онлайн | -Установить сервис онлайн | ||
<code>./ums-X.XXX-universal.sh -i -on</code> | <code>./ums-X.XXX-universal.sh -i -on</code> | ||
| Строка 46: | Строка 41: | ||
<code>}</code> | <code>}</code> | ||
UMS в составе содержит nginx сервер. Его файл конфигурации: | UMS в составе содержит nginx-сервер. Его файл конфигурации: /opt/ums/nginx/etc/nginx/conf.d/default.conf.example. В нем, возможно, будет необходимость править таймауты. | ||
В нем возможно будет необходимость править таймауты. | |||
На поведение UMS также влияет строка запроса например: | На поведение UMS также влияет строка запроса, например: | ||
<code>builtin:grammar/calls?language=ru-RU&b=1&spl=ru-RU&i=any&ct=0.7&sl=0.7&sint=1000&sct=800&nit=3000</code> | <code>builtin:grammar/calls?language=ru-RU&b=1&spl=ru-RU&i=any&ct=0.7&sl=0.7&sint=1000&sct=800&nit=3000</code> | ||
| Строка 55: | Строка 49: | ||
'''Параметры распознавания:''' | '''Параметры распознавания:''' | ||
'''b''' — Возможность прервать проигрываемый файл (режим barge-in) и начать распознавание (нельзя перебить=0, можно перебить | '''b''' — Возможность прервать проигрываемый файл (режим barge-in) и начать распознавание (нельзя перебить = 0, можно перебить и обнаружение речи осуществляет ASR движок = 1, можно перебить и обнаружение речи осуществляет Asterisk = 2). | ||
'''t''' — Время, по истечении которого система распознавания может прервать процедуру распознавания с кодом | '''t''' — Время, по истечении которого система распознавания может прервать процедуру распознавания с кодом. | ||
recognition-timeout (003) | |||
recognition-timeout (003) в случае, если распознавание началось и нет ни одного варианта распознавания. Значение задается в миллисекундах ↵в диапазоне [0..MAXTIMEOUT]. | |||
'''ct''' — Порог уверенного распознавания (0.0 – 1.0). | '''ct''' — Порог уверенного распознавания (0.0 – 1.0). | ||
Если confidence-level, возвращаемый при распознавании, меньше confidence-threshold, то результат распознавания no match. | |||
Если confidence-level, возвращаемый при распознавании, меньше confidence-threshold, то результат распознавания — no match. | |||
'''sl''' — Чувствительность к несловарным командам. (0.0 — 1.0). Чем больше значение, тем выше чувствительность к шуму. | '''sl''' — Чувствительность к несловарным командам. (0.0 — 1.0). Чем больше значение, тем выше чувствительность к шуму. | ||
'''nit''' — no input timeout (msec) Время, по истечении которого система распознавания может прервать процедуру | '''nit''' — no input timeout (msec) Время, по истечении которого система распознавания может прервать процедуру распознавания с кодом no-input-timeout (002), в случае, если распознавание началось и не найдено речи. | ||
Значение задается в миллисекундах, в диапазоне [0..MAXTIMEOUT]. | Значение задается в миллисекундах, в диапазоне [0..MAXTIMEOUT]. | ||
| Строка 103: | Строка 94: | ||
<code>/opt/ums/mrcp/usr/local/unimrcp/log</code> | <code>/opt/ums/mrcp/usr/local/unimrcp/log</code> | ||
Версия от 12:02, 20 февраля 2025
Общее описание
Сервис UMS — это серверная реализация протокола MRCP, предназначенная для работы с сервисом SPR.
Термины и определения
UMS — Universal MRCP Server (расширенная реализация MRCP-сервера для обработки речи) ↵ MRCP — Media Resource Control Protocol (протокол управления медиа-ресурсами) ↵ SRP — Short Phrase Recognized (продукт для распознавания речи)
VAD — Voice Activity Detection (обнаружение голосовой активности во входном акустическом сигнале для отделения активной речи от фонового шума или тишины)
Установка пакета UMC
Дистрибутив распространяется в виде универсального установочного пакета. ↵ Пакет может быть установлен в онлайн-режиме (при наличии доступа к репозиториям) или оффлайн (с предварительно собранными пакетами). ↵ Для установки в оффлайн-режиме сперва нужно запустить экземпляр скрипта на копии целевой системы (версия и ядро ОС) с доступом к репозиториям. ↵ Для установки пакета запустить инсталлятор с требуемыми ключами. При запуске без ключей инсталлятор выдаст короткую справку. ↵ Например.
-Установить сервис онлайн
./ums-X.XXX-universal.sh -i -on
-Установить сервис оффлайн
./ums-X.XXX-universal.sh -i -off
-Скопировать внутренний архив рядом со скриптом не распаковывая в папку
./ums-X.XXX-universal.sh --extract
-Запаковать архив в скрипт
./ums-X.XXX-universal.sh --pack <service>-offline.tgz
-Сжать каталог и запаковать архив в скрипт
./ums-X.XXX-universal.sh --pack -d <имя каталога>
-Распаковать внутренний архив рядом со скриптом в каталог
./ums-X.XXX-universal.sh -e -d archive
-Собрать все пакеты для установки оффлайн сервиса
./ums-X.XXX-universal.sh --build
-Удалить внутренний архив из скрипта
./ums-X.XXX-universal.sh --null
Конфигурирование
Основной файл конфигурации /opt/ums/params.conf
В файле ссылка на сервис распознавания или прокси сервис через который доступен кластер сервисов распознавания
{
"spr_server": "127.0.0.1:6182"
}
UMS в составе содержит nginx-сервер. Его файл конфигурации: /opt/ums/nginx/etc/nginx/conf.d/default.conf.example. В нем, возможно, будет необходимость править таймауты.
На поведение UMS также влияет строка запроса, например:
builtin:grammar/calls?language=ru-RU&b=1&spl=ru-RU&i=any&ct=0.7&sl=0.7&sint=1000&sct=800&nit=3000
Параметры распознавания:
b — Возможность прервать проигрываемый файл (режим barge-in) и начать распознавание (нельзя перебить = 0, можно перебить и обнаружение речи осуществляет ASR движок = 1, можно перебить и обнаружение речи осуществляет Asterisk = 2).
t — Время, по истечении которого система распознавания может прервать процедуру распознавания с кодом.
recognition-timeout (003) в случае, если распознавание началось и нет ни одного варианта распознавания. Значение задается в миллисекундах ↵в диапазоне [0..MAXTIMEOUT].
ct — Порог уверенного распознавания (0.0 – 1.0).
Если confidence-level, возвращаемый при распознавании, меньше confidence-threshold, то результат распознавания — no match.
sl — Чувствительность к несловарным командам. (0.0 — 1.0). Чем больше значение, тем выше чувствительность к шуму.
nit — no input timeout (msec) Время, по истечении которого система распознавания может прервать процедуру распознавания с кодом no-input-timeout (002), в случае, если распознавание началось и не найдено речи. Значение задается в миллисекундах, в диапазоне [0..MAXTIMEOUT].
sint — speech incomplete timeout (msec)
i - digits to allow recognition to be interrupted with (by default DTMFs are sent to the MRCP server to recognize; otherwise, if "any" or other digits are specified, recognition will be interrupted)
sct - speech complete timeout (msec)
Подробнее: unimrcp.org/manuals/html/AsteriskManual
Протоколы и порты
Сервис использует следующие порты:
- 8060/tcp
- 8060/udp
- 5000-6000/udp
- 443/tcp
- 11554/tcp
- 6170/tcp
Сбор данных об ошибках
Сервис логи MRCP хранит по адресу
/opt/ums/mrcp/usr/local/unimrcp/log
Удаление UMC
Для удаления запустить инсталлятор с ключом:
./ums-X.XXX-universal.sh --uninstall