QAS. Руководство администратора: различия между версиями

Версия от 09:56, 27 февраля 2024

Общее описание

Сервис предназначен для поиска ответа на заданный вопрос. Входным значением для сервиса являются данные в текстовом формате. В ответ на входящий запрос сервис возвращает данные в формате JSON.

Термины и определения

Question Answering System (QAS) – сервис ответов на вопросы.

Системные требования

Для нормальной работы сервиса на каждый 1 одновременный запрос поиска ответа необходимо обеспечить 1 CPU >= 2.20GHz с поддержкой иструкций AVX2 или новее:

Intel Haswell
Intel Broadwell
Intel Skylake
Intel Kaby Lake
Intel Coffee Lake
Intel Comet Lake
Intel Rocket Lake
Intel Alder Lake
AMD Excavator
AMD Zen (AMD Ryzen)
AMD Zen 2 (AMD Ryzen)
AMD Zen 3 (AMD Ryzen)

Оперативной памяти необходимо не менее 4Gb.

Установка/обновление сервиса

Дистрибутив распространяется в виде установочных пакетов для окружения и сервиса. Загрузите установочные пакеты на сервер и выполните команды для Вашей системы в каталоге с пакетом.

Перед установкой непосредственно сервиса необходимо установить сервисный пакет окружения.

Установка/обновление QAS осуществляется скриптом chmod +x ./qas-<версия>-<релиз>.sh && ./qas-<версия>-<релиз>.sh -i с правами администратора. Список всех ключей инсталятора можно посмотреть, запустив инсталятор ./qas-<версия>-<релиз>.sh без ключей.

Загрузить последнюю версию пакета curl -s 'https://cloud.connect2ai.net/qas/' --user 'user_nexcloud:pass_nexcloud' | bash

Устновить/обновить пакет одной командой curl -s 'https://cloud.connect2ai.net/qas/?name=s' --user 'user_nexcloud:pass_nexcloud' | bash && chmod +x ./qas.sh && ./qas.sh -i

Проверить актуальную версию пакета можно curl -s 'https://cloud.connect2ai.net/qas/?type=v'

Не забудьте запустить сервис и включить в автозапуск в системе:

sudo systemctl enable qas.service && sudo systemctl start qas.service

Удостоверьтесь, что сервис стартовал:

systemctl status qas.service

Разрешите доступ к порту 6187 на нужном интерфейсе по протоколу tcp.

Конфигурирование параметров сервиса

Настройка параметров сервиса ыьс производится в файле /opt/smc/config.json

Описание параметров приведено в таблице


Параметр	По умолчанию	Назначение
logs.path	logs/	Дерриктория для хранения логов. Примеры абсолютного пути: "/var/log/qas/"
logs.backups	10	Количество файлов ротации
logs.maxSize	5242880	Максимальный размер файла в байтах, триггер для ротации
fragments.window	256	Флаг загрузки модели в GPU. productionModels подразумевает все рабочие модели, которые создаются в системе. Можно отдельно по названию созданной модели включать/выключать ее загрузку в GPU. Остальные модели - сервисные: embeddingModel - языковая, punctuationModel - пунктуация, emotionsModel - анализ эмоций, compressorModel - модель сжатия фраз.
fragments.shift	8
fragments.neighbours	1
fragments.context	2048
fragments.threshold	0.6
fragments.limit	2

Сбор данных об ошибках

Логи сервиса по умолчанию находятся в файле /opt/ups/logs/log.txt

Сбор данных об ошибках

Для увеличения информативности журналов можно выполнить от суперпользователя команду:

sed -i 's/log-level error/log-level debug/g' /etc/systemd/system/qas.service && systemctl daemon-reload && systemctl restart qas.service

При возникновении проблем в работе сервиса и недостаточной информативности журналов, можно запустить сервис вручную с привилегиями суперпользователя и выводом информации в stdout:

systemctl stop qas.service && source /opt/pve/bin/activate && cd /opt/qas/ && python3 api.py && deactivate

или

systemctl stop qas.service

source /opt/pve/bin/activate

cd /opt/qas/ && python3 api.py

deactivate

Удаление

Для удаления выполните команду: /opt/qas/uninstall. Команда деинсталлирует сервис и удалит рабочий каталог, включая все установленные модели.

@@ Строка 57: / Строка 57: @@
 |logs.path
 |logs/
-|Дерриктория для хранения логов. Примеры абсолютного пути: "/var/log/smc/"
+|Дерриктория для хранения логов. Примеры абсолютного пути: "/var/log/qas/"
 |-
 |logs.backups
@@ Строка 67: / Строка 67: @@
 |Максимальный размер файла в байтах, триггер для ротации
 |-
-|gpu.productionModels
+|fragments.window
-|true
+|256
 | rowspan="6" |Флаг загрузки модели в GPU. productionModels подразумевает все рабочие модели, которые создаются в системе. Можно отдельно по названию созданной модели включать/выключать ее загрузку в GPU. Остальные модели - сервисные: embeddingModel - языковая, punctuationModel - пунктуация, emotionsModel - анализ эмоций, compressorModel - модель сжатия фраз.
 |-
-|gpu.embeddingModel
+|fragments.shift
-|true
+|8
 |-
-|gpu.punctuationModel
+|fragments.neighbours
-|true
+|1
 |-
-|gpu.emotionsModel
+|fragments.context
-|true
+|2048
 |-
-|gpu.compressorModel
+|fragments.threshold
-|true
+|0.6
 |-
-|gpu.emotionsModel
+|fragments.limit
-|true
+|2
 |}

QAS. Руководство администратора: различия между версиями

Материал из Флора AI

Версия от 09:56, 27 февраля 2024

Содержание

Общее описание

Термины и определения

Системные требования

Установка/обновление сервиса

Конфигурирование параметров сервиса

Сбор данных об ошибках

Сбор данных об ошибках

Удаление