Действия

QAS. Руководство администратора: различия между версиями

Материал из Флора AI

Нет описания правки
Нет описания правки
Строка 57: Строка 57:
|logs.path
|logs.path
|logs/
|logs/
|Дерриктория для хранения логов. Примеры абсолютного пути: "/var/log/smc/"
|Дерриктория для хранения логов. Примеры абсолютного пути: "/var/log/qas/"
|-
|-
|logs.backups
|logs.backups
Строка 67: Строка 67:
|Максимальный размер файла в байтах, триггер для ротации
|Максимальный размер файла в байтах, триггер для ротации
|-
|-
|gpu.productionModels
|fragments.window
|true
|256
| rowspan="6" |Флаг загрузки модели в GPU. productionModels подразумевает все рабочие модели, которые создаются в системе. Можно отдельно по названию созданной модели включать/выключать ее загрузку в GPU. Остальные модели - сервисные: embeddingModel - языковая, punctuationModel - пунктуация, emotionsModel - анализ эмоций, compressorModel - модель сжатия фраз.
| rowspan="6" |Флаг загрузки модели в GPU. productionModels подразумевает все рабочие модели, которые создаются в системе. Можно отдельно по названию созданной модели включать/выключать ее загрузку в GPU. Остальные модели - сервисные: embeddingModel - языковая, punctuationModel - пунктуация, emotionsModel - анализ эмоций, compressorModel - модель сжатия фраз.
|-
|-
|gpu.embeddingModel
|fragments.shift
|true
|8
|-
|-
|gpu.punctuationModel
|fragments.neighbours
|true
|1
|-
|-
|gpu.emotionsModel
|fragments.context
|true
|2048
|-
|-
|gpu.compressorModel
|fragments.threshold
|true
|0.6
|-
|-
|gpu.emotionsModel
|fragments.limit
|true
|2
|}
|}



Версия от 09:56, 27 февраля 2024

Общее описание

Сервис предназначен для поиска ответа на заданный вопрос. Входным значением для сервиса являются данные в текстовом формате. В ответ на входящий запрос сервис возвращает данные в формате JSON.

Термины и определения

Question Answering System (QAS) – сервис ответов на вопросы.

Системные требования

Для нормальной работы сервиса на каждый 1 одновременный запрос поиска ответа необходимо обеспечить 1 CPU >= 2.20GHz с поддержкой иструкций AVX2 или новее:

  • Intel Haswell
  • Intel Broadwell
  • Intel Skylake
  • Intel Kaby Lake
  • Intel Coffee Lake
  • Intel Comet Lake
  • Intel Rocket Lake
  • Intel Alder Lake
  • AMD Excavator
  • AMD Zen (AMD Ryzen)
  • AMD Zen 2 (AMD Ryzen)
  • AMD Zen 3 (AMD Ryzen)

Оперативной памяти необходимо не менее 4Gb.

Установка/обновление сервиса

Дистрибутив распространяется в виде установочных пакетов для окружения и сервиса. Загрузите установочные пакеты на сервер и выполните команды для Вашей системы в каталоге с пакетом.

Перед установкой непосредственно сервиса необходимо установить сервисный пакет окружения.

Установка/обновление QAS осуществляется скриптом chmod +x ./qas-<версия>-<релиз>.sh && ./qas-<версия>-<релиз>.sh -i с правами администратора. Список всех ключей инсталятора можно посмотреть, запустив инсталятор ./qas-<версия>-<релиз>.sh без ключей.

Загрузить последнюю версию пакета curl -s 'https://cloud.connect2ai.net/qas/' --user 'user_nexcloud:pass_nexcloud' | bash

Устновить/обновить пакет одной командой curl -s 'https://cloud.connect2ai.net/qas/?name=s' --user 'user_nexcloud:pass_nexcloud' | bash && chmod +x ./qas.sh && ./qas.sh -i

Проверить актуальную версию пакета можно curl -s 'https://cloud.connect2ai.net/qas/?type=v'

Не забудьте запустить сервис и включить в автозапуск в системе:

sudo systemctl enable qas.service && sudo systemctl start qas.service

Удостоверьтесь, что сервис стартовал:

systemctl status qas.service

Разрешите доступ к порту 6187 на нужном интерфейсе по протоколу tcp.

Конфигурирование параметров сервиса

Настройка параметров сервиса ыьс производится в файле /opt/smc/config.json

Описание параметров приведено в таблице

Параметр По умолчанию Назначение
logs.path logs/ Дерриктория для хранения логов. Примеры абсолютного пути: "/var/log/qas/"
logs.backups 10 Количество файлов ротации
logs.maxSize 5242880 Максимальный размер файла в байтах, триггер для ротации
fragments.window 256 Флаг загрузки модели в GPU. productionModels подразумевает все рабочие модели, которые создаются в системе. Можно отдельно по названию созданной модели включать/выключать ее загрузку в GPU. Остальные модели - сервисные: embeddingModel - языковая, punctuationModel - пунктуация, emotionsModel - анализ эмоций, compressorModel - модель сжатия фраз.
fragments.shift 8
fragments.neighbours 1
fragments.context 2048
fragments.threshold 0.6
fragments.limit 2
Сбор данных об ошибках

Логи сервиса по умолчанию находятся в файле /opt/ups/logs/log.txt

Сбор данных об ошибках

Для увеличения информативности журналов можно выполнить от суперпользователя команду:

sed -i 's/log-level error/log-level debug/g' /etc/systemd/system/qas.service && systemctl daemon-reload && systemctl restart qas.service

При возникновении проблем в работе сервиса и недостаточной информативности журналов, можно запустить сервис вручную с привилегиями суперпользователя и выводом информации в stdout:

systemctl stop qas.service && source /opt/pve/bin/activate && cd /opt/qas/ && python3 api.py && deactivate

       или

systemctl stop qas.service

source /opt/pve/bin/activate

cd /opt/qas/ && python3 api.py

deactivate

Удаление

Для удаления выполните команду: /opt/qas/uninstall. Команда деинсталлирует сервис и удалит рабочий каталог, включая все установленные модели.