SPR. Руководство пользователя: различия между версиями
Материал из Флора AI
Нет описания правки |
KorolkovS (обсуждение | вклад) Нет описания правки |
||
| (не показана 1 промежуточная версия этого же участника) | |||
| Строка 19: | Строка 19: | ||
Ответ сервиса представляет собой JSON-документ в кодировке UTF-8 или двоичный файл. Содержимое документа зависит от результата выполнения запроса. При наличии ошибки в качестве ответа вернется переменная error=1 и описание в переменной message. Для удобства проверки методов по ссылке http://АДРЕС:6183 будет отображен интерфейс Swagger со всеми методами с возможностью их проверки. | Ответ сервиса представляет собой JSON-документ в кодировке UTF-8 или двоичный файл. Содержимое документа зависит от результата выполнения запроса. При наличии ошибки в качестве ответа вернется переменная error=1 и описание в переменной message. Для удобства проверки методов по ссылке http://АДРЕС:6183 будет отображен интерфейс Swagger со всеми методами с возможностью их проверки. | ||
<onlyinclude> | |||
{| class="wikitable" style="width: 110%" | {| class="wikitable" style="width: 110%" | ||
|+ | |+ | ||
|- | |- | ||
! style="color:blue;width: 15%"|'''GET:/spr/''' | ! style="color:blue;width: 15%"|'''GET:/spr/models''' | ||
! colspan="3" |<small>Вывод списка моделей.</small> | ! colspan="3" |<small>Вывод списка моделей.</small> | ||
|- | |- | ||
| Строка 34: | Строка 35: | ||
|<small>Файл аудиозаписи или</small> <small><code>{ error: INT , message: DESCRIPTION }</code></small> | |<small>Файл аудиозаписи или</small> <small><code>{ error: INT , message: DESCRIPTION }</code></small> | ||
|- | |- | ||
! style="color:blue;width: 15%"|'''GET:/spr/ | ! style="color:blue;width: 15%"|'''GET:/spr/export/{id}''' | ||
! colspan="3" |<small>Получение архива модели.</small> | ! colspan="3" |<small>Получение архива модели.</small> | ||
|- | |- | ||
| Строка 40: | Строка 41: | ||
|<small>ZIP-файл с моделью, либо <code>{ error: INT , message: DESCRIPTION }</code></small> | |<small>ZIP-файл с моделью, либо <code>{ error: INT , message: DESCRIPTION }</code></small> | ||
|- | |- | ||
!style="color:green;width: 15%"|'''POST:/spr/ | !style="color:green;width: 15%"|'''POST:/spr/import/{id}''' | ||
! colspan="3" |<small>Добавление модели. Может быть добавлена как из файла архива, так и переименованием существующей модели.</small> | ! colspan="3" |<small>Добавление модели. Может быть добавлена как из файла архива, так и переименованием существующей модели.</small> | ||
|- | |- | ||
| Строка 51: | Строка 52: | ||
|<small><code>{ error: INT, message: DESCRIPTION }</code></small> | |<small><code>{ error: INT, message: DESCRIPTION }</code></small> | ||
|- | |- | ||
!style="color:red;width: 15%"|'''DELETE:/spr/ | !style="color:red;width: 15%"|'''DELETE:/spr/delete/{id}''' | ||
! colspan="3" |<small>Удаление модели.</small> | ! colspan="3" |<small>Удаление модели.</small> | ||
|- | |- | ||
| Строка 261: | Строка 262: | ||
<small><code>}</code></small> | <small><code>}</code></small> | ||
|} | |} | ||
</onlyinclude> | |||
Текущая версия от 11:01, 12 января 2026
Общее описание
Сервис Short phrase recognizer предназначен для преобразования речи в текст. Принимает на вход аудиофайл в формате wav и возвращает структурированные данные в формате JSON.
Термины и определения
Short Phrase Recognizer (SPR) — сервис распознавания речи.
Модель — предварительно обученная специализированная нейронная сеть для распознавания естественной речи в аудиозаписях.
Swagger UI — интерактивная веб-консоль с кратким описанием методов API и возможностью выполнять запросы к сервису SPR в реальном времени.
Описание методов API SPR
Запросы осуществляются по протоколу HTTP 1.1 на адрес сервера с доступным сервисом SPR. По умолчанию используется порт 6183/tcp.
Авторизация запросов не требуется. HTTP-запросы должны содержать заголовок "accept: application/json"
Ответ сервиса представляет собой JSON-документ в кодировке UTF-8 или двоичный файл. Содержимое документа зависит от результата выполнения запроса. При наличии ошибки в качестве ответа вернется переменная error=1 и описание в переменной message. Для удобства проверки методов по ссылке http://АДРЕС:6183 будет отображен интерфейс Swagger со всеми методами с возможностью их проверки.
| GET:/spr/models | Вывод списка моделей. | ||
|---|---|---|---|
| Без входных параметров. | { models: [model1,...,modelN] }
| ||
| GET:/spr/audio/{taskID} | Получение файла аудиозаписи отложенного задания. | ||
| taskID — идентификатор задания. | Файл аудиозаписи или { error: INT , message: DESCRIPTION }
| ||
| GET:/spr/export/{id} | Получение архива модели. | ||
| id — идентификатор модели. | ZIP-файл с моделью, либо { error: INT , message: DESCRIPTION }
| ||
| POST:/spr/import/{id} | Добавление модели. Может быть добавлена как из файла архива, так и переименованием существующей модели. | ||
| id — идентификатор модели, обязательный параметр.
zip-model — zip-архив с файлами модели. Или from-existing-model — название модели, которая должна перемещена на место id. |
{ error: INT, message: DESCRIPTION }
| ||
| DELETE:/spr/delete/{id} | Удаление модели. | ||
| id — идентификатор модели. | { error: INT, message: DESCRIPTION }
| ||
| GET:/spr/queue | Получение очереди отложенных заданий на распознавание. | ||
| Без входных параметров. | {
| ||
| DELETE:/spr/queue/{taskID} | Удаление отложенных заданий на распознавание. | ||
| taskID — идентификатор задания в очереди. | {
| ||
| POST:/spr/stt/{id} | Отправка файла на распознавание речи. Моно-файлы до 60 секунд распознаются без разбивки на фрагменты и определения спикеров. Многоканальные файлы и файлы длиннее 60 секунд предварительно разбиваются на фрагменты по отсутствию речи. Настройка данных параметров описана в руководстве администратора. | ||
|
В случае async=1 возвращается только taskID, результат по taskID смотреть в методе /spr/result.
Для коротких файлов:
Для транскрибации больших файлов:
| ||
| GET:/spr/result/{taskID} | Получение результата отложенного распознавания. | ||
| taskID — идентификатор задания. | Вывод по окончанию распознавания аналогичен выводу метода stt + добавлено поле status, которое содержит информацию о статусе отложенной задачи:ready — готово
waiting — ожидание not found — не найдена failed — сбой. | ||
| GET:/spr/waveform/{taskID} | Служебный метод для отображения аудио в графическом виде, содержит пики сигнала. | ||
| taskID — идентификатор задания. | {
| ||