SBS. Руководство пользователя: различия между версиями
Материал из Флора AI
VoroninE (обсуждение | вклад) (параметр мультиспикеров в sbs) |
|||
| (не показаны 32 промежуточные версии 3 участников) | |||
| Строка 5: | Строка 5: | ||
===== '''Термины и определения''' ===== | ===== '''Термины и определения''' ===== | ||
Simple Biometry Server (SBS) | Simple Biometry Server (SBS) — сервис извлечения метаданных. | ||
Swagger UI — интерактивная веб-консоль с кратким описанием методов API и возможностью выполнять запросы к сервису SBS. | |||
| Строка 15: | Строка 16: | ||
Авторизация запросов не требуется. HTTP-запросы должны содержать заголовок <code>"accept: application/json"</code> | Авторизация запросов не требуется. HTTP-запросы должны содержать заголовок <code>"accept: application/json"</code> | ||
Ответ сервиса представляет собой JSON-документ в кодировке UTF-8 или двоичный файл. Содержимое документа зависит от результата выполнения запроса. При наличии ошибки в качестве ответа вернется переменная error=1 и описание в переменной message. Для удобства проверки методов по ссылке <nowiki>http://АДРЕС:6185</nowiki> будет отображен интерфейс | Ответ сервиса представляет собой JSON-документ в кодировке UTF-8 или двоичный файл. Содержимое документа зависит от результата выполнения запроса. При наличии ошибки в качестве ответа вернется переменная error=1 и описание в переменной message. Для удобства проверки методов по ссылке <nowiki>http://АДРЕС:6185</nowiki> будет отображен интерфейс Swagger со всеми методами с возможностью их проверки. | ||
< | {| class="wikitable" style="width: 110%" | ||
|+''Описание методов API'' | |||
!style="color:green;width: 15%" |'''POST/sbs/analyze''' | |||
! colspan="3" style="width: 85%" |<small>Получение аналитических метаданных из голосового фрагмента. Вернется массив с метаданными голосового фрагмента.</small> | |||
|- | |||
| colspan="2" style="width: 50%" | | |||
* <small>'''wav''' — файл для анализа.</small> | |||
| colspan="2" style="width: 50%" |<small>Пример:</small> | |||
<code><small>{</small></code> | |||
< | <<age: { | ||
class: 20-29, # {"00-05", "06-12", "13-19", "20-29", "30-39", "40-49", "50-59", "60+"} | |||
confidence: 0.99 | |||
}, | |||
emotion: { | |||
class: SADNESS, # { "ANGER", "BORE", "DISAPPOINTMENT", "DISGUST", "EXCITEMENT", "FEAR", | |||
<<"NEUTRAL", "PAIN", "PLEASURE", "SADNESS", "SUPRISE"} | |||
confidence: 0.99 | |||
}, | |||
gender: { | |||
class: FEMALE, # { "MALE", "FEMALE" } | |||
confidence: 0.99 | |||
}, | |||
multispeaker : { | |||
class: YES, # { "YES", "NO" } | |||
confidence: 0.99 | |||
} | |||
<code><small>}</small></code> | |||
|- | |- | ||
| | ! style="color:green;width: 15%" |'''POST/sbs/noiselevel''' | ||
| | ! colspan="3" |<small>Возвращает процент зашумленности аудио</small> | ||
|- | |- | ||
| | | colspan="2" | | ||
| | *<small>'''wav''' — файл для анализа</small> | ||
| colspan="2" |<small>Пример ответа:</small> | |||
<small><code>{ error: 0, message: 'success', 'noise': 0.79 }</code></small> | |||
|- | |- | ||
| | ! style="color:green;width: 15%" |'''POST/sbs/search''' | ||
| | ! colspan="3" style="width: 85%" |<small>Поиск говорящего по базе слепков.</small> | ||
| | |- | ||
| | | colspan="2" style="width: 50%" | | ||
| | * <small>'''wav''' — файл для анализа</small> | ||
*<small>'''threshold''' — порог совпадения спикера, от 0 до 1</small> | |||
*<small>'''text''' — текст для сравнения с распознанным текстом из '''wav''', необязательный параметр. Если указан, то поиск не будет осуществлен, если распознанный текст будет сильно отличаться от '''text.'''</small> | |||
*'''<small>textSimilarity</small>''' - <small>порог похожести текста и распознанного аудио</small> | |||
| colspan="2" style="width: 50%" |<small>Пример ответа:</small> | |||
<small><code>{ error: 0, speaker: Ivan, confidence: 0.79 }</code></small> | |||
|- | |||
! style="color:green;width: 15%" |'''POST/sbs/verify/{id}''' | |||
| | ! colspan="3" style="width: 85%" |<small>Сравнение wav-файла cо слепком в базе. В ответе - вероятность совпадения от 0 до 1.</small> | ||
! | |||
|- | |- | ||
| | | colspan="2" style="width: 50%" | | ||
*<small>'''wav''' — файл для поиска</small> | |||
*<small>'''id''' — идентификатор говорящего</small> | |||
| | *<small>'''text''' — текст для сравнения с распознанным текстом из '''wav''', необязательный параметр. Если указан, но слепок не будет проверен, если распознанный текст будет сильно отличаться от '''text.'''</small> | ||
* '''wav''' | *'''<small>textSimilarity</small>''' - <small>порог похожести текста и распознанного аудио</small> | ||
| colspan="2" style="width: 50%" | <code><small>{ "error": 0, "confidence": 0.78 }</small></code> | |||
< | |||
< | |||
< | |||
< | |||
< | |||
|- | |- | ||
|/sbs/ | ! style="color:green;width: 15%" |'''POST/sbs/speakers/add''' | ||
! colspan="3" style="width: 85%" |<small>Добавление слепка в базу.</small> | |||
| | |||
|- | |- | ||
| | | colspan="2" style="width: 50%" | | ||
| | *<small>'''name''' — имя говорящего</small> | ||
*<small>'''wav''' — файл для создания оцифрованного представления говорящего</small> | |||
*<small>'''text''' — текст для сравнения с распознанным текстом из '''wav''', необязательный параметр. Если указан, но слепок не будет создан, если распознанный текст будет сильно отличаться от '''text.'''</small> | |||
* ''' | *'''<small>textSimilarity</small>''' - <small>порог похожести текста и распознанного аудио</small> | ||
* '''wav''' - | | colspan="2" style="width: 50%" |<small><code>{</code></small> | ||
|<code>{</code> | |||
<code>"error": 0,</code> | <small><code> "error": 0,</code></small> | ||
<code>" | <small><code> "id": "251f78d7-ee50-4ba1-a669-ee89fdaf5433"</code></small> | ||
<code>}</code> | <small><code>}</code></small> | ||
|- | |||
! style="color:red;width: 15%" |'''DELETE/sbs/speakers/delete/{id}''' | |||
! colspan="3" style="width: 85%" |<small>Удаление слепка из базы.</small> | |||
|- | |- | ||
| | | colspan="2" style="width: 50%" | | ||
*<small>'''id''' — идентификатор говорящего</small> | |||
| colspan="2" style="width: 50%" |<small><code>{ error: INT, message: DESCRIPTION }</code></small> | |||
| | |||
* ''' | |||
|{ | |||
} | |||
|- | |- | ||
|/sbs/speakers/ | ! style="color:blue;width: 15%" |'''GET/sbs/speakers/list''' | ||
! colspan="3" style="width: 85%" |<small>Получение списка всех слепков.</small> | |||
|< | |||
|- | |- | ||
|/ | | colspan="2" style="width: 50%" |<small>Входные параметры отсутствуют</small> | ||
| | | colspan="2" style="width: 50%" |<small><code>[</code></small> | ||
| | <small><code> {</code></small> | ||
<small><code> "id": "251f78d7-ee50-4ba1-a669-ee89fdaf5433",</code></small> | |||
" | <small><code> "name": "наименование слепка"</code></small> | ||
<small><code> }</code></small> | |||
<small><code>]</code></small> | |||
|- | |||
! style="color:green;width: 15%" |'''POST/sbs/speakers/modify/{id}''' | |||
! colspan="3" style="width: 85%" |<small>Дообучение слепка.</small> | |||
|- | |- | ||
| | | colspan="2" style="width: 50%" | | ||
*<small>'''wav''' — файл для обучения</small> | |||
| | |||
* '''wav''' | |||
"error": 0, | *<small>'''id''' '''—''' идентификатор слепка</small> | ||
*<small>'''text''' — текст для сравнения с распознанным текстом из '''wav''', необязательный параметр. Если указан, то слепок не будет дообучен, если распознанный текст будет сильно отличаться от '''text.'''</small> | |||
*'''<small>textSimilarity</small>''' - <small>порог похожести текста и распознанного аудио</small> | |||
| colspan="2" style="width: 50%" |<small><code>{</code></small> | |||
<small><code> "error": 0,</code></small> | |||
"message": "Success" | <small><code> "message": "Success"</code></small> | ||
} | <small><code>}</code></small> | ||
|} | |} | ||
Текущая версия от 11:46, 27 августа 2025
Общее описание
Сервис Simple Biometry Server предназначен для извлечения именованных сущностей из текстовых фрагментов (фраз естественной речи). Принимает на вход текстовую строку и возвращает структурированные данные в формате JSON.
Термины и определения
Simple Biometry Server (SBS) — сервис извлечения метаданных.
Swagger UI — интерактивная веб-консоль с кратким описанием методов API и возможностью выполнять запросы к сервису SBS.
Описание методов API сервиса биометрии (SBS)
Запросы осуществляются по протоколу HTTP 1.1 на адрес сервера с доступным сервисом SBS. По умолчанию используется порт 6185/tcp.
Авторизация запросов не требуется. HTTP-запросы должны содержать заголовок "accept: application/json"
Ответ сервиса представляет собой JSON-документ в кодировке UTF-8 или двоичный файл. Содержимое документа зависит от результата выполнения запроса. При наличии ошибки в качестве ответа вернется переменная error=1 и описание в переменной message. Для удобства проверки методов по ссылке http://АДРЕС:6185 будет отображен интерфейс Swagger со всеми методами с возможностью их проверки.
| POST/sbs/analyze | Получение аналитических метаданных из голосового фрагмента. Вернется массив с метаданными голосового фрагмента. | ||
|---|---|---|---|
|
Пример:
<<age: {
class: 20-29, # {"00-05", "06-12", "13-19", "20-29", "30-39", "40-49", "50-59", "60+"}
confidence: 0.99
},
emotion: {
class: SADNESS, # { "ANGER", "BORE", "DISAPPOINTMENT", "DISGUST", "EXCITEMENT", "FEAR",
<<"NEUTRAL", "PAIN", "PLEASURE", "SADNESS", "SUPRISE"}
confidence: 0.99
},
gender: {
class: FEMALE, # { "MALE", "FEMALE" }
confidence: 0.99
},
multispeaker : {
class: YES, # { "YES", "NO" }
confidence: 0.99 }
| ||
| POST/sbs/noiselevel | Возвращает процент зашумленности аудио | ||
|
Пример ответа:
| ||
| POST/sbs/search | Поиск говорящего по базе слепков. | ||
|
Пример ответа:
| ||
| POST/sbs/verify/{id} | Сравнение wav-файла cо слепком в базе. В ответе - вероятность совпадения от 0 до 1. | ||
|
{ "error": 0, "confidence": 0.78 }
| ||
| POST/sbs/speakers/add | Добавление слепка в базу. | ||
|
{
| ||
| DELETE/sbs/speakers/delete/{id} | Удаление слепка из базы. | ||
|
{ error: INT, message: DESCRIPTION }
| ||
| GET/sbs/speakers/list | Получение списка всех слепков. | ||
| Входные параметры отсутствуют | [
| ||
| POST/sbs/speakers/modify/{id} | Дообучение слепка. | ||
|
{
| ||