SBS. Руководство пользователя: различия между версиями
Материал из Флора AI
KorolkovS (обсуждение | вклад) Нет описания правки |
VoroninE (обсуждение | вклад) Нет описания правки |
||
| (не показано 5 промежуточных версий 3 участников) | |||
| Строка 25: | Строка 25: | ||
|- | |- | ||
| colspan="2" style="width: 50%" | | | colspan="2" style="width: 50%" | | ||
* <small>'''wav''' — файл для анализа.</small> | * <small>'''wav''' — файл для анализа.</small> | ||
| colspan="2" style="width: 50%" |< | | colspan="2" style="width: 50%" |Пример: | ||
<code>{</code> | |||
<code>age: {</code> | |||
<code>class: 20-29, # {"00-05", "06-12", "13-19", "20-29", "30-39", "40-49", "50-59", "60+"}</code> | |||
<code>confidence: 0.99</code> | |||
<code>},</code> | |||
<code>emotion: {</code> | |||
<code>class: SADNESS, # { "ANGER", "BORE", "DISAPPOINTMENT", "DISGUST", "EXCITEMENT", "FEAR",</code> | |||
<code><<"NEUTRAL", "PAIN", "PLEASURE", "SADNESS", "SUPRISE"}</code> | |||
<code>confidence: 0.99</code> | |||
<code>},</code> | |||
<code>gender: {</code> | |||
<code>class: FEMALE, # { "MALE", "FEMALE" }</code> | |||
<code>confidence: 0.99</code> | |||
<code>},</code> | |||
<code>multispeaker: {</code> | |||
<code>class: YES, # { "YES", "NO" }</code> | |||
<code>confidence: 0.99</code> | |||
<code>},</code> | |||
<code>synth: {</code> | |||
<code>class: YES, # { "NO", "YES" }</code> | |||
<code>confidence: 0.73</code> | |||
<code>},</code> | |||
|- | |- | ||
! style="color:green;width: 15%" |'''POST/sbs/noiselevel''' | ! style="color:green;width: 15%" |'''POST/sbs/noiselevel''' | ||
! colspan="3" |<small>Возвращает процент зашумленности аудио</small> | ! colspan="3" |<small>Возвращает процент зашумленности аудио</small> | ||
|- | |- | ||
| colspan="2" | | | colspan="2" | | ||
*<small>'''wav''' — файл для анализа</small> | *<small>'''wav''' — файл для анализа</small> | ||
| colspan="2" |<small>Пример ответа:</small> | | colspan="2" |<small>Пример ответа:</small> | ||
| Строка 61: | Строка 84: | ||
|- | |- | ||
| colspan="2" style="width: 50%" | | | colspan="2" style="width: 50%" | | ||
* <small>'''wav''' — файл для анализа</small> | *<small>'''wav''' — файл для анализа</small> | ||
*<small>'''threshold''' — порог совпадения спикера, от 0 до 1</small> | *<small>'''threshold''' — порог совпадения спикера, от 0 до 1</small> | ||
*<small>'''text''' — текст для сравнения с распознанным текстом из '''wav''', необязательный параметр. Если указан, то поиск не будет осуществлен, если распознанный текст будет сильно отличаться от '''text.'''</small> | *<small>'''text''' — текст для сравнения с распознанным текстом из '''wav''', необязательный параметр. Если указан, то поиск не будет осуществлен, если распознанный текст будет сильно отличаться от '''text.'''</small> | ||
*'''<small>textSimilarity</small>''' - <small>порог похожести текста и распознанного аудио</small> | *'''<small>textSimilarity</small>''' - <small>порог похожести текста и распознанного аудио</small> | ||
*<small>'''dataset''' - набор данных</small> | |||
| colspan="2" style="width: 50%" |<small>Пример ответа:</small> | | colspan="2" style="width: 50%" |<small>Пример ответа:</small> | ||
| Строка 77: | Строка 101: | ||
*<small>'''text''' — текст для сравнения с распознанным текстом из '''wav''', необязательный параметр. Если указан, но слепок не будет проверен, если распознанный текст будет сильно отличаться от '''text.'''</small> | *<small>'''text''' — текст для сравнения с распознанным текстом из '''wav''', необязательный параметр. Если указан, но слепок не будет проверен, если распознанный текст будет сильно отличаться от '''text.'''</small> | ||
*'''<small>textSimilarity</small>''' - <small>порог похожести текста и распознанного аудио</small> | *'''<small>textSimilarity</small>''' - <small>порог похожести текста и распознанного аудио</small> | ||
| colspan="2" style="width: 50%" | <code><small>{ "error": 0, "confidence": 0.78 }</small></code> | *<small>'''dataset''' - набор данных</small> | ||
| colspan="2" style="width: 50%" |<code><small>{ "error": 0, "confidence": 0.78 }</small></code> | |||
|- | |- | ||
! style="color:green;width: 15%" |'''POST/sbs/speakers/add''' | ! style="color:green;width: 15%" |'''POST/sbs/speakers/add''' | ||
| Строка 87: | Строка 112: | ||
*<small>'''text''' — текст для сравнения с распознанным текстом из '''wav''', необязательный параметр. Если указан, но слепок не будет создан, если распознанный текст будет сильно отличаться от '''text.'''</small> | *<small>'''text''' — текст для сравнения с распознанным текстом из '''wav''', необязательный параметр. Если указан, но слепок не будет создан, если распознанный текст будет сильно отличаться от '''text.'''</small> | ||
*'''<small>textSimilarity</small>''' - <small>порог похожести текста и распознанного аудио</small> | *'''<small>textSimilarity</small>''' - <small>порог похожести текста и распознанного аудио</small> | ||
*<small>'''dataset''' - набор данных</small> | |||
| colspan="2" style="width: 50%" |<small><code>{</code></small> | | colspan="2" style="width: 50%" |<small><code>{</code></small> | ||
| Строка 98: | Строка 124: | ||
! colspan="3" style="width: 85%" |<small>Удаление слепка из базы.</small> | ! colspan="3" style="width: 85%" |<small>Удаление слепка из базы.</small> | ||
|- | |- | ||
| colspan="2" style="width: 50%" | | | colspan="2" style="width: 50%" | | ||
*<small>'''id''' — идентификатор говорящего</small> | *<small>'''id''' — идентификатор говорящего</small> | ||
| colspan="2" style="width: 50%" |<small><code>{ error: INT, message: DESCRIPTION }</code></small> | | colspan="2" style="width: 50%" |<small><code>{ error: INT, message: DESCRIPTION }</code></small> | ||
| Строка 105: | Строка 131: | ||
! colspan="3" style="width: 85%" |<small>Получение списка всех слепков.</small> | ! colspan="3" style="width: 85%" |<small>Получение списка всех слепков.</small> | ||
|- | |- | ||
| colspan="2" style="width: 50%" |<small> | | colspan="2" style="width: 50%" |'''<small>dataset</small>''' <small>- набор данных</small> | ||
| colspan="2" style="width: 50%" |<small><code>[</code></small> | | colspan="2" style="width: 50%" |<small><code>[</code></small> | ||
<small><code> {</code></small> | <small><code> {</code></small> | ||
| Строка 126: | Строка 152: | ||
*<small>'''text''' — текст для сравнения с распознанным текстом из '''wav''', необязательный параметр. Если указан, то слепок не будет дообучен, если распознанный текст будет сильно отличаться от '''text.'''</small> | *<small>'''text''' — текст для сравнения с распознанным текстом из '''wav''', необязательный параметр. Если указан, то слепок не будет дообучен, если распознанный текст будет сильно отличаться от '''text.'''</small> | ||
*'''<small>textSimilarity</small>''' - <small>порог похожести текста и распознанного аудио</small> | *'''<small>textSimilarity</small>''' - <small>порог похожести текста и распознанного аудио</small> | ||
*<small>'''dataset''' - набор данных</small> | |||
| colspan="2" style="width: 50%" |<small><code>{</code></small> | | colspan="2" style="width: 50%" |<small><code>{</code></small> | ||
<small><code> "error": 0,</code></small> | <small><code> "error": 0,</code></small> | ||
Текущая версия от 15:11, 14 января 2026
Общее описание
Сервис Simple Biometry Server предназначен для извлечения именованных сущностей из текстовых фрагментов (фраз естественной речи). Принимает на вход текстовую строку и возвращает структурированные данные в формате JSON.
Термины и определения
Simple Biometry Server (SBS) — сервис извлечения метаданных.
Swagger UI — интерактивная веб-консоль с кратким описанием методов API и возможностью выполнять запросы к сервису SBS.
Описание методов API сервиса биометрии (SBS)
Запросы осуществляются по протоколу HTTP 1.1 на адрес сервера с доступным сервисом SBS. По умолчанию используется порт 6185/tcp.
Авторизация запросов не требуется. HTTP-запросы должны содержать заголовок "accept: application/json"
Ответ сервиса представляет собой JSON-документ в кодировке UTF-8 или двоичный файл. Содержимое документа зависит от результата выполнения запроса. При наличии ошибки в качестве ответа вернется переменная error=1 и описание в переменной message. Для удобства проверки методов по ссылке http://АДРЕС:6185 будет отображен интерфейс Swagger со всеми методами с возможностью их проверки.
| POST/sbs/analyze | Получение аналитических метаданных из голосового фрагмента. Вернется массив с метаданными голосового фрагмента. | ||
|---|---|---|---|
|
Пример:
| ||
| POST/sbs/noiselevel | Возвращает процент зашумленности аудио | ||
|
Пример ответа:
| ||
| POST/sbs/search | Поиск говорящего по базе слепков. | ||
|
Пример ответа:
| ||
| POST/sbs/verify/{id} | Сравнение wav-файла cо слепком в базе. В ответе - вероятность совпадения от 0 до 1. | ||
|
{ "error": 0, "confidence": 0.78 }
| ||
| POST/sbs/speakers/add | Добавление слепка в базу. | ||
|
{
| ||
| DELETE/sbs/speakers/delete/{id} | Удаление слепка из базы. | ||
|
{ error: INT, message: DESCRIPTION }
| ||
| GET/sbs/speakers/list | Получение списка всех слепков. | ||
| dataset - набор данных | [
| ||
| POST/sbs/speakers/modify/{id} | Дообучение слепка. | ||
|
{
| ||