Действия

SPR. UPS руководство по работе с интерфейсом: различия между версиями

Материал из Флора AI

(*/ SPR Распознавание */)
(*/ SPR Распознавание */)
Строка 1: Строка 1:


=='''SPR Распознавание'''==
=='''SPR Распознавание'''==


Перейти в блок '''«Распознавание»''' можно кликнув по соответствующей кнопке на главном экране UPS (Universal Proxy Server) (см.рисунок 1).[[Файл:Spr главный экран.png|центр|мини|408x408пкс|Рисунок 1 - Главный экран UPS.]]
Перейти в блок '''«Распознавание»''' можно кликнув по соответствующей кнопке на главном экране UPS (Universal Proxy Server) (см.рисунок 1).[[Файл:Spr главный экран.png|центр|мини|408x408пкс|Рисунок 1 - Главный экран UPS.]]

Версия от 18:23, 7 мая 2024

SPR Распознавание

Перейти в блок «Распознавание» можно кликнув по соответствующей кнопке на главном экране UPS (Universal Proxy Server) (см.рисунок 1).

Рисунок 1 - Главный экран UPS.

Описание интерфейса блока SPR «Распознавание»

Интерфейс включает в себя панель с выпадающим списком моделей распознавания (SPR) в левой части экрана (блок с оглавлением «Модель»), отсортированными в алфавитном порядке, панель управления (см. раздел «Панель управления»), информационные блоки о модели, функциональный блок для загрузки звуковых файлов. Также есть возможность добавить новую модель распознавания (SPR) с помощью кнопки, расположенной слева внизу рабочей области. Ниже есть переключатели вкладок «Модели», «Очередь» и «Сохранено». Так же есть информационная вкладка - Серверы, которая отображает информацию о серверах и процессах - находится в правом нижнем углу рабочей области (рисунок 2).

Рисунок 2 - Интерфейс рабочей области блока «Распознавание».

Вкладка «Модели» SPR

Рисунок 3 - Информация о модели.

Блок интерфейса, находящийся под списком моделей, предоставляет подробную информацию о моделях распознавания — об их статусе и времени последнего изменения, и функционал для загрузки звукового фрагмента в формате WAV. (см. рисунок 3).

Подробная информация о модели «Распознавания» SPR:

  • название модели (big и call),
  • статус модели.

На панели слева, под блоком с информацией о модели, есть два флажка: «определение говорящих» и «выполнить пунктуацию». Если выбрана модель big, то галочка «выполнить пунктуацию» не влияет на расстановку знаков препинания. Если же используется модель call, то эта галочка может повлиять на пунктуацию. «Определение говорящих» не влияет на пунктуацию, так как это взаимодействие с сервисом биометрии SBS. Ниже под флажками располагаются: раскрывающийся список «Тип VAD» (тип модели для разбивки аудиофайлов: webrtc и neuro) и кнопка «Указать другую модель». При нажатии на кнопку появляется раскрывающийся список, в котором можно выбрать встроенную модель из списка (big или call), она становится приоритетной.

Под информационным блоком располагается функционал для загрузки звуковых фрагментов. Нажимая на кнопку Wav-файл.png «wav-файл» можно выбрать файл звуковой дорожки. Либо можно сделать запись нажав и удерживая кнопку с микрофоном (только для модели call). Для работы данной кнопки требуется доступ к UPS по https. Настроить его можно проксированием через любой веб-сервер (nginx или apache). Кнопка «Распознать» отправляет звуковой файл на распознавание, при успешной отправке в правом нижнем углу появится сообщение о том, что файл добавлен в очередь на распознавание. После этого результат распознавания можно будет увидеть перейдя на вкладку «Очередь» (см. раздел Вкладка «Очередь» ).


На панели инструментов слева расположены иконки версий модели, с помощью которых можно переключаться между ними. Описание этих иконок представлено в таблице 1.

Таблица 1 - Версии модели
Иконка версии Наименование версии модели Описание
Черновик.png
Черновик это не примененная модель. Можно устанавливать и применять. Можно экспортировать и импортировать. Цвет акцента версии модели - серый. После применения (установки) модель (см. табл.2 «Установка») становится «Рабочей версией».
Рабочая нов.png
Рабочая это модель, которая уже используется в прод (англ. production – производство). Применённую модель нельзя установить заново. Можно экспортировать модель. Цвет акцента версии модели - зелёный. По нажатию кнопки «Архив»- «Рабочая» модель переходит в архивную версию.
Архив нов.png
Архивная это рабочая модель, которая переводится в архив (резервную копию) после применения черновика. Можно вернуть архивную модель в рабочую версию, нажав на кнопку «Откат». При этом рабочая версия также становится архивной, то есть рабочая и архивная версии меняются местами. Цвет акцента версии модели - синий.

Модель Распознавания SPR имеет свойство «Статус», которые принимает следующие значения:

  • Пустая. Новая созданная модель. Модель «Распознавания» можно импортировать из файла в формате zip, для этого необходимо нажать кнопку «Импорт» на панели управления (см. табл. 2)
  • Обучена.
  • Установлена. В этот статус модель переходит при нажатии кнопки «Установка». В этом статусе возможны Импорт, Экспорт, Применение модели – по соответствующим кнопкам на панели управления.
  • Применена. В статус Применена модель переходит при нажатии кнопки «Применение». Для модели в статусе Применена экспорт (выгрузка) по кнопке «Экспорт» (см. табл. 2).
  • Ошибка. Информирует о сбое процессов.
Панель управления вкладки «Модели» SPR

Панель управления находится в правом верхнем углу экрана и содержит 6 кнопок: экспорт, импорт, установка и применение, откат, переход на главный экран и пользовательское меню. Подробное описание каждой функции можно найти в таблице 2.

Таблица 2 – Описание функционала панели управления
Иконка кнопки Наименование кнопки Описание
Экспорт нов.png
Экспорт позволяет экспортировать модель.
Импорт нов.png
Импорт позволяет импортировать (добавить) модель.
Установка.png
Установка переводит модель в статус установлена. После чего кнопка меняется на кнопку «Применение»Primenenie.png. Пока модель не применена (не используется), можно ее экспортировать или импортировать.
Откат.png
Откат позволяет перевести архивную версию модели обратно в рабочую.
Меню пользователя.png
Меню пользователя отображает меню пользователя (имя, смена пароля, переход на главную страницу, выход из системы и убрать фон)

Вкладка «Очередь» SPR

Рабочая область вкладки «Очередь» содержит список всех распознанных аудиодорожек: сам аудиофайл и его текст, панель управления (см. раздел. Панель управления вкладки «Очередь» SPR). Выше каждой аудиодорожки отображается информация о модели, времени добавления файла и времени окончания обработки (рисунок 4).

Рисунок 4 - Интерфейс вкладки «Очередь».
Рисунок 5 - Прослушивание отдельных слов и фрагментов стенограммы.

Чтобы прослушать аудиодорожку, вы можете нажать на кнопку «Play». Если вы хотите начать прослушивание с определенного слова, просто щелкните по нему левой кнопкой мыши и нажмите на кнопку воспроизведения (рисунок 5).

Аудиодорожку также можно сохранить, нажав на иконку «Скачать», которая находится справа от аудио. В текст можно вносить изменения вручную, корректируя ошибки распознавания и пунктуации. Однако, если вносите новые слова, которых нет в тексте, у них не будет таймлайна и они будут подсвечены при проигрывании как одно слово.

Панель управления вкладки «Очередь» SPR
Таблица 3 - Описание функционала панели управления
Иконка кнопки Наименование кнопки Описание
Подсветка достоверности (1).png Включить подсветку достоверности подсвечивает красным слова, где модель сомневается в правильности распознавания, где уровень достоверности от 0 до 0.4 подсвечивает красным, от 0.4 до 0.7 - розовым.
Сохранить doc (1).png Экспортировать как документ Microsoft Word позволяет сохранить текст распознавания в виде документа.
Добавить стенограмму (1).png Создать стенограмму создает стенограмму из данных распознавания из очереди. При нажатии на эту кнопку создается стенограмма, доступная для редактирования во вкладке «Сохранено».
Удаление документа.png Удалить задачу Позволяет удалить задачу распознавания. В диалоговом окне подтверждения действия, после чего появляется сообщение о статусе удаления в правом нижнем углу. Нельзя создать стенограмму, кнопка не активна, если спикер всего один.
Меню пользователя.png Меню пользователя отображает меню пользователя (имя, смена пароля, переход на главную страницу, выход из системы и убрать фон)

Вкладка «Сохранено» SPR

Во вкладке «Сохранено» находятся все созданные стенограммы из очереди на распознавание, аудиофайл, панель управления (см. раздел. Панель управления вкладки «Сохранено» SPR), область редактирования стенограммы, блок с информацией о модели и список спикеров (рисунок 6).

Рисунок 6 - Интерфейс вкладки «Сохранено».
Рисунок 7 – Функционал работы со стенограммой.

Если необходимо, можно переименовать спикера, нажав на иконку карандаша справа от имени. Затем нужно внести изменения и подтвердить действие, нажав на зеленую галочку. Над каждой репликой указано имя спикера. Чтобы выбрать имя из списка или ввести новое, нужно кликнуть левой кнопкой мыши по имени. После этого можно нажать «Добавить нового спикера», его имя появится в списке спикеров.

Чтобы удалить лишнее слово, разделить реплику на двух разных спикеров, или наоборот, объединить реплики одного спикера, нужно кликнуть правой кнопкой мыши на нужной реплике и в диалоговом окне выбрать необходимое действие (рисунок 7).

Панель управления вкладки «Сохранено» SPR
Таблица 4 - Функционал панели управления вкладки «Сохранено»
Иконка кнопки Наименование кнопки Описание
Подсветка достоверности (1).png Включить подсветку достоверности подсвечивает красным слова, где модель сомневается в правильности распознавания, где уровень достоверности от 0 до 0.4 подсвечивает красным, от 0.4 до 0.7 - розовым.
Сохранить doc (1).png Экспортировать как документ Microsoft Word позволяет сохранить текст распознавания в виде документа.
Сохранить.png Сохранить изменения позволяет сохранить внесенные правки в стенограмму.
Удаление документа.png Удалить задачу Позволяет удалить задачу распознавания. В диалоговом окне подтверждения действия, после чего появляется сообщение о статусе удаления в правом нижнем углу.
Меню пользователя.png Меню пользователя отображает меню пользователя (имя, смена пароля, переход на главную страницу, выход из системы и убрать фон)