Действия

SPR. UPS руководство по работе с интерфейсом: различия между версиями

Материал из Флора AI

Строка 1: Строка 1:


=='''SPR Распознавание'''==
=='''SPR Распознавание'''==
[[Файл:SPR.png|мини|''<small>Рис. 1 Главный экран UPS</small>'']]


В главном меню UPS (Universal Proxy Server) расположены кнопки для перехода в блоки (см. рисунок 1):
В главном меню UPS (Universal Proxy Server) расположены кнопки для перехода в блоки (см. рисунок 1):
Строка 17: Строка 19:
# Воспользоваться кнопкой на панели управления «На главную» [[Файл:Меню пользователя new.png|безрамки|41x41пкс]]  .
# Воспользоваться кнопкой на панели управления «На главную» [[Файл:Меню пользователя new.png|безрамки|41x41пкс]]  .
# Воспользоваться кнопкой в виде линии , которая находится снизу в центе экрана (см. рисунок 2).
# Воспользоваться кнопкой в виде линии , которая находится снизу в центе экрана (см. рисунок 2).
 
Перейти в блок '''«Распознавание»''' можно кликнув по соответствующей кнопке на главном экране UPS (см.рисунок 1).[[Файл:Spr workscreen new.png|мини|''<small>Рис. 2 Интерфейс рабочей области блока «Распознавание»</small>'']]
 
 
Перейти в блок '''«Распознавание»''' можно кликнув по соответствующей кнопке на главном экране UPS (см.рисунок 1).
 
[[Файл:SPR.png|центр|мини|407x407пкс|Рисунок 1 - Главный экран UPS.]]


===Описание интерфейса блока SPR «Распознавание»===
===Описание интерфейса блока SPR «Распознавание»===
Интерфейс включает в себя панель с выпадающим '''списком моделей''' распознавания (SPR) в левой части экрана (блок с оглавлением «Модель»), отсортированными в алфавитном порядке, панель управления, информационные блоки о модели, функциональный блок для загрузки звуковых файлов. Также есть возможность ''добавить новую модель'' распознавания (SPR) с помощью кнопки, расположенной слева внизу рабочей области. Ниже есть переключатели вкладок '''«Модели»''', '''«Очередь»''' и '''«Сохранено»'''. Так же есть информационная вкладка - '''Серверы''', которая  отображает информацию о серверах и процессах - находится в правом нижнем углу рабочей области (рисунок 2).
Интерфейс включает в себя панель с выпадающим '''списком моделей''' распознавания (SPR) в левой части экрана (блок с оглавлением «Модель»), отсортированными в алфавитном порядке, панель управления, информационные блоки о модели, функциональный блок для загрузки звуковых файлов. Также есть возможность ''добавить новую модель'' распознавания (SPR) с помощью кнопки, расположенной слева внизу рабочей области. Ниже есть переключатели вкладок '''«Модели»''', '''«Очередь»''' и '''«Сохранено»'''. Так же есть информационная вкладка - '''Серверы''', которая  отображает информацию о серверах и процессах - находится в правом нижнем углу рабочей области (рисунок 2).
[[Файл:Spr workscreen new.png|центр|мини|422x422пкс|Рисунок 2 - Интерфейс рабочей области блока «Распознавание».]]
[[Файл:Ф-ии spr.png|мини|443x443пкс|''<small>Рис.3 Информация о модели</small>'']]


====Вкладка «Модели» SPR====
====Вкладка «Модели» SPR====
[[Файл:2024-10-16 17-10-39.png|мини|487x487пкс|Рисунок 3 - Информация о модели.]]
Блок интерфейса, находящийся под списком моделей, предоставляет подробную информацию о моделях распознавания — об их статусе и времени последнего изменения, и функционал для загрузки звукового фрагмента в формате WAV. (см. рисунок 3).
Блок интерфейса, находящийся под списком моделей, предоставляет подробную информацию о моделях распознавания — об их статусе и времени последнего изменения, и функционал для загрузки звукового фрагмента в формате WAV. (см. рисунок 3).


Строка 49: Строка 45:
Ниже под флажками располагаются: раскрывающийся список '''«Тип VAD»''' (тип модели для разбивки аудиофайлов: webrtc и neuro) и кнопка '''«Указать другую модель»'''. При нажатии на кнопку появляется раскрывающийся список, в котором можно выбрать встроенную модель из списка (big или call), она становится приоритетной.
Ниже под флажками располагаются: раскрывающийся список '''«Тип VAD»''' (тип модели для разбивки аудиофайлов: webrtc и neuro) и кнопка '''«Указать другую модель»'''. При нажатии на кнопку появляется раскрывающийся список, в котором можно выбрать встроенную модель из списка (big или call), она становится приоритетной.


Под информационным блоком располагается функционал для загрузки звуковых фрагментов. Нажимая на кнопку [[Файл:Wav-файл.png|безрамки|38x38пкс]] «'''wav-файл»''' можно выбрать файл звуковой дорожки. Либо можно сделать запись нажав и удерживая кнопку с микрофоном [[Файл:Микрофон 1.png|безрамки|41x41пкс]] (только для модели call). Для работы данной кнопки требуется доступ к UPS по https. Настроить его можно проксированием через любой веб-сервер (nginx или apache). Кнопка '''«Распознать»''' отправляет звуковой файл на распознавание, при успешной отправке в правом нижнем углу появится сообщение о том, что файл добавлен в очередь на распознавание. После этого результат распознавания можно будет увидеть перейдя на вкладку '''«Очередь»''' (см. раздел ''[[SPR. UPS руководство по работе с интерфейсом#Вкладка «Очередь» SPR|Вкладка «Очередь»]]'' ).
Под информационным блоком располагается функционал для загрузки звуковых фрагментов. Нажимая на кнопку [[Файл:Wav-файл.png|безрамки|29x29px]] «'''wav-файл»''' можно выбрать файл звуковой дорожки. Либо можно сделать запись нажав и удерживая кнопку с микрофоном [[Файл:Микрофон 1.png|безрамки|31x31px]] (только для модели call). Для работы данной кнопки требуется доступ к UPS по https. Настроить его можно проксированием через любой веб-сервер (nginx или apache). Кнопка '''«Распознать»''' отправляет звуковой файл на распознавание, при успешной отправке в правом нижнем углу появится сообщение о том, что файл добавлен в очередь на распознавание. После этого результат распознавания можно будет увидеть перейдя на вкладку '''«Очередь»''' (см. раздел ''[[SPR. UPS руководство по работе с интерфейсом#Вкладка «Очередь» SPR|Вкладка «Очередь»]]'' ).




Строка 55: Строка 51:


{| class="wikitable"
{| class="wikitable"
|+Таблица 1 - Версии модели
|+''<small>Табл.1 Версии модели</small>''
!'''Иконка версии'''
!'''Иконка версии'''
!'''Наименование  версии модели'''
!'''Наименование  версии модели'''
!'''Описание'''
!'''Описание'''
|-
|-
|[[Файл:Черновик.png|слева|безрамки|58x58пкс]]
|[[Файл:Черновик.png|безрамки|40x40px|центр]]
|Черновик
|Черновик
|это не примененная модель. Можно устанавливать  и применять. Можно экспортировать и импортировать. Цвет акцента версии модели  - серый. После применения (установки) модель (см. [[SPR. UPS руководство по работе с интерфейсом|табл.2]] «Установка»)  становится «Рабочей версией».
|это не примененная модель. Можно устанавливать  и применять. Можно экспортировать и импортировать. Цвет акцента версии модели  - серый. После применения (установки) модель (см. [[SPR. UPS руководство по работе с интерфейсом|табл.2]] «Установка»)  становится «Рабочей версией».
|-
|-
|[[Файл:Рабочая нов.png|слева|безрамки|59x59пкс]]
|[[Файл:Рабочая нов.png|безрамки|40x40px|центр]]
|Рабочая
|Рабочая
|это модель, которая уже используется в прод (англ. ''production –'' производство'')''. Применённую модель нельзя установить заново. Можно экспортировать модель. Цвет акцента версии модели - зелёный. По нажатию кнопки «Архив»- «Рабочая»  модель переходит в архивную версию.
|это модель, которая уже используется в прод (англ. ''production –'' производство'')''. Применённую модель нельзя установить заново. Можно экспортировать модель. Цвет акцента версии модели - зелёный. По нажатию кнопки «Архив»- «Рабочая»  модель переходит в архивную версию.
|-
|-
|[[Файл:Архив нов.png|слева|безрамки|58x58пкс]]
|[[Файл:Архив нов.png|безрамки|40x40px|центр]]
|Архивная
|Архивная
|это рабочая модель, которая переводится в архив (резервную копию) после  применения черновика. Можно вернуть архивную модель в рабочую версию, нажав  на кнопку «Откат». При этом рабочая версия также становится архивной, то есть  рабочая и архивная версии меняются местами. Цвет акцента версии модели - синий.
|это рабочая модель, которая переводится в архив (резервную копию) после  применения черновика. Можно вернуть архивную модель в рабочую версию, нажав  на кнопку «Откат». При этом рабочая версия также становится архивной, то есть  рабочая и архивная версии меняются местами. Цвет акцента версии модели - синий.
Строка 83: Строка 79:


{| class="wikitable"
{| class="wikitable"
|+Таблица 2 Описание функционала панели управления
|+<small>''Табл. 2 Описание функционала панели управления''</small>
!'''Иконка кнопки'''
!'''Иконка кнопки'''
!'''Наименование кнопки'''
!'''Наименование кнопки'''
!'''Описание'''
!'''Описание'''
|-
|-
|[[Файл:Экспорт нов.png|слева|безрамки|62x62пкс]]
|[[Файл:Экспорт нов.png|безрамки|40x40px|центр]]
|Экспорт
|Экспорт
|позволяет экспортировать модель.
|позволяет экспортировать модель.
|-
|-
|[[Файл:Импорт нов.png|слева|безрамки|60x60пкс]]
|[[Файл:Импорт нов.png|безрамки|40x40px|центр]]
|Импорт
|Импорт
|позволяет импортировать (добавить) модель.
|позволяет импортировать (добавить) модель.
|-
|-
|[[Файл:Установка.png|слева|безрамки|59x59пкс]]
|[[Файл:Установка.png|безрамки|40x40px|центр]]
|Установка
|Установка
|переводит модель в статус ''установлена.'' После чего кнопка  меняется на кнопку «Применение»[[Файл:Primenenie.png|безрамки|34x34пкс]]. Пока модель не применена (не используется),  можно ее ''экспортировать'' или ''импортировать''.
|переводит модель в статус ''установлена.'' После чего кнопка  меняется на кнопку «Применение»[[Файл:Primenenie.png|безрамки|34x34пкс]]. Пока модель не применена (не используется),  можно ее ''экспортировать'' или ''импортировать''.
|-
|-
|[[Файл:Откат.png|слева|безрамки|58x58пкс]]
|[[Файл:Откат.png|безрамки|40x40px|центр]]
|Откат
|Откат
|позволяет перевести ''архивную'' версию модели  обратно в ''рабочую''.
|позволяет перевести ''архивную'' версию модели  обратно в ''рабочую''.
|-
|-
|[[Файл:Меню пользователя.png|слева|безрамки|58x58пкс]]
|[[Файл:Меню пользователя.png|безрамки|41x41px|центр]]
|Меню пользователя
|Меню пользователя
|отображает меню пользователя (имя, смена пароля, переход на главную страницу, выход из системы и убрать фон)
|отображает меню пользователя (имя, смена пароля, переход на главную страницу, выход из системы и убрать фон)
Строка 110: Строка 106:




[[Файл:Инт очередь SPR.png|мини|''<small>Рис. 4 Интерфейс вкладки «Очередь»</small>'']]
====Вкладка «Очередь» SPR====
====Вкладка «Очередь» SPR====
Рабочая область вкладки '''«Очередь»''' содержит список всех распознанных аудиодорожек: сам аудиофайл и его текст, панель управления (см. раздел. ''[[SPR. UPS руководство по работе с интерфейсом|Панель управления вкладки «Очередь»]] SPR''). Выше каждой аудиодорожки отображается информация о модели, времени добавления файла и времени окончания обработки (рисунок 4).
Рабочая область вкладки '''«Очередь»''' содержит список всех распознанных аудиодорожек: сам аудиофайл и его текст, панель управления (см. раздел. ''[[SPR. UPS руководство по работе с интерфейсом|Панель управления вкладки «Очередь»]] SPR''). Выше каждой аудиодорожки отображается информация о модели, времени добавления файла и времени окончания обработки (рисунок 4).
[[Файл:Инт очередь SPR.png|центр|мини|495x495пкс|Рисунок 4 - Интерфейс вкладки «Очередь».]]Чтобы прослушать аудиодорожку, вы можете нажать на кнопку '''«Play»'''. Если вы хотите начать прослушивание с определенного слова, просто щелкните по нему ''левой кнопкой мыши'' и нажмите на кнопку воспроизведения (рисунок 5).


Вы можете ускорить или слегка замедлить воспроизведение аудио. Для этого справа от аудиодорожки есть переключатель скорости  [[Файл:Переключатель скорости воспроизведения.png|безрамки|52x52пкс]]. По умолчанию он установлен на ''1x'', что соответствует оригинальной скорости.
Чтобы прослушать аудиодорожку, вы можете нажать на кнопку '''«Play»'''. Если вы хотите начать прослушивание с определенного слова, просто щелкните по нему ''левой кнопкой мыши'' и нажмите на кнопку воспроизведения (рисунок 5).[[Файл:Очередь прослушивание.png|мини|''<small>Рис.5 Прослушивание отдельных слов и фрагментов стенограммы</small>'']]Вы можете ускорить или слегка замедлить воспроизведение аудио. Для этого справа от аудиодорожки есть переключатель скорости  [[Файл:Переключатель скорости воспроизведения.png|безрамки|52x52пкс]]. По умолчанию он установлен на ''1x'', что соответствует оригинальной скорости.


Аудиодорожку также можно сохранить, нажав на иконку '''«Скачать»''' [[Файл:Кнопка скачать.png|безрамки|30x30пкс]] , которая находится справа от аудио. В текст можно вносить изменения вручную, корректируя ошибки распознавания и пунктуации. Однако, если вносите новые слова, которых нет в тексте, у них не будет таймлайна и они будут подсвечены при проигрывании как одно слово.[[Файл:Очередь прослушивание.png|мини|428x428пкс|Рисунок 5 - Прослушивание отдельных слов и фрагментов стенограммы.|центр]]
Аудиодорожку также можно сохранить, нажав на иконку '''«Скачать»''' [[Файл:Кнопка скачать.png|безрамки|30x30пкс]] , которая находится справа от аудио. В текст можно вносить изменения вручную, корректируя ошибки распознавания и пунктуации. Однако, если вносите новые слова, которых нет в тексте, у них не будет таймлайна и они будут подсвечены при проигрывании как одно слово.
=====Панель управления вкладки «Очередь» SPR=====
=====Панель управления вкладки «Очередь» SPR=====
{| class="wikitable"
{| class="wikitable"
|+Таблица 3 - Описание функционала панели управления
|+''<small>Табл. 3 Описание функционала панели управления</small>''
!'''Иконка кнопки'''
!'''Иконка кнопки'''
!'''Наименование кнопки'''
!'''Наименование кнопки'''
!'''Описание'''
!'''Описание'''
|-
|-
|[[Файл:Подсветка достоверности (1).png|безрамки|72x72пкс]]
|[[Файл:Подсветка_достоверности_(1).png|центр|безрамки|40x40пкс]]
|Включить подсветку достоверности и анализа на токсичность
|Включить подсветку достоверности и анализа на токсичность
|подсвечивает красным слова, где модель сомневается в правильности распознавания, где уровень достоверности от 0 до 0.4 подсвечивает красным, от 0.4 до 0.7 - розовым.  
|подсвечивает красным слова, где модель сомневается в правильности распознавания, где уровень достоверности от 0 до 0.4 подсвечивает красным, от 0.4 до 0.7 - розовым.  
При наведении на реплику будет выводиться анализ на наличие токсичных выражений, таких как ненормативная лексика и угрозы.
При наведении на реплику будет выводиться анализ на наличие токсичных выражений, таких как ненормативная лексика и угрозы.
|-
|-
|[[Файл:Сохранить doc (1).png|безрамки|74x74пкс]]
|[[Файл:Сохранить_doc_(1).png|центр|безрамки|40x40пкс]]
|Экспортировать как документ Microsoft Word
|Экспортировать как документ Microsoft Word
|позволяет сохранить текст распознавания в виде документа в формате doc(x) или txt.
|позволяет сохранить текст распознавания в виде документа в формате doc(x) или txt.
|-
|-
|[[Файл:Добавить стенограмму (1).png|безрамки|73x73пкс]]
|[[Файл:Добавить_стенограмму_(1).png|центр|безрамки|40x40пкс]]
|Создать стенограмму
|Создать стенограмму
|создает стенограмму из данных распознавания из очереди. При нажатии на эту кнопку создается стенограмма, доступная для редактирования во вкладке «Сохранено».
|создает стенограмму из данных распознавания из очереди. При нажатии на эту кнопку создается стенограмма, доступная для редактирования во вкладке «Сохранено».
|-
|-
|[[Файл:Удаление документа.png|безрамки|73x73пкс]]
|[[Файл:Удаление_документа.png|центр|безрамки|40x40пкс]]
|Удалить задачу
|Удалить задачу
|Позволяет удалить задачу распознавания. В диалоговом окне подтверждения действия, после чего появляется сообщение о статусе удаления в правом нижнем углу. Нельзя создать стенограмму, кнопка не активна, если спикер всего один.
|Позволяет удалить задачу распознавания. В диалоговом окне подтверждения действия, после чего появляется сообщение о статусе удаления в правом нижнем углу. Нельзя создать стенограмму, кнопка не активна, если спикер всего один.
|-
|-
|[[Файл:Меню пользователя.png|безрамки|73x73пкс]]
|[[Файл:Меню_пользователя.png|центр|безрамки|41x41пкс]]
|Меню пользователя
|Меню пользователя
|отображает меню пользователя (имя, смена пароля, переход на главную страницу, выход из системы и убрать фон)
|отображает меню пользователя (имя, смена пароля, переход на главную страницу, выход из системы и убрать фон)
|}
|}
====Вкладка «Сохранено» SPR====
====Вкладка «Сохранено» SPR====
Во вкладке '''«Сохранено»''' находятся все созданные стенограммы из очереди на распознавание, аудиофайл, панель управления (см. раздел. ''[[SPR. UPS руководство по работе с интерфейсом|Панель управления вкладки «Сохранено»]] SPR''), область редактирования стенограммы, блок с информацией о модели и список спикеров (рисунок 6).
[[Файл:2024-05-21 12-21-26.png|мини|''<small>Рис. 6 Интерфейс вкладки «Сохранено»</small>'']]Во вкладке '''«Сохранено»''' находятся все созданные стенограммы из очереди на распознавание, аудиофайл, панель управления (см. раздел. ''[[SPR. UPS руководство по работе с интерфейсом|Панель управления вкладки «Сохранено»]] SPR''), область редактирования стенограммы, блок с информацией о модели и список спикеров (рисунок 6).
[[Файл:2024-05-21 12-21-26.png|центр|мини|494x494пкс|Рисунок 6 - Интерфейс вкладки «Сохранено».]]Если необходимо, можно переименовать спикера, нажав на иконку ''карандаша'' справа от имени. Затем нужно внести изменения и подтвердить действие, нажав на ''зеленую галочку''. Предусмотрена функция прослушивания самого длинного отрезка спикера, для этого нужно кликнуть на значок [[Файл:Play.png|безрамки|33x33пкс]] напротив имени спикера (рисунок 6). При изменении данных спикера длина самого большого отрезка пересчитывается. Над каждой репликой указано имя спикера. Чтобы ''выбрать имя из списка'' или ''ввести новое'', нужно кликнуть левой кнопкой мыши по имени. После этого можно нажать '''«Добавить нового спикера»''', его имя появится в списке спикеров.


Чтобы ''удалить'' лишнее слово, ''добавить недостающее'', ''разделить реплику на двух разных спикеров'', или наоборот, ''объединить реплики одного спикера'', нужно кликнуть правой кнопкой мыши на нужной реплике и в диалоговом окне выбрать необходимое действие (рисунок 7). Реплики можно объединить только в том случае, если совпадают имена спикеров.  
Если необходимо, можно переименовать спикера, нажав на иконку ''карандаша'' справа от имени. Затем нужно внести изменения и подтвердить действие, нажав на ''зеленую галочку''. Предусмотрена функция прослушивания самого длинного отрезка спикера, для этого нужно кликнуть на значок [[Файл:Play.png|безрамки|33x33пкс]] напротив имени спикера (рисунок 6). При изменении данных спикера длина самого большого отрезка пересчитывается. Над каждой репликой указано имя спикера. Чтобы ''выбрать имя из списка'' или ''ввести новое'', нужно кликнуть левой кнопкой мыши по имени. После этого можно нажать '''«Добавить нового спикера»''', его имя появится в списке спикеров.[[Файл:SPR ПКМ функции.png|мини|''<small>Рис. 7 Функционал работы со стенограммой</small>'']]Чтобы ''удалить'' лишнее слово, ''добавить недостающее'', ''разделить реплику на двух разных спикеров'', или наоборот, ''объединить реплики одного спикера'', нужно кликнуть правой кнопкой мыши на нужной реплике и в диалоговом окне выбрать необходимое действие (рисунок 7). Реплики можно объединить только в том случае, если совпадают имена спикеров.  


Чтобы ''добавить новое слово'', поместите курсор в то место, где должно быть слово, и вызовите контекстное меню. Когда вы нажмёте на пункт меню '''«Добавить слово»''', на этом месте появится подчёркивание. Введенное вами слова будет с достоверностью 100% и подсветится синим.
Чтобы ''добавить новое слово'', поместите курсор в то место, где должно быть слово, и вызовите контекстное меню. Когда вы нажмёте на пункт меню '''«Добавить слово»''', на этом месте появится подчёркивание. Введенное вами слова будет с достоверностью 100% и подсветится синим.
[[Файл:SPR ПКМ функции.png|центр|мини|425x425пкс|Рисунок 7 – Функционал работы со стенограммой.]]
 




=====Панель управления вкладки «Сохранено» SPR=====
=====Панель управления вкладки «Сохранено» SPR=====
{| class="wikitable"
{| class="wikitable"
|+Таблица 4 - Функционал панели управления вкладки «Сохранено»
|+''<small>Табл. 4 Функционал панели управления вкладки «Сохранено»</small>''
!'''Иконка кнопки'''
!'''Иконка кнопки'''
!'''Наименование кнопки'''
!'''Наименование кнопки'''
!'''Описание'''
!'''Описание'''
|-
|-
|[[Файл:Подсветка достоверности (1).png|безрамки|72x72пкс]]
|[[Файл:Подсветка_достоверности_(1).png|центр|безрамки|40x40пкс]]
|Включить подсветку достоверности
|Включить подсветку достоверности
|подсвечивает красным слова, где модель сомневается в правильности распознавания, где уровень достоверности от 0 до 0.4 подсвечивает красным, от 0.4 до 0.7 - розовым.
|подсвечивает красным слова, где модель сомневается в правильности распознавания, где уровень достоверности от 0 до 0.4 подсвечивает красным, от 0.4 до 0.7 - розовым.
|-
|-
|[[Файл:Автосохранение (1).png|безрамки|77x77пкс]]
|[[Файл:Автосохранение_(1).png|центр|безрамки|40x40пкс]]
|Включить автосохранение
|Включить автосохранение
|позволяет включить автоматическое сохранение каждые 30 секунд. Если кнопка активирована вокруг нее появляется красный контур.  
|позволяет включить автоматическое сохранение каждые 30 секунд. Если кнопка активирована вокруг нее появляется красный контур.  
|-
|-
|[[Файл:Сохранить doc (1).png|безрамки|74x74пкс]]
|[[Файл:Сохранить_doc_(1).png|центр|безрамки|40x40пкс]]
|Экспортировать как документ Microsoft Word
|Экспортировать как документ Microsoft Word
|позволяет сохранить текст распознавания в виде документа.
|позволяет сохранить текст распознавания в виде документа.
|-
|-
|[[Файл:Сохранить.png|безрамки|73x73пкс]]
|[[Файл:Сохранить.png|центр|безрамки|40x40пкс]]
|Сохранить изменения
|Сохранить изменения
|позволяет сохранить внесенные правки в стенограмму.
|позволяет сохранить внесенные правки в стенограмму.
|-
|-
|[[Файл:Удаление документа.png|безрамки|73x73пкс]]
|[[Файл:Удаление_документа.png|центр|безрамки|40x40пкс]]
|Удалить задачу
|Удалить задачу
|Позволяет удалить задачу распознавания. В диалоговом окне подтверждения действия, после чего появляется сообщение о статусе удаления в правом нижнем углу.
|Позволяет удалить задачу распознавания. В диалоговом окне подтверждения действия, после чего появляется сообщение о статусе удаления в правом нижнем углу.
|-
|-
|[[Файл:Меню пользователя.png|безрамки|73x73пкс]]
|[[Файл:Меню_пользователя.png|центр|безрамки|41x41пкс]]
|Меню пользователя
|Меню пользователя
|отображает меню пользователя (имя, смена пароля, переход на главную страницу, выход из системы и убрать фон)
|отображает меню пользователя (имя, смена пароля, переход на главную страницу, выход из системы и убрать фон)
|}
|}

Версия от 16:13, 21 октября 2024

SPR Распознавание

Рис. 1 Главный экран UPS

В главном меню UPS (Universal Proxy Server) расположены кнопки для перехода в блоки (см. рисунок 1):

  1. SMC Классификатор,
  2. SEE Сущности,
  3. SPR Распознавание,
  4. SBS Биометрия,
  5. TTS Синтез,
  6. QAS ЧаВО,
  7. SES Сценарная машина,
  8. Выход.

Переключаться между продуктами можно двумя способами:

  1. Воспользоваться кнопкой на панели управления «На главную» Меню пользователя new.png  .
  2. Воспользоваться кнопкой в виде линии , которая находится снизу в центе экрана (см. рисунок 2).

Перейти в блок «Распознавание» можно кликнув по соответствующей кнопке на главном экране UPS (см.рисунок 1).

Рис. 2 Интерфейс рабочей области блока «Распознавание»

Описание интерфейса блока SPR «Распознавание»

Интерфейс включает в себя панель с выпадающим списком моделей распознавания (SPR) в левой части экрана (блок с оглавлением «Модель»), отсортированными в алфавитном порядке, панель управления, информационные блоки о модели, функциональный блок для загрузки звуковых файлов. Также есть возможность добавить новую модель распознавания (SPR) с помощью кнопки, расположенной слева внизу рабочей области. Ниже есть переключатели вкладок «Модели», «Очередь» и «Сохранено». Так же есть информационная вкладка - Серверы, которая отображает информацию о серверах и процессах - находится в правом нижнем углу рабочей области (рисунок 2).

Рис.3 Информация о модели

Вкладка «Модели» SPR

Блок интерфейса, находящийся под списком моделей, предоставляет подробную информацию о моделях распознавания — об их статусе и времени последнего изменения, и функционал для загрузки звукового фрагмента в формате WAV. (см. рисунок 3).

Подробная информация о модели «Распознавания» SPR:

  • название модели (big и call),
  • статус модели.

На панели слева, под блоком с информацией о модели есть опции: «определить говорящих», «выполнить пунктуацию», «анализ на токсичность», «голосовой анализ», «текстовый анализ», а также «указать кол-вл говорящих» и «шумоподавление» с помощью него можно выставить процент шумоподавления в диапазоне [0,1].

Если выбрана модель big, то галочка «выполнить пунктуацию» не влияет на расстановку знаков препинания. Если же используется модель call, то эта галочка может повлиять на пунктуацию. «Определение говорящих» не влияет на пунктуацию, так как это взаимодействие с сервисом биометрии SBS.

Анализ на токсичность — при активации этого флага система будет оценивать текст на предмет наличия в нём токсичных выражений, таких как ненормативная лексика и угрозы. Эта статистика будет доступна во всплывающем окне при наведении курсора на реплику.

Голосовой анализ — при активации этой функции будет проведен анализ голоса, чтобы определить пол (мужской или женский) и примерный возраст (ребенок, взрослый или пожилой человек)Также будет отображаться эмоциональная окраска каждого фрагмента. Эти данные будут отображаться во всплывающем окне над репликой, когда вы наведете на неё курсор.

Текстовый анализ — это метод, который позволяет определить только эмоциональное содержание каждого фрагмента текста.

Указать количество говорящих — активировав этот флаг, появится окно «Количество говорящих», где сможете указать количество спикеров (если оно вам известно) в аудиофайле, который хотите отправить на распознавание.

Ниже под флажками располагаются: раскрывающийся список «Тип VAD» (тип модели для разбивки аудиофайлов: webrtc и neuro) и кнопка «Указать другую модель». При нажатии на кнопку появляется раскрывающийся список, в котором можно выбрать встроенную модель из списка (big или call), она становится приоритетной.

Под информационным блоком располагается функционал для загрузки звуковых фрагментов. Нажимая на кнопку Wav-файл.png «wav-файл» можно выбрать файл звуковой дорожки. Либо можно сделать запись нажав и удерживая кнопку с микрофоном Микрофон 1.png (только для модели call). Для работы данной кнопки требуется доступ к UPS по https. Настроить его можно проксированием через любой веб-сервер (nginx или apache). Кнопка «Распознать» отправляет звуковой файл на распознавание, при успешной отправке в правом нижнем углу появится сообщение о том, что файл добавлен в очередь на распознавание. После этого результат распознавания можно будет увидеть перейдя на вкладку «Очередь» (см. раздел Вкладка «Очередь» ).


На панели инструментов слева расположены иконки версий модели, с помощью которых можно переключаться между ними. Описание этих иконок представлено в таблице 1.

Табл.1 Версии модели
Иконка версии Наименование версии модели Описание
Черновик.png
Черновик это не примененная модель. Можно устанавливать и применять. Можно экспортировать и импортировать. Цвет акцента версии модели - серый. После применения (установки) модель (см. табл.2 «Установка») становится «Рабочей версией».
Рабочая нов.png
Рабочая это модель, которая уже используется в прод (англ. production – производство). Применённую модель нельзя установить заново. Можно экспортировать модель. Цвет акцента версии модели - зелёный. По нажатию кнопки «Архив»- «Рабочая» модель переходит в архивную версию.
Архив нов.png
Архивная это рабочая модель, которая переводится в архив (резервную копию) после применения черновика. Можно вернуть архивную модель в рабочую версию, нажав на кнопку «Откат». При этом рабочая версия также становится архивной, то есть рабочая и архивная версии меняются местами. Цвет акцента версии модели - синий.

Модель Распознавания SPR имеет свойство «Статус», которые принимает следующие значения:

  • Пустая. Новая созданная модель. Модель «Распознавания» можно импортировать из файла в формате zip, для этого необходимо нажать кнопку «Импорт» на панели управления (см. табл. 2)
  • Обучена.
  • Установлена. В этот статус модель переходит при нажатии кнопки «Установка». В этом статусе возможны Импорт, Экспорт, Применение модели – по соответствующим кнопкам на панели управления.
  • Применена. В статус Применена модель переходит при нажатии кнопки «Применение». Для модели в статусе Применена экспорт (выгрузка) по кнопке «Экспорт» (см. табл. 2).
  • Ошибка. Информирует о сбое процессов.


Панель управления вкладки «Модели» SPR

Панель управления находится в правом верхнем углу экрана и содержит 6 кнопок: экспорт, импорт, установка и применение, откат, переход на главный экран и пользовательское меню. Подробное описание каждой функции можно найти в таблице 2.

Табл. 2 Описание функционала панели управления
Иконка кнопки Наименование кнопки Описание
Экспорт нов.png
Экспорт позволяет экспортировать модель.
Импорт нов.png
Импорт позволяет импортировать (добавить) модель.
Установка.png
Установка переводит модель в статус установлена. После чего кнопка меняется на кнопку «Применение»Primenenie.png. Пока модель не применена (не используется), можно ее экспортировать или импортировать.
Откат.png
Откат позволяет перевести архивную версию модели обратно в рабочую.
Меню пользователя.png
Меню пользователя отображает меню пользователя (имя, смена пароля, переход на главную страницу, выход из системы и убрать фон)


Рис. 4 Интерфейс вкладки «Очередь»

Вкладка «Очередь» SPR

Рабочая область вкладки «Очередь» содержит список всех распознанных аудиодорожек: сам аудиофайл и его текст, панель управления (см. раздел. Панель управления вкладки «Очередь» SPR). Выше каждой аудиодорожки отображается информация о модели, времени добавления файла и времени окончания обработки (рисунок 4).

Чтобы прослушать аудиодорожку, вы можете нажать на кнопку «Play». Если вы хотите начать прослушивание с определенного слова, просто щелкните по нему левой кнопкой мыши и нажмите на кнопку воспроизведения (рисунок 5).

Рис.5 Прослушивание отдельных слов и фрагментов стенограммы

Вы можете ускорить или слегка замедлить воспроизведение аудио. Для этого справа от аудиодорожки есть переключатель скорости Переключатель скорости воспроизведения.png. По умолчанию он установлен на 1x, что соответствует оригинальной скорости.

Аудиодорожку также можно сохранить, нажав на иконку «Скачать» Кнопка скачать.png , которая находится справа от аудио. В текст можно вносить изменения вручную, корректируя ошибки распознавания и пунктуации. Однако, если вносите новые слова, которых нет в тексте, у них не будет таймлайна и они будут подсвечены при проигрывании как одно слово.

Панель управления вкладки «Очередь» SPR
Табл. 3 Описание функционала панели управления
Иконка кнопки Наименование кнопки Описание
Подсветка достоверности (1).png
Включить подсветку достоверности и анализа на токсичность подсвечивает красным слова, где модель сомневается в правильности распознавания, где уровень достоверности от 0 до 0.4 подсвечивает красным, от 0.4 до 0.7 - розовым.

При наведении на реплику будет выводиться анализ на наличие токсичных выражений, таких как ненормативная лексика и угрозы.

Сохранить doc (1).png
Экспортировать как документ Microsoft Word позволяет сохранить текст распознавания в виде документа в формате doc(x) или txt.
Добавить стенограмму (1).png
Создать стенограмму создает стенограмму из данных распознавания из очереди. При нажатии на эту кнопку создается стенограмма, доступная для редактирования во вкладке «Сохранено».
Удаление документа.png
Удалить задачу Позволяет удалить задачу распознавания. В диалоговом окне подтверждения действия, после чего появляется сообщение о статусе удаления в правом нижнем углу. Нельзя создать стенограмму, кнопка не активна, если спикер всего один.
Меню пользователя.png
Меню пользователя отображает меню пользователя (имя, смена пароля, переход на главную страницу, выход из системы и убрать фон)

Вкладка «Сохранено» SPR

Рис. 6 Интерфейс вкладки «Сохранено»

Во вкладке «Сохранено» находятся все созданные стенограммы из очереди на распознавание, аудиофайл, панель управления (см. раздел. Панель управления вкладки «Сохранено» SPR), область редактирования стенограммы, блок с информацией о модели и список спикеров (рисунок 6). Если необходимо, можно переименовать спикера, нажав на иконку карандаша справа от имени. Затем нужно внести изменения и подтвердить действие, нажав на зеленую галочку. Предусмотрена функция прослушивания самого длинного отрезка спикера, для этого нужно кликнуть на значок Play.png напротив имени спикера (рисунок 6). При изменении данных спикера длина самого большого отрезка пересчитывается. Над каждой репликой указано имя спикера. Чтобы выбрать имя из списка или ввести новое, нужно кликнуть левой кнопкой мыши по имени. После этого можно нажать «Добавить нового спикера», его имя появится в списке спикеров.

Рис. 7 Функционал работы со стенограммой

Чтобы удалить лишнее слово, добавить недостающее, разделить реплику на двух разных спикеров, или наоборот, объединить реплики одного спикера, нужно кликнуть правой кнопкой мыши на нужной реплике и в диалоговом окне выбрать необходимое действие (рисунок 7). Реплики можно объединить только в том случае, если совпадают имена спикеров.

Чтобы добавить новое слово, поместите курсор в то место, где должно быть слово, и вызовите контекстное меню. Когда вы нажмёте на пункт меню «Добавить слово», на этом месте появится подчёркивание. Введенное вами слова будет с достоверностью 100% и подсветится синим.


Панель управления вкладки «Сохранено» SPR
Табл. 4 Функционал панели управления вкладки «Сохранено»
Иконка кнопки Наименование кнопки Описание
Подсветка достоверности (1).png
Включить подсветку достоверности подсвечивает красным слова, где модель сомневается в правильности распознавания, где уровень достоверности от 0 до 0.4 подсвечивает красным, от 0.4 до 0.7 - розовым.
Автосохранение (1).png
Включить автосохранение позволяет включить автоматическое сохранение каждые 30 секунд. Если кнопка активирована вокруг нее появляется красный контур.
Сохранить doc (1).png
Экспортировать как документ Microsoft Word позволяет сохранить текст распознавания в виде документа.
Сохранить.png
Сохранить изменения позволяет сохранить внесенные правки в стенограмму.
Удаление документа.png
Удалить задачу Позволяет удалить задачу распознавания. В диалоговом окне подтверждения действия, после чего появляется сообщение о статусе удаления в правом нижнем углу.
Меню пользователя.png
Меню пользователя отображает меню пользователя (имя, смена пароля, переход на главную страницу, выход из системы и убрать фон)