39 страниц

Устанавливает требования к разработке пользовательского интерфейса приложений голосового меню (далее — систем IVR). Стандарт охватывает обе существующие разновидности систем IVR по способу ввода: посредством тонального набора и с помощью автоматического распознавания речи (ASR). Это в равной степени применимо ко всем случаям, в которых инициатором вызова выступает либо абонент, либо сама система IVR (например, в некоторых приложениях телемаркетинга).

Стандарт предполагает использование совместно с ИСО/МЭК 13714.

Скачать PDF

Идентичен ISO 9241-154:2013

Дата введения	01.12.2016
Добавлен в базу	01.02.2017
Актуализация	01.01.2021

Раздел Электроэнергия
- Раздел 35 ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ. МАШИНЫ КОНТОРСКИЕ
  - Раздел 35.180 Информационно-технологические терминалы и другие периферийные устройства

Организации:

08.10.2015	Утвержден	Федеральное агентство по техническому регулированию и метрологии	1502-ст
	Разработан	ОАО НИЦ КД
	Издан	Стандартинформ	2016 г.
	Издан	Стандартинформ	2018 г.

Ergonomics of human-system interaction. Part 154. Interactive voice response applications

стр. 1

стр. 2

стр. 3

стр. 4

стр. 5

стр. 6

стр. 7

стр. 8

стр. 9

стр. 10

стр. 11

стр. 12

стр. 13

стр. 14

стр. 15

стр. 16

стр. 17

стр. 18

стр. 19

стр. 20

стр. 21

стр. 22

стр. 23

стр. 24

стр. 25

стр. 26

стр. 27

стр. 28

стр. 29

стр. 30

ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ТЕХНИЧЕСКОМУ РЕГУЛИРОВАНИЮ И МЕТРОЛОГИИ

ГОСТ Р исо

9241-154—

2015

НАЦИОНАЛЬНЫЙ

СТАНДАРТ

РОССИЙСКОЙ

ФЕДЕРАЦИИ

ЭРГОНОМИКА ВЗАИМОДЕЙСТВИЯ ЧЕЛОВЕК—СИСТЕМА

Часть 154

Применение интерактивного голосового меню

(ISO 9241-154:2013, ЮТ)

Издание официальное

Москва

Стандартинформ

2016

Предисловие

1 ПОДГОТОВЛЕН Открытым акционерным обществом «Научно-исследовательский центр контроля и диагностики технических систем» (АО «НИЦ КД») на основе собственного аутентичного перевода англоязычной версии международного стандарта, указанного в пункте 4

2 ВНЕСЕН Техническим комитетом по стандартизации ТК 201 «Эргономика, психология труда и инженерная психология»

3 УТВЕРЖДЕН И ВВЕДЕН В ДЕЙСТВИЕ Приказом Федерального агентства по техническому регулированию и метрологии от 8 октября 2015 г. № 1502-ст

4 Настоящий стандарт идентичен международному стандарту ИСО 9241-154:2013 «Эргономика взаимодействия человек—система. Часть 154. Применение интерактивного голосового меню (IVR)» (ISO 9241-154:2013 «Ergonomics of human-system interaction — Part 154: Interactive voice response (IVR) applications», IDT).

Наименование настоящего стандарта изменено относительно наименования указанного международного стандарта для приведения в соответствие с ГОСТ Р 1.5-2012 (подраздел 3.5).

При применении настоящего стандарта рекомендуется использовать вместо ссылочных международных стандартов соответствующие им национальные стандарты Российской Федерации, сведения о которых приведены в дополнительном приложении ДА

5 ВВЕДЕН ВПЕРВЫЕ

Правила применения настоящего стандарта установлены в ГОСТ Р 1.0-2012 (раздел 8). Информация об изменениях к настоящему стандарту публикуется в ежегодном (по состоянию на 1 января текущего года) информационном указателе «Национальные стандарты», а официальный текст изменений и поправок — в ежемесячном информационном указателе «Национальные стандарты». В случае пересмотра (замены) или отмены настоящего стандарта соответствующее уведомление будет опубликовано в ближайшем выпуске ежемесячного информационного указателя «Национальные стандарты». Соответствующая информация, уведомление и тексты размещаются также в информационной системе общего пользования — на официальном сайте Федерального агентства по техническому регулированию и метрологии в сети Интернет (www.gost.ru)

Настоящий стандарт не может быть полностью или частично воспроизведен, тиражирован и распространен в качестве официального издания без разрешения Федерального агентства по техническому регулированию и метрологии

Примечание 1 — Противоположностью синтезированной речи являются оцифрованная речь (3.14), записанная речь (3.35) и текст, преобразованный в речь (3.45).

3.41 инициатива системы (system initiative): Ситуация, при которой система голосового меню руководит действиями пользователя и ведет абонента по выбранному плану взаимодействия.

3.42 опережающий речевой ввод (talk-ahead): Свойство системы голосового меню принимать речевой ввод данных до запроса такого ввода системой.

Примечание 1 — Данный термин близок к термину «опережающий тональный ввод данных» (3.12) при вводе данных с помощью тонального набора.

Примечание 2 — Введенные речевые данные затем используют в системе, в том порядке, в котором они были получены. Это позволяет абонентам вводить данные без прослушивания соответствующего запроса о необходимости ввода данных.

3.43 одновременный речевой ввод (talk-through): Способность системы голосового меню принимать речевой ввод во время воспроизведения запроса (или объявления).

Примечание 1 — В ответ на одновременное произношение фраз воспроизведение речи системой прекращается, и система реагирует на речь вызывающего абонента.

Примечание 2 — См. также одновременный набор (3.13) и прерывание (3.3).

3.44 текстовый телефон, терминал; TTY (text telephone, TTY): Телекоммуникационное устройство, позволяющее вести двухсторонний диалог с помощью текста, вместо голосового общения.

Примечание 1 — В некоторых случаях такое устройство называют TDD¹) (телекоммуникационное устройство для глухих).

3.45 преобразование текста в речь (text-to-speech, TTS): Процесс, при котором компьютер преобразует представленный текст в сформированную компьютером речь.

Примечание 1 — Преобразование текста в речь, как правило, построено из фрагментов записанной речи человека или речи, смоделированной с помощью вычислительных средств.

Примечание 2 — Данный термин является противоположным к терминам: синтезированная речь (3.40), оцифрованная речь (3.14) и записанная речь (3.35).

3.46 тайм-аут (time-out): Временной интервал, выделяемый системой для ввода данных от пользователя, по истечении которого она изменяет свое состояние, а также событие изменения состояния системы по истечению такого интервала при отсутствии ввода данных.

Пример — Тайм-аут в период ввода числовых данных может быть интерпретирован системой как окончание ввода, в результате чего система изменяет состояние ввода данных на состояние управления или какое-либо другое.

3.47 настройка (тюнинг) (tuning): Процесс анализа имеющихся данных о производительности речевого приложения, и последующего их использования для выбора параметров автоматического распознавания речи с целью повышения его производительности.

3.48 чередование (turn-taking): Процесс в системе голосового меню, при котором вызывающий абонент и голосовое меню по очереди воспроизводят сообщение, а затем ожидают реакции с противоположной стороны.

3.49 распознавание голоса (voice recognition): Способность системы распознавать голос конкретного человека.

Примечание 1 — Распознавание голоса следует отличать от распознавания речи, при котором происходит распознавание произнесенных слов.

Примечание 2 — Распознавание голоса часто используют для идентификации, аутентификации или верификации говорящего в целях обеспечения безопасности.

ГОСТ Р ИСО 9241-154-2015

4 Соответствие требованиям стандарта

Соответствие требованиям настоящего стандарта достигается путем выполнения всех применимых требований и предоставление систематизированного списка всех рекомендаций, которые были учтены. Все требования, признанные неприменимыми, должны быть указаны с описанием причин, по которым они не могут быть применены.

Пользователи настоящего стандарта должны исследовать применимость каждого требования (на наличие требования указывают слова: «должен», «должно быть», «следует», «необходимо») и каждой рекомендации (на рекомендацию указывают слова «может», «рекомендовано»), для определения их применимости в конкретных условиях или ситуациях. В случае если заявлено, что продукция соответствует применимым рекомендациям, должна быть описана процедура формирования требований, разработки и проверки соответствия пользовательских интерфейсов систем голосового меню. Уровень детализации такой процедуры определяют вовлеченные стороны в результате согласования.

5 Системы голосовых сообщений

Системы голосовых сообщений должны соответствовать требованиям ИСО/МЭК 13714.

6 Ввод информации

6.1 Введение

Ввод данных в системе голосового меню производят с помощью устной речи, тонального ввода с клавиатуры телефона или их комбинации. Содержание данного раздела касается ввода данных пользователем в систему голосового меню.

Примечание — Пользователи текстовых телефонов (также «терминалов TTY» или «терминалов TDD») и сервисов, управляемых с помощью голоса иногда имеют особые требования из-за ограничений, реализованных в этих полезных технологиях и сервисах. Положения, основанные на таких ограничениях, также вошли в данный

раздел.

6.2 Информирование абонента о допустимых способах ввода информации с текстового

телефона

Рекомендуется, чтобы приложения голосового меню информировали пользователя с TTYтерминалом о том, каким способом эти приложения получают вводимые данные — посредством тонального ввода с использованием клавиш клавиатуры, речевого ввода или обоими этими способами.

Примечание 1 — Некоторые текстовые телефоны не имеют возможности тонального ввода данных, а некоторые системы голосового меню не принимают телетайпный ввод символов (с телетайп-терминалов TTY). Пользователей текстовых телефонов необходимо информировать о способах ввода информации в системы голосового меню.

Примечание 2 — Такую информацию в диалоге с абонентом наиболее уместно передать в сообщении об ошибке после истечения срока ожидания ввода или в запросе о повторной попытке (для первого интерактивного состояния приложения).

6.3 Недопустимость дублирования (повторного) ввода информации

В течение одного телефонного вызова абоненту должно быть предложено ввести конкретную информацию только один раз, кроме случаев, когда для обеспечения конфиденциальности, безопасности или верификации требуется повторный ввод данных.

Примечание — Это требование распространяется также на все ситуации, в которых вызовы переводят из одного места в другое, как, например, в ситуациях с избыточным поступлением вызовов. После перевода вызова от абонента не требуют повторного ввода информации, которая уже была им введена.

Пример 1 — Если приложение использует голосовую верификацию, конкретный абонент произносит свое имя или пароль дважды для обеспечения требований безопасности.

Пример 2 — Если абонент ввел свой адрес в ответ на запрос, а данный вызов затем был переведен для обслуживания в другое место, информацию об адресе передают вместе с этим вызовом и вызывающему абоненту не требуется вводить эту информацию повторно.

6.4 Использование информации, имеющейся в системе, для повышения эффективности

Если в системе имеется информация, которая позволяет улучшить диалог с абонентом, то рекомендуется ее использовать, чтобы сделать вызов более эффективным.

Пример —Для пассажиров часто пользующихся самолетами сохраняется информация о кредитной карте, так что им не нужно повторно вводить сведения о ней для каждого нового заказа.

6.5 Изменение введенной информации

Вызывающему абоненту рекомендуется предоставлять возможность изменения данных и информации, введенной в течение вызова.

Примечание — Иногда в приложении голосового меню существует место, после которого абонент уже не может вносить изменения.

Пример — После того, как абонент предоставил информацию, необходимую для выполнения заказа на товар, система повторяет детали (спецификацию) заказа и просит у абонента подтверждения, обеспечивая возможность сделать все необходимые изменения перед отправкой заказа. Однако, после того как абонент подтвердил заказ, он уже не может его изменить.

7 Речевой ввод

7.1 Выбор словаря для голосового меню с речевым вводом

При использовании системы распознавания речи и выборе словаря для приложения необходимо учитывать производительность ASR. Выбранный словарный запас должен быть проверен.

7.2 Фонетически различающийся словарь для приложений голосового меню с поддержкой речевого ввода

Для приложений, использующих автоматическое распознавание речи, варианты команд, которые предполагают одновременный ввод в ответ на запрос такого приложения, рекомендуется разрабатывать так, чтобы они были фонетически различимыми, для повышения точности распознавания речи.

Пример — В приложении голосовой почты на английском языке, используют набор команд «стереть, повторить и перейти к следующему» вместо «удалить, повторить и перейти к следующему», потому что, к примеру, в английском языке «удалить» и «повторить» (delete и repeat) фонетически схожи и могут быть ошибочно восприняты системой распознавания речи.

7.3 Грамматика для отдельных состояний приложения

Для каждого состояния диалога рекомендуется иметь собственную выделенную грамматику.

Примечание 1 — Даже для таких запросов, ответом на которые могут быть только «Да» и «Нет», предпочтителен грамматический набор вариантов, т.к. это упрощает обработку избыточного сообщения. Вызывающий абонент может ответить на вопрос: «да», «нет», но так же и «о... да», «да, пожалуйста», «ничего», «однозначно нет» в зависимости от заданного вопроса и других факторов.

Пример 1 — Запрос, который запрашивает у звонящего абонента год, в котором его автомобиль обслуживали в последний раз, имеет примерно следующий грамматический набор: «две тысячи девять», «две тысячи десять», ..., «две тысячи двенадцать», «две тысячи десятый», ..., «двадцать-двенадцать» и «в этом году... т.е. две тысячи пятнадцатый»

Примечание 2 — Ответы абонента часто содержат части предваряющего их запроса.

Пример 2 — В ответ на запрос «Хотите ли вы забронировать эту поездку?» звонящий может ответить с помощью «Да, хочу» или «Да, забронировать».

7.4 Синонимы в грамматических наборах

В грамматические наборы рекомендуется включать варианты сообщений, все вероятные слова и варианты фраз.

Примечание 1 — Для расширения начального грамматического набора на основе имеющихся значений используют настройку (тюнинг) (3.47).

ГОСТ Р ИСО 9241-154-2015

Примечание 2 — Создание грамматических наборов со всеми возможными вариантами ответов делает распознавание речи более сложным и может в результате привести к снижению коэффициента достоверности.

Пример — При анализе запроса «Произнесите Вашу команду: сохранить, стереть или изменить» грамматический набор включает в себя, как «стереть», так и его синоним «удалить».

7.5 Использование динамических грамматических наборов

В случае если скорость распознавания речи может быть повышена с помощью ограничения грамматики, рекомендуется использовать динамический грамматический набор, например, в случаях когда:

a) количество элементов в грамматике стало слишком большим для приемлемой производительности распознавания речи;

b) для использования грамматики доступна информация о вызывающем абоненте;

c) возможно использование для грамматики информации, полученной из предыдущих введенных вызывающим абонентом данных в течение текущего сеанса связи.

7.6 Регистрация (внесение в списки)

7.6.1 Введение

Если в приложениях голосового меню с поддержкой речевого ввода для вызывающего абонента требуется регистрация, то рекомендуется, чтобы данный процесс был как можно более простым.

Примечание — Иногда необходимо пожертвовать простотой регистрации ради обеспечения требований безопасности. Обеспечение более высокого уровня безопасности в приложении часто требует более длительного и более трудоемкого процесса регистрации.

7.6.2 Регистрация в среде использования

Если приложение использует речевой ввод и требует регистрации вызывающего абонента, то рекомендуется уведомлять вызывающего абонента (в диалоге или в документации) о том, что он должен пройти процедуру регистрации, если возможно, в среде, аналогичной той, в которой будет использовано приложение.

7.6.3 Регистрация с использованием повторения

Если система, в качестве процедуры регистрации, предлагает вызывающему абоненту повторить определенные фразы, то рекомендуется, чтобы каждая такая фраза была достаточно короткой для легкого запоминания абонентом. В частности, если вызывающему абоненту предложено повторить последовательность цифр, каждое повторение должно включать не более четырех цифр.

7.7 Определение границ речевого ввода и чередование

Определение границ речевого ввода рекомендуется настраивать таким образом, чтобы улучшить процесс чередования активности абонента и системы.

Пример — Большинство абонентов произносят номер банковского счета или номер телефона группами по несколько цифр с паузами между ними, например, «код страны — пауза — номер абонента». Гоаницы речевого ввода устанавливают так, чтобы они соответствовали такому способу речевого ввода данных.

Примечание 1 — В определенных диалоговых ситуациях в естественной речи абонента существуют паузы. Настройки слишком короткого периода ввода могут завершить ввод данных до того, как абонент произнесет данные полностью.

Примечание 2 — Этот подраздел соотносится с 8.2, который устанавливает требования к использованию разделителей в системах голосового меню с тональным вводом данных.

Примечание 3 — Паузы с длительностью менее 250 мс нежелательно использовать для смены очередности в диалоге, в то время как паузы длиннее 1500 мс более подходят для этого. Таким образом, разумно устанавливать продолжительность паузы после окончания ввода равным приблизительно 1500 мс, но отдельные этапы диалога или отдельные национальные языковые особенности могут потребовать иных настроек данного параметра.

7.8 Обработка тайм-аутов речевого ввода данных

Поскольку не существует речевого аналога для клавиши «#» («решетка» или «хэш») рекомендуется настраивать тайм-аут речевого ввода данных (отдельно от значения тайм-аута тонального ввода) таким образом, чтобы достигнуть удовлетворительной скорости реакции системы на ввод данных пользователем.

Примечание — Для учета пауз в речи можно отдельно устанавливать продолжительность речевого тайм-аута.

7.9 Голосовые меню с речевым вводом и тональный набор

Варианты (опции) речевого ввода данных должны иметь эквивалентные способы ввода через тональный набор, исключая случаи, когда характер вводимых данных не может быть выполнен с помощью тонального набора.

Примечание — Это требование является особенно важным по двум причинам: удобство использования и доступность.

Пример 1 — Речевой запрос о выборе вариантов («А, В или С?») соотносит А с «1», В с «2» и С с «3» для ввода информации с помощью тонального набора.

Пример 2 — Если при вводе данных в режиме открытого диалога происходит ошибка в ответ на запрос, то голосовое меню предлагает иерархически структурированный список вариантов, из которого абоненты могут выбрать нужный, используя тональный набор.

8 Тональный набор

8.1 Оповещение о возможности тонального ввода данных

Если у абонента явно запрашивают подтверждение возможности тонального набора с его телефонного устройства, система должна ожидать ввода «1» в качестве правильного ответа на запрос. В то же время, любой введенный тональный сигнал должен быть распознан как правильный ответ на такой запрос.

Примечание — Также могут существовать другие равноправные способы идентификации возможности тонального набора, кроме требования от абонента нажать на клавишу его аппарата. Это требование не подразумевает, что эта конкретная процедура представляет собой единственный или самый лучший способ определения, имеет ли абонент телефон с возможностью тонального набора.

8.2 Назначение клавиши-разделителя вводимых данных

Если для ввода данных переменной длины необходимо использовать клавишу-разделитель, то для этой цели должна быть использована клавиша «#» («решетка»).

Примечание — В некоторых странах используют другие названия данной клавиши, например, клавиша «хэш».

8.3 Клавиша «#» при вводе данных фиксированной длины

В приложениях, использующих тональный набор, применение клавиши «#», как разделителя, не является обязательным для ввода данных фиксированной длины. Поэтому рекомендуется игнорировать нажатие на клавишу «#» во время ввода данных фиксированной длины.

8.4 Использование тайм-аута для тонального набора вводимых данных переменной

длины

Принимая тональный набор от абонента в приложениях, использующих ввод данных переменной длины, рекомендуется считать клавишу «#» автоматически введенной системой после окончания установленного разработчиками тайм-аута, в течение которого не было получено никаких сигналов от вызывающего абонента. Продолжительность времени ожидания (тайм-аута) рекомендуется определять путем тестирования на репрезентативной выборке абонентов, в том числе тех, кому, как ожидается, потребуются относительно длинные интервалы времени для ввода данных (например, для пожилых людей, пользователей с нарушениями моторики, пользователей текстовых телефонов).

Примечание — В настоящем стандарте предполагается, что нажатие на клавишу «#» для разделения вводимых данных приветствуется, но не обязательно.

8.5 Назначение клавиш для утвердительных и отрицательных ответов

Для варианта положительного ответа всегда должна быть назначена клавиша «1». Для варианта отрицательного ответа всегда должна быть назначена клавиша «2».

ГОСТ Р ИСО 9241-154-2015

Пример — В приложениях на русском языке ответы «да» и «нет» назначены клавишам тонального набора «1» и «2» соответственно.

8.6 Назначение клавиш для функции получения помощи от специалиста службы

поддержки

В случае возможности предоставления поддержки от специалиста, приложения, использующие для ввода тональный набор и/или речевой ввод, должны назначать для запроса помощи клавишу «0».

Примечание 1—См. также 12.2 и 12.7.

Примечание 2 — Это требование не запрещает назначение других клавиш или комбинаций клавиш в дополнение к использованию клавиши «0».

8.7 Минимизация количества клавиш, нажимаемых вызывающим абонентом

В приложениях, использующих тональный набор, рекомендуется минимизировать количество клавиш нажимаемых пользователем. Если это возможно, рекомендуется использовать ввод данных пользователем простым однократным нажатием клавиши вместо множественных нажатий.

9 Вывод информации

9.1 Общие положения для запросов и объявлений

9.1.1 Краткость информации

Чтобы избежать излишней нагрузки на память вызывающего абонента, выводимую информацию рекомендуется делать краткой.

Примечание —Считается, что, вызывающие абоненты за небольшой интервал времени могут мысленно обрабатывать лишь небольшое количество (около четырех) порций информации в одном объявлении или запросе, такой как даты, названия или номера мест. Тем не менее, точное количество зависит от сложности информации и степени близости элементов выбора. Также, если абонент не обязан держать в памяти все элементы, иногда оправдано использование большого количества порций информации.

9.1.2 Группировка информации

Если в одном объявлении или запросе представлены несколько частей информации, между фразами рекомендуется вставлять паузы для группировки информации.

Пример — В следующем объявлении между фразами вставлены паузы, а каждая фраза представляет собой одну порцию информации: «Номер рейса 123. <Пауза> Посадка производится у ворот номер 12. < Пауза> Время отправления — 15:45».

9.1.3 Интонация и другие аспекты речи

С целью улучшения восприятия, ритм речи при произнесении информационных элементов, включая шаблоны интонации, (например, для чисел, последовательности цифр и дат) рекомендуется делать похожим на ритм и произношение речи человека.

Примечание — Это достижимо путем обеспечения двух или более представлений каждой цифры или последовательности цифр, с различными интонациями, в цифровой, записанной или синтезированной речи, используемой в приложении.

Пример — В английском языке произнося последовательность цифр «один, два, три», обычно цифры «один» и «два» имеют повышающуюся интонацию в то время как «три» имеет понижающуюся интонацию. В случае последовательности «три, два, один», «три» и «два» имеют повышающуюся интонацию, а «один» — понижающуюся.

9.1.4 Скорость речи

При выборе скорости речи для запросов и объявлений рекомендуется учитывать особенности совокупности пользователей, назначение приложения голосового меню и используемый диалект.

Примечание — Скорость речи часто существенно отличается в различных системах голосового меню.

Пример — В приложениях голосового меню для служб поддержки пользователей в Северной Америке используют скорость от 140 до 170 слов в минуту.

9.1.5 Простые лингвистические формы

По возможности, рекомендуется использовать простые лингвистические конструкции и словоформы.

Пример — Вместо запроса «Сейчас должен быть введен номер счета» (пассивный залог) используют запрос «Теперь введите номер вашего счета».

Примечание — В целом, если существует возможность выбора между длинным и коротким словом, обозначающим одно и то же, следует использовать короткое слово. В большинстве случаев, короткое слово более употребляемое, чем длинное, и пользователи услышат и поймут его быстрее. Использование хорошо построенных предложений и словаря наиболее употребляемых слов позволяет обеспечить уверенность в том, что наибольшее количество пользователей поймет сообщения приложения.

Пример — В запросах чаще используют слово «скажите» вместо «произнесите» и слово «помощь» вместо «содействие».

9.1.6 Разумное использование вежливости в запросах на ввод данных

Термины вежливости (например, «пожалуйста», «спасибо») в приложениях голосового меню следует использовать разумно. Рекомендуется избегать и чрезмерного, и недостаточного использования таких терминов.

Пример — Если слова вежливости (например, «пожалуйста») используют слишком часто, это может стать утомительным.

Примечание — Если система предлагает список пунктов меню, слово «пожалуйста» используют не для каждого варианта, а только в начале запроса (например, «Пожалуйста, выберите одно из следующих действий: для отдела продаж нажмите 1, для отдела отгрузки нажмите 2, для других отделов, нажмите 3»),

Пример — Использование вежливого термина в начале запроса (например, «Пожалуйста, введите Ваш номер счета») помогает подготовить абонента к ответу на запрос, а также может положительно настроить абонентов относительно приложения голосового меню и, косвенно, относительно компании или организации, которой принадлежит это приложение.

9.1.7 Завершение вызова

В случае если приложение голосового меню инициирует завершение вызова, то рекомендуется делать это в очень вежливой форме.

Пример — «Спасибо за Ваш звонок в компанию «Лучшее — детям». До свидания»

9.1.8 Качество звука запросов и объявлений

Рекомендуется, чтобы у звука запросов и объявлений было высокое качество. Следует свести к минимуму окружающий шум во время записи, т. е. фоновый шум должен быть ограничен в максимально возможной степени.

Примечание 1 — Для абонентов с нарушениями слуха иногда бывает очень трудно выделять полезную информацию (например, запросы и объявления) на фоне шума.

Примечание 2 — «Высокое» качество звука является субъективной оценкой разработчиков приложений голосового меню и других заинтересованных сторон. Эти суждения основаны на записях звука без искажений, на ясности речи и на понимании ограничений по пропускной способности и полосе частот для телефонных линий.

9.1.9 Постоянство уровней громкости звука запросов и объявлений

Запросы и объявления рекомендуется записывать и воспроизводить с постоянным уровнем громкости во всем приложении голосового меню.

9.1.10 Восприятие абонента

Приложение голосового меню должно быть построено таким образом, чтобы для пользователей было понятно, что они взаимодействуют с компьютером, а не человеком.

Пример — система IVR: «Добро пожаловать в автоматизированную систему обслуживания компании «Аладдин»».

Примечание 1 — Это требование не мешает использованию антропоморфизма в персонаже, но антропоморфизм может усложнить выполнение этого требования.

Примечание 2 — Использование нехарактерных для речи человека звуков также помогает передать ощущение того, что абонент разговаривает с компьютером.

ГОСТ Р ИСО 9241-154-2015

9.1.11 Персонаж

Рекомендуется тщательно выбирать персонажа для применения в голосовом меню на основе систематического анализа и данных, полученных от потребителей. Выбранного персонажа рекомендуется использовать на протяжении всего голосового меню.

Примечание 1 — Во всех приложениях голосового меню на самом деле существует персонаж (см. 3.31), независимо от целей разработчиков. Если разработчики не принимают активного участия в создании персонажа, приложение может быть воспринято целевой аудиторией пользователей неожиданным для разработчиков образом.

Примечание 2 — Персонаж не может заменить хорошую структуру пользовательского интерфейса и имеет второстепенное значение после обеспечения удобства использования приложения.

9.1.12 Повторение запросов и объявлений

a) Вызывающему абоненту рекомендуется предоставлять возможность повторения запросов и объявлений в случае, если они очень длинные или содержат большие списки вариантов, из которых абоненту предлагают сделать выбор.

Примечание — Нежелательно реализовывать повторение всех запросов и объявлений, разработчикам следует рассмотреть различные компромиссы для определения условий, при которых эта функция является целесообразной.

b) В системах с поддержкой речевого ввода данных, команда «Повторить» должна быть использована в качестве речевой команды повторения запросов и объявлений.

9.1.13 Повторение частей длинного запроса и объявления

При наличии технической возможности, рекомендуется, чтобы абоненты имели возможность повторения частей длинного запроса и объявления (например, режим «небольшой перемотки»).

Примечание 1 — Хотя в настоящем стандарте не указан объем длинного объявления или запроса, разработчики приложений могут определить через тестирование варианты длинных или сложных запросов или объявлений, в которых требуется режим «небольшой перемотки». Важно, чтобы такое тестирование включало репрезентативные выборки пользователей приложения.

Пример — В приложениях для запроса страховых возмещений, в которых абоненту предлагают выполнить сложные, многоступенчатые инструкции используют функцию «небольшая перемотка» так, чтобы абоненты могли перепроверить какую-либо часть сложных инструкций, которые они могли пропустить или забыть.

Примечание 2 — Целесообразность использования таких длинных, многоэтапных инструкций в приложении голосового меню довольно сомнительна.

9.1.14 Запросы и объявления для пользователей текстовых телефонов

Приглашения и объявления для пользователей текстовых телефонных аппаратов (терминалов TTY) должны передавать то же содержание, что и для пользователей нетекстовых телефонных аппаратов, но формулировка должна отличаться из-за различий в способах передачи информации. Разработчикам приложений следует консультироваться у пользователей текстовых телефонных аппаратов при разработке запросов и объявлений для использования в текстовых телефонах.

9.1.15 Выбор языка

Если приложение позволяет звонящему абоненту выбрать язык, используемый для подсказок, и если абонент это сделал, то все последующие пункты системы голосового меню, относящиеся к той же задаче, должны быть предоставлены абоненту на выбранном им языке.

Примечание — Если абонент запросил, например, испанский язык, и поставил вызов на удержание с фоновой музыкой, передаваемой по радио, целесообразно выбирать радиостанцию, производящую вещание на испанском языке.

9.1.16 Язык сообщений для текстового терминала (телефонного аппарата)

Язык текстового сообщения необходимо обрабатывать как отдельный выбор языка сообщений.

Примечание —Упомянутая обработка необходима, поскольку сообщения TTY-терминалов содержат сокращения и принятые обозначения (например, в английском «GA» означает «далее»), которые в других системах телефонной связи не используют. Последовательное использование таких сокращений и конвенций важно для пользователей текстовых телефонных аппаратов (TTY-терминалов).

9.2 Подсказки и сообщения

9.2.1 Порядок расположения пунктов в списках опций

Списки опций рекомендуется упорядочивать таким образом, чтобы самые приоритетные параметры были представлены в начале, а все неспецифические или смешанные варианты — в конце списка. При определении вариантов упорядочивания списка также рекомендуется рассматривать такие факторы, как частота использования, детализация, получение доходов, логический порядок, важность для раздраженного абонента и переобучение модели задачи.

Примечание — Если наиболее используемые параметры представлены первыми, абоненты, как правило, выбирают их, не дожидаясь определенного варианта, который лучше соответствует их потребностям. Размещение часто используемых параметров в начале списка позволяет абонентам быстрее выбирать опции, повышая общую эффективность списка опций.

Пример 1 — «Если у Вас чрезвычайная ситуация, нажмите 1. Если у Вас есть крайний срок, в который необходимо уложиться, нажмите 2. Для обслуживания в обычном режиме с поставкой в течение от одного до трех дней, нажмите 3.»

Пример 2 — «Для отелей в Европе нажмите 1. Для отелей в Азии нажмите 2. Для отелей в Северной Америке нажмите 3. Для остальных отелей нажмите 4.»

9.2.2 Порядок назначения клавиш для списка опций

Клавиши для списка опций рекомендуется назначать в соответствии с порядком вариантов в списках, сохраняя последовательность таких назначений.

Пример — Если порядок перечисления в списке: «Баланс счета», «Оплатить мой счет», «Закрыть счет», и «Другие», то для этих вариантов можно назначить клавиши 1,2, 3 и 4 соответственно.

Примечание —Для глобальных команд, как правило, назначают клавиши с более высокими значениями цифр и «0», например, «0» — «получить помощь специалиста», так, чтобы избежать противоречия с назначением элементов в списке опций, начинающихся с клавиши «1».

9.2.3 Порядок размещения целей и действий в запросах

При формулировке запроса рекомендуется сначала определить цели (желаемый для пользователя результат), а затем действия, необходимые для их достижения.

Пример 1 — «Чтобы сделать заказ нажмите 1»

Примечание 1 — Требуемое от вызывающего абонента действие размещают в запросе так, чтобы это была самая последняя представленная информация для запоминания.

Примечание 2 — Приложения голосовых меню с речевым управлением часто совмещают цели и действия в одном слове или одной фразе.

Пример 2 — «Скажите, пожалуйста, «новый пользователь» или «существующий пользователь».

9.2.4 Интонация и другие аспекты произношения

Для естественного звучания и более легкого понимания абонентом сообщения голосового меню его рекомендуется озвучивать с помощью речи с правильным произношением.

Примечание — Для записанных запросов при выполнении данной рекомендации полезна правильная тренировка диктора.

9.2.5 Интонация и другие аспекты произношения для сцепленных сообщений

Для сцепленных сообщений может быть важной подготовка трех разных версий с различными интонациями в зависимости от порядка появления отдельных сообщений: в начале, середине или в конце.

Примечание — См. также 9.1.3.

9.2.6 Интонация и другие аспекты произношения для указания очередности

Подсказки системы рекомендуется представлять с таким произношением, которое помогает абоненту понять — подошла ли его очередь говорить или вводить данные. В частности, запросы, формирующиеся как вопросы, должны иметь выраженную интонацию вопроса.

Примечание — В английском вопросы, как правило, имеют повышающуюся интонацию в конце предложения. По этой причине часто используется короткий вопрос «Верно?», так как эта фраза может быть легко за-14

ГОСТ Р ИСО 9241-154-2015

писана с четкой восходящей интонацией и соответствующим произношением, указывая на то, что система ожидает реакции абонента.

9.2.7 Формулировка преамбулы для списка параметров речи

Запрос рекомендуется формулировать таким образом, чтобы список опций изначально не звучал как вопрос «Да/Нет» и не запрашивал произвольную формулировку.

Пример — «По какому вопросу Вы звоните: «Ваш счет», «платеж», «заказ» или «техническая поддержка»?»

Примечание — Запрос сформулированный как «Вы звоните по поводу «Вашего счета», «оплаты», «заказа» или «технической поддержки» ?» часто вызывает проблемы потому, что абоненты, услышав «Вашего счета», отвечают «Да» или «Нет». Или такие подсказки, как например: «По поводу какого сервиса вы звоните: «телевизор», «Интернет», или «телефон» будет вызывать ответную речь сразу после окончания фразы «По поводу какого сервиса вы звоните...»

9.2.8 Ограничения речевого ввода

В случае, когда существуют многочисленные языковые варианты одной и той же информации, рекомендуется предоставить наглядный пример.

Пример — «Пожалуйста, назовите срок действия вашей кредитной карты. Например, «Декабрь, две тысячи двенадцать»

9.2.9 Использование меток в запросах

Запросы рекомендуется начинать с любой метки (короткой фразы или сигнала), но последовательные запросы не должны начинаться с одного и того же слова или фразы.

Примечание — Использование меток в запросах помогает сделать звучание диалога более естественным и достаточно эффективно обеспечивает неявную обратную связь от предыдущего запроса и ощущение прогресса в решении задачи вызывающего абонента.

9.2.10 Однозначность запроса

Запрос рекомендуется формулировать таким образом, чтобы он был однозначным для целевой аудитории вызывающих абонентов.

Примечание — То, что считается двусмысленным, в значительной степени зависит от целевой аудитории пользователей.

Пример — Вместо сообщения об оплате: «У Вас есть непогашенный остаток в 50 долларов», где «непогашенный» (оповещение о наличии остатка) может быть истолковано и как положительная ситуация, и как просроченный баланс, сообщение формулируют так: «Задолженность по вашему счету составляет 50 долларов».

9.2.11 Неполный набор вариантов (опций)

Варианты списков рекомендуется разрабатывать таким образом, чтобы они содержали только единственный компонент выбора. Если вариант списка содержит более одного компонента выбора, то вызывающему абоненту рекомендуется также предложить варианты отдельно с каждым из компонентов выбора.

Пример — Сообщение «Чтобы заказать этот товар и списать его стоимость с Вашей кредитной карты, нажмите 1» является непонятной возможностью выбора для пользователя, который хочет заказать товар, но не хочет оплачивать его стоимость со своей кредитной карты. В данный момент, вызывающий абонент не может знать, будут ли ему предоставлены другие варианты, которые соответствуют его потребностям. Вместо этого, лучше воспроизвести запрос абоненту о том, хочет ли он заказать товар, а затем — дополнительный запрос, который запросит информацию о предпочтительном способе оплаты.

9.2.12 Дополнительные варианты (опции)

Если перечислены не все варианты, рекомендуется уведомить об этом абонента и предоставить ему средства идентификации дальнейших вариантов.

Примечание 1 — В системах с ограниченным набором вариантов, вызывающему абоненту предоставляют наиболее часто используемые варианты вместе с вариантом получения списка дополнительных опций.

Примечание 2 — Для систем с речевым управлением с большим набором опций абоненту представляют ограниченный набор опций-примеров.

ГОСТ Р ИСО 9241-154-2015

Содержание

1 Область применения.................................................................1

2 Нормативные ссылки.................................................................1

3 Термины и определения ..............................................................1

4 Соответствие требованиям стандарта...................................................7

5 Системы голосовых сообщений........................................................7

6 Ввод информации ...................................................................7

7 Речевой ввод .......................................................................8

8 Тональный набор...................................................................10

9 Вывод информации.................................................................11

10 Навигация........................................................................17

11 Помощь..........................................................................19

12 Доступ к специалисту ..............................................................19

13 Обратная связь ...................................................................21

14 Ошибки..........................................................................24

Приложение А (справочное) Обзор стандартов серии ИСО 9241 ..............................28

Приложение В (справочное) Ошибки распознавания речи в разработке голосового меню.........29

Приложение ДА (справочное) Сведения о соответствии ссылочных международных стандартов

национальным стандартам Российской Федерации...........................31

Библиография.......................................................................32

9.2.13 Неиспользование избыточных инструкций

В системах голосового меню с речевым управлением рекомендуется избегать использования избыточных инструкций о том, как следует говорить.

Примечание 1 — Избыточное поощрение вызывающих абонентов к свободной естественной речи увеличивает застенчивость абонентов и, как следствие, абоненты говорят даже менее естественно и менее свободно, чем обычно.

Примечание 2 — Распознавание речи лучше всего работает с четкими, естественными речевыми данными, введенными пользователем.

9.2.14 Грамматический набор и термины, используемые в запросах

9.2.14.1 Введение

Термины, используемые в данном разделе (например, «нажмите» и «введите»), могут быть переведены на язык целевой совокупности пользователей для того, чтобы учесть специфику языка.

Примечание — Документ ETSI ES 202-076 обеспечивает эквивалентность терминов на разных языках для многих терминов, используемых в настоящем стандарте.

9.2.14.2 Словарный запас запроса

В запросы рекомендуется включать лишь тот словарный запас, который, скорее всего, понимает целевая аудитория пользователей.

Примечание — Распространенной ошибкой при разработке приложений голосового меню является использование жаргонных слов и выражений из технической области, которые хорошо знакомы разработчикам, но незнакомы неспециалистам.

9.2.14.3 Последовательность в использовании терминов

Используемые термины рекомендуется согласовывать во всех приложениях, интегрированных в системе.

Пример — Если приложение голосового меню, приложение для обмена сообщениями и приложение для пейджинга соединены вместе в один сервис, система должна использовать одни и те же термины во всех трех приложениях.

9.2.14.4 Изменения терминов в зависимости от географического расположения

Если есть вероятность того, что при использовании определенного приложения вызов абонента будет переведен или соединен с различными географическими пунктами, рекомендуется использовать термины в максимально возможной степени подходящие для тех пунктов.

Примечание — Язык несколько отличается в разных частях страны. Если подавляющее большинство абонентов живут в одной географической области, целесообразно приспосабливать приложения к местным языковым особенностям. Тем не менее, осуществлять такие действия нецелесообразно, если предполагается, что значительная доля вызовов будет переведена из одного географического пункта в другой.

9.2.14.5 Использование в запросах термина «нажмите»

Термин «нажмите» необходимо использовать, когда абонента просят нажать одну клавишу (например, чтобы выбрать опцию из приведенного списка).

9.2.14.6 Использование в запросах термина «введите»

Термин «введите» рекомендуется использовать в запросах, когда абонента просят ввести данные, требующие нажатий нескольких клавиш (например, для ввода номера счета). Термин «введите» также рекомендуется использовать в приложениях, которые по одинарному нажатию клавиши «#» воспринимают выбор по умолчанию.

Пример — «Для запуска сервиса с завтрашнего дня нажмите клавишу «решетка». В противном случае, пожалуйста, введите нужные даты сервиса».

Примечание 1 — В действительности, когда одним нажатием клавиши «#» вводят значение по умолчанию, подразумевается нажатие нескольких клавиш (т. е. опция по умолчанию плюс клавиша «#»).

Примечание 2 — Термин «набрать» иногда употребляют в запросах телефонного номера.

9.2.14.7 Использование термина «оставьте сообщение»

Термин «оставьте сообщение» рекомендуется использовать, когда абонента просят, чтобы он оставил записанное сообщение.

Введение

Настоящий стандарт устанавливает требования и содержит положения, относящиеся к системам голосового меню (системам IVR¹), которые могут включать различное сочетание голосовых технологий и различаются по способам использования телефона^{2 3}) в качестве механизма передачи информации. Эти положения не предполагают визуального отображения информации для пользователя над кнопками телефонного аппарата за исключением текстовых телефонов, которые имеют дисплей для визуального отображения обратной связи.

Хотя чрезвычайно важно, чтобы разработчики пользовательского интерфейса голосового меню учитывали культурные и языковые особенности пользователей, соответствующих целевой совокупности пользователей, эти аспекты выходят за рамки настоящего стандарта и не учтены в нем. Кроме того, поскольку автоматическое распознавание речи (ASR⁴) работает по-разному для различных языков, и данная технология продолжает совершенствоваться, детали положений, относящихся к проектированию пользовательского интерфейса ASR по большей части не рассматриваются в настоящем стандарте. Содержание настоящего стандарта сосредоточено на проектировании диалога голосового меню и касается только тех вопросов проектирования пользовательского интерфейса ASR, которые влияют на структуры диалога.

Для пользователей с ограниченными возможностями использование современных систем голосового меню создают значительные проблемы доступа. Часть положений настоящего стандарта разработана специально для людей с ограниченными возможностями, в частности для глухих или с нарушениями слуха.

Положения настоящего стандарта соответствуют требованиям ИСО/МЭК 13714.

Системы голосового меню стали распространенными средствами обслуживания потребителей в конце восьмидесятых годов 20 века. Такие системы созданы для уменьшения, либо исключения необходимости присутствия человека путем автоматизации функций, которые обычно осуществляют специалисты технической поддержки по телефону, обрабатывая обращения пользователей.

Таким образом, пользователи могут выполнять такие действия, как уточнение расписания поездов, заказ книги или сообщение о проблемах с обслуживанием кабельного телевидения, взаимодействуя с системой голосового меню. Кроме того, с помощью использования голосового меню часто автоматизируют функцию маршрутизации вызовов, чтобы абоненты могли соединяться с необходимым отделом сопровождения для решения конкретных вопросов.

Настоящий стандарт устанавливает требования к разработке диалога «человек—система IVR» и соответствующих тем. На рисунке 1 показано, что абоненты обычно взаимодействуют с системой голосового меню с помощью одного из двух методов: голосового или тонального ввода с кнопок телефонного аппарата. В системе голосового меню с речевым вводом задействована система распознавания речи, которая анализирует речь вызывающего абонента. При отсутствии в системе IVR возможности речевого ввода, она обычно распознает только тональный ввод с кнопок телефонного аппарата или, иногда, текстовый ввод с терминала. Системы IVR с речевым вводом данных появились относительно недавно. Многие системы способны принимать как тональный, так и речевой ввод данных в рамках диалога с абонентом (пользователем). Система IVR формирует ответ с помощью аппаратного обеспечения и/или программного обеспечения и передает его в виде синтезированного, оцифрованного или записанного голоса вызывающему абоненту и часто может содержать другие звуки. Тот факт, что в этих приложениях предполагается отсутствие отображения информации абоненту, создает определенные проблемы разработчикам диалогов из-за перекладывания на абонента действий по навигации внутри приложения, обработке и запоминанию соответствующей информации без помощи каких-либо средств визуального отображения.

ГОСТ Р ИСО 9241-154-2015

			Система голосового меню
	Речь		Компонент автоматического
		>	распознавания речи		Голосовое
Абонент					меню
Абонент	Тональный набор		Распознаватель DTMF-		Программное
		>	сигналов	>	обеспечение и базы
					данных
	Речь / Музыка / Звук		Система воспроизведения звука оцифрованной,		данных
	S		записанной или синтезированной речи	*ч

Рисунок 1 — Система голосового меню

Настоящий стандарт содержит требования и положения по разработке диалога голосового меню с распознаванием речи и тональным вводом. Поэтому стандарт сконцентрирован на интерфейсе между абонентом, программным обеспечением и базами данных голосового меню, которые работают на аппаратном и программном обеспечении распознавания речи и/или тонального ввода, и которые передают речевой вывод вызывающему абоненту. Как системы распознавания речи, так и системы распознавания тонального ввода накладывают ограничения на структуру диалога голосового меню. Эти ограничения были учтены при разработке положений настоящего стандарта. Тем не менее, в общем случае настоящий стандарт не предназначен для разработки структуры пользовательских интерфейсов распознавания речи и тонального ввода по двум причинам: первая — технология, особенно систем ASR, еще развивается, и вторая — многие пользовательские интерфейсы распознавания речи разработаны для применения с видеодисплеем (например, приложения распознавания речи диктофона), наличия которого приложения голосового меню не предполагают.

Наконец, большая часть положений для диалога с речевым вводом предполагает использование совместно с голосовым меню на основе грамматики. Хотя некоторые из принципов применяются в естественных языковых системах (т. е. приложениях, использующих статистические языковые модели), подробные положения для разработки этих приложений не включены в настоящий стандарт потому, что распознавание естественного языка реализовано с помощью другой технологии, и применение естественного языка в голосовом меню с речевым вводом еще находится в стадии совершенствования. Существует специфика структуры диалогов, основанных на технологии распознавания речи. В дополнение к этому существуют некоторые аспекты структуры приложений, специфичные для диалогов на естественном языке (основанных на грамматике).

НАЦИОНАЛЬНЫЙ СТАНДАРТ РОССИЙСКОЙ ФЕДЕРАЦИИ

ЭРГОНОМИКА ВЗАИМОДЕЙСТВИЯ человек—система Часть 154

Применение интерактивного голосового меню

Ergonomics of human-system interaction. Part 154. Interactive voice response applications

Дата введения — 2016—12—01

1 Область применения

Настоящий стандарт устанавливает требования к разработке пользовательского интерфейса приложений голосового меню (далее — систем IVR¹)). Стандарт охватывает обе существующие разновидности систем IVR по способу ввода: посредством тонального набора и с помощью автоматического распознавания речи (ASR²)). Это в равной степени применимо ко всем случаям, в которых инициатором вызова выступает либо абонент, либо сама система IVR (например, в некоторых приложениях телемаркетинга).

Настоящий стандарт предполагает использование совместно с ИСО/МЭК 13714.

Примечание — Область применения настоящего стандарта шире, чем у ИСО/МЭК 13714, которая ограничена системами голосовых сообщений.

2 Нормативные ссылки

В настоящем стандарте использованы нормативные ссылки на следующие стандарты:

ИСО/МЭК 13714 Информационные технологии. Обработка документов и связанная с этим передача данных. Интерфейс пользователя и услуги, основанные на телефонной связи. Применение речевых сообщений (ISO/IEC 13714:1995, Information technology — Document processing and related communication — User interface to telephone-based services — Voice messaging applications)

МСЭ-Т Рекомендации E-161 Размещение цифровых, буквенных знаков и символов на наборных табло телефонных аппаратов и других устройств, используемых для получения доступа к телефонной сети. (ITU-T E 161, Arrangement of digits, letters and symbols on telephones and other devices that can be used for gaining access to a telephone network)

3 Термины и определения

В настоящем стандарте применены следующие термины с соответствующими определениями:

3.1 объявление (announcement): Информационное сообщение, которое передается вызывающему абоненту, но не побуждает его к каким-либо действиям.

Примечание 1 — Некоторые промышленные стандарты не делают различий между объявлением и запросом, рассматривая их как запросы или сообщения.

^ ) IVR — interactive voice response (англ, голосовое меню или дословно интерактивный речевой ответ). ²) ASR — automatic speech recognition (англ, автоматическое распознавание речи).

Издание официальное

Примечание 2 — Объявление инструктирует вызывающего абонента, исключая последующий ввод данных от него (см. 3.33).

3.2 автоматическое распознавание речи; ASR (automatic speech recognition, automated speech recognition, ASR): Преобразование произнесенных слов в набор данных, понятных для машин (машинно-читаемый ввод).

3.3 прерывание (воспроизведения сообщения) (barge-in): Способность системы IVR принимать ввод данных во время воспроизведения сообщения.

Примечание 1 — Воспроизведение сообщения мгновенно прекращается, и система реагирует на ввод

данных абонентом.

Примечание 2 — См. 3.13 и 3.43. Термин «прерывание» является синонимом термина «сквозной набор» для систем, использующих тональный ввод данных. Он также является синонимом термина «сквозное речевое управление» для систем использующих речевой ввод данных.

3.4 вызывающий абонент (caller): Подключенный к системе голосового меню и взаимодействующий с ней позвонивший пользователь телефонной связи, а также пользователь, который был вызван с помощью телефонного сервиса.

Примечание 1 — В системах голосового меню понятие вызывающий абонент является синонимом понятия пользователь.

3.5 инструктаж (для дикторов) (coaching): Инструкции дикторам, записывающим сообщения (запросы, объявления), для обеспечения требуемых интонаций при записи сообщений.

3.6 сцепленные (составные) сообщения (concatenated prompts): Сообщения, полученные слиянием нескольких простых запросов или объявлений.

Примечание 1 — Сцепленные сообщения обычно используют для передачи динамической информации (информации, изменяющейся во времени или в зависимости от раннее введенных данных).

3.7 уровень достоверности (confidence level): Степень уверенности, с которой система распознавания речи возвращает результат для конкретного речевого ввода.

Примечание 1 — См. коэффициент достоверности (3.8).

Примечание 2 — Уровни достоверности часто определяют диапазонами коэффициентов достоверности, которые обычно разделяют на высокий, средний, низкий. Эти значения затем используют для управления ответами системы голосового меню, включая прием, отклонение и подтверждение речи абонента.

3.8 коэффициент достоверности (confidence score): Значение в баллах, устанавливаемое системой автоматического распознавания речи и отражающее степень соответствия результата распознавания исходному высказыванию абонента.

Примечание —Для всех принятых от абонента данных, система ASR возвращает список потенциальных слов-кандидатов или фраз с цифровым коэффициентом, характеризующим вероятность корректного результата распознавания.

3.9 непрерывное распознавание речи (continuous speech recognition): Распознавание речи, допускающее непрерывный ввод слов или фраз.

Примечание — При таком распознавании речи не требуются паузы некоторой минимальной продолжительности в начале или конце слов или фраз (кроме пауз, обычно встречающихся в естественных языковых шаблонах). Сравните — дискретное распознавание речи (3.16).

3.10 восстановление диалога (conversational repair): Способность системы IVR устранять разрывы диалога, которые происходят из-за ошибок речевого или тонального ввода, путем использования последующего ввода данных абонентом для определения следующего подходящего этапа диалога.

Пример — Абонент звонит в систему заказа билетов и на запрос о пункте назначения сообщает «Буффало». Система IVR отвечает: «Вы хотите поехать в Чикаго, правильно?» В ответ абонент говорит: «Нет, в Буффало». Если система использует восстановление диалога, она сможет определить, что абонент предоставил «корректирующие» входные данные и сможет попытаться распознать эти данные и использовать их для продолжения диалога. Вариант последующего ответа системы: «Извините, вы имели в виду Буффало. Сообщите удобное для Вас время отправления.», вместо того, чтобы вновь задавать звонящему первоначальный вопрос: «Куда Вы хотите поехать?».

ГОСТ Р ИСО 9241-154-2015

3.11 ошибка удаления (при распознавании речи) (deletion error): Вариант ошибки распознавания, когда часть речи абонента ошибочно удалена или пропущена модулем распознавания речи.

3.12 опережающий набор, опережающий тональный ввод данных (dial-ahead): Способность системы IVR воспринимать от абонента тональный ввод данных до того, как система запросит такой ввод.

Примечание 1 — Система будет использовать тональный ввод данных от абонента в том порядке, в каком эти данные были введены абонентом. Это позволяет вызывающему абоненту осуществить ввод данных без необходимости прослушивания соответствующих сообщений.

Примечание 2 — См. опережающий речевой ввод (3.42).

3.13 одновременный набор, одновременный тональный ввод данных (dial-through): Способность систем IVR на основе тонального ввода воспринимать ввод данных от абонента во время воспроизведения запроса или объявления.

Примечание 1 — См. одновременный голосовой ввод данных (3.43) и прерывание (3.3).

Примечание 2 — В ответ на одновременный ввод данных абонентом воспроизведение фразы прекращается, и система реагирует на нажатую клавишу номеронабирателя.

3.14 оцифрованная речь (digitized speech): Цифровая запись человеческой речи.

Примечание — Оцифрованную речь следует отличать от понятий: синтезированная речь (3.40), записанная речь (3.35), текст, преобразованный в речь (3.45).

3.15 речевой маркер (метка) (discourse marker): Слово, фраза или звук используемые для оповещения вызывающего абонента о том, что началось воспроизведение нового запроса или объявления, и система ожидает от него ввода данных.

Примечание — Наиболее часто употребляемые речевые метки: «хорошо», «а теперь», «далее».

3.16 дискретное распознавание речи (discrete speech recognition): Распознавание речи, которое для корректного распознавания речевого ввода данных подразумевает необходимость паузы (с некоторой минимальной продолжительностью) в начале и в конце слова или фразы для распознавания.

Примечание —Данный термин является противоположным по отношению к термину «непрерывное распознавание речи» (3.9).

3.17 двухтональный мульти частотный код; DTMF (dual tone multiple frequency, DTMF): Тональные сигналы от клавиш номеронабирателя телефонного аппарата.

3.18 динамическая грамматика (dynamic grammar): Грамматика, используемая для распознавания речи, которая не предопределена заранее.

Пример — Абоненту предлагается произнести указанные номера для пополнения грамматики и грамматика состоит только из номеров, произнесенных этим абонентом, а не всех возможных числовых комбинаций.

Примечание — Обычно создается в реальном времени на основе меняющихся данных.

3.19 определение границ речевого ввода (end-pointing): Процесс определения начала и окончания речевого ввода.

Примечание — В системе голосового меню начало речи обычно обозначают как начало и конец речи — как конец.

3.20 наполнение (enrolment): Процедура выполнения абонентом обучающего ввода данных для абонент-ориентированных систем распознавания речи, требующих обучения до начала эксплуатации.

3.21 явное подтверждение (explicit confirmation): Подтверждение ввода данных в систему голосового меню, при котором абоненту предлагается подтвердить ввод данных.

Примечание — Противоположность по отношению к неявному подтверждению (3.23).

3.22 грамматика, грамматический набор (grammar): Набор синтаксических, а иногда и морфологических правил, определяющих все высказывания вызывающего абонента, охваченные системой распознавания речи.

Примечание — Грамматика определяет допустимые изменения слов, используемых для ввода данных, которые распознает приложение.

3.23 неявное подтверждение (implicit confirmation): Метод подтверждения ввода данных в систему голосового меню, при котором система голосового меню реагирует на ввод данных от абонента так, как если бы эти данные были корректными.

Пример 1 — Если абонент выбрал из меню «баланс», чтобы указать, что он желает, чтобы система предоставила ему баланс его банковского счета, реакция голосового меню: «Ваш баланс составляет 45215 рублей» неявно указывает, что система правильно распознала запрос о «балансе», в отличие от любой другой информации о банковском счете.

Пример 2 — Абонент: «Завтра». — Система голосового меню: «В какое время вы хотите завтра уехать?»

Примечание 1 — При неявном подтверждении, абонент узнает, какой ввод был получен системой голосового меню с помощью ее последующего действия (воспроизведения сообщения).

Примечание 2 — Неявные подтверждения — это естественный способ ускорить диалог. Тем не менее, в случае ошибки (неподтверждения пользователем ошибочно распознанных данных), механизм восстановления диалога с пользователем в полной мере не ясен.

3.24 ошибка вставки (insertion error): Ошибка распознавания речи, когда одно или несколько слов в результате распознавания речи не соответствуют слову (или последовательности слов) в высказывании говорящего.

3.25 голосовое меню (интерактивное голосовое меню); IVR (interactive voice response, IVR): Программное обеспечение, с которым взаимодействует вызывающий абонент через телефонную линию, которое воспроизводит заранее записанную и/или динамически сформированную речь и которое умеет воспринимать тональный или речевой ввод данных от абонента.

3.26 (навигационная) метка (landmark): Короткая фраза или звук в голосовом меню, выступающие как начало раздела диалога голосового меню, которые могу быть использованы для облегчения навигации (перемещения, передвижения) вызывающего абонента по приложению голосового меню.

Пример — Короткая фраза «Информация о счете», «Служба ремонта».

3.27 сообщение (message): Информация в системе голосового меню предоставляемая системой, другими абонентами, подписчиками или системными администраторами вызывающему абонента.

Примечание — Сообщениями считают как запросы (требующие ответной реакции), так и объявления (не требующие выполнения каких-либо действий).

3.28 смешанная инициатива (mixed initiative): Ситуация, при которой в потоке событий взаимодействия в системе голосового меню, инициатива может принадлежать как вызывающему абоненту, так и системе.

3.29 распознавание естественного языка (natural language understanding, NLU): Технология, используемая для распознавания определенных слов и фраз речи вызывающего абонента так, как если бы он говорил с другим человеком.

Примечание — Хотя распознавание естественного языка на самом деле не является пониманием речи вызывающего абонента, оно используется совместно с другими технологиями для извлечения данных о том, что имеет в виду абонент.

3.30 открытый диалог (open-ended dialogue): Диалог, не ограничивающий вербальный ответ вызывающего абонента.

Пример — «Чем я могу Вам помочь?»

Примечание — Открытый диалог обычно используют вместе с распознаванием естественного языка (3.29).

3.31 персонаж (persona): (В голосовом меню) Набор индивидуальных, присущих человеку характеристик (иногда называемых голосовыми особенностями), передаваемых приложением¹) посредством произносимых запросов или объявлений, а также словарный выбор для запросов и другие стилистиче-ские/эстетические свойства голосового меню.

¹¹ Приложением (или прикладной программой) называется программа, предназначение которой заключается в выполнении пользовательских задач.

ГОСТ Р ИСО 9241-154-2015

Примечание — В приложениях голосового меню персонаж отличается от персонажа, который используется в других областях разработки интерфейса человек—компьютер. Персонаж приложения голосового меню, сообщающий абоненту сведения о компании или организации, находящейся в центре внимания этого приложения (например, центр банковских услуг, компания розничных продаж), представлен голосом, который читает запросы и объявления в приложении. В других ситуациях разработки интерфейса человек—компьютер, персонаж — это подробное описание репрезентативного пользователя, которое используют при разработке приложения.

3.32 включение примеров (priming): Включение фраз с примерами и другие техники запросов, используемые с целью влияния на стиль и продолжительность высказывания вызывающего абонента в системах голосового меню с поддержкой речевого ввода.

Пример 1 — Приложение голосового меню банка предлагает вызывающему абоненту произнести наименование пункта меню, который абонент может выбрать с помощью системы с помощью специальных слов, которые предпочтительно должен произнести вызывающий абонент: «Вы можете оплатить счет, проверить баланс своего счета или пополнить счет».

Пример 2 — «Скажите, что Вы хотели бы сделать. Вы можете произнести «Оплатить счет», «Проверить баланс» или «Пополнить счет». В этом случае приложение точно указывает абоненту, что он может сказать.

Примечание — Как правило, включение примеров используют для открытых диалогов.

3.33 запрос (prompt): Выход системы, требующий от вызывающего абонента ввода данных.

Примечание 1 — Противоположным выходом системы является объявление (3.1).

Примечание 2 — Термин «запрос» часто используют в общем смысле для обозначения любого сообщения, которое воспроизводит голосовое меню.

3.34 ошибка распознавания (recognition error): Общий термин, обозначающий любую ошибку, допущенную системой автоматического распознавания речи.

Примечание 1 — Ошибки замещения, удаления, вставки и отклонения представляют собой более конкретные типы ошибок распознавания речи.

3.35 записанная речь (recorded speech): Записанная и сохраненная в памяти системы речь человека.

Примечание 1 — Данный термин является противоположным к терминам: синтезированная речь (3.40), оцифрованная речь (3.14) и текст, преобразованный в речь (3.45).

Примечание 2 — Иногда записанную речь называют «консервированной речью».

3.36 ошибка отклонения (rejection error): Ошибка распознавания речи, при которой система автоматического распознавания речи не может распознать произнесенное высказывание, несмотря на использование правильного словарного набора.

3.37 абонент-ориентированная система (speaker dependent): Система распознавания речи, в которой созданы различные акустические модели для каждого говорящего, использующего систему.

3.38 состояние (state): Сохранение неизмененными контекстных свойств приложения голосового меню в течение заданного периода времени.

Примечание 1 — Под приложением голосового меню часто понимают набор отдельных состояний и переходов из одного состояния в другое. Текущее состояние определяет предмет взаимодействия и допустимые события ввода от абонента. Состояние внутри голосового меню, как правило, связано с определенным выходом системы (см. сообщение (3.27)). Состояние внутри голосового меню — это выполнение внутренних функций системы с соответствующим набором возможных событий ввода от абонента (то есть допустимого ввода DTMF-сигналов и/или активного словарного запаса или грамматического набора) и множества переходов, вызванных событиями, которые и инициируют переключение в другое конкретное состояние голосового меню.

[Адаптированное определение по: ИСО 14915-3: 2002, 3.6.11.]

3.39 ошибка замещения (substitution error): Ошибка распознавания речи, при которой слово или последовательность слов в высказывании говорящего ошибочно распознаны как другое слово или последовательность слов из активной лексики (словаря) распознавателя речи.

3.40 синтезированная речь (synthesized speech): Компьютерно-генерируемая речь, которая полностью синтезирована (сформирована) компьютером или построена из фрагментов записанной человеческой речи.

) TDD — telecommunication device for the deaf.

^ IVR — interactive voice response (англ, голосовое меню или дословно интерактивный речевой ответ)

> Под телефоном и телефонным аппаратом в настоящем стандарте понимаются любые современные средства связи (смартфоны и пр.) при их работе в режиме телефона (телефонного аппарата).

) ASR — automatic speech recognition (англ, автоматическое распознавание речи)

ГОСТ Р ИСО 9241-154-2015
Эргономика взаимодействия человек-система. Часть 154. Применение интерактивного голосового меню

Оглавление

Этот ГОСТ находится в:

Организации:

Ergonomics of human-system interaction. Part 154. Interactive voice response applications

ГОСТ Р ИСО 9241-154-2015Эргономика взаимодействия человек-система. Часть 154. Применение интерактивного голосового меню

Оглавление

Этот ГОСТ находится в:

Организации:

Ergonomics of human-system interaction. Part 154. Interactive voice response applications

ЭРГОНОМИКА ВЗАИМОДЕЙСТВИЯ ЧЕЛОВЕК—СИСТЕМА

Применение интерактивного голосового меню

ГОСТ Р ИСО 9241-154-2015

4 Соответствие требованиям стандарта

5 Системы голосовых сообщений

6 Ввод информации

6.1 Введение

6.2 Информирование абонента о допустимых способах ввода информации с текстового

6.3 Недопустимость дублирования (повторного) ввода информации

6.4 Использование информации, имеющейся в системе, для повышения эффективности

6.5 Изменение введенной информации

7 Речевой ввод

7.1 Выбор словаря для голосового меню с речевым вводом

7.2 Фонетически различающийся словарь для приложений голосового меню с поддержкой речевого ввода

7.3 Грамматика для отдельных состояний приложения

7.4 Синонимы в грамматических наборах

ГОСТ Р ИСО 9241-154-2015

7.5 Использование динамических грамматических наборов

7.6 Регистрация (внесение в списки)

7.6.1 Введение

7.6.2 Регистрация в среде использования

7.6.3 Регистрация с использованием повторения

7.7 Определение границ речевого ввода и чередование

7.8 Обработка тайм-аутов речевого ввода данных

7.9 Голосовые меню с речевым вводом и тональный набор

8 Тональный набор

8.1 Оповещение о возможности тонального ввода данных

8.2 Назначение клавиши-разделителя вводимых данных

8.3 Клавиша «#» при вводе данных фиксированной длины

8.4 Использование тайм-аута для тонального набора вводимых данных переменной

8.5 Назначение клавиш для утвердительных и отрицательных ответов

ГОСТ Р ИСО 9241-154-2015

8.6 Назначение клавиш для функции получения помощи от специалиста службы

поддержки

8.7 Минимизация количества клавиш, нажимаемых вызывающим абонентом

9 Вывод информации

9.1 Общие положения для запросов и объявлений

9.1.1 Краткость информации

9.1.2 Группировка информации

9.1.3 Интонация и другие аспекты речи

9.1.4 Скорость речи

9.1.5 Простые лингвистические формы

9.1.6 Разумное использование вежливости в запросах на ввод данных

9.1.7 Завершение вызова

9.1.8 Качество звука запросов и объявлений

9.1.9 Постоянство уровней громкости звука запросов и объявлений

9.1.10 Восприятие абонента

ГОСТ Р ИСО 9241-154-2015

9.1.11 Персонаж

9.1.12 Повторение запросов и объявлений

9.1.13 Повторение частей длинного запроса и объявления

9.1.14 Запросы и объявления для пользователей текстовых телефонов

9.1.15 Выбор языка

9.1.16 Язык сообщений для текстового терминала (телефонного аппарата)

9.2 Подсказки и сообщения

9.2.1 Порядок расположения пунктов в списках опций

9.2.2 Порядок назначения клавиш для списка опций

9.2.3 Порядок размещения целей и действий в запросах

9.2.4 Интонация и другие аспекты произношения

9.2.5 Интонация и другие аспекты произношения для сцепленных сообщений

9.2.6 Интонация и другие аспекты произношения для указания очередности

9.2.11 Неполный набор вариантов (опций)

9.2.12 Дополнительные варианты (опции)

9.2.13 Неиспользование избыточных инструкций

9.2.14 Грамматический набор и термины, используемые в запросах

Введение

ГОСТ Р ИСО 9241-154-2015

ГОСТ Р ИСО 9241-154-2015

ГОСТ Р ИСО 9241-154-2015
Эргономика взаимодействия человек-система. Часть 154. Применение интерактивного голосового меню