Товары в корзине: 0 шт Оформить заказ
Стр. 1 

95 страниц

639.00 ₽

Купить ГОСТ Р 56047-2014 — бумажный документ с голограммой и синими печатями. подробнее

Распространяем нормативную документацию с 1999 года. Пробиваем чеки, платим налоги, принимаем к оплате все законные формы платежей без дополнительных процентов. Наши клиенты защищены Законом. ООО "ЦНТИ Нормоконтроль"

Наши цены ниже, чем в других местах, потому что мы работаем напрямую с поставщиками документов.

Способы доставки

  • Срочная курьерская доставка (1-3 дня)
  • Курьерская доставка (7 дней)
  • Самовывоз из московского офиса
  • Почта РФ

Распространяется на цифровые системы охранные телевизионные и устанавливает классификацию, общие требования и методы оценки алгоритмов компрессии оцифрованных аудиоданных. Стандарт устанавливает методику сравнения различных алгоритмов компрессии и декомпрессии оцифрованных аудиоданных. Стандарт применяют к алгоритмам компрессии и декомпрессии аудиоданных независимо от их реализации на аппаратном уровне. Стандарт применяют совместно c ГОСТ Р 51558.

 Скачать PDF

Оглавление

1 Область применения

2 Нормативные ссылки

3 Термины и определения

4 Общие требования

5 Классификация

6 Методы оценки алгоритмов компрессии

     6.1 Общее описание методов оценки

     6.2 Метрика PEAQ

     6.3 Метрика PSNR

     6.4 Метрика «коэффициент различия форм сигналов»

     6.5 Метрика «коэффициент сжатия»

7 Методы сравнения алгоритмов компрессии оцифрованных аудиоданных

Приложение А (обязательное) Математическое описание алгоритмов расчета метрик оценки качества алгоритмов компрессии аудиоданных

     А.1 Алгоритм расчета метрики PEAQ

     А.2 Алгоритм расчета метрики PSNR

     А.3 Алгоритм расчета метрики «коэффициент различия форм сигналов»

     А.4 Алгоритм расчета коэффициента сжатия

Приложение Б (рекомендуемое) Листинги программ расчета метрик качества аудиоданных

     Б.1 Листинг программы расчета метрики PEAQ на языке Matlab

     Б.2 Листинг программы расчета метрики PEAQ на языке С

     Б.3 Листинг программы расчета метрики PSNR на языке Matlab

     Б.4 Листинг программы расчета метрики PSNR на языке С

     Б.5 Листинг программы расчета метрики «Коэффициент различия форм сигналов» на языке Ма1аЬ

     Б.6 Листинг программы расчета метрики «Коэффициент различия форм сигналов» на языке С

Стр. 1
стр. 1
Стр. 2
стр. 2
Стр. 3
стр. 3
Стр. 4
стр. 4
Стр. 5
стр. 5
Стр. 6
стр. 6
Стр. 7
стр. 7
Стр. 8
стр. 8
Стр. 9
стр. 9
Стр. 10
стр. 10
Стр. 11
стр. 11
Стр. 12
стр. 12
Стр. 13
стр. 13
Стр. 14
стр. 14
Стр. 15
стр. 15
Стр. 16
стр. 16
Стр. 17
стр. 17
Стр. 18
стр. 18
Стр. 19
стр. 19
Стр. 20
стр. 20
Стр. 21
стр. 21
Стр. 22
стр. 22
Стр. 23
стр. 23
Стр. 24
стр. 24
Стр. 25
стр. 25
Стр. 26
стр. 26
Стр. 27
стр. 27
Стр. 28
стр. 28
Стр. 29
стр. 29
Стр. 30
стр. 30

ГОСТР

56047-

2014

ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ТЕХНИЧЕСКОМУ РЕГУЛИРОВАНИЮ И МЕТРОЛОГИИ

НАЦИОНАЛЬНЫЙ

СТАНДАРТ

РОССИЙСКОЙ

ФЕДЕРАЦИИ

Системы охранные телевизионные

КОМПРЕССИЯ ОЦИФРОВАННЫХ АУДИОДАННЫХ

Классификация. Общие требования и методы оценки алгоритмов

Издание официальное

Москва Станда рти нформ 2015

Предисловие

1    РАЗРАБОТАН Закрытым акционерным обществом «Нордавинд» и Всероссийским научно-исследовательским институтом стандартизации и сертификации в машиностроении (ВНИИНМАШ)

2    ВНЕСЕН Техническим комитетом по стандартизации ТК 234 «Системы тревожной сигнализации и противокриминальной защиты»

3    УТВЕРЖДЕН И ВВЕДЕН В ДЕЙСТВИЕ Приказом Федерального агентства по техническому регулированию и метрологии от 30 июня 2014 г. № 677-ст

4    ВВЕДЕН ВПЕРВЫЕ

Правила применения настоящего стандарта установлены в ГОСТ Р 1.0-2012 (раздел 8). Информация об изменениях к настоящему стандарту публикуется в годовом (по состоянию на 1 января текущего года) информационном указателе «Национальные стандарты», а официальный текст изменений и поправок — в ежемесячно издаваемом информационном указателе «Национальные стандарты». В случае пересмотра (замены) или отмены настоящего стандарта соответствующее уведомление будет опубликовано в ближайшем выпуске ежемесячного информационного указателя «Национальные стандарты». Соответствующая информация, уведомление и тексты размещаются также в информационной системе общего пользования — на официальном сайте Федерального агентства по техническому регулированию и метрологии (gost.ru)

© Стандартинформ.2015

Настоящий стандарт не может быть полностью или частично вопроизведен. тиражирован или распространен в качестве официального издания без разрешения Федерального агентства по техническому регулированию и метрологии

ГОСТ Р 56047-2014

Рисунок 3 — Общая схема реализации метода оценки алгоритма компрессии на основе разделения аудиоданных

6.2 Метрика PEAQ

6.2.1    Метрика PEAQ предназначена для оценки качества обработанного сигнала относительно исходного с учетом слуховых особенностей человека (психоакустической модели). Метрика должна быть рассчитана в соответствии с А. 1 (приложение А).

6.2.2    Для расчета метрики PEAQ к аудиосигналам предъявляют следующие требования:

-    исходный и восстановленный аудиосигналы должны иметь частоту дискретизации равную 48000 Гц. Для сигналов с частотой отличной от указанной необходимо предварительно выполнить передискретизацию аудиосигнала;

-    исходный и восстановленный аудиосигналы должны иметь одинаковую длину, т. е. состоять из одного и того же количества оцифрованных значений.

6.3    Метрика PSNR

6.3.1    Метрика PSNR выражает количественную характеристику отношения энергии шума (искажений). вносимого процессом кодирования, к максимально возможной энергии исходного сигнала. Значения метрики PSNR измеряют в децибелах. Метрика должна быть рассчитана в соответствии с А.2 (приложение А).

6.3.2    Для расчета метрики PSNR к аудиосигналам предъявляют следующие требования:

-    исходный и восстановленный аудиосигналы должны иметь частоту дискретизации равную 44100 Гц. Для сигналов с частотой, отличной от указанной, необходимо предварительно выполнить передискретизацию аудиосигнала;

-    если исходный и восстановленный аудиосигналы многоканальные, то используют только один канал исходного аудиосигнала и соответствующий ему один канал восстановленного аудиосигнала.

6.4    Метрика «коэффициент различия форм сигналов»

6.4.1 Разница соседних последовательных значений амплитуд исходного аудиосигнала, полученных в результате импульсно-кодовой модуляции, и разница соседних последовательных значений амплитуд восстановленного аудиосигнала определяют соответственно форму исходного аудиосигнала и форму восстановленного аудиосигнала в последовательные моменты времени. Конечное значение метрики «коэффициента различия форм сигналов» подсчитывают как суммарную среднеквадратичную

7

ошибку между формой исходного аудиосигнала и формой восстановленного аудиосигнала. Метрика должна быть рассчитана в соответствии с А.З (приложение А).

6.4.2 Для расчета метрики «коэффициент различия форм сигналов» к аудиосигналам предъявляют следующие требования:

-    исходный и восстановленный аудиосигналы должны иметь частоту дискретизации равную 44100 Гц. Для сигналов с частотой, отличной от указанной, необходимо предварительно выполнить передискретизацию аудиосигнала;

-    если исходный и восстановленный аудиосигналы многоканальные, то для расчета метрики используют только один канал исходного аудиосигнала и соответствующий ему один канал восстановленного аудиосигнала.

6.5 Метрика «коэффицент сжатия»

6.5.1    Метрика «коэффициент сжатия»предназначена для характеристики качества алгоритма компрессии с точки зрения уменьшения объема занимаемой исходными аудиоданными памяти после их обработки алгоритмом сжатия. Метрика должна быть рассчитана в соответствии с А.4 (приложение А).

7 Методы сравнения алгоритмов компрессии оцифрованных аудиоданных

7.1    Два и более алгоритмов компрессии сравнимы друг с другом, если они принадлежат одному и тому же классу в соответствии с таблицей 1.

7.2    Из двух и более сравниваемых алгоритмов компрессии лучшим признают алгоритм, обеспечивающий лучшие значения хотя бы двух из трех метрик, приведенных в таблице 1. Лучшим значением метрики признают большее значение — для метрик PSNR и PEAQ и меньшее значение — для метрики «коэффициент различия форм сигналов». Если сравниваемые алгоритмы имеют одинаковые значения метрик качества, приведенных в таблице 1. то лучшим считают алгоритм с наибольшей степенью сжатия, определяемой коэффицентом сжатия по 6.5.

8


Приложение А (обязательное)


Математическое описание алгоритмов расчета метрик оценки качества алгоритмов компрессии аудиоданных

А.1 Алгоритм расчета метрики PEAQ

А.1.1 Обозначения, используемые в алгоритме:

Fs = 48000 Гц — частота дискретизации сигналов;

Nf = 2048 — количество оцифрованных значений сигнала, определяющих длину звукового фрагмента (размер фрейма);

х[л] — оцифрованные данные фрейма, где п — целое число, представляющее собой индекс конкретного значения амплитуды сигнала внутри звукового фраг мен га (фрейма), п е(0. Nt - 1).

покадровый шаг вперед: Npl2 = 1024, таким образом перекрытие фреймов составляет 50 %;

Fss = Fs/1024 —частота выборки кадров с учетом покадровою шага;

Nc= 109 — количество частотных полос фильтрации.

А.1.2 Расчет метрики должен состоять из пяти этапов:

I    — предварительная обработка сигналов;

II    — обработка образов;

III    — расчет выходных значений психоакустической модели;

IV    — нормирование значений выходных переменных психоакустической модели;

V    — оценка качества восстановленного сигнала с помощью искусственной нейронной сети.

А.1.2.1 Предварительная обработка сигналов

А.1.2.1.1 Применение оконного преобразования

Исходные оцифрованные данные разбивают на фреймы. Оцифрованные данные каждого фрейма подвергают масштабированному оконному преобразованию Ханна, h^ по формуле


Л.(и) = n8/3 h [п. Л/,).


(А.1)


где h[n, NF] — функция, рассчитываемая по формуле


в остальных случаях


(А.2)


Переход в частотную область осуществляют путем применения дискретного преобразования Фурье (ДПФ) X [*] по формуле


= ***'*• NF п-о


(АЗ)


гдеО^Л <NF- 1;


у — мнимая единица.

А. 1.2.1.2 Модель наружного и среднего уха

Частотную характеристику наружного и среднего уха W(0 вычисляют по формуле


(А.4)


где f— частота, заданная в кГц. а Аав(0 вычисляют по формуле



(А.5)


По формуле (А.4) вектор весовых коэффициентов W(At) вычисляют следующим образом:



(А.6)


гдеО^*^^.


9



Используя веса, рассчитанные по формуле (А.6). вычисляют взвешенную энергию ДПФ \ХJk)\* по формуле:

|XJft]| * =    (А.7)

где 0

2

Gl = 2.794-10'3.

А. 1.2.1.3 Разложение критической полосы слуха

Для преобразования частоты сигнала в высоту звука используют шкалу Барка. Расчет следует производить по формуле (А.8). для обратного преобразования — по формуле (А.9)

г = 8(0 = 7 asinh (/7650).    (А.8)

где г — высота звука, измеряемая в Барках.

f - B~'(z) = 650sinh(z /7).    (А.9)

Полосы частот определяют заданием нижней, центральной и верхней частот каждой полосы и их значение по шкале Барка определяют по формулам


4‘) = zL + ibz,


... _ZL ♦ (/ г 1)Д*. / * is


*1/. ~ZL

Дz


(A.10)

(All)


в остальных случаях.


zc[j] u*oVl-*£\

где ±z = 1/4;

zu=B^

(L = 80Гц;

Fu = 18 кГц.

Обратное преобразование выполняют по формулам


(А. 12)


ЯЛ-а-’да.

у/1-e-VcPD.


a'l-e-'w))

где/* 1.2.....Л/с= 109.

Вклад энергии от /с-ой основной частоты ДПФ U[i, Л) для г-й полосы частот вычисляют по формуле


(А. 13) (А-14) (А. 15)


maJo.rnkWJ/).2* *1 F>*} -тах    1    F%

up. Я) *-J-L—2 у_L 2 *


Энергию г-й полосы частот Ea[i) вычисляют по формуле


£.[<) = mn-lx.lW ♦ *1 l4l*)l^4HlxjO)1l2.

*-м<и


где С/Дг) = 1Д/. АД/));

ед-и/.у/п.

Конечную формулу энергии г'-й полосы частот ЕЛр] вычисляют по формуле


(А-16)


(А-17)


EJf) = max(EJ/). E„J.    (А.    18)

где Emjn«1.10-4

А. 1.2.1.4 Внутренний шум уха

Для компенсации внутренних шумов в самом ухе. следует ввести надбавочное значение Е„Д/) для энергии каждой полосы частот. E[i):


ЕР )в£*Р1 ♦£*(/).    (А.    19)

где внутренний шум Е,[г) моделируют следующим образом:



= 1456(^000) o e.

(ej/j .lot'-wwo


Энергии £[/] — образы высоты.

А. 1.2.1.5 Энергии распространений в пределах одного фрейма

Характеристику энергии распространении в шкапе Барка £,[/'] рассчитывают по формуле

Е,И-5-(Е11[/|»£„(ЛР.


W ej/'J — характеристика рассчитываемая по формуле


где E[i) — надбавочные значении энергий из (А. 19);

EJ0] устанавливают равным 1;

S(i, /. £) — характеристика рассчитываеман по формуле


1

4(/.£)


S(»./.£) = <


(Ю2.7Д,)М

( Я-Ц'

(10 гш) 10 W4

(£**“)

1


/5/.

Ш


' 1 ам

L '

^Е)1*и*сЧМЕ)1 \


/£/.

i S/.


-2014

(А. 20)

(А.21) (А. 22)

(А. 23)


где (дли упрощении записи выражении) aL = 102 7v; аи • 10

ай

ас(/) = Ю ае = £°-2tf.

Тогда А-1 (/. £) преобразуется по формуле

4-V. £)= 1а[Ч    ac[/]af (£))' 1 -1

/-0 1-1


= 1-at<'-,» + l-(auac(/]aE(£)/<= ’-1 1-at1    1-ауас[/)ае(£)


Слагаемые £^[/] и £жСД/) из формулы (А.21) вычисляют по формулам

^-ьайР

Л/е-2.....0.

е«|''"е‘('+,)*(ет)Г


Энергии £,(< ] в дальнейшем в тексте стандарта — образы нераспространенных возбуждений.

А.1.2.1.6 Фильтрации энергии

Фильтрацию энергии вычислнют по формулам

£,(/. л) = о [/ )£,[/. п - I) ♦ (1 - о [/))EJi. л].

Et[i. л] = max (£,[/. л). £,[/. л])

где л — индекс фрейма (фреймы проиндексированы, начинай с л = 0);

£,(», л] — энергия л-то фрейма, соответствующая формуле (А.21); а (/] — постоянная времени для угасающей энергии. Начальное условие для фильтрации: £,[/. -1) = 0. л) — конечные значения (образы возбуждений в дальнейшем).


(А. 24)

(А-25)

(А-26) (А. 27)

(А.28) (А. 29)


А 1.2.1.7 Постоянные времени

Постоянную времени т (/] для фильтрации f-й полосы вычисляют по формуле

ж100 .

tNsTne, + —(т,о°-0.


(А 30)


гДе т100

т


= 0.03 с; = 0.008 с.


Постоянную времени для угасающей энергии и [/ ] следует вычислять по формуле


«[/'] = ехр


(А 31)


На рисунке А 1 приведена схема предварительных вычислений.



Рисунок А. 1 — Схема предварительных вычислений


12


ГОСТ Р 56047-2014

Содержание

1    Область применения...................................................1

2    Нормативные ссылки..................................................1

3    Термины и определения................................................1

4    Общие требования....................................................3

5    Классификация......................................................4

6    Методы оценки алгоритмов компрессии.......................................5

6.1    Общее описание методов оценки........................................5

6.2    Метрика PEAQ....................................................7

6.3    Метрика PSNR....................................................7

6.4    Метрика «коэффициент различия форм сигналов».............................7

6.5    Метрика «коэффициент сжатия»........................................8

7    Методы сравнения алгоритмов компрессии оцифрованных аудиоданных.................8

Приложение А (обязательное) Математическое описание алгоритмов расчета метрик оценки

качества алгоритмов компрессии аудиоданных.........................9

А.1 Алгоритм расчета метрики PEAQ........................................9

А.2 Алгоритм расчета метрики PSNR.......................................23

А.З Алгоритм расчета метрики «коэффициент различия    форм сигналов»................23

А.4 Алгоритм расчета коэффициента сжатия..................................24

Приложение Б (рекомендуемое) Листинги программ расчета метрик качества аудиоданных......25

Б.1 Листинг программы расчета метрики PEAQ на языке    Matlab......................25

Б.2 Листинг программы    расчета метрики PEAQ на языке С.........................50

Б.З Листинг программы    расчета метрики PSNR на языке Matlab......................89

Б.4 Листинг программы    расчета метрики PSNR на языке С.........................89

Б.5 Листинг программы    расчета метрики «Коэффициент различия форм сигналов»

на языке Matlab.....................................................89

Б.6 Листинг программы расчета метрики «Коэффициент различия форм сигналов» на языке С . . 90

III

Введение

Активное применение в системах охранных телевизионных (СОТ) методов компрессии оцифрованных аудиоданных, заимствованных из мультимедийных применений телевидения, из-за низкого качества восстановленных после компрессии оцифрованных аудиоданных привело к невозможности осуществления следственных мероприятий, а также оперативных функций, с использованием отдельных СОТ.

Важной отличительной особенностью методов компрессии оцифрованных аудиоданных для СОТ является необходимость обеспечения высокого качества звука в восстановленных аудиоданных. Настоящий стандарт позволяет упорядочить существующие и разрабатываемые методы компрессии оцифрованных аудиоданных, предназначенные для применения в составе систем противокриминаль-ной защиты.

В качестве критерия для классификации алгоритмов компрессии оцифрованных аудиоданных в настоящем стандарте установлены значения метрик качества, характеризующих степень отклонения восстановленных оцифрованных данных от соответствующих им исходных аудиоданных.

Методика классификации алгоритмов компрессии оцифрованных аудиоданных, приведенная в настоящем стандарте, основана на оценке качества восстановленных аудиоданных, с учетом психоакустических особенностей человеческого слуха. Этот подход к оценке качества восстановленных аудиоданных рекомендован Сектором радиосвязи Международного союза электросвязи (МСЭ-Р), членом которого является Российская Федерация.

IV

НАЦИОНАЛЬНЫЙ СТАНДАРТ РОССИЙСКОЙ ФЕДЕРАЦИИ

Системы охранные телевизионные

КОМПРЕССИЯ ОЦИФРОВАННЫХ АУДИОДАННЫХ

Классификация. Общие требования и методы оценки алгоритмов

Video surveillance systems. Digital audio data compression. Classification. General requirements and evaluation algorithm methods

Дата введения — 2015—09—01

1    Область применения

Настоящий стандарт распространяется на цифровые системы охранные телевизионные (далее — ЦСОТ) и устанавливает классификацию, общие требования и методы оценки алгоритмов компрессии оцифрованных аудиоданных.

Настоящий стандарт устанавливает методику сравнения различных алгоритмов компрессии и декомпрессии оцифрованных аудиоданных.

Настоящий стандарт применяют к алгоритмам компрессии и декомпрессии аудиоданных независимо от их реализации на аппаратном уровне.

Настоящий стандарт применяют совместно с ГОСТ Р 51558.

2    Нормативные ссылки

В настоящем стандарте использованы нормативные ссылки на следующие стандарты:

ГОСТ 15971 Системы обработки информации. Термины и определения

ГОСТ Р 51558 Средства и системы охранные телевизионные. Классификация. Общие технические требования. Методы испытаний

Примечание — При пользовании настоящим стандартом целесообразно проверить действие ссылочных стандартов в информационной системе общего пользования — на официальном сайте Федерального агентства по техническому регулированию и метрологии в сети Интернет или по ежегодному информационному указателю«Национальиыесгандаргы».которыйопубликованпосостояниюна 1 января текущего года, и по выпускам ежемесячного информационного указателя «Национальные стандарты» за текущий год. Если заменен ссылочный стандарт, на который дана недатированная ссылка, то рекомендуется использовать действующую версию этого стандарта с учетом всех внесенных в данную версию изменений. Если ссылочный стандарт отменен без замены. то положение, в котором дана ссылка на него, рекомендуется применять в части, не затрагивающей эту ссылку.

3    Термины и определения

В настоящем стандарте применены термины по ГОСТ 15971 и следующие термины с соответствующими определениями:

3.1 алгоритм быстрого преобразования Фурье (БПФ) (fast Fourier transform. FFT): Набор алгоритмов, реализация которых приводит к существенному уменьшению вычислительной сложности дискретного преобразования Фурье (ДПФ).

Примечание — Смысл быстрого преобразования Фурье состоит в том. чтобы разбить исходный N-отсчетный сигнал х(п) на два более коротких сигнала, дискретные преобразования Фурье которых могут быть скомбинированы таким образом, чтобы получить дискретное преобразования Фурье исходного N-отсчетного сигнала.

Издание официальное

3.2    алгоритм декомпрессии (decompression algonthm): Точный набор инструкций и правил, описывающий последовательность действий, согласно которым сжатые аудиоданные преобразуются в восстановленные, реализуемый при помощи аудио декодера.

3.3    алгоритм компрессии (compression algonthm): Точный набор инструкций и правил, описывающий последовательность действий, согласно которым исходные аудиоданные преобразуются в сжатые. реализуемый при помощи аудио кодера.

3.4    амплитудно-временная метрика (time-amplitude metric): Метрика качества, основанная на сравнении оцифрованных и восстановленных аудиоданных по форме волны.

3.5    аналого-цифровой преобразователь, АЦП (analog-to-digital converter. ADC): Устройство, преобразующее входной аналоговый аудиосигнал в оцифрованные аудиоданные.

3.6    аудио декодер (audio decoder): Программные, аппаратные или аппаратно-программные средства. с помощью которых осуществляется декомпрессия сжатых аудиоданных.

3.7    аудио кодер (audio encoder): Программные, аппаратные или аппаратно-программные средства. с помощью которых осуществляется компрессия оцифрованных аудиоданных.

3.8    аудиоданные (audio data), аудиосигнал (audio signal), моноканальный аудиосигнал (mono channel audio): Аналоговый сигнал, несущий информацию об изменении во времени амплитуды звука.

3.9    битрейт (bitrate): Выраженная в битах оценка количества сжатых аудиоданных, определенная для некоторого временного интервала и отнесенная к длительности выбранного временного интервала в секундах.

3.10    восстановленные аудиоданные (recovered audio data): Данные, полученные из сжатых аудиоданных после их декомпрессии.

3.11    декомпрессия сжатых аудиоданных (decompression of compressed digitized audio data): Восстановление оцифрованных данных из сжатых аудиоданных.

3.12    дискретное преобразование Фурье, ДПФ (discrete Fourier transform. DFT): Преобразование, ставящее в соответствием отсчетам дискретного сигнала N отсчетов дискретного спектра сигнала.

3.13    дифференциация (differentia): Выделение частного из общей совокупности по некоторым признакам.

3.14    искаженный фрейм (distorted frame): Фрейм, для которого максимальное отношение шума к порогу маскирования превышает 1.5 дБ.

3.15    искусственная нейронная сеть (artificial neural network. ANN): Модель биологической нейронной сети, которая представляет собой сеть элементов — искусственных нейронов — связанных между собой синаптическими соединениями.

Примечание — Нейронная сеть предназначена для обработки входной информации и в процессе изменения своего состояния во времени формирует совокупность выходных сигналов.

3.16    качество восстановленных аудиоданных (decoded audiodata quality): Объективная оценка соответствия восстановленных аудиоданных исходным оцифрованным аудиоданным на основе рассчитанных метрик качества.

3.17    кодек аудиоданных (audiocodec): Программный, аппаратный или аппаратно-программный модуль, способный выполнять как компрессию, так и декомпрессию аудиоданных.

3.18    компрессия (сжатие) оцифрованных аудиоданных (digitzed audio data compression): Обработка оцифрованных аудиоданных с целью уменьшения их объема.

3.19    компрессия оцифрованных аудиоданных без потерь (lossless digitized audio compression): Обработка оцифрованных аудиоданных, при которой не происходит потери информации, вследствие чего восстановленные (в результате выполнения декомпрессии) оцифрованные аудиоданные не отличаются от исходных оцифрованных аудиоданных.

3.20    компрессия оцифрованных аудиоданных с потерями (lossy compression of digitized audio data): Обработка оцифрованных аудиоданных, при которой происходит потеря информации, и вследствие этого восстановленные (в результате выполнения декомпрессии) оцифрованные аудиоданные отличаются от исходных оцифрованных аудиоданных.

3.21    метод оценки алгоритма компрессии (evaluation method of compression algorithm): Метод аналитического определения значений метрик качества на соответствие требованиям, предъявляемым к алгоритмам компрессии аудиоданных.

3.22    метрика качества (quality metric): Аналитически определяемые параметры, характеризующие степень отклонения восстановленных аудиоданных от исходных оцифрованных аудиоданных.

3.23    многоканальный аудиосигнал (multi-channel audio): Аудиосигнал, состоящий из объединения определенного количества аудиосигналов (каналов), которые несут информацию об одном и том же звуке.

ГОСТ Р 56047-2014

Примечание — Предназначен для более качественной передачи звука с учетом пространственной ориентации.

3.24    окно (window): Весовая функция, которая используется для управления эффектами, обусловленными наличием боковых лепестков в спектральных оценках (растеканием спектра).

Примечание — Имеющуюся конечную запись данных или имеющуюся конечную корреляционную последовательность удобно рассматривать как некоторую часть соответствующей бесконечной последовательности, видимую через применяемое окно.

3.25    оконное преобразование Ханна (short-time Fourier transform with Hann window): Дискретное преобразование Фурье с весовой функцией — окном Ханна.

3.26    оцифрованные аудиоданные (digitized audio data): Данные, полученные путем аналого-цифрового преобразования аудиоданных, представляющие собой последовательность байтов в некотором формате (WAV или др.).

3.27    передискретизация аудиосигнала (resampling): Изменениечастотыдискретизацииаудио-сигнала.

3.28    пиковое отношение сигнал/шум (peak-to-peak signat-to-noise ratio): Соотношение между максимумом возможного значения сигнала и мощностью шума.

3.29    порог маскирования (masking threshold): Пороговый уровень сигнала, не различаемого человеком из-за эффекта психоакустического маскирования.

3.30    психоакустическая модель (psychoacoustics model): Модель для сжатия аудиоданных с потерями, использующая особенности восприятия звука человеческим ухом.

3.31    психоакустическое маскирование (psychoacoustics masking): Подавление (сокрытие) при определенных условиях одного звука другим звуком из-за особенностей восприятия звука человеческим ухом.

3.32    разрядность АЦП (resolution of ADC): Количество бит. которым кодируется каждый отсчет сигнала в процессе АЦП.

3.33    сжатые аудиоданные (compressed audio data): Данные, полученные путем компрессии оцифрованных аудиоданных.

3.34    спектр сигнала (frequency spectrum): Результат разложения сигнала на простые синусоидальные функции (гармоники).

3.35    спектрограмма (spectrogram): Характеристика плотности мощности сигнала в частотно-временном пространстве.

3.36    степень сжатия (compressionratio): Коэффициент сокращения объема оцифрованных аудиоданных в результате компрессии.

3.37    стереофонический двухканальный аудиосигнал (stereophonic audiosignal), стерео аудиосигнал (stereo audio signal), двухканальный аудиосигнал (two-channel audio signal): Многоканальный аудиосигнал, состоящий из двух моноканальных аудиосигналов.

3.38    формат оцифрованных аудиоданных (digitized audio data format): Представление оцифрованных аудиоданных, обеспечивающее их обработку цифровыми вычислительными средствами.

3.39    фрейм (frame): Фрагмент звукового сигнала с заданным количеством значений (длиной фрейма).

3.40    частота дискретизации (sample rate): Частота взятия последовательных значений непрерывного во времени сигнала при его аналого-цифровом преобразовании в оцифрованные аудиоданные.

3.41    частотно-временная метрика (time-frequency metric): Метрика качества, основанная на сравнении спектрограмм оцифрованных и восстановленных аудиоданных.

3.42    шум (noise): Совокупность апериодических звуков различной интенсивности и частоты, не несущая полезную информацию.

4 Общие требования

4.1    Оценку качества восстановленных после сжатия аудиоданных определяют по качеству каждого отдельного звукового фрагмента восстановленных аудиоданных.

4.2    Размер звукового фрагмента определяется в секундах или количеством оцифрованных значений внутри фрагмента.

4.3    Качество звукового фрагмента восстановленных аудиоданных определяют по значениям метрик качества алгоритмов компрессии оцифрованных аудиоданных (далее — метрики качества), харак-

3

теризующих степень искажения восстановленных после сжатия аудиоданных в сравнении с исходными оцифрованными аудиоданными. Описание метрик приведено в разделе 6 настоящего стандарта, а порядок их расчета приведен в приложении А.

4.4 Алгоритмы компрессии оцифрованных аудиоданных относят к одному из трех классов, установленных в разделе 5 настоящего стандарта.

5 Классификация

5.1 Класс алгоритма компрессии оцифрованных данных определяют по рассчитанным для него значениям метрик качества. Для оценки качества восстановленных аудиоданных и классификации алгоритмов компрессии используют метрики качества, указанные в таблице 1.

Таблица 1 — Диапазоны значений метрик качества по классам алгоритмов компрессии оцифрованных аудиоданных

Метрика качества

Диапазон значений метрик качества по классам алгоритмов компрессии оцифрованных аудиоданных

Класс III

Класс II

Класс 1

Пиковое отношение сигнал/шум (PSNR). дБ

Менее 30

[30; 40]

Свыше 40

Коэффициент различия форм сигналов

Более 10“*

[КГ5; 10-*]

Менее 10-5

Объективная оценка аудиоданных с точки зрения восприятия (PEAQ)

[-3.98; -2.3)

(-2.3; -0.62]

(-0.62; 0.22]

1

Примечание — Метрики качества отражают изменения оцифрованных аудиоданных (после их обработки алгоритмами компрессии и декомпрессии), которые могут оказать критическое влияние на возможность использования восстановленных аудиоданных для установления наличия звуковых сигналов, дифференциации звуков и речи.

5.2    В зависимости от значений метрик качества, вычисленных в ходе проведения их оценки, алгоритм компрессии оцифрованных аудиоданных относят к одному из классов:

-    класс III — алгоритмы компрессии, обеспечивающие качество восстановленных аудиоданных, достаточное для установления наличия звуковых сигналов и не уступающее в этом качеству исходных аудиоданных, но создающее помехи при дифференциации звуков, понимании речи.

-    класс II — алгоритмы компрессии, обеспечивающие качество восстановленных аудиоданных, достаточное для установления наличия звуковых сигналов, дифференциации звуков, речи и не уступающее в этом качеству исходных аудиоданных, но отличимое от качества исходных аудиоданных;

-    класс I — полнофункциональные алгоритмы компрессии, обеспечивающие качество восстановленных аудиоданных, неотличимое от качества исходных аудиоданных.

5.3    Значения метрик качества определяют для каждого звукового фрагмента (длиной 5 с) оцифрованных аудиоданных, а в качестве результирующей оценки восстановленных аудиоданных выбирают наименьшее значение для метрик PSNR и PEAQ и наибольшее значение для коэффициента различия форм сигналов.

Для расчета метрик PSNR и коэффициента различия форм сигналов исходные и восстановленные цифровые аудиоданные должны быть представлены с частотой дискретизации 44100 Гц. 16 битами памяти на одно дискретное значение выборки и с одним звуковым каналом. Длина звукового фрагмента 5 с должна включать в себя 220500 оцифрованных значений.

Для расчета метрики PEAQ исходные и восстановленные цифровые аудиоданные должны быть представлены с частотой дискретизации 48000 Гц. 16 битами памяти на одно дискретное значение выборки и с одним или с двумя звуковыми каналами. Длина звукового фрагмента 5 с должна включать в себя 240000 оцифрованных значений для каждого канала.

Для сигналов с частотой, отличной от требуемой, необходимо предварительно выполнить передискретизацию аудиосигнала.

5.4    Алгоритмы компрессии следует различать по степени сжатия, выражаемой через коэффициент сжатия. Коэффициент сжатия определяют как отношение объема исходных несжатых данных к объему сжатых данных (порядок расчета данной метрики выполняют в соответствии с А 4 (приложение А)].

4

ГОСТ Р 56047-2014

В зависимости от значения коэффициента сжатия алгоритмы компрессии аудиоданных подразделяют на:

-    алгоритмы с высокой степенью сжатия — коэффициент сжатия более 42;

-    алгоритмы со средней степенью сжатия — коэффициент сжатия от 15 до 42 включительно;

-    алгоритмы с низкой степенью сжатия — коэффициент сжатия менее 15.

6 Методы оценки алгоритмов компрессии

6.1 Общее описание методов оценки

Общая схема работы ЦСОТ при использовании алгоритмов компрессии и декомпрессии представлена на рисунке 1.

Рисунок 1 — Общая схема работы ЦСОТ

Аналоговые аудиоданные подвергают аналогово-цифровому преобразованию, в результате которого получают оцифрованные аудиоданные с определенной частотой дискретизации и количеством битов на одно дискретное оцифрованное значение. На компьютере оцифрованные аудиоданные следует хранить в одном из форматов хранения оцифрованных аудиоданных.

Оцифрованные аудиоданные подвергают компрессии, в результате которой формируют сжатые аудиоданные.

Сжатые аудиоданные используют для хранения архива или для передачи по сети, после чего их подвергают декомпрессии. В результате декомпрессии сжатых аудиоданных получают восстановленные аудиоданные, которые используют для воспроизведения оператору и подают на вход программным модулям анализа аудиоданных.

В соответствии с представленной общей схемой работы ЦСОТ классификацию алгоритмов компрессии оцифрованных аудиоданных осуществляют путем оценки метрик качества восстановленных аудиоданных от исходных оцифрованных аудиоданных. В зависимости от особенностей технической реализации конкретной ЦСОТ существует два метода оценки: с разделением оцифрованных аудиоданных и с разделением аудиоданных.

Перед оценкой значений метрик качества оба аудиосигнала (исходный и восстановленный) должны быть преобразованы в сигналы с частотой дискретизации 44100 и 48000 Гц. Для указанных частот количество бит. приходящееся на одно дискретное оцифрованное значение, должно быть равным 16.

6.1.1 Метод оценки алгоритма компрессии на основе разделения оцифрованных аудиоданных

Для применения данного метода техническая реализация ЦСОТ должна позволять получить оцифрованные аудиоданные до их обработки алгоритмами компрессии и декомпрессии.

5

Рисунок 2 — Общая схема реализации метода оценки на основе разделения оцифрованных аудиоданных

Общая схема реализации метода оценки алгоритма на основе разделения оцифрованных аудиоданных представлена на рисунке 2.

Оценку алгоритма выполняют в последовательности:

-    на вход испытуемой ЦСОТ подают последовательные аудиоданные;

-    оцифрованные и восстановленные аудиоданные сохраняют на устройствах хранения;

-    выполняют расчет значений метрик качества и осуществляют классификацию алгоритма компрессии по таблице 1. Описания метрик приведены в 6.2—6.5. Метрики должны быть рассчитаны в соответствии с приложением А.

6.1.2 Мотод оценки алгоритма компрессии на основе разделения аудиоданных

Метод оценки алгоритма компрессии на основе разделения аудиоданных следует применять в случае. если техническая реализация ЦСОТ не позволяет применять метод оценки на основе разделения оцифрованных аудиоданных. Применение данного метода требует наличия дополнительной ЦСОТ в составе испытательного стенда, которая предназначена для сохранения оцифрованных аудиоданных.

Общая схема реализации метода оценки на основе разделения аудиоданных представлена на рисунке 3.

Оценку алгоритма компрессии выполняют в последовательности:

-    на вход испытуемой ЦСОТ подают последовательные аудиоданные, которые автоматически дублируются на другую ЦСОТ посредством делителя аудиосигнала, являющегося элементом испытательного стенда;

-    восстановленные аудиоданные сохраняют на устройствах хранения ЦСОТ;

-    оцифрованные аудиоданные сохраняют на устройствах хранения с использованием возможностей второй ЦСОТ (из состава испытательного стенда);

-    выполняют расчет значений метрик качества и осуществляют классификацию алгоритма компрессии по таблице 1. Описания метрик приведены в 6.2—6.5. Метрики должны быть рассчитаны в соответствии с приложением А.

6