Товары в корзине: 0 шт Оформить заказ
Стр. 1 

109 страниц

700.00 ₽

Купить ГОСТ Р 54712-2011 — бумажный документ с голограммой и синими печатями. подробнее

Распространяем нормативную документацию с 1999 года. Пробиваем чеки, платим налоги, принимаем к оплате все законные формы платежей без дополнительных процентов. Наши клиенты защищены Законом. ООО "ЦНТИ Нормоконтроль"

Наши цены ниже, чем в других местах, потому что мы работаем напрямую с поставщиками документов.

Способы доставки

  • Срочная курьерская доставка (1-3 дня)
  • Курьерская доставка (7 дней)
  • Самовывоз из московского офиса
  • Почта РФ

Предназначен для регулирования отношений между оператором и пользователем в процессе установления соединения в части выполнения технических требований к электрическим параметрам, определяющим качество каналов и трактов звукового вещания с полосой передаваемых частот до 20 000 Гц. Стандарт используется при проектировании, вводе в эксплуатацию и техническом обслуживании каналов и трактов звукового вещания студийного качества (с полосой частот до 20 000 Гц), организуемых в наземных и спутниковых линиях на магистральной, внутризоновых и местных сетях связи. Действие документа распространяется на услуги местной, внутризоновой, междугородной и международной сети звукового вещания, независимо от используемой сетевой технологии. Это способствует обеспечению целостности сетей звукового вещания, устойчивости работы сети, выполнению норм на основные электрические параметры при разработке и проектированию каналообразующей аппаратуры звукового вещания (ГОСТ Р 52742-2007 и ГОСТ Р 53537-2009). Показатели, определенные документом, являются базовыми для профессиональной и бытовой аппаратуры - проигрывателей компакт-дисков, усилителей сигналов звуковой частоты и другого оборудования класса Hi-Fi.

 Скачать PDF

Оглавление

1 Область применения

2 Нормативные ссылки

3 Термины, определения, символы и сокращения

     3.1 Термины и определения

     3.2 Символы и сокращения

     3.3 Метод описания синтаксиса потока битов

4 Задачи по совершенствованию обработки цифровых сигналов звукового вещания с целью повышения качества передачи

4.1 Требования к расширению ГОСТ Р 54711 для поддержки низких частот дискретизации

4.2 Требования к расширению ГОСТ Р 54711 для поддержки многоканального звука

Приложение А (обязательное) Схемы

Приложение Б (обязательное) Таблицы

Приложение В (обязательное) Процесс кодирования

Приложение Г (обязательное) Психоакустические модели

Приложение Д (обязательное) Использование дополнительных данных

Библиография

 
Дата введения01.07.2013
Добавлен в базу01.10.2014
Актуализация01.01.2021

Этот ГОСТ находится в:

Организации:

13.12.2011УтвержденФедеральное агентство по техническому регулированию и метрологии873-ст
РазработанФГУП ЛО ЦНИИС
ИзданСтандартинформ2014 г.

Digital Sound broadcasting. Coding of sound broadcasting signals with redundancy reduction for transfer on digital communication channel. MPEG-2 a part III (MPEG-2 audio)

Стр. 1
стр. 1
Стр. 2
стр. 2
Стр. 3
стр. 3
Стр. 4
стр. 4
Стр. 5
стр. 5
Стр. 6
стр. 6
Стр. 7
стр. 7
Стр. 8
стр. 8
Стр. 9
стр. 9
Стр. 10
стр. 10
Стр. 11
стр. 11
Стр. 12
стр. 12
Стр. 13
стр. 13
Стр. 14
стр. 14
Стр. 15
стр. 15
Стр. 16
стр. 16
Стр. 17
стр. 17
Стр. 18
стр. 18
Стр. 19
стр. 19
Стр. 20
стр. 20
Стр. 21
стр. 21
Стр. 22
стр. 22
Стр. 23
стр. 23
Стр. 24
стр. 24
Стр. 25
стр. 25
Стр. 26
стр. 26
Стр. 27
стр. 27
Стр. 28
стр. 28
Стр. 29
стр. 29
Стр. 30
стр. 30

ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ТЕХНИЧЕСКОМУ РЕГУЛИРОВАНИЮ И МЕТРОЛОГИИ

ГОСТР

54712—

2011

НАЦИОНАЛЬНЫЙ

СТАНДАРТ

РОССИЙСКОЙ

ФЕДЕРАЦИИ

Звуковое вещание цифровое

КОДИРОВАНИЕ СИГНАЛОВ ЗВУКОВОГО ВЕЩАНИЯ С СОКРАЩЕНИЕМ ИЗБЫТОЧНОСТИ ДЛЯ ПЕРЕДАЧИ ПО ЦИФРОВЫМ КАНАЛАМ СВЯЗИ

MPEG-2 ЧАСТЬ III (MPEG-2 AUDIO)

1SO/1EC 13818=3:1998 (NEQ)

Издание официальное

Москва

Стандартинформ

2014

Предисловие

1    РАЗРАБОТАН Санкт-Петербургским филиалом Центрального научно-исследовательского института связи «Ленинградское отделение» (ФГУП ЛО ЦНИИС)

2    ВНЕСЕН Техническим комитетом по стандартизации ТК 480 «Связь»

3    УТВЕРЖДЕН И ВВЕДЕН В ДЕЙСТВИЕ Приказом Федерального агентства по техническому регулированию и метрологии от 13 декабря 2011 г. № 873-ст

4    Настоящий стандарт разработан с учетом основных нормативных положений международного стандарта ИСО/МЭК 13818-3:1998 «Информационные технологии. Универсальное кодирование движущихся изображений и сопутствующего аудио. Часть III. Аудио» (ISO/IEC 13818-3:1998 «Information technology - Generic coding of moving pictures and associated audio information - Part III. Audio») [1]

5    ВВЕДЕН ВПЕРВЫЕ

Правила применения настоящего стандарта установлены в ГОСТ Р 1.0-2012 (раздел 8). Информация об изменениях к настоящему стандарту публикуется в ежегодном (по состоянию на 1 января текущего года) информационном указателе «Национальные стандарты», а официальный текст изменений и поправок - в ежемесячном информационном указателе «Национальные стандарты». В случае пересмотра (замены) или отмены настоящего стандарта соответствующее уведомление будет опубликовано в ближайшем выпуске ежемесячного информационного указателя «Национальные стандарты». Соответствующая информация, уведомление и тексты размещаются также в информационной системе общего пользования - на официальном сайте Федерального агентства по техническому регулированию и метрологии в сети Интернет (gost.ru)

© Стандартинформ, 2014

Настоящий стандарт не может быть полностью или частично воспроизведен, тиражирован и распространен в качестве официального издания без разрешения Федерального агентства по техническому регулированию и метрологии

4.1.2 Спецификация кодированного звукового потока битов

4.1.2.1    Последовательность звукового сигнала См. ГОСТ Р 54711,5.1.1.

4.1.2.2    Фрейм звукового сигнала См. ГОСТ Р 54711,5.1.2.

4.1.2.3    Заголовок

См. ГОСТ Р 54711,5.1.3.

4.1.2.4    Проверка на ошибки См. ГОСТ Р 54711,5.1.4.

4.1.2.5    Данные звукового сигнала. Уровень I См. ГОСТ Р 54711,5.1.5.

4.1.2.6    Данные звукового сигнала. Уровень II См. ГОСТ Р 54711,5.1.6.

4.1.2.7    Данные звукового сигнала. Уровень III

Синтаксис

Количество

Мнемоника

битов

audio_data () {

main_data_begin if (mode==single_chanr>el)

8

uimsbf

private_bits

1

bslbf

else

private_bits

2

bslbf

for (ch=0; ch <nch; ch ++) {

part2_3_length[ch]

12

uimsbf

big_values[ch]

9

uimsbf

global_gain[ch]

8

uimsbf

scalefac_compress[ch]

9

bslbf

win do w_ s witch ing_ flag[ch] if (window_switching_flag[ch] == '1) {

1

bslbf

block_type[ch]

2

bslbf

mixed_block_flag[ch]

for (region= 0; region<2; region++)

1

uimsbf

table_select[ch][region]

5

bslbf

for (window=0; window<3; window++)

subblock_gain[ch][window]

}

else {

3

uimsbf

for (region= 0; region <3; region ++)

table_select[ch][region]

5

bslbf

regionO_count[ch]

4

bslbf

region 1_count[ch]

}

scalefac_scale[ch]

3

bslbf

1

bslbf

countltable_select[ch]

}

main_data ()

}

1

bslbf

Ниже определяется структура основного потока битов данных. Поле main_data в audio_data() содержит байты основных данных. Однако, из-за свойств кодов Хаффмана, используемых на Уровне III, основные данные кадра обычно не следуют непосредственно за заголовком и служебной информацией об этом кадре. Данные main_data начинаются в потоке битов перед заголовком фрейма при отрицательном смещении, заданном значением main_data_begin.

Синтаксис


Количество

битов


Мнемоника


main_data () {

for (ch= 0; ch<nch; ch++) {

if ((window_switching_flag[ch] == '1) &&

(block_type[ch] : if (mixed_block_flag[ch] == '1') { for (sfb=0; sfb <6; sfb++)


'W){


scalefac_l[ch][sfb] for (sfb= 3; sfib<12; sfb++)

for (window=0; window<3; window++) scalefac_s[ch][sfb][window]


0 ... 4


0 ... 5


uimsbf


uimsbf


else {


for (sfb= 0; sfib<12; sfb++)

for (window=0; window<3; window++) scalefac_s[ch][sfb][window]


0 ... 5


uimsbf


else {


for (sfb= 0; sfib<21; sfb++) scalefac_l[ch][sfb]


0 ... 5


uimsbf


}


Huffmancodebits ()

}

for (b= 0; b<no_of_ancillary_bits; b++) ancillary_bit


bslbf


4.1.2.8 Дополнительные данные

См. ГОСТ P 54711,5.1.8.

4.1.3 Семантика звукового потока битов

4.1.3.1    Последовательность звуковых сигналов

См. ГОСТ Р 54711,5.2.1.

Фрейм Уровня III с низкой частотой дискретизации содержит информацию только о 576 отсчетах в отличие от 1152 отсчетах фрейма Уровня III ГОСТ Р 54711.

4.1.3.2    Звуковой фрейм

См. ГОСТ Р 54711,5.2.2.

4.1.3.3    Заголовок

Первые 32 битова (четыре байта) являются заголовком, который одинаков для всех уровней.

syncword - см. ГОСТ Р 54711,5.2.3.

ID - Бит-идентификатор алгоритма. Равен Т для ГОСТ Р 54711, значение '0' означает режим малых частот дискретизации.

Layer-ГОСТ Р 54711,5.2.3.

protection_bit - см. ГОСТ Р 54711,5.2.3.

bitrate_index - Четыре бита, определяющие скорость передачи. При равенстве всех битов нулю устанавливается «свободный формат», при котором используется фиксированная скрость передачи, не указанная в списке. «Фиксированная» означает, что фрейм содержит или Л/, или Л/+1 слотов, в зависимости от значения битова дополнения. bitrate_index является индексом таблицы, которая одинакова для Уровней II и III, но отличается для Уровня I.

bitrate_index указывает на полную скорость передачи независимо от режима (стерео, joint_stereo, dual_channel, single_channel), в соответствии со следующей таблицей, верной при Ю==’0’:


9


bitratejndex

Скорость передачи, (кбит/с) для Fs = 16; 22,05; 24 кГц

Уровень 1

Уровни II и III

'0000'

Свободный

Свободный

'0001'

32

8

'0010'

48

16

'0011'

56

24

'0100'

64

32

'0101'

80

40

'0110'

96

48

'0111'

112

56

'1000'

128

64

'1001'

144

80

'1010'

160

96

'1011'

176

112

'1100'

192

128

'1101'

224

144

'1110'

256

160

'1111'

Запрещено

Запрещено

Декодер, работая в свободном режиме, не обязан поддерживать скорости передачи выше чем 256 кбит/с, 160 кбит/с, 160 кбит/с на Уровнях I, II и III соответственно.

sampling_frequency - Указывает на частоту дискретизации при ID == ‘0’, согласно следующей таблице:

sampling_frequency

Частота (кГц)

'00'

22,05

'01'

24

'10'

16

'11'

Зарезервировано

При смене частоты дискретизации возможен сброс аудио декодера.

padding_bit- см. ГОСТ Р 54711,5.2.3. Дополнение нулями необходимо при частоте дискретизации

22,05 кГц. Дополнение нулями может также требоваться в свободном формате. private_bit- см. ГОСТ Р 54711,5.2.3. mode -см. ГОСТ Р 54711,5.2.3. mode_extension - см. ГОСТ Р 54711,5.2.3. copyright - см. ГОСТ Р 54711,5.2.3. original/copy - см. ГОСТ Р 54711,5.2.3. emphasis - см. ГОСТ Р 54711,5.2.3.

4.1.3.4    Проверка на ошибки

Для Уровней I и II, см. ГОСТ Р 54711,5.2.4.

Для Уровня III, для проверки на ошибки используются следующие биты:

-    биты 16 ... 31 заголовка;

-    биты 0 ... 71 audio_dataдля режима single channel;

-    биты 0 ... 135 audio_data для других режимов.

4.1.3.5    Звуковые данные. Уровень I См. ГОСТ Р 54711,5.2.5.

4.1.3.6    Звуковые данные, Уровень II См. ГОСТ Р 54711,5.2.6.

4.1.3.7    Звуковые данные, Уровень III

См.ГОСТ Р 54711,5.2.7 за исключением различного определения scalefac_compress. scalefac_compress[ch] - Определяет количество битов, используемых для передачи масштабных коэффициентов, и устанавливает или сбрасывает префлаг. Если префлаг установлен, значения таблицы добавляются к масштабным коэффициентам, как описано в ГОСТ Р 54711, (таблица Б.6).

4.1.3.8    Дополнительные данные См. ГОСТ Р 54711,5.2.8.

ГОСТ P 54712-2011
4.1.4 Процесс декодирования звука

4.1.4.1    Декодирование звука. Уровни I и II

См. ГОСТ Р 54711,5.3.2, 5.3.3. Для Уровня II вместо таблиц Б.2 ГОСТ Р 54711 должна использоваться таблица Б.1 настоящего стандарта.

4.1.4.2    Декодирование звука. Уровень III

Декодирование уровня III при использовании низких частот дискретизации выполняется аналогично декодированию Уровня III в ГОСТ Р 54711 при следующих различиях.

1. При низких частотах дискретизации фрейм Уровня III содержит только одну гранулу, в отличие от ГОСТ Р 54711, где фрейм Уровня III состоит из двух гранул. Переменная ‘дг’ больше не существует. Число отсчетов на фрейм - 576. В связи с этим, константа, которая используется для вычисления длины фрейма, и алгоритм дополнения нулями должны быть изменены для уровня III в соответствии со следующей таблицей

Константа

Значения констант для Уровня III

ГОСТ Р 54711

Настоящий стандарт

slots_per_frame

144

72

frame_size

1152

576

2.    Если выбран режим intensity stereo, то максимальное значение интенсивностной позиции укажет на недопустимую позицию. Полосы масштабных коэффициентов в ГОСТ Р 54711 с недопустимой интенсивностной позицией должны декодироваться согласно уравнениям MS, в соответствии с ГОСТ Р 54711 раздел 5.5.5.2, если MS stereo включен, или оба канала независимы, если MS stereo не включен.

3.    Как и в ГОСТ Р 54711, последняя полоса масштабных коэффициентов, для которой не применяется интенсивностное кодирование, равна последней полосе масштабных коэффициентов правого канала, не являющейся полностью нулевой, и для которой соответствующий масштабный коэффициент не указывает на недопустимую интенсивностную позицию. Как в ГОСТ Р 54711, декодирование нижней границы при intensity stereo выполняется индивидуально для каждого окна в случае коротких блоков Оbiockjtype == '10'). Это означает, что, как и в ГОСТ Р 54711, 5.3.4, вычисление границы интенсивности применяется к значениям каждого короткого окна и допускается индивидуальное декодирование intensity stereo для короткого окна.

4.    Шаги 4 и 5 описанного процесса декодирования для декодирования intensity stereo изменены: шаг 4 Rj := Lf * кр

шаг 5 L, := Lj * kt.

Значения kj и кг вычисляются по переданному масштабному коэффициенту / is_possb следующим образом:

if (is_possb == 0)    /</=1,0    kr= 1,0

else if(is_posb % 2 == 1)    k, = L f,s-P°s    ,+1V2    k = 1,0

else    *,= 1,0    kr = ijs-P°sstj2

Коэффициент декодирования intensity stereo /0 определяется no intensity_scale (1/V2 for intensity_ scale == 1, else 1/VV2). Значение intensity_scale определяется из значения scalefac_compress правого канала:

intensity_scale = scalefac_compress % 2

5.    Масштабные коэффициенты

Масштабные коэффициенты декодируются в соответствии с slen 1, slen2, slenZ и sienA и nr_of_sfb 1, nr_of_sfb2, nr_of_sfb3, nr_of_sfb4, которые определяются из значений scalefac_compress.

Количество битов, используемых для кодирования масштабных коэффициентов, называется part2_length и вычисляется следующим образом:

part2_length = nr_of_s/Ы *s/en1 + nr_of_sfb2*slen2 + nr_of_sfb3*slen3 + nr_of_sfb4*slen4 Масштабные коэффициенты передаются в четырех разделах. Количество масштабных коэффициентов в каждом разделе (nr_of_sfb 1, nr_of_sfb2, nr_of_sfb3 и nr_of_sfb4), длина масштабных коэффициентов в каждом разделе (slen 1, slen2, slen3 и slen4) и префлаг декодируются по scalefac_compress согласно следующей процедуре:

11

ГОСТ P 54712-2011

if (\(((mode_extension == '01 ’) || (mode_extension == ‘11 ’)) && (ch==1))){ if (scalefac_compress < 400) {

blockjtype

mixed_block_flag

nr of sfb 1

nr_of_sfb2

nr_of_sfbZ

nr of sfb4

‘00’ ,’01711 ’

X

6

5

5

5

‘10’

0

9

9

9

9

‘10’

1

6

9

9

9


slen 1 = (scalefac_compress » 4) / 5 slen2 = (scalefac_compress » 4) % 5 s/елЗ = (scalefacjcompress % 16) »2 s/en4 = scalefacjcompress % 4 preflag = 0

}

blockjtype

mixed_block_flag

nr of sfb 1

nr of sfb2

nr of sfb3

nrjofjsfM

‘00’,’01’,’IT

X

6

5

7

3

‘10’

0

9

9

12

6

‘10’

1

6

9

12

6


if ((400 <= scalefac_compress) && (scalefac_compress < 500)) { slen 1 = ((scalefac_compress-400) » 2) / 5 s/en2 = ((scalefac_compress-400) » 2) % 5 s/en3 = (scalefac_compress-400) % 4 s/en4 = 0 preflag = 0

}

preflag = 1

blockjype mixed_blockJlag

nr of sfb 1 nr of sfb2

nr of sfb3

nr_of_sfb4

‘00’,’ОТ,’ll’ x

11

10

0

0

‘10’

0

18

18

0

0

‘10’

1

15

18

0

0


if ((500 <= scalefac_compress) && (scalefacjcompress < 512)) { s/enl = (scalefac_compress-500) / 3 s/en2 = (scalefac_compress-500) % 3 slen3 = 0 s/en4 = 0

}

}

if {{{mode_extension == ‘01’) || (mode_extension == ‘11’))&&(ch == 1)) { intensity_scale = scalefac_compress % 2 int_scalefac_compress = scalefac_compress » 1 if (int_scalefac_compress < 180) {

block type

mixed_blockJlag

nr of sfb 1

nr of sfb2

nr_of_sfb3

nr of_sfb4

‘00’,’ОТ,’IT

X

7

1

7

0

‘10’

0

12

12

12

0

‘10’

1

6

15

12

0


slen 1 = int_scalefac_compress / 36 slen2 = (int_scalefac_compress % 36) / 6 s/en3 = (int_scalefac_compress % 36) % 6 s/en4 = 0 preflag = 0

}

/f ((180 <= int_scalefac_compress) && (int_scalefac_compress < 244)) { s/enl = (int_scalefac_compress-180) % 64) » 4 s/en2 = (int_scalefac_compress-180) % 16) » 2 s/елЗ = (int_scalefac_compress-180) % 4 slen4 = 0 preflag = 0

12

ГОСТ P 54712-2011

blockjtype

mixed_block_flag

nr_of_sfb 1

nr_of_sfb2

nr_of_sfb3

nr_of_sfb4

‘00’,’01’,’11’

X

6

6

6

3

‘10’

0

12

9

9

6

‘10’

}

1

6

12

9

6


if ((244 <= int_scalefac_compress) && (int_scalefac_compress < 255)) { slen 1 = (int_scalefac_compress-244) / 3 slen2 = (int_scalefac_compress-244) % 3 s/en3 = 0 slen4 = 0 preflag = 0

‘00’,’01’,’11’

X

8

8

5

0

‘10’

0

15

12

9

0

‘10’

}

1

6

18

9

0


blockjtype mixed_block_flag nr_of_sfM nr_of_sfb2 nr_of_sfb3 nr_of_sfb4

}

В полосах масштабных коэффициентов, где slen 1, slen2, slenZ или slen4 являются нулями и соответствующие nr_of_slen 1, nr_of_slen2, nr_of_slen3 или nr_of_slen4 не равны нулю, масштабные коэффициенты этих полос должны быть обнулеваны, что соответствует нулевой позиции интенсивностности.

4.2 Требования к расширению ГОСТ Р 54711 для поддержки многоканального звука
4.2.1    Кодирование многоканального звука при низкой скорости передачи

4.2.1.1    Универсальная многоканальная звуковая система

Стандарт на низкоскоростное кодирование моно - и стерео звуковых сигналов был установлен в ГОСТ Р 54711. Настоящий стандарт применим для кодирования высококачественных цифровых аудиосигналов без изображений для каналов передачи с ограниченной пропускной способностью.

Стандарт аудиокодирования ГОСТ Р 54711 может использоваться как вместе с MPEG-1 Видео, так и с MPEG-2 Видео, если требования ограничены двухканальным стерео. MPEG-2 Аудио (настоящий стандарт) обеспечивает расширение до 3/2 многоканального аудио и дополнительного НЧ-канала (LFE).

В данном стандарте регламентируется субполосная система аудиокодирования под названием MPEG-AudioMultichannel, которая может использоваться для высококачественного цифрового многоканального и/или многоязычного звука на носителях или для передачи по каналам связи с ограниченной емкостью. Одной из основных характеристик является обратная совместимость с ГОСТ Р 54711 моно, стерео или двухканальными аудиопрограммами. Эта ситема разработана для использования в различных приложениях.

Системы многоканального звука обеспечивают улучшенное стереозвучание по сравнению со стандартными двухканальными системами. Улучшенное звучание требуется не только для приложений сопровождения изображений, но также и для звуковых приложений.

Универсальная и совместимая многоканальная звуковая система применима для спутникового и наземного телевизионного вещания, цифрового звукового вещания (наземного и спутникового), также как и для других носителей.

4.2.1.2    Представление многоканального звука

4.2.1.2.1 312-stereo плюс LFE

Для стереофонического представления звуковой программы рекомендуется использование дополнительного центрального канала С и двух каналов окружения LS и RS вместе с фронтальными левым и правым каналами L и R. Такая система названа 3/2-stereo (3 фронтальных канала / 2 канала окружения) и требует передачи соответственным образом форматированных пяти аудиосигналов.

Для звукового сопровождения изображения (например HDTV) три фронтальных канала обеспечивают достаточную направленность и четкость фронтальных звуковых образов, связанных с изображением, в соответствии с принятой в кино практикой. Основным преимуществом является «устойчивый центр», который обеспечен при любом расположении слушателя и важен для большинства диалогов.

Кроме того, для приложений, ориентированных только на звуковые программы, формат 312-stereo является улучшением двухканального стерео. Добавление одной пары каналов окружения позволяет получить улучшенение эффекта пространственного звучания.

13

Канал НЧ (в данном случае канал LFE) может быть добавлен к любой из этих конфигураций. Назначение этого канала заключается в расширении диапазона воспроизводимых нижних частот и увеличении их уровня громкости. В этом смысле данный канал несет ту же функцию, что и канал LFE, предложенный киноиндустрией для их цифровых звуковых систем.

Канал LFE не должен использоваться для всего низкочастотного контента многоканальной звуковой программы. Канал LFE является дополнительным в ресивере, и, следовательно, должен использоваться только для низкочастотных эффектов большого уровня громкости. Канал LFE исключен из любых операций дематрицирования в декодере. Частота дискретизации канала LFE соответствует частоте дискретизации основных каналов, разделенной на 96. Это обеспечивает 12 отсчетов LFE в пределах одного аудиофрейма. Канал LFE способен передавать сигналы в диапазоне от 15 до 120 Гц.

4.2.1.2.2 Совместимость

L0=L + y242-C + )/2J2-LS,

(1)

Rq = R + yj2C + y>/2RS

(2)

L0 =L + y2J2C + y2LS ,

(3)

R0 = R + yj2C + y2RS

(4)

^1

II

О

^1

(5)

R0=R,

(6)

LQ=L + y2j2C-y-j2jS,

(7)

Rq = R + y2j2C + y2j2jS ,

(8)


В результате широкого использования стандартных стереопрограмм с двумя каналами (2/0-stereo), должна поддерживаться совместимость с существующими системами озвучания 210-stereo или с существующими матрицируемыми ресиверами объемного звука. Это означает, что для многих приложений основной сигнал стерео, содержащий сумму сигналов многоканальной системы, должен быть передан вместе с многоканальной аудиоинформацией. Соответствующие пары выражений являются (1,2), (3,4), (5,6) и (7,8).

где jS образуется из LS и RS вычислением моносоставляющей.

Затем к этой составляющей применяются сжатие динамического диапазона и фазовый сдвиг на 90 градусов. Пара [(7),(8)] приемлема для существующих декодеров объемного звука с матрицированием.

Формат потока битов настоящего стандарта выбран так, чтобы аудиодекодер мог правильно декодировать основную стереоинформацию в соответствии с одной из приведенных выше парой выражений. В случае использования этой части данного стандарта существует три возможных варианта обеспечения пользователя основным стереозвуком вместе с многоканальной аудиоинформацией.

1. Непосредственная передача 210-stereo вместе с многоканальной информацией в одном потоке битов с обеспечением обратной совместимости с ГОСТ Р 54711, во избежание одновременной передачи, обеспечивает наиболее рациональное использование скорости передачи, требуемой для обеих программ -210-stereo и многоканальной. Дополнительные преимущества состоят в том, что обе программы строго синхронизируются по отсчетам ИКМ и что информация, связанная с аудио, которая передается во вспомогательном поле данных потока битов MPEG-Аудио, должна быть передана всего один раз. Создание стерео из многоканального аудиосигнала выполняется кодером настоящего стандарта. Для этого в данной части стандарта представлен ряд матричных опций, соответствущих выражениям (1) и (2), (3) и (4).

2.Одновременная передача многоканального аудиосигнала, кодированного в соответствии с настоящим стандартом, вместе с сигналом 2/0 - stereo, кодированным в соответствии с ГОСТ Р 54711, требует использования двух независимых потоков битов, которые могут быть мультиплексированы и переданы совместно [1]. При наличии обоих потоков синхронизацию обеспечивает провайдер программы. Кроме того, опция одновременной передачи требует более высокой скорости передачи, так как вместо 5 каналов в случае 3/2-многоканального звука должны быть переданы 7 звуковых каналов. Однако опция одновременной передачи учитывает индивидуальные требования, то есть звукооператор имеет возможность контролировать баланс 210-stereo.

ГОСТ Р 54712-2011

3. Передача только многоканального сигнала при использовании нематрицируемого режима [выражения [5],[6] возможна со стереодекодером, который должен декодировать все пять каналов и переводить их в стереорежим. В то же время сведение сигналов в стерео режим может быть выполнено в декодере перед блоком фильтров, вследствие чего фильтрации будут подвергнуты отсчеты только двух каналов. Однако это значительно усложняет алгоритм декодирования.

Если требуется совместимость с существующими матрицируемыми декодерами объемного звука, эта часть стандарта снова предоставляет три решения.

1.    Для гарантирования высокой производительности относительно скорости передачи, требуемой как для З/2-multichannel, так и для матрицируемого объемного звука, последний может быть передан в стереоканале, имеющем обратную совместимость. Матричная опция '10' согласно уравнениям (7) и (8) обеспечивает соответствующую стереосовместимость для сигнала, который передается в обычных стереоканалах. Матрицируемый сигнал окружения, подходящий для существующих матрицируемых декодеров, может быть получен в ресивере при использовании двухканального декодера по ГОСТ Р 54711. Соответствующий 3/2-канальный выходной сигнал может быть получен при использовании декодера, описанного в настоящем стандарте.

2.    Для одновременной передачи матрицируемого сигнала окружения, использующего ГОСТ Р 54711 и 3/2-канального звукового сигнала, использующего настоящий стандарт, необходима более высокая скорость передачи. Эта опция допускает регулирование звукооператором баланса матрицируемых каналов откружения.

Недостаток данного решения заключается в увеличении скорости передачи цифрового потока из-за необходимости передавать семь звуковых каналов вместо пяти при использовании матричной опции '10'.

3. Для передачи только многоканального сигнала при использовании нематрицируемого режима каждый декодер стерео должен иметь возможность декодировать все пять сигналов и выполнять микширование согласно уравнениям (7) и (8). Несмотря на то, что микширование может быть применено в декодере перед блоком фильтров и фильтрации подлежат только два канала, это значительно усложняет декодер.

Иерархия аудиоформатов, обеспечивающих пониженное число каналов, качество (210-stereo или даже моно) и соответствующий набор вниз суммирующих уравнений, дана в [3]. Альтернативными аудиоформатами, которые могут использоваться при экономических или физических ограничениях канала передачи, являются 3/1,3/0, 2/2,2/1,2/0 и 1/0. Соответствующие расположения громкоговорителей -3/2, 3/1,3/0, 2/2, 2/1,2/0 и 1/0.

Основная задача состоит в том, чтобы расширить существующие 210-stereo аудиосистемы путем передачи дополнительных звуковых каналов (центрального, окружения) без одновременной передачи. Это условие обратной совместимости с существующими ресиверами подразумевает использование матриц совместимости: декодер предыдущего поколения должен воспроизводить два стандартных основных сигнала стерео L'o/R'o, а многоканальный декодер - полный 3/2-stereo набор каналов L'/C'/R'/ LS'/RS' основного стереосигнала и сигналов расширения.

4.2.1.3 Многоязычная поддержка

В ряде случаев требуются многоканальное стерео и двуязычные программы или многоязычные комментарии, в частности в HDTV. Эта часть данного стандарта предусматривает альтернативные конфигурации звуковых каналов в аудиосистеме с пятью каналами, например двуязычная 2/0 программа стерео или стереозвук 2/0, 3/0 плюс сопроводительные службы (например «чистый диалог» для слабослышащего, комментарии для людей со слабым зрением, многоязычные комментарии и т. д.). Важной частью конфигурации является возможность воспроизведения диалога комментария (например через центральный громкоговоритель) вместе с музыкой/эффектами (например документальный фильм, спортивные передачи).

4.2.2 Основные параметры многоканальной системы звукового кодирования

Передача пяти аудиосигналов системы 3/2 требует наличия пяти каналов передачи (хотя в контексте сжатия сигналов эти каналы не обязательно должны быть независимы). Чтобы два из переданных сигналов могли обеспечить стереорежим, исходные звуковые сигналы как правило объединяются перед кодированием в линейной матрице. Эти комбинированные сигналы (и их каналы передачи) обозначаются 76, 71, 72, 73 и 74.

15

4.2.2.1 Совместимость с ГОСТ Р 54711

Многоканальная система полностью совместима с ГОСТ Р 54711. Для многоканального аудиопотока битов наличие обратной совместимости означает, что аудиодекодер ГОСТ Р 54711 будет должным образом декодировать основную стерео информацию (см. 4.2.1.2.2). Совместимость с ГОСТ Р 54711 означает, что многоканальный аудиодекодер MPEG-2 может декодировать поток битов звука, сформированного по ГОСТ Р 54711.

Обратная совместимость реализуется за счет кодирования основной стерео информации в соответствии с ГОСТ Р 54711 при использовании полей дополнительных данных аудиофрейма (в этой части стандарта - основной фрейм) плюс дополнительный фрейм расширения для многоканального расширения.

Полный аудио фрейм включает четыре различных типа данных:

-    информация заголовка в пределах первых 32 битов аудиофрейма ГОСТ Р 54711;

-    контроль ошибок с помощью циклического избыточного кода (CRC), состоящего из 16 битов, следующих сразу после информации заголовка (дополнительная опция);

-    аудиоданные, состоящие для Уровня II из информации о распределении битов (BAL), информации о выборе масштабных коэффициентов (SCFS/), масштабных коэффициентов (SCF) и субполосных отсчетов;

-    дополнительные данные, которые из-за большого количества различных приложений будут использовать эту часть стандарта, длина и назначение этого поля не определены.

Переменная длина вспомогательного поля данных позволяет поместить полную информацию о расширении каналов 72/73/74 в первую часть поля вспомогательного поля. Если кодер МС не использует все поле дополнительных данных для информации о многоканальном расширении, оставшаяся часть этого поля может применяться для других дополнительных данных.

Скорость передачи, необходимая для передачи информации о многоканальном расширении, может меняться от фрейма к фрейму в зависимости от свойства звуковых сигналов. Полная скорость передачи может превышать значения, предусмотренные в настоящем стандарте, из-за использования дополнительных битов расширения. Максимальные скорости передачи, с учетом передачи битов расширения, определяются в соответствии со следующей таблицей:

Частота дискретизации, кГц

Уровень

Максимальная полная скорость передачи, кбит/с

32

1

903

32

II

839

32

III

775

44,1

1

1075

44,1

II

1011

44,1

III

947

48

1

1130

48

II

1066

48

III

1002

В этой части стандарта описываются комбинации основных стереосигналов L0, R0 Уровня I, II и III и многоканальное расширение уровня II и Уровня III. Возможны следующие комбинации:

Стерео L0, R0

Многоканальное расширение

Уровень II

Уровень II тс

Уровень III

Уровень III тс

Уровень 1

Уровень II тс

4.2.2.2 Формат входного/выходного звукового сигнала Частоты дискретизации: 48, 44,1 или 32 кГц Квантование: до 24 битов на ИКМ-отсчет

Следующие комбинации звуковых каналов могут использоваться в качестве входов аудиокодера:

а)    конфигурация 3/2 - пять каналов, включая L, С, R плюс два канала окружения LS, RS;

б)    конфигурация 3/1 - четыре канала, включая L, С, R плюс один канал окружения S;

в)    конфигурация 3/0 - три канала, включая L, С, R без каналов окружения;

г)    конфигурация 3/0 + 2/0 - пять каналов, включая L, С, R первой программы плюс L2, R2 второй программы;

ГОСТ Р 54712-2011

д)    конфигурация 2/2 - четыре канала, включая L, R плюс два канала окружения LS, RS;

е)    конфигурация 2/1 - три канала, включая L, R с одним каналом окружения S;

ж)    конфигурация 2/0 (или 1/0+1/0) - стерео или два независимых канала, как в ГОСТ Р 54711;

и)    конфигурация 2/0 + 2/0 (или 1/0+1/0 + 2/0) -четыре канала, включая L, R (или каналы I и II) первой программы плюс L2, R2 второй программы;

к)    конфигурация 1/0 - одноканальный режим, как в ГОСТ Р 54711;

л)    конфигурация 1/0 + 2/0 - три канала, включая одноканальный режим, как в ГОСТ Р 54711 плюс L2, R2 второй программы.

Различные комбинации входных аудиосигналов кодируются и передаются в пяти доступных каналах передачи 70, 71, 72, 73 и 74, из которых 70 и 71 являются двумя основными каналами ГОСТ Р 54711 и соответствуют сигналам L0 и RQ. По каналам 72, 73 и 74 передается многоканальная информация, использующая вспомогательное поле данных ГОСТ Р 54711 и дополнительный поток битов расширения.

После многоканального декодирования возможно восстановление до пяти звуковых каналов, которые затем могут быть представлены в любом удобном формате по выбору слушателей:

а)    пять каналов, конфигурация 3/2

фронт - левый (L) и правый (R) каналы плюс центральный канал (С), окружение - левый (LS) и правый (RS) каналы окружения;

б)    четыре канала, конфигурация 3/1

фронт - левый (L) и правый (R) каналы плюс центральный канал (С), окружение - моно канал окружения (S);

в)    три канала, конфигурация 3/0

фронт - левый (L) и правый (R) каналы плюс центральный канал (С), окружение - нет каналов окружения;

г)    четыре канала, конфигурация 2/2 фронт - левый (L) и правый (R) каналы,

окружение - левый (LS) и правый (RS) каналы окружения;

д)    три канала, конфигурация 2/1

фронт - левый (L) и правый (R) каналы, окружение - моно канал окружения (S);

е)    два канала, конфигурация 2/0

фронт-левый (L) и правый (R) каналы, окружение - нет каналов окружения;

ж)    один канал, конфигурация 1/0 фронт- моно (М0),

окружение - нет каналов окружения.

Канал НЧ может быть дополнительно добавлен к любой из этих конфигураций, за исключением конфигурации 1/0.

Сигналы на выходах должны быть представлены раздельно или объединенными в соответствии с уравнениями преобразования, как определено в [5].

4.2.2.3 Режимы составного кодирования

4.2.2.3.1    Динамическое переключение канала передачи

Для обеспечения лучшей ортогональности между двумя совместными сигналами ТО и 71 и тремя дополнительными сигналами 72, 73 и 74, необходимо иметь определенную гибкость при выборе каналов 72, 73 и 74. Эта часть настоящего стандарта позволяет, независимо от количества частотных областей, выбрать между несколькими комбинациями трех сигналов из указанных пяти L, С, R, LS, RS. Выбранная комбинация будет передана в 72, 73 и 74.

4.2.2.3.2    Динамическое перекрестное распределение

Согласно бинауральной модели слуха возможно определить части стереофонического сигнала, которые не важны при пространственном восприятии стереофонического представления. Такие составляющие стереосигнала не маскируются, однако они не влияют на локализацию звуковых источников. Они игнорируются при бинауральном восприятии в слуховой системе человека. Поэтому составляющие любого стерео сигнала (L, С, R, LS или RS), не влияющие на локализацию, могут быть воспроизведены через любой громкоговоритель или через несколько громкоговорителей системы, не влияя на стереофоническое восприятие. Это может быть выполнено независимо для различных частотных областей.

ГОСТ P 54712-2011

Содержание

1    Область применения....................................................................................................................................1

2    Нормативные ссылки....................................................................................................................................2

3    Термины, определения, символы и сокращения........................................................................................2

3.1    Термины и определения........................................................................................................................2

3.2    Символы и сокращения.........................................................................................................................3

3.3    Метод описания синтаксиса потока битов...........................................................................................6

4    Задачи по совершенствованию обработки цифровых сигналов звукового вещания

с целью повышения качества передачи.....................................................................................................7

4.1 Требования к расширению ГОСТ Р 54711 для поддержки низких частот дискретизации................7

4.2 Требования к расширению ГОСТ Р 54711 для поддержки многоканального звука........................13

Приложение А (обязательное) Схемы.........................................................................................................57

Приложение Б (обязательное) Таблицы......................................................................................................60

Приложение В (обязательное) Процесс кодирования................................................................................64

Приложение Г (обязательное) Психоакустические модели.......................................................................73

Приложение Д (обязательное) Использование дополнительных данных...............................................104

Библиография..............................................................................................................................................106

4.2.2.3.3    Адаптивное многоканальное предсказание

Для того чтобы использовать для устранения избыточности статистические зависимости между сигналами в различных каналах применяют адаптивное многоканальное предсказание. Вместо того чтобы передавать непосредственно сами сигналы в каналах передачи 72, 73, 74, передаются соответствующие сигналы ошибки предсказания. Используются предсказывающие устройства вплоть до 2-го порядка с компенсацией задержки.

4.2.2.3.4    Фантомное кодирование центрального канала

Слуховая система человека при локализации на верхних частотах реагирует только на интенсивность звуковых сигналов, вследствие чего можно передавать ВЧ-часть центрального канала во фронтальных левом и правом каналах. При этом образуется фантомный источник звука, расположенный по центру.

аналогично ГОСТ Р 54711

3/2, 3/1,3/0 (+ 2/0), 2/2, 2/1,2/0 (+ 2/0),

1/0+1/0 (+ 2/0), 1/0 (+ 2/0), вторая стерео программа,

до 7 дополнительных многоязычных каналов или каналов

комментария,

связанные службы.

число субполос - 32, частота дискретизации - Fs/32, ширина субполос - Fs/64.

4.2.2.4    Параметры кодера и декодера

Кодирование и декодирование:

Режимы кодирования:

Субполосная фильтрация:

Дополнительное МДКП (только Уровень III): Разрешающая способность по частоте Канал LFE:


6 или 18 коэффициентов на субполосу

число каналов LFE - 1, частота дискретизации - Fs/96, ширина канала LFE - 125 Гц

более 20 битов.


Динамический диапазон:


4.2.3 Спецификация кодированного звукового потока битов

4.2.3.1 Поток битов расширения

Последовательность звукового сигнала состоит из основного потока битов, декодируемого в соответствии с ГОСТ Р 54711, и дополнительного потока битов расширения:

Синтаксис

Количество битов

Мнемоника

base bit streamQ {

while (nextbits ()==syncword) { base frameQ }

}

Синтаксис

Количество битов

Мнемоника

ext_bit_stream() {

while (ext_bit_stream ()== '1 ’) { ext frameQ

}

}

НАЦИОНАЛЬНЫЙ СТАНДАРТ РОССИЙСКОЙ ФЕДЕРАЦИИ
Звуковое вещание цифровое
КОДИРОВАНИЕ СИГНАЛОВ ЗВУКОВОГО ВЕЩАНИЯ С СОКРАЩЕНИЕМ ИЗБЫТОЧНОСТИ ДЛЯ ПЕРЕДАЧИ ПО ЦИФРОВЫМ КАНАЛАМ СВЯЗИ MPEG-2 ЧАСТЬ III (MPEG-2 AUDIO)

Digital sound broadcasting.

Coding of sound broadcasting signals with redundancy reduction for transfer on digital communication channels.

MPEG-2 part III (MPEG-2 audio)

Дата введения - 2013-07-01

1 Область применения

Для достижения лучшего качества звучания на низких скоростях передачи данных (менее 64 кбит/с на канал), в частности, по сравнению с [2], для уровней I, II и III ГОСТ Р 54711 вводятся три дополнительных частоты дискретизации (Fs): 16 кГц, 22,05 кГц и 24 кГц. Это позволяет поддерживать звуковые сигналы с полосами частот 7,5 кГц, 10,3 кГц и 11,25 кГц соответственно, и обеспечивать передачу сигналов звукового вещания по стандартным каналам (ГОСТ Р 52742 и ГОСТ Р 53537).

Синтаксис, семантика и методы кодирования ГОСТ Р 54711 сохраняются в данном стандарте, за исключением определения поля частоты дискретизации, поля скорости передачи и таблиц распределения битов. Новые значения действительны, если в заголовке ГОСТ Р MPEG-1 audio битов Ю равняется нулю. Для получения лучшей производительности звуковой системы параметры психоакустической модели, используемой в кодере, должны быть изменены, соответственно.

Вход кодера и выход декодера совместимы с существующими стандартами ИКМ, такими как ГОСТ 28376, ГОСТ 27667 и др.

Стандарт предназначен для регулирования отношений между оператором и пользователем в процессе установления соединения в части выполнения технических требований к электрическим параметрам, определяющим качество каналов и трактов звукового вещания с полосой передаваемых частот до 20 000 Гц.

Настоящий стандарт используется при проектировании, вводе в эксплуатацию и техническом обслуживании каналов и трактов звукового вещания студийного качества (с полосой частот до 20 000 Гц), организуемых в наземных и спутниковых линиях на магистральной, внутризоновых и местных сетях связи.

Действие настоящего стандарта распространяется на услуги местной, внутризоновой, междугородной и международной сети звукового вещания, независимо от используемой сетевой технологии. Это способствует обеспечению целостности сетей звукового вещания, устойчивости работы сети, выполнению норм на основные электрические параметры при разработке и проектированию каналообразующей аппаратуры звукового вещания (ГОСТ Р 52742 и ГОСТ Р 53537). Показатели, определенные настоящим стандартом, являются базовыми для профессиональной и бытовой аппаратуры - проигрывателей компакт-дисков, усилителей сигналов звуковой частоты и другого оборудования класса Hi-Fi.

Универсальная и совместимая многоканальная звуковая система применима для спутникового и наземного телевизионного вещания, цифрового звукового вещания (наземного и спутникового), также как и для других носителей, например:

CATV- кабельное телевидение;

CDAD - кабельное цифровое звуковое вещание;

DAB - широковещательная передача цифрового звукового сигнала;

DVD - цифровой универсальный диск;

ENG- электронные новости (включая новости по спутнику);

HDTV-телевидение высокой четкости;

IPC- межличностное общение (видеоконференция, видеотелефон и т. д.);

ISM- интерактивные носители (оптические диски и т. д.).

Издание официальное

2    Нормативные ссылки

В настоящем стандарте использованы нормативные ссылки на следующие стандарты:

ГОСТ Р 54711-2011 Звуковое вещание цифровое. Кодирование сигналов звукового вещания с сокращением избыточности для передачи по цифровым каналам связи. MPEG-1 часть III (MPEG-1 audio)

ГОСТ Р 52742-2007 Каналы и тракты звукового вещания. Типовые структуры. Основные параметры качества. Методы измерений

ГОСТ Р 53537-2009 Звуковое вещание. Основные электрические параметры каналов и трактов студийного качества (с полосой частот 20 ...20000 Гц).

ГОСТ 27667-88 Система цифровая звуковая «Компакт-диск». Параметры

ГОСТ 28376-89 Компакт-диск. Параметры и размеры.

Примечание - При пользовании настоящим стандартом целесообразно проверить действие ссылочных стандартов в информационной системе общего пользования - на официальном сайте Федерального агентства по техническому регулированию и метрологии в сети Интернет или по ежегодному информационному указателю «Национальные стандарты», который опубликован по состоянию на 1 января текущего года, и по выпускам ежемесячного информационного указателя «Национальные стандарты» за текущий год. Если заменен ссылочный стандарт, на который дана недатированная ссылка, то рекомендуется использовать действующую версию этого стандарта с учетом всех внесенных в данную версию изменений. Если заменен ссылочный стандарт, на который дана датированная ссылка, то рекомендуется использовать версию этого стандарта с указанным выше годом утверждения (принятия). Если после утверждения настоящего стандарта в ссылочный стандарт, на который дана датированная ссылка, внесено изменение, затрагивающее положение, на которое дана ссылка, то это положение рекомендуется применять без учета данного изменения. Если ссылочный стандарт отменен без замены, то положение, в котором дана ссылка на него, рекомендуется применять в части, не затрагивающей эту ссылку.

3    Термины, определения, символы и сокращения 3.1 Термины и

определения

В настоящем стандарте применены следующие термины и сокращения с соответствующими определениями:

3.1.1    дополнительные данные: Часть потока битов, которая может использоваться для передачи вспомогательных данных.

3.1.2    динамическое перекрестное распределение: Метод сокращения объема многоканальных данных, при котором нелокализуемые в пространстве компонентны копируются в другой канал.

3.1.3    динамическое переключение канала передачи: Метод сокращения объема многоканальных данных, при котором для передачи выбираются наиболее ортогональные компонентны.

3.1.4    канал низкой частоты (LFE): Ограниченный по частоте канал для низкочастотных звуковых эффектов в многоканальной системе.

3.1.5    канал окружения: Звуковой канал, добавленный к фронтальным каналам (L и R или L, R и С) для улучшения пространственного восприятия.

3.1.6    канал представления: Звуковые каналы на выходе декодера, соответствующие левой, центральной, правой, левой окружения и правой окружения позициям громкоговорителей.

3.1.7    многоканальная система: Комбинация звуковых каналов для создания пространственного звукового поля.

3.1.8    многоязычная система: Передача диалогов более чем на одном языке.

3.1.9    многоканальное предсказание: Метод понижения объема многоканальных данных, основанный на статистических зависимостях между каналами.

3.1.10    несоответствующая стерео: Часть стереофонического звукового сигнала, не способствующая пространственному восприятию.

3.1.11    обратная совместимость: Более новый стандарт кодирования обратно совместим с более ранним стандартом, если декодеры, разработанные для раннего стандарта кодирования, в состоянии декодировать весь или часть потока битов, произведенного в соответствии с более новым стандартом кодирования.

3.1.12    основной поток битов: Информация, представленная в потоке битов, который состоит из непрерывных основных фреймов. Этот поток битовое декодируется декодерами выполненными в соответствии как с ГОСТ Р 54711, так и данным стандартом. Поток битов данного стандарта всегда состоит из основного потока битов, к которому может быть дополнительно добавлен поток битов расширения.

3.1.13    основной фрейм: Часть звукового фрейма данного стандарта, которая может обрабатываться декодером ГОСТ Р 54711 и содержит основной сигнал стерео.

2

ГОСТ P 54712-2011

3.1.14    ошибка предсказания: Разность фактического значения отсчета или элемента данных и его результата предсказания.

3.1.15    параметр: Переменная в пределах этого стандарта, которая может принимать одно значение из диапазона значений.

3.1.16    поток битов расширения: Информация, содержащаяся в дополнительном потоке битов, связанным с основным звуковым потоком битов на системном уровне, для поддержки скоростей передачи, неопределенных в ГОСТ Р 54711. Дополнительный поток битов расширения содержит оставшиеся многоканальные и (или) многоязычные данные.

3.1.17    предсказание: Использование предсказателя с целью получить оценку значения отсчета или элемента данных, которые должны быть декодированы.

3.1.18    предсказатель: Линейная комбинация ранее декодированных значений отсчетов или элементов данных.

3.1.19    прямая совместимость: Более новый стандарт кодирования обладает прямой совместимостью с более старым стандартом кодирования, если декодеры, разработанные для более нового стандарта кодирования, в состоянии декодировать потоки битов более старого стандарта кодирования.

3.1.20    сведение: Матрицирование п каналов для получения меньшего числа каналов.

3.1.21    флаг: Переменная, которая может принимать только одно из двух значений, определенных в этом стандарте.

3.1.22    фрейм расширения: Часть аудио фрейма, которая может быть декодирована только декодером данного стандарта. Этот дополнительный фрейм содержит оставшиеся многоканальные и (или) многоязычные данные, так же как и дополнительные данные.

3.1.23    центральный канал: Один из каналов многоканальной звуковой системы, в котором сосредоточена информация о передней части пространственного звукового образа.

3.2 Символы и сокращения
3.2.1 Арифметические операторы

Математические операторы, используемые в настоящем стандарте, аналогичны используемым в языке программирования С. Однако целочисленное деление с усечением и округление определены особым образом. Побитовные операторы определяются с учетом представления чисел в дополнительном коде. Нумерация и счетчики циклов обычно начинаются с нуля.

+ Сложение.

Вычитание (как бинарный оператор) или отрицание (как унарный оператор).

++ Инкремент.

— Декремент.

* Умножение.

л Возведение в степень.

/ Целочисленное деление с округлением к меньшему по модулю целому. Например, 7/4 и -7/4 округляются до единицицы -7/4 и 7/-4 округляются до минус единицицы.

// Целочисленное деление с округлением к ближайшему целому числу. Полуцелые числа округляются в сторону ближайшего большего по модулю числа, если не указано другое. Например, 3//2 округляется до двух, а -3112 округляется до минус двух.

DIV Целочисленное разделение с округлением результата в сторону

| | Абсолютное значение | х | = х, когда х > 0

| х | = 0, когда х == 0 | х | = -х, когда х < 0

% Деление с остатком. Операция определена только для положительных чисел.

Sign () Принимает следующие значения:    Sign (х) = 1, когда х > 0;

Sign (х) = 0, когда х = 0;

Sign (х) = -1, когда х < 0.

NINT () Округление до ближайшего целого. Возвращает самое близкое к вещественному аргументу целочисленное значение. Полуцелые числа округляются в сторону от нуля.

sin Синус.

cos Косинус.

3

exp Экспонента V Квадратный корень.

Ig Логарифм по основанию 10.

In Натуральный логарифм 1од2 Логарифм по основанию 2.

3.2.2    Логические операторы

II Логическое ИЛИ.

&&Логическое И.

I Логическое НЕ

3.2.3    Операторы сравнения

>    Больше

>    = Больше или равно.

< Меньше.

<= Меньше или равно.

== Равно.

! = Не равно.

max [,...,] Максимальное значение, min [,...,] Минимальное значение.

3.2.4    Побитовные операторы

Использование побитовных операций подразумевает представление чисел в дополнительном

коде.

& Побитовное И.

| Подбитовное ИЛИ.

» Сдвиг вправо.

« Сдвиг влево.

3.2.5    Оператор присвоения

= Оператор присвоения.

3.2.6    Мнемоники

bslbf

Следующие мнемоники подлежат определению для описания различных типов данных, используемых в кодированном потоке битов.

centre_chan

centrejimited

ch

dyn_cross

Qr

l~0’ R0

L, C, R, LS, RS

Битововая строка, младший бит слева, в соответствии с настоящим стандартом. Битововые строки пишутся, как строка единиц и нулей внутри одинарных кавычек, например '1000 000Г. Пробелы внутри битововой строки вводятся для удобства чтения и не имеют никакого значения.

Индекс центрального канала.

Переменная, показывающая, что субполоса центрального канала не передается. Это используется в случае режима фантомного кодирования канала центра.

Канал. Если ch имеет значение 0, это соответствует левому каналу стереопары или первому из двух независимых каналов.

dyn_cross означает, что динамическое перекрестное распределение используется для определенного канала передачи и определенной субполосы.

Гранула 3 * 32 субполосных отсчета в Уровне II, 18 * 32 субполосных отсчета на Уровне III.

Суммарные звуковые сигналы стерео.

Звуковые сигналы: левый, центральный, правый, левый окружения, правый окружения.

4

ГОСТ Р 54712-2011

Lw, Cw, Rw, LSW,RSW

Взвешенные звуковые сигналы: левый, центральный, правый, левый окружения, правый окружения. Взвешивание необходимо по двум причинам:

а)    все сигналы должны быть ослаблены перед кодированием во избежание перегрузки при вычислении суммарного сигнала стерео;

б)    матричные уравнения содержат коэффициенты затухания и другую обработку, такую как сдвиг фазы.

left_surr_chan

main_data

mlsblimit

mono_surr_chan

msblimit

rich

nmch

nmlch

npred

npredcoeff

part2_iength

pci

px

right_surr_chan

rpchof

sb

sbgr

sblimit

scfsi

switch_point_ I switch_point_s TO, 71, 72, 73, 74

Взвешенные и обработанные сигналы кодируются, передаются и денормализуются в декодере.

Индекс левого канала окружения.

Часть потока битов, которая содержит масштабные коэффициенты, кодированные методом Хаффмана данные и дополнительную информацию.

Максимальная субполоса в многоязычной части потока битов.

Индекс моно канала окружения. Этот индекс идентичен индексу левого канала объемного звучания.

Максимальная субполоса в многоканальной части расширения потока битов.

Число каналов; равно 1 для singiejchannei mode и 2 в других режимах.

Число каналов в многоканальной части расширения.

Число многоязычных каналов.

Число допустимых предсказаний.

Число используемых коэффициентов предсказания.

Число main_data битов, используемых для масштабных коэффициентов.

Индекс предсказывающего устройства [0,1,2].

Индекс предсказывающего устройства [0,1, npred-1].

Индекс правого канала окружения

Коэффициенты остатка от деления на порождающий полином, сначала следует коэффициент высшего порядка.

Субполоса.

Группы отдельных субполос.

Номер самой низкой субполосы, для которой не были выделены биты.

Информация о выборе масштабного коэффициента.

Номер полосы масштабных коэффициентов (полоса «длинного» блока), с которой производится переключение окон.

Номер полосы масштабных коэффициентов (полоса «короткого» блока), с которой производится переключение окон.

tc

uimsbf

vlclbf

window

Аудио каналы передачи. Соответствие звуковых сигналов каналам передачи определяется процедурой дематрицирования и информацией о выделении канала передачи.

Переданный канал.

Целое число без знака, старший бит первый.

Код с переменной длиной слова, левый бит первый, где «левый» относится к порядку, в котором пишутся коды с переменной длиной.

Номер текущего временного интервала в случае block_type == 2, 0<window<2 (Уровень III).

В многобайтовых словах старший байт является первым.

5

3.2.7 Константы

7г 3,14159265358...

е 2,71828182845...

3.3 Метод описания синтаксиса потока битов

Поток битов, полученный декодером, описывается в 4.1.1 и 4.2.3. Каждый элемент данных описывается именем, длиной в битах, мнемоникой типа и порядком передачи.

Действие, вызванное декодируемым элементом данных в потоке битов, зависит от значений этого элемента данных и элементов данных, декодированных ранее. Декодирование элементов данных и определение параметров состояния, используемых в их декодировании, описываются в 4.1.2, 4.1.3, 4.2.4 и 4.2.5.

while ( condition ) {

data_element

Для выражения условий присутствия элементов данных используются следующие конструкции:

Если «истина», то группа элементов данных появляется в потоке данных. Это повторяется, пока условие не «ложь».

}

do {    Элемент    данных    всегда появляется по крайней мере один раз.

data_element    Элемент    данных    повторяется, пока условие не «ложь».

} while ( condition )

if ( condition) {    Если условие является «истина», то первая группа элементов данных

data_element    появляется в потоке данных.

}

else {    Если    условие    «истина»    не    сохраняется,    то    вторая    группа    элементов

}

for (expr 1; ехрг2; ехргЗ) { data element

datajeiement    данных    появляется    в    потоке    данных.

}

Expri является инициализирующим выражением цикла. Обычно оно определяет начальное состояние счетчика. Ехрг2 является условием, определяющим проверку перед каждой итерацией цикла. Цикл завершается, когда условие не является «истиной». ЕхргЗ является выражением, которое выполняется в конце каждой итерации цикла, обычно оно инкрементирует счетчик.

В этом синтаксисе используется принятое в языке С соглашение о том, что переменная или выражение, возвращающие ненулевое значение, эквивалентны результату «истина».

Следует обратить внимание на наиболее распространенные варианты использования этой конструкции:

for (/ = 0; / < п; /++) {    Группа    элементов данных появляется п раз. Условия в пределах группы

datajeiement    элементов    данных    могут    зависеть от значения переменной управления

циклом /, которая обнуляется при первом появлении, увеличивается на }    1    при    втором появлении и т. д.

Группа элементов данных может содержать вложенные условные конструкции. Для компактности скобки {} могут быть опущены, когда следует только один элемент данных.

datajeiement[]    Является массивом данных.

Число элементов массива зависит от контекста.

datajeiement [п]    Является    (л+1)-ым    элементом    массива    данных.

datajeiement [т] [п]    Является элементом (т+1)-ой строки (п+1)-го столбца    двухмерного

массива данных.

ГОСТ P 54712-2011

data_element[I][т][п]    Является (/+1), (m+1), (п+1)-ым элементом трехмерного массива дан

ных.

data_element[т...п]    Содержит битовы массива datajelementcm по п включительно.

Знание самого синтаксиса потока битов в разделах 4.1.3 и 4.2.5 не следует считать достаточным для декодирования. В частности это лишь определяет корректный и свободный от ошибок входной поток битов. Для правильного начала декодирования, реальные декодеры должны иметь средства обнаружения стартовых последовательностей.

bytealignedQ    Возвращает 1, если текущая позиция находится на границе байта, так

что следующий бит потока будет первым бит нового байта. В противном случае, функция возвращает 0.

nextbitsQ    Реализует сравнение строки битов со строкой битов на входе декодера.

next_start_code()    Удаляет все нулевые битовы и битовы стаффинга и определяет положе

ние следующего синхрослова.

Синтаксис

Количество битов

Мнемоника

next_start_code () {

while (!bytealignedQ) zero bit

while (nextbitsQ != '0000 0000 0000 0000 0000 0001) zero byte

}

1

8

'O'

'00000000'

Эта функция проверяет, является ли текущая позиция побайтно выровненной. Иначе, присутствуют нулевые битовы стаффинга. Это означает, что перед синхрословом может присутствовать любое количество нулевых байтов. В связи с этим, синхрослово всегда является побайтно выровненным и ему может предшествовать любое число нулевых битов стаффинга.

4 Задачи по совершенствованию обработки цифровых сигналов звукового вещания с целью повышения качества передачи

4.1    Требования к расширению ГОСТ Р 54711 для поддержки низких частот дискретизации
4.1.1    Дополнительные частоты дискретизации

Для достижения лучшего качества звучания на низких скоростях передачи данных (менее 64 кбит/с на канал), в частности, по сравнению с [1], для уровней I, II и III предусматриваются три дополнительных частоты дискретизации (Fs): 16 кГц, 22,05 кГц и 24 кГц. Дополнительные частоты дискретизации позволяют поддерживать звуковые сигналы с полосами частот 7,5 кГц, 10,3 кГц и 11,25 кГц соответственно. Синтаксис, семантика и методы кодирования ГОСТ Р 54711 сохраняются, за исключением определения поля частоты дискретизации, поля скорости передачи и таблиц распределения. Новые значения действительны, если бит Ю в заголовке MPEG-1 audio равняется нулю. Чтобы получить лучшую производительность, параметры психоакустической модели, используемой в кодере, должны быть соответственно изменены.

С указанными частотами дискретизации продолжительность аудиофрейма соответствует:

Уровень

Частота дискретизации, кГц

16

22,05

24

1

24 мс

17,41 мс

16 мс

II

72 мс

52,24 мс

48 мс

IN

36 мс

26,12 мс

24 мс