ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ТЕХНИЧЕСКОМУ РЕГУЛИРОВАНИЮ И МЕТРОЛОГИИ
НАЦИОНАЛЬНЫЙ
СТАНДАРТ
РОССИЙСКОЙ
ФЕДЕРАЦИИ
Звуковое вещание цифровое
Кодирование сигналов звукового вещания с сокращением избыточности для передачи по цифровым каналам связи Часть III (MPEG-4 audio)
Методы кодирования звука MPEG-1/2 Audio в MPEG-4 Основные технические требования
ISO/IEC 14496-3:2009 (NEQ)
Издание официальное
ГОСТ P 53556.9—2013
Предисловие
1 РАЗРАБОТАН Санкт-Петербургским филиалом Центрального научно-исследовательского института связи «Ленинградское отделение» (ФГУП ЛО ЦНИИС)
2 ВНЕСЕН Техническим комитетом по стандартизации № 480 «Связь»
3 УТВЕРЖДЕН И ВВЕДЕН В ДЕЙСТВИЕ Приказом Федерального агентства по техническому регулированию и метрологии от 22 ноября 2013 г. № 1721-ст
4 Настоящий стандарт разработан с учетом основных нормативных положений международного стандарта ИСО/МЭК 14496-3:2009 «Информационные технологии. Кодирование аудиовизуальных объектов. Часть 3. Звуковое кодирование» (ISO/IEC 14496-3:2009 «Information technology - Coding of audio-visual objects - Part 3: Audio» (NEQ)
5 ВВЕДЕН ВПЕРВЫЕ
Правила применения настоящего стандарта установлены в ГОСТ Р 1 0—2012 (раздел 8) Информация об изменениях к настоящему стандарту публикуется в ежегодном (по состоянию на 1 января текущего года) информационном указателе ^Национальные стандарты». а официальный текст изменений и поправок — в ежемесячном формационном указателе вНациональные стандарты». 8 случае пересмотра (замены) или отмены настоящего стандарта соответствующее уведомление будет опубликовано в ближайшем выпуске ежемесячного информационного указателя «Национальные стандарты» Соответствующая информация, уведомление и тексты размещаются также в информационной системе общего пользования — на официальном сайте Федерального агентства по техническому регулированию и метрологии в сети Интернет (gost.ru)
©Стандартинформ, 2014
Настоящий стандарт не может быть полностью или частично воспроизведен, тиражирован и распространен в качестве официального издания без разрешения Федерального агентства по техническому регулированию и метрологии
ГОСТ P 53556.9—2013
НАЦИОНАЛЬНЫЙ СТАНДАРТ РОССИЙСКОЙ ФЕДЕРАЦИИ
Звуковое вещание цифровое
КОДИРОВАНИЕ СИГНАЛОВ ЗВУКОВОГО ВЕЩАНИЯ С СОКРАЩЕНИЕМ ИЗБЫТОЧНОСТИ ДЛЯ ПЕРЕДАЧИ ПО ЦИФРОВЫМ КАНАЛАМ СВЯЗИ.
ЧАСТЬ III (MPEG-4 AUDIO)
Методы кодирования звука MPEG-1/2 Audio в MPEG-4 Основные технические требования
Sound broadcasting digital
Coding of signals of sound broadcasting with reduction of redundancy for transfer on digital communication channels A
part III (MPEG-4 audio).
Main positions MPEG-1/2 Audio in MPEG-4
Дата введения - 2014—09—01
1 Область применения
Стандарт MPEG-M2 Аудио в MPEG-А спецификации MPEG-4 Аудио определяет использование MPEG-M2 уровня 1,2 или 3 ориентированным на MPEG-А способом, то есть так. что сигнализация и доступ до обработки на системном уровне идентичны другим типам обьектов MPEG-4 Аудио.
Чтобы перенести фреймы потока битов MPEG-Л 12 уровень 1, 2 или 3 в MPEG-А. они переформатируются таким образом, что становятся автономными единицами доступа MPEG-Л Это облегчает транспортировку по пакетным сетям, произвольный доступ, и возможность редактирования. Автономные единицы доступа, которые используются в системах совместимой транспортировки или формата хранения MPEG-А. могут быть переконвертированы в совместимые с MPEG-1/2 потоки битов и затем декодированы любым совместимым с MPEG-M2 декодером.
Синтаксис MPEG-Л Аудио дополнительно расширяется, чтобы сделать возможными многоканальные конфигурации на базе ГОСТ Р 54711 и ГОСТ Р 54712. Многоканальные конфигурации подобны конфигурациям, определенным для других аудио объектных типов MPEG-Л с многоканальными возможностями. Для MPEG-M2 уровня 1 и 2 формат не расширяется. Многоканальный формат для этих уровней описывается в ГОСТ Р 54712.
Разрешенные частоты дискретизации для уровня 3 расширяются для речевого выхода инструментов FA и для дублирования МР с информацией о форме губ.
Для использования MPEG-M2 уровня 1. 2 или 3 в MPEG-Л посредством унаследованного интерфейса MPEG Л. используется ObjectTypelndication 0x69 или 0x6Ь.
2 MPEG 1 2 SpecificConfiq |
Синтаксис |
Количество битов |
Мнемоника |
MPEG_ 1 _2_ SpecificConfig () {
extension*; |
|
|
1 |
bslbf |
1_ |
|
*extension должно быть нулем. |
3 Отображение канала
Применяются следующие правила:
элементы single_channel_element () s и lfe_element () s представляются монофоническими аудиофреймами;
элементы channel_pair_element () s представляются стереофоническими аудиофреймами: для уровня 1 и уровня 2 разрешается не больше одного монофонического аудиофрейма, представляющего single_char>nel_element Q, или одного стереофонического аудиофрейма,
представляющего channel_pair_eiement Q._
Издание официальное
1
4 Формат единицы доступа
4.1 Уровень 1 и 2
Один аудио фрейм отображается непосредственно одной единицей доступа.
4.2 Уровень 3
Одна единица доступа состоит из одного или нескольких элементов mp3_channel_elements. Элемент mpZ_channel_element равняется аудиофрейму уровня 3 со следующими изменениями по сравнению с его определением в ГОСТ Р 54711 или ГОСТ Р 54712: syncword (12 битов) Сообщает полную длину mp3_channel_element (состоящего из
заголовка. error_check, дополнительной информация и основных данных) в байтах.
main_data_begin (9/8 бит) Устанавливается в корректное значение соответствующее, потоку
битов MPEG-1/2 уровня 3. или обнуляется. main_data 0 Обычно сохраняется после допонительной информации
Все прочие элементы данных должны быть установлены согласно их спецификации в ГОСТ Р 54711 или ГОСТ Р 54712. Все установки в заголовке должны соответствовать установкам в AudioSpecirtcConfig 0.
Все элементы mp3_channel_elements, принадлежащие одной и той же метке времени, сохраняются последовательно в одной единице доступа
5 Расширение частоты дискретизации для уровня 3
В этом пункте приводятся спецификации, позволяющие использовать уровень 3 с частотами дискретизации, не определенными в ГОСТ Р 54711 или ГОСТ Р 54712.
Синтаксис и описание потока битов для расширения частот дискретизации ниже, чем определенные в ГОСТ Р 54711-2012. находятся в соответствии с ГОСТ Р 54712-2012 (один фрейм охватывает 576 выборок).
5.1 Скорости передачи
Таблица 1 определяет скорость передачи в зависимости от bitratejndex и частоты дискретизации.
Таблица 1 - Скорость передачи в зависимости от bitratejndex и частоты дискретизации |
bitratejndex |
Определенная скорость передачи. Кбит/с |
8.11.025.12 кГц |
16. 22.05. 24 кГц (см. ГОСТ Р 54712) |
32.44.1.48 кГц (см. ГОСТ Р 54711). |
•0000’ |
Запрещено |
Запрещено |
Запрещено |
•0001 • |
8 |
8 |
32 |
•оою* |
16 |
16 |
40 |
•001Г |
24 |
24 |
48 |
•0100’ |
32 |
32 |
56 |
•оюг |
40 |
40 |
64 |
'ОНО1 |
48 |
48 |
80 |
•0111' |
56 |
56 |
96 |
•1000’ |
64 |
64 |
112 |
•юог |
Запрещено |
80 |
128 |
•1010* |
Запрещено |
96 |
160 |
'1011' |
Запрещено |
112 |
192 |
•1100’ |
Запрещено |
128 |
224 |
'1101' |
Запрещено |
144 |
256 |
'1110' |
Запрещено |
160 |
320 |
•1111' |
Запрещено |
Запрещено |
Запрещено |
|
5.2 Частота дискретизации
В зависимости от частоты дискретизации, сообщенной в AudioSpecificConfig. элемент данных sampling_frequency в заголовке должен быть установлен, как определено в таблице 2.
ГОСТ P 53556.9—2013
Таблица 2 - Установка элемента данных sampling_frequency в зависимости от частоты дискретизации, определенной в AudioSpecificconfig Q |
sampling frequency |
Частота дискретизации |
00 |
11.025 кГц и ее кратные |
01 |
12 кГц и ее кратные |
10 |
8 кГц и ее кратные |
11 |
Зарезервировано |
|
5.3 Дополнение
Дополнение необходимо при частоте дискретизации 11,025 кГц и ее кратных.
5.4 Полосы масштабного коэффициента
Подразделение спектра на scalefactor полосы фиксируется для каждого размера блока и частоты дискретизации и сохраняется в таблицах в кодере и декодере. Таблицы для частот дискретизации, не определенные в ГОСТ Р 54711 или ГОСТ Р 54712. определяются в Приложении А. В соответствии с ГОСТ Р 54711 или ГОСТ Р 54712 масштабный коэффициент для частоты выше самой высокой строки в таблицах является нулем, что означает, что фактический фактор умножения равен 1.0.
3
Приложение А (обязательное)
Таблицы полосы масштабного коэффициента
Таблица А.1 - Частота дискретизации 8 кГц. длинные блоки, число линий 576
Полоса масштабного коэффициента |
Ширина
полосы |
index_of_start |
index_of_end |
0 |
12 |
0 |
11 |
1 |
12 |
12 |
23 |
2 |
12 |
24 |
35 |
3 |
12 |
36 |
47 |
4 |
12 |
48 |
59 |
5 |
12 |
60 |
71 |
6 |
16 |
72 |
87 |
7 |
20 |
88 |
107 |
8 |
24 |
108 |
131 |
9 |
28 |
132 |
159 |
10 |
32 |
160 |
191 |
11 |
40 |
192 |
231 |
12 |
48 |
232 |
279 |
13 |
56 |
280 |
335 |
14 |
64 |
336 |
399 |
15 |
76 |
400 |
475 |
16 |
90 |
476 |
565 |
17 |
2 |
566 |
567 |
18 |
2 |
568 |
569 |
19 |
2 |
570 |
571 |
20 |
2 |
572 |
573 |
|
Таблица А.2 - Частота дискретизации 8 кГц. короткие блоки, число линий 192 |
Полоса масштабного коэффициента |
Ширина
полосы |
index_of_start |
index_of_end |
0 |
8 |
0 |
7 |
1 |
8 |
8 |
15 |
2 |
8 |
16 |
23 |
3 |
12 |
24 |
35 |
4 |
16 |
36 |
51 |
5 |
20 |
52 |
71 |
6 |
24 |
72 |
95 |
7 |
28 |
96 |
123 |
8 |
36 |
124 |
159 |
9 |
2 |
160 |
161 |
10 |
2 |
162 |
163 |
11 |
2 |
164 |
165 |
4
Таблицы А.З - Частота дискретизации 11.025 кГц. длинные блоки, число линий 576 |
Полоса масштабного коэффициента |
Ширина
полосы |
index_of_start |
index_of_end |
0 |
6 |
0 |
5 |
1 |
6 |
6 |
11 |
2 |
6 |
12 |
17 |
3 |
6 |
18 |
23 |
4 |
6 |
24 |
29 |
5 |
6 |
30 |
35 |
6 |
8 |
36 |
43 |
7 |
10 |
44 |
53 |
8 |
12 |
54 |
65 |
9 |
14 |
66 |
79 |
10 |
16 |
80 |
95 |
11 |
20 |
96 |
115 |
12 |
24 |
116 |
139 |
13 |
28 |
140 |
167 |
14 |
32 |
168 |
199 |
15 |
38 |
200 |
237 |
16 |
46 |
238 |
283 |
17 |
52 |
284 |
335 |
18 |
60 |
336 |
395 |
19 |
68 |
396 |
463 |
20 |
58 |
464 |
521 |
|
Таблица А 4 - Частота дискретизации 11,025 кГц. короткие блоки, число линий 192 |
Полоса scalefactor |
Ширина полосы |
index of start |
index of end |
0 |
4 |
0 |
3 |
1 |
4 |
4 |
7 |
2 |
4 |
8 |
11 |
3 |
6 |
12 |
17 |
4 |
8 |
18 |
25 |
5 |
10 |
26 |
35 |
6 |
12 |
36 |
47 |
7 |
14 |
48 |
61 |
8 |
18 |
62 |
79 |
9 |
24 |
80 |
103 |
10 |
30 |
104 |
133 |
11 |
40 |
134 |
173 |
|
Таблицы А.5 - Частота дискретизации 12 кГц. длинные блоки, число линий 576 |
Полоса масштабного коэффициента |
Ширина
полосы |
index_of_start |
index_of_end |
0 |
6 |
0 |
5 |
1 |
6 |
6 |
11 |
2 |
6 |
12 |
17 |
3 |
6 |
18 |
23 |
4 |
6 |
24 |
29 |
5 |
6 |
30 |
35 |
6 |
8 |
36 |
43 |
7 |
10 |
44 |
53 |
8 |
12 |
54 |
65 |
9 |
14 |
66 |
79 |
10 |
16 |
80 |
95 |
11 |
20 |
96 |
115 |
12 |
24 |
116 |
139 |
13 |
28 |
140 |
167 |
14 |
32 |
168 |
199 |
15 |
38 |
200 |
237 |
16 |
46 |
238 |
283 |
17 |
52 |
284 |
335 |
18 |
60 |
336 |
395 |
19 |
68 |
396 |
463 |
20 |
58 |
464 |
521 |
|
Таблица А.6 - Частота дискретизации 12 кГц. короткие блоки, число линий 192 |
Полоса масштабного коэффициента |
Ширина
полосы |
index_of_start |
index_of_end |
0 |
4 |
0 |
3 |
1 |
4 |
4 |
7 |
2 |
4 |
8 |
11 |
3 |
6 |
12 |
17 |
4 |
8 |
18 |
25 |
5 |
10 |
26 |
35 |
6 |
12 |
36 |
47 |
7 |
14 |
48 |
61 |
8 |
18 |
62 |
79 |
9 |
24 |
80 |
103 |
10 |
30 |
104 |
133 |
11 |
40 |
134 |
173 |
|
6
ГОСТ P 53556.9—2013
Приложение Б (справочное)
Преобразование потоков битов MPEG-M2 уровень 3 в элементы mp3_channel_elements
Использование битового накопителя обычно вызывает запуск появления main_data Qa прошлом фрейме потока битов. Это следует изменить, перемещая main_data () сразу после его дополнительной информации. Каждый результирующий элемент mp3_channel_element отображается непосредственно в единицу доступа. Получающийся заголовок и дополнительная информация обозначаются как Н и S/'соответственно.
Все элементы данных header () должны быть сохранены. Элемент данных main_data_begin может быть обнулен. В этом случае CRC должно быть пересчитано.
7
Приложение В (справочное)
Преобразование элементов mpZ_channel elements в потоки битов MPEG-ЛИуровень 3
В.1 Обзор
Элементы mpZ_channel_elements, извлеченные из единицы доступа, должны подвергнуться следующим операциям преобразования, чтобы получить аудиопотоки битов MPEG-M2 уровень 3. соответствующие ГОСТ Р 54711 или ГОСТ Р 54712:
для каждого mpZ_channel_element на устройство доступа открыть экземпляр декодера или выходной поток;
для каждого mpZ_channel_element в каждой единице доступа выполнить:
восстановить syncword и Юех;
скорректировать bitrate_index;
орегулировать main_data_begin:
пересчитать crc_word;
восстановить кадрирование.
В.2. Сигнализация о частоте дискретизации
Чтобы позволить использовать сигнализацию о частотах дискретизации, не определенных в ГОСТ Р 54711 или ГОСТ Р 54712. используется последний бит syncword. Это приводит к следующей модификации синтаксиса:
Синтаксис |
Количество битов |
Мнемоника |
headerQ |
|
|
{ |
|
|
syncword; |
11 |
bslbf |
Idex; |
1 |
bslbf |
... |
|
|
syncword Битовая строка '1111 1111 111'.
Юех Один бит. чтобы указать на расширенный Ю алгоритма. Имеет значение '0* для частот дискретизации, не определенных в ГОСТ Р 54711 или ГОСТ Р 54712.
Юех |
ID |
Частота дискретизации |
0 |
0 |
8, 11.025.12 кГц |
1 |
0 |
16. 22.05. 24 кГц (см. ГОСТ Р 54712), |
1 |
1 |
32. 44.1,48 кГц (см. ГОСТ Р 54711), |
В.З. Инструкции по востановлению
Этот процесс реконструкции предоставляет определенные степени свободы:
bitratejndex (чтобы отрегулировать длину фрейма потока битов согласно новым настройкам bitratejndex, частоте дискретизации и padding_bit. может потребоваться вставка битов (стаффинг)).
^установить максимально позволенное значение (сигнализация максимально позволенной длины фрейма потока битов).
2) установить ближайшее более высокое значение, которое соответствует длине
mp2_channel_element.
3) установить ближайшее более высокое значение, которое соответствует длине
mpZ_channel_element минус main_data_begin текущего аудиофрейма.
4) main_data_begin обнулить.
5) установить main_data_begin в значение, указывающее на конец main_data предыдущего аудиофрейма.
6) установить корректное значение main_data_begin соответствующего потока битов MPEG-1/2 уровень 3.
7) расположение наполнения (вставки битов) в конце main_data. сохраняет вспомогательные
8