ПО ТЕХНИЧЕСКОМУ РЕГУЛИРОВАНИЮ И МЕТРОЛОГИИ
НАЦИОНАЛЬНЫЙ
СТАНДАРТ
РОССИЙСКОЙ
ФЕДЕРАЦИИ
Звуковое вещание цифровое
КОДИРОВАНИЕ СИГНАЛОВ ЗВУКОВОГО ВЕЩАНИЯ С СОКРАЩЕНИЕМ ИЗБЫТОЧНОСТИ ДЛЯ ПЕРЕДАЧИ ПО ЦИФРОВЫМ КАНАЛАМ СВЯЗИ. ЧАСТЬ III (MPEG-4 AUDIO)
Параметрическое кодирование звуковых сигналов (HILN)
ISO/IEC 14496-3:2009 (NEQ)
Издание официальное
Москва
Стандартинформ
2014
Предисловие
1 РАЗРАБОТАН Санкт-Петербургским филиалом Центрального научно-исследовательского института связи «Ленинградское отделение» (ФГУП ЛО ЦНИИС)
2 ВНЕСЕН Техническим комитетом по стандартизации ТК 480 «Связь»
3 УТВЕРЖДЕН И ВВЕДЕН В ДЕЙСТВИЕ Приказом Федерального агентства по техническому регулированию и метрологии от 22 ноября 2013 г. ТК 1704-ст
4 Настоящий стандарт разработан с учетом основных нормативных положений международного стандарта ИСО/МЭК 14496-3:2009 «Информационные технологии. Кодирование аудиовизуальных объектов. Часть 3. Аудио» (ISO/IEC 14496-3:2009 «Information technology — Coding of audio-visual objects — Part 3: Audio». NEQ)
5 ВВЕДЕН ВПЕРВЫЕ
Правипа применения настоящего стандарта установлены в ГОСТ Р 1.0-2012 (раздел 8). Информация об изменениях к настоящему стандарту публикуется в годовом (по состоянию на 1 января текущего года) информационном указателе «Национальные стандарты», а официальный текст изменений и поправок — в ежемесячно издаваемом информационном указателе «Национальные стандарты». В случае пересмотра (замены) или отмены настоящего стандарта соответствующее уведомление будет опубликовано в ближайшем выпуске ежемесячного информационного указателя «Национальные стандарты». Соответствующая информация, уведомление и тексты размещаются также в информационной системе общего пользования — на официальном сайте Федерального агентства по техническому регулированию и метрологии в сети Интернет (gost.ru)
О Стандартинформ. 2014
Настоящий стандарт не может быть полностью или частично воспроизведен, тиражирован и распространен в качестве официального издания без разрешения Федерального агентства по техническому регулированию и метрологии
II
ГОСТ P 53556.7—2013
Содержание
1 Область действия.........................................................................................................................................1
1.1 Технический обзор..................................................................................................................................1
2 Термины и определения...............................................................................................................................2
3 Синтаксис потока битов...............................................................................................................................2
3.1 Конфигурация декодера (ParametricSpecificConfig).............................................................................2
3.2 Фрейм потока битов (sIPacketPayload)..................................................................................................5
4 Семантика потока битов............................................................................................................................26
4.1 Конфигурация декодера (ParametricSpecificConfig)...........................................................................26
4.2 Фрейм потока битов (sIPacketPayload).................................................................................................27
5 Инструменты параметрического декодера...............................................................................................29
5.1 Инструменты декодера HILN...............................................................................................................29
5.2 Интегрированный параметрический кодер.........................................................................................47
6 Устойчивые к ошибкам полезные нагрузки потока битов........................................................................47
6.1 Обзор инструментов.............................................................................................................................47
6.2 ERHILN.................................................................................................................................................48
Приложение А (справочное) Параметрический аудиокодер......................................................................49
Библиография................................................................................................................................................54
III
НАЦИОНАЛЬНЫЙ СТАНДАРТ РОССИЙСКОЙ ФЕДЕРАЦИИ
Звуковое вещание цифровое
КОДИРОВАНИЕ СИГНАЛОВ ЗВУКОВОГО ВЕЩАНИЯ С СОКРАЩЕНИЕМ ИЗБЫТОЧНОСТИ ДЛЯ ПЕРЕДАЧИ ПО ЦИФРОВЫМ КАНАЛАМ СВЯЗИ.
ЧАСТЬ III (MPEG-4 AUDIO)
Параметрическое кодирование звуковых сигналов (HILN)
Sound broadcasting digital
Coding of signals of sound broadcasting with reduction of redundancy for transfer on digital communication channels A part III (MPEG-4 audio) Parametric audio coding (HILN)
Дата введения — 2014—09—01
1 Область действия
Параметрическое аудиокодирование обеспечивает инструменты HILN. которые дополняют другие инструменты кодирования естественного аудио в области уровней очень низких битовых скоростей. Их внимание сосредоточено на представлении монофонических музыкальных сигналов с низкой и промежуточной сложностью контента в диапазоне 4 — 16 Кбит/с. HILN задействует высокую степень интерактивности путем неявной поддержки изменения скорости и шага во время воспроизведения с возможностью масштабируемости скорости передачи. Кроме того возможная комбинация с инструментами параметрического кодирования речи HVXC допускает очень эффективные схемы кодирования речи и музыкальных сигналов.
1.1 Технический обзор
Параметрическое аудиокодирование MPEG-4 использует метод HILN (Гармонические и отдельные линии плюс шум), чтобы кодировать такие аудиосигналы, как музыка на скоростях передачи 4 Кбит/с и выше, используя масштабируемое параметрическое представление аудиосигнала HILN позволяет независимо изменять скорости и шаг во время декодирования. Кроме того HILN может быть объединено с параметрическим кодированием речи MPEG-4 (HVXC). чтобы сформировать интегрированный параметрический кодер, охватывающий более широкий диапазон сигналов и скоростей передачи.
Интегрированный параметрический кодер может работать в следующих режимах:
Таблица 1— Режимы работы параметрического кодера |
PARAmode |
Описание |
0 |
только HVXC |
1 |
только HILN |
2 |
переключение HVXC/HILN |
3 |
смешанный HVXC/HILN |
|
PARAmodes 0 и 1 представляют режимы фиксированных HVXC и HILN. PARAmode 2 разрешает автоматическое переключение между HVXC и HILN в зависимости от типа текущего входного сигнала. В PARAmode 3 декодеры HVXC и HILN могут использоваться одновременно, и их выходные сигналы добавляются (смешиваются) в параметрическом декодере.
В режимах ‘коммутируемые HVXC/HILN" и “смешанные HVXC/HILN инструменты декодера HVXC и HILN работают альтернативно или одновременно согласно PARAswitchMode или PARAmixMode те-
Издание официальное
кущего фрейма. Чтобы получить надлежащее временное выравнивание выходных сигналов декодера HVXC и HILN прежде, чем они будут добавлены, буфер FIFO компенсирует разницу во времени между задержкой декодера HVXC и HILN.
Чтобы избежать трудных переходов на границах фрейма, когда декодеры HVXC или HILN включаются или выключаются, соответствующие выходные сигналы декодера появляются и спадают постепенно. Для декодера HVXC применяется линейное изменение 20 мс. когда он включается или выключается. Декодер HILN не требует дополнительного замирания из-за гладких окон синтеза, используемых в синтезаторе HILN Необходимо только сбросить декодер HILN (numLine = 0). если текущий фрейм потока битов не содержит HILNframe ().
2 Термины и определения
В настоящем стандарте применены термины и сокращения с соответствующими определениями, используемые в ГОСТ Р 53556.0-2009.
3 Синтаксис потока битов
Естественный объект аудио MPEG-4. использующий параметрическое кодирование, передается в одном или нескольких элементарных потоках: поток базового уровня, поток дополнительного уровня улучшения и один или более дополнительных потоков уровня расширения.
Синтаксис потока битов описывается в коде pseudo-C.
Мнемоники LARH1, LARH2. LARH3. LARN1. LARN2. DIA, DIF. DHF. DFS указывают, что используется кодовая комбинация "v/c/ftf.
Мнемонический SDC указывает, что используется кодовая комбинация Vc/бГ. которая декодируется HILN SubDivisionCode. используя параметры для SDCdecode 0, как дано в описании синтаксиса потока битов.
3.1 Конфигурация декодера (ParametricSpecificConfig)
Информация о конфигурации декодера для параметрического кодирования передается в ParametricSpecificConfig 0 базового уровня и элементарном потоке уровня улучшения или расширения.
Параметрический базовый уровень — конфигурация
Параметрический кодер в немасштабируемом режиме или базовом уровне в масштабируемом режиме HILN используют ParametricSpeciricConrig () с isBaseLayer == 1.
Параметрический уровень улучшения/расширения HILN — конфигурация
Чтобы использовать HILN в качестве ядра в режиме «масштабируемый T/F с ядром», в дополнение к базовому уровню HILN требуется уровень улучшения HILN. При работе с масштабируемой скоростью передачи HILN в дополнение к базовому уровню HILN разрешаются один или более уровней расширения HILN. Уровень улучшения и уровень расширения используют ParametricSpecificConfig 0 с isBaseLayer == 0.
Таблица 2 — Синтаксис ParametricSpecificConfig () |
Синтаксис |
Количество битов |
Мнемоника |
ParametricSpecificConfig () {
IsBaseLayer; if (isBaseLayer) { PARAconfig Q;
}
else {
HUNenexConhg Q;
}
) |
1 |
uimsbf |
|
ГОСТ P 53556.7—2013
3.1.1 Конфигурация параметрического декодера аудио
Таблица 3 — Синтаксис PARAconhg () |
Синтаксис |
КОЛИ'ЖСТВО битое |
Мнемоника |
PARAconfig 0 {
PARAmode. |
2 |
uimsbf |
if (PARAmode1 = 1){ ErHVXCconhg 0;
}
if (PARAmode1 = 0) { HILNconhg 0.
}
PARAextensjonHag. |
1 |
uimsbf |
if (PARAextensionRag) (
Г to be dehned in MPEG 4 Phase 3 7
}
} |
|
|
|
Таблица 4 — PARAmode |
PARAmode |
Длина фрейма |
Описание |
0 |
20 мс (N = 160 выборок) |
только HVXC |
1 |
см 3.1.2 и 5.1 4 3 3 |
только HILN |
2 |
40 мс (N = 320 выборок) |
переключение HVXC/HILN |
3 |
40 мс (Л/ = 320 выборок) |
смешивание HVXC/HILN |
|
3.1.2 Конфигурация декодера HILN
Таблица 5 — СинтаксисHILNconhg |
Синтаксис |
Количество битов |
Мнемоника |
HILNconhg 0 {
HILNquantMode. |
1 |
uimsbf |
HILNmaxNumUne: |
8 |
uimsbf |
HILNsampleRateCode. |
4 |
uimsbf |
HILNframeLength. |
12 |
uimsbf |
HILNcontMode. |
2 |
uimsbf |
} |
|
|
|
Таблица 6 — Синтаксис HILNenexConhg 0 |
Синтаксис |
Количество битов |
Мнемоника |
HILNconfig 0 |
|
|
{ |
|
|
HILNenhaLayer |
1 |
uimsbf |
|
3 |
Окончание таблицы 6 |
Синтаксис |
Количество битов |
Мнемоника |
if (HILNenhaLayer) { HILNenhaQuantMode
}
} |
2 |
uimsbf |
|
Таблица 7 — HILNsampleRateCode |
HIL NsampteRate Code |
sampleRate |
maxF Index |
0 |
96000 |
890 |
1 |
88200 |
876 |
2 |
64000 |
825 |
3 |
48000 |
779 |
4 |
44100 |
765 |
5 |
32000 |
714 |
6 |
24000 |
668 |
7 |
22050 |
654 |
8 |
16000 |
603 |
9 |
12000 |
557 |
10 |
11025 |
544 |
11 |
8000 |
492 |
12 |
7350 |
479 |
13 |
зарезервировано |
зарезервировано |
14 |
зарезервировано |
зарезервировано |
15 |
зарезервировано |
зарезервировано |
|
Таблица 8 — linebits |
HIL NmaxNumUne |
0 |
1 |
2.3 |
4,. 7 |
8 15 |
16 31 |
32. 63 |
64 127 |
128 255 |
linebits |
0 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
|
Таблица 9 — HILNcontMode |
HILNcontMode |
Дополнительное продолжение линии декодером (см подпункт 514 31) |
0 |
гармонические линии <-> отдельные линии и линии гармоник <-> линии гармоник |
1 |
режим 0 плюс отдельные линии <-> отдельные линии |
2 |
дополнительное продолжение линий декодером отсутствует |
3 |
(зарезервировано) |
|
Число битов улучшения частоты (fEnhbits р]) в HILNenhaFrame () вычисляется следующим образом:
• отдельная линия:
fEnhbits р] = max (О. fEnhbitsBase [ILFreqlndex р]] + fEnhbitsMode [HILNenhaQuantMode])
• линия гармоники:
fEnhbits pj = max (0, fEnhbitsBase piarmFreqlndex] + fEnhbitsMode [HILNenhaQuantMode] + fEnhbitsHanm [i])
ГОСТ P 53556.7—2013
Таблица 10 — fEnbbitsBase |
ILFreqlndex |
harwFreqlndex |
fEnhbrtsBase |
0.. 159 |
0 1243 |
0 |
160 269 |
1244 1511 |
1 |
270.. 380 |
1512.. 1779 |
2 |
381.. 491 |
1780 2047 |
3 |
492 602 |
|
4 |
603 713 |
|
5 |
714 890 |
|
6 |
|
Таблица 11 — fEnhbilsMode |
HILNenhaQuantMoOe |
0 |
1 |
2 |
3 |
fEnhMsModa |
-3 |
-2 |
-1 |
0 |
|
Таблица 12 — fEnhbitsHarm |
i |
0 |
1 |
2 3 |
4.7 |
8 9 |
fEnhbtsHarm ft] |
0 |
1 |
2 |
3 |
4 |
|
Таблица 13 — Константы HILN |
tmbits |
4 |
atkbils |
4 |
decbits |
4 |
tmEnhbits |
3 |
atkEnhbits |
2 |
dacEnhbits |
2 |
phasabits |
5 |
|
3.2 Фрейм потока битов (sIPacketPayload)
Динамические данные для параметрического кодирования передаются как пакетная полезная нагрузка SL в элементарном потоке базового уровня и дополнительного уровня улучшения или расширения
Параметрический базовый уровень — полезная нагрузка устройства доступа.
Для параметрического кодера в немасштабируемом режиме или для базового уровня в масштабируемом режиме HILN определяется следующая полезная нагрузка фрейма потока битов:
sIPacketPayload {
PARAframe ();
}
Параметрический уровень улучшения/расширения HILN— полезная нагрузка устройства доступа.
Чтобы проанализировать и декодировать уровень улучшения HILN. запрашивается декодируемая информация из базового уровня HILN.
Чтобы проанализировать и декодировать уровень расширения HILN. запрашивается декодируемая информация из базового уровня HILN и возможного нижнего уровня расширения HILN. Синтаксис потока битов уровней расширения HILN описывается способом, который требует, чтобы фреймы базового потока битов HILN и расширения анализировались в надлежащем порядке:
5
1 |
HILNbasicFrame () |
фрейм базового потока битов |
2 |
HILNextFrame (1) |
фрейм 1-го потока битов расширения (если доступен фрейм базового потока битов) |
3 |
HILNextFrame (2) |
фрейм 2-го потока битое расширения (если доступны фреймы базового потока и 1-го потока битов расширения) |
4 |
ит д |
|
Для уровня улучшения и уровня расширения в масштабируемом режиме HILN определяется следующая полезная нагрузка фрейма потока битов:
si Packet Payload {
HILNenexFrame ();
}
3.2.1 Фрейм параметрического потока битов аудио
Таблица 14 — Синтаксис PARAframe () |
Синтаксис |
Количество битов |
Мнемоника |
PARAframe ()
{
if (PARAmode == 0) { ErHVXCtrame (HVXCrate);
}
else if (PARAmode =- 1) { HILNframe 0.
}
else if (PARAmode ==2){ SMtchFrame ();
}
else if (PARAmode == 3) { mixFrame ().
}
} |
|
|
|
Таблица 15 — Синтаксис sviitchFrame () |
Синтаксис |
Количество битов |
Мнемоника |
switchFrame 0 {
РА RA s witch Mode, if (PARAswtchMode == 0) {
ErHVXCdoubleframe (HVXCrate);
}
else {
HILNframe ();
)
} |
1 |
uimsbf |
|
6 |
ГОСТ P 53556.7—2013
В каждом фрейме выбирается один из следующих PARAswitchModes
Таблица 16 — PARAswtchMode |
PARAsnrtchMod* |
Описание |
0 |
только HVXC |
1 |
только HILN |
|
Таблица 17 — Синтаксис rmxFrame () |
Синтаксис |
Количество битов |
Мнемоника |
rmxFrame 0 {
PARAmixMode if (PARAmixMode == 0) {
ErHVXCdoubleframe (HVXCrate).
}
else if (PARAmixMode == 1) { ILNframe 0-
ErHVXCdoubleframe (2000).
}
else if (PARAmixMode == 2) { HILNframe Q.
ErHVXCdoubleframe (4000).
}
else if (PARAmixMode == 3) { HILNframe ();
)
} |
2 |
uimsbf |
|
В каждом фрейме выбирается один из следующих PARAmixModes: Таблица 18 — PARAmixMode
PARAmixMode |
Описание |
0 |
только HVXC |
1 |
HVXC 2 Кбит/с и HILN |
2 |
HVXC 4 Кбит/с и HILN |
3 |
только HILN |
|
Таблица 19 — Синтаксис HVXCdoubleframe () |
Синтаксис |
Количество битов |
Мнемоника |
ErHVXCdoubleframe (rate)
{
if (rate> = 3000) {
ErHVXCfixframe (4000): |
|
|
|
7 |