Товары в корзине: 0 шт Оформить заказ
Стр. 1
 

101 страница

669.00 ₽

Купить ГОСТ Р 53556.3-2012 — бумажный документ с голограммой и синими печатями. подробнее

Распространяем нормативную документацию с 1999 года. Пробиваем чеки, платим налоги, принимаем к оплате все законные формы платежей без дополнительных процентов. Наши клиенты защищены Законом. ООО "ЦНТИ Нормоконтроль"

Наши цены ниже, чем в других местах, потому что мы работаем напрямую с поставщиками документов.

Способы доставки

  • Срочная курьерская доставка (1-3 дня)
  • Курьерская доставка (7 дней)
  • Самовывоз из московского офиса
  • Почта РФ

Здесь дается краткий обзор декодера CELP (Code Excited Linear Prediction (Линейное предсказание с кодированием)). Декодер CELP прежде всего состоит из генератора возбуждения и фильтра синтеза. Дополнительно декодеры CELP часто включают в свой состав постфильтр. У генератора возбуждения имеется адаптивная книга шифров для моделирования периодических компонент, фиксированные книги шифров для моделирования случайных компонент и декодер усиления, чтобы представлять уровень речевого сигнала.

 Скачать PDF

Оглавление

1 Область применения

     1.1 Общее описание декодера CELP

     1.2 Функциональные возможности MPEG-4 CELP

2 Термины и определения

3 Синтаксис потока бит

     3.1 Тип объекта CELP

     3.2 Тип объекта ER-CELP

4 Семантики

     4.1 Семантики заголовка

     4.2 Семантика фрейма

5 Инструменты декодера MPEG-4 CELP

     5.1 Введение в набор инструментов декодера MPEG-4 CELP

     5.2 Конфигурация масштабируемого AAC/CELP

     5.3 Переменные помощи

     5.4 Элементы потока бит для набора инструментов MPEG-4 CELP

     5.5 Демультиплексор потока бит CELP

     5.6 Декодер CELP LPC и интерполятор

     5.7 Генератор возбуждения CELP

     5.8 Фильтр синтеза CELP LPC

     5.9 Инструмент сжатия тишины CELP

Приложение А (справочное) Инструменты декодера MPEG-4 CELP

Приложение В (справочное) Инструменты кодера MPEG-4 CELP

Библиография

 
Дата введения01.09.2013
Добавлен в базу01.10.2014
Актуализация01.01.2019

Этот ГОСТ находится в:

Организации:

20.11.2012УтвержденФедеральное агентство по техническому регулированию и метрологии942-ст
ИзданСтандартинформ2014 г.
РазработанФГУП ЛО ЦНИИС

Sound broadcasting digital. Coding of signals of sound broadcasting with reduction of redundancy for transfer on digital communication channels. Part 3 (MPEG-4 audio). Code excited linear prediction

Стр. 1
стр. 1
Стр. 2
стр. 2
Стр. 3
стр. 3
Стр. 4
стр. 4
Стр. 5
стр. 5
Стр. 6
стр. 6
Стр. 7
стр. 7
Стр. 8
стр. 8
Стр. 9
стр. 9
Стр. 10
стр. 10
Стр. 11
стр. 11
Стр. 12
стр. 12
Стр. 13
стр. 13
Стр. 14
стр. 14
Стр. 15
стр. 15
Стр. 16
стр. 16
Стр. 17
стр. 17
Стр. 18
стр. 18
Стр. 19
стр. 19
Стр. 20
стр. 20
Стр. 21
стр. 21
Стр. 22
стр. 22
Стр. 23
стр. 23
Стр. 24
стр. 24
Стр. 25
стр. 25
Стр. 26
стр. 26
Стр. 27
стр. 27
Стр. 28
стр. 28
Стр. 29
стр. 29
Стр. 30
стр. 30

ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ТЕХНИЧЕСКОМУ РЕГУЛИРОВАНИЮ И МЕТРОЛОГИИ

ГОСТ Р 53556.3— 2012

НАЦИОНАЛЬНЫЙ

СТАНДАРТ

РОССИЙСКОЙ

ФЕДЕРАЦИИ

Звуковое вещание цифровое

КОДИРОВАНИЕ СИГНАЛОВ ЗВУКОВОГО ВЕЩАНИЯ С СОКРАЩЕНИЕМ ИЗБЫТОЧНОСТИ ДЛЯ ПЕРЕДАЧИ ПО ЦИФРОВЫМ КАНАЛАМ СВЯЗИ

Часть 3

(MPEG-4 AUDIO)

Кодирование речевых сигналов с использованием линейного предсказания — CELP

ISO/IEC 14496-3:2009 (NEQ)

Издание официальное

Москва

Стандартинформ

2014

Предисловие

1    РАЗРАБОТАН Санкт-Петербургским филиалом Центрального научно-исследовательского института связи «Ленинградское отделение» (ФГУП ЛО ЦНИИС)

2    ВНЕСЕН Техническим комитетом по стандартизации ТК480 «Связь»

3    УТВЕРЖДЕН И ВВЕДЕН В ДЕЙСТВИЕ Приказом Федерального агентства по техническому регулированию и метрологии от 20 ноября 2012 г. № 942-ст

4    Настоящий стандарт разработан с учетом основных нормативных положений международного стандарта ИСО/МЭК 14496-3:2009 «Информационные технологии. Кодирование аудиовизуальных объектов. Часть 3. Аудио» (ISO/IEC 14496-3:2009 «Information technology — Coding of audio-visual objects — Part 3: Audio») [1]

5    ВВЕДЕН ВПЕРВЫЕ

Правила применения настоящего стандарта установлены в ГОСТР 1.0-2012 (раздел 8). Информация об изменениях к настоящему стандарту публикуется в ежегодном (по состоянию на 1 января текущего года) информационном указателе «Национальные стандарты», а официальный текст изменений и поправок—в ежемесячном информационном указателе «Национальные стандарты». В случае пересмотра (замены) или отмены настоящего стандарта соответствующее уведомление будет опубликовано в ежемесячно издаваемом информационном указателе «Национальные стандарты». Соответствующая информация, уведомление и тексты размещаются также в информационной системе общего пользования—на официальном сайте Федерального агентства по техническому регулированию и метрологии в сети Интернет (gost.ru)

©Стандартинформ, 2014

Настоящий стандарт не может быть полностью или частично воспроизведен, тиражирован и распространен в качестве официального издания без разрешения Федерального агентства по техническому регулированию и метрологии

II

Синтаксис

Количество

битов

Мнемосхема

BandScalable LSP() {

Ipcjndices [5];

4

uimcbf

Ipcjndices [6];

7

uimcbf

Ipcjndices [7];

4

uimcbf

Ipcjndices [8];

6

uimcbf

Ipcjndices [9];

7

uimcbf

Ipc indices [10];

4

uimcbf

}

Таблица 20 — Синтаксис WideBandLSP ()

Синта ксис

Количество

битов

Мнемосхема

WideBand LSPQ {

Ipcjndices [0];

5

uimcbf

Ipcjndices [1];

5

uimcbf

Ipcjndices [2];

7

uimcbf

Ipcjndices [3];

7

uimcbf

Ipcjndices [4];

1

uimcbf

Ipcjndices [5];

4

uimcbf

Ipcjndices [6];

4

uimcbf

Ipcjndices [7];

7

uimcbf

Ipcjndices [8];

5

uimcbf

Ipc indices [9];

1

uimcbf

}

3.1.2.2 Синтаксис возбуждения (см. таблицы 21,22)

Таблица 21 — Синтаксис RPE_frame ()

Синтаксис

Количество

битов

Мнемосхема

RPE frame])

{

for (subframe = 0; subframe < nrof subframes; subframe++)

{

shapejdeiay [subframe];

8

uimcbf

shapejndex [subframe];

11

uimcbf

gainindices [0][subframe];

12

uimcbf

gainindices [1][subframe];

}

6, 3, 5

uimcbf

Таблица 22 — Синтаксис МРЕ frame ()

Синтаксис

Количество

битов

Мнемосхема

MPE frame])

{

signalmode;

2

uimcbf

mcindex;

6

uimcbf

for (subframe = 0; subframe < nrof subframes; subframe++)

{

8, 9

uimcbf

Окончание таблицы 22

Синтаксис

Количество

битов

Мнемосхема

shape_delay [subframe];

14...

uimcbf

shapepositions [subframe];

32 3...

uimcbf

shapesigns [subframe];

12 6, 7

uimcbf

gainindex [subframe];

}

}

3.2 Тип объекта ER-CELP

3.2.1 Синтаксис заголовка

ErrorResilientCelpSpecificConfig ()

Для типа объекта ER-CELPтребуется следующий ErrorResilientCelpSpecificConfig () (см. таблицы 23,24).

Таблица 23 — Синтаксис ErrorResilientCelpSpecificConfig ()

Синтаксис

Количество

битов

Мнемосхема

ErrorResilientCelpSpecificConfig (uint(4) samplingFrequencylndex) {

isBaseLayer; if (isBaseLayer)

{

ER SC CelpHeader (samplingFrequencylndex);

}

Else

1

uimcbf

{

isBWS Layer; if (isBWSLayer)

{

CelpBWSenhHeader ();

}

else

1

uimcbf

{

CELP-BRS-id;

2

uimcbf

}

}

}

Таблица 24 — Синтаксис ERSCCelpHeader ()

Синтаксис

Количество

битов

Мнемосхема

ER SC CelpHeader (samplingFrequencylndex) {

Excita tion Mode;

1

uimcbf

SampleRateMode;

1

uimcbf

FineRate Control;

1

uimcbf

Silence Compression; if (ExcitationMode == RPE) {

1

uimcbf

RPE Configuration;

}

if (ExcitationMode == MPE) [

3

uimcbf

uimcbf

MPEConfiguration;

5

uimcbf

NumEnhLayers;

2

uimcbf

BandwidthScalabilityMode;

}

}

1

3.2.2 Синтаксис фрейма

Чтобы описать чувствительность к ошибке в символе элементов потока бит, введены категории чувствительности к ошибкам (ESC). Чтобы описать отдельные биты элементов, используется следующая система обозначений.

Усиление, х — у

Обозначает усиление элемента от битах до бита у, в силу чего сначала передается х. Младший бит LSB — нулевой бит и МСВ элемента, который состоит из N бит равен N-1. МСВ всегда первый бит в потоке бит.

Следующий синтаксис является заменой для CelpBaseFrame. Синтаксис для уровня расширения для масштабируемости битовой скорости и полосы пропускания не затронут.

Передача потоков бит CELP

Данные полезной нагрузки для объекта CELP ER передаются как полезная нагрузка sIPacketPayload в базовом уровне и опционном уровне расширения Elementary Stream (элементарный поток).

Базовый уровень эластичного CELP ошибок — полезная нагрузка модуля доступа sIPacketPayload {

ERSCCelpBaseFrame ();

}

Уровень расширения эластичного CELP ошибок — полезная нагрузка модуля доступа.

Чтобы анализировать и декодировать уровни расширения эластичного CELP ошибок, требуется декодированная информация из базового уровня эластичного CELP ошибок. Для режима масштабируемой битовой скорости должны быть включены следующие данные для уровней расширения эластичного CELP ошибок:

sIPacketPayload

{

ERSCCelpBRSenhFrame ();

}

Для режима масштабируемой полосы пропускания должны быть включены следующие данные для уровня расширения эластичного CELP ошибок: sIPacketPayload {

ER_SC_CelpBWSenhFrame ();

}

3.2.2.1 Базовый уровень CELP (см. таблицы 25,26,27)

Таблица 25 — Синтаксис ERSCCelpBaseFrame ()

Синта ксис

Количество

битов

Мнемосхема

ER SC CelpBaseFrameQ {

if (SilenceCompression == OFF) { ER_CelpBaseFrame();

} else {

SC VoiceActivity ESCOQ; if (TXflag == 1){

ER CelpBaseFrameQ; } else if (TX flag == 2) {

SID LSP VQ ESCOQ; SID Frame ESCOQ;

} else if (TX flag == 3) {

SID Frame ESCOQ;

}

}

}

Синтаксис

Количество

битов

Мнемосхема

SC VoiceActivity ESC0 ()

{

ТХ flag;

2

uimcbf

}

Таблица 27 — Синтаксис ERCelpBaseFrame ()

Синтаксис

Количество

битов

Мнемосхема

ER CelpBaseFrameQ {

if (ExcitationMode == МРЕ) { if (SampleRateMode == 8кГц) {

MPE_NarrowBand ESCOQ;

MPE_NarrowBand_ESC1 ();

MPE_NarrowBand_ESC2();

MPE_NarrowBand_ESC3();

MPE NarrowBand ESC4Q;

}

if (SampleRateMode == 16кГц) {

MPE WideBand ESCOQ;

MPE WideBand ESC1Q;

MPE WideBand ESC2Q;

MPE WideBand ESC3Q;

MPE WideBand ESC4Q;

}

}

if ((ExcitationMode == RPE) && (SampleRateMode == 16кГи,)) { RPE WideBand ESCOQ;

RPE WideBand ESC1Q;

RPE WideBand ESC2Q;

RPE WideBand ESC3Q;

RPE WideBand ESC4Q;

};

}

3.2.2.1.1 Синтаксис узкополосного МРЕ (см. таблицы 28,29,30, 31,32)

Таблица 28 — Синтаксис MPE_NarrowBand_ESCO ()

Синтаксис

Количество

битов

Мнемосхема

МРЕ NarrowBand ESC0()

{

if (FineRateControl == ON) {

interpolationflag;

1

uimcbf

LPC Present;

1

uimcbf

}

mcjndex, 5-4;

for (subframe = 0; subframe < nrof subframes;

2

uimcbf

subframe++) {

1

uimcbf

shape delay[subframe], 7;

}

}

Синтаксис

Количество

битов

Мнемосхема

МРЕ NarrowBand ESC1 ()

{

if (FineRateControl == ON) { if (LPC Present == YES) {

Ipcjndices [0], 1-0;

2

uimcbf

Ipc indices [1], 0;

}

} else {

1

uimcbf

Ipcjndices [0], 1-0;

2

uimcbf

Ipc indices [1], 0;

}

signal mode;

for (subframe = 0; subframe < nrof_subframes; subframe++) {

1

uimcbf

2

uimcbf

shape delay[subframe], 6-5;

}

}

2

uimcbf

Таблица 30 — Синтаксис MPE_NarrowBand_ESC2 ()

Синта ксис

Количество

битов

Мнемосхема

MPE NarrowBand ESC2()

{

if (FineRateControl == ON) { if (LPC Present == YES) {

Ipcjndices [2], 6;

1

uimcbf

Ipcjndices [2], 0;

1

uimcbf

Ipc indices [4];

}

} else {

1

uimcbf

Ipcjndices [2], 6;

1

uimcbf

Ipcjndices [2], 0;

1

uimcbf

Ipc indices [4];

}

rMcJndex, 3

for (subframe = 0; subframe < nrof subframes; subframe++)

1

uimcbf

1

uimcbf

{

2

uimcbf

shape_delay[subframe], 4-3; gain index[subframe], 1-0;

}

}

2

uimcbf

Таблица 31 — Синтаксис MPE_NarrowBand_ESC3 ()

Синта ксис

Количество

битов

Мнемосхема

MPE NarrowBand ESC3()

{

if (FineRateControl == ON) {

if (LPC Present == YES) {

Ipc indices [0], 3-2;

2

uimcbf

Ipcjndices [1], 2-1;

2

uimcbf

Ipc indices [2], 5-1;

}

} else {

5

uimcbf

ГОСТ Р 53556.3-2012

Синтаксис

Количество

битов

Мнемосхема

lpc_indices [0], 3-2;

2

uimcbf

Ipcjndices [1], 2-1;

2

uimcbf

Ipc indices [2], 5-1;

}

for (subframe = 0; subframe < nrof subframes;

5

uimcbf

subframe++) {

3

uimcbf

shape_delay[subframe], 2-0;

3... 12

uimcbf

shape signs[subframe]; gain index[subframe], 2;

}

}

1

uimcbf

Таблица 32 — Синтаксис MPE_NarrowBand_ESC4 ()

Синтаксис

Количество

битов

Мнемосхема

MPE NarrowBand ESC4Q

{

if (FineRateControl == ON) { if (LPCPresent == YES) {

Ipcjndices [1], 3;

1

uimcbf

Ipc indices [3];

}

} else {

6

uimcbf

Ipc indices [1], 3;

1

uimcbf

Ipc indices [3],

}

rMcJndex, 2-0

for (subframe = 0; subframe < nrof_subframes; subframe++) {

6

uimcbf

3

uimcbf

shape positions[subframe];

CM

CO

CO

uimcbf

gain index[subframe], 5-3;

}

}

3

uimcbf

Таблица 33 — Синтаксис MPE_WideBand_ESCO ()

3.2.2.1.2 Широкополосный синтаксис МРЕ (см. таблицы 33,34,35,36,37)

Синтаксис

Количество

битов

Мнемосхема

MPE WideBand ESCOQ {

if (FineRateControl == ON) {

interpolation flag;

1

uimcbf

LPC Present;

1

uimcbf

if (LPC Present == YES) {

Ipcjndices [0];

5

uimcbf

Ipcjndices [1], 1-0;

2

uimcbf

Ipcjndices [2], 6;

1

uimcbf

Ipcjndices [2], 4-0;

5

uimcbf

Ipcjndices [4];

1

uimcbf

Ipc indices [5], 0;

}

} else {

1

uimcbf

Ipcjndices [0];

5

uimcbf

13

Синтаксис

Количество

битов

Мнемосхема

Ipcjndices [1], 1-0;

2

uimcbf

Ipcjndices [2], 6;

1

uimcbf

Ipcjndices [2], 4-0;

5

uimcbf

Ipcjndices [4];

1

uimcbf

Ipc indices [5], 0;

}

me index, 4-5;

1

uimcbf

2

uimcbf

}

Таблица 34 — Синтаксис MPE_WideBand_ESC 1 ()

Синтаксис

Количество

Мнемосхема

битов

MPE WideBand ESC1()

{

if (FineRateControl == ON) {

if (LPC_Present == YES) {

Ipcjndices [1], 3-2;

2

uimcbf

Ipcjndices [2], 5;

1

uimcbf

Ipcjndices [5], 1;

1

uimcbf

Ipc indices [6], 1-0;

}

} else {

2

uimcbf

Ipcjndices [1], 3-2;

2

uimcbf

Ipcjndices [2], 5;

1

uimcbf

Ipcjndices [5], 1;

1

uimcbf

Ipc indices [6], 1-0;

}

signal mode;

2

uimcbf

2

uimcbf

for (subframe = 0; subframe < nrof_subframes; subframe++) {

shape delay [subframe], 8-6;

}

}

3

uimcbf

Таблица 35 — Синтаксис MPE_WideBand_ESC2 ()

Синтаксис

Количество

битов

Мнемосхема

MPE WideBand ESC2Q {

if (FineRateControl == ON) { if (LPC_Present == YES) {

Ipcjndices [1], 4;

1

uimcbf

Ipcjndices [3], 6;

1

uimcbf

Ipcjndices [3], 1;

1

uimcbf

Ipcjndices [5], 2;

1

uimcbf

Ipcjndices [6], 3;

1

uimcbf

Ipcjndices [7], 6;

1

uimcbf

Ipcjndices [7], 4;

1

uimcbf

Ipcjndices [7], 1-0;

2

uimcbf

Ipc indices [9];

}

} else {

1

uimcbf

Ipcjndices [1], 4;

1

uimcbf

Ipcjndices [3], 6;

1

uimcbf

Синтаксис

Количество

битов

Мнемосхема

Ipcjndices [3], 1;

1

uimcbf

Ipcjndices [5], 2;

1

uimcbf

Ipcjndices [6], 3;

1

uimcbf

Ipcjndices [7], 6;

1

uimcbf

Ipcjndices [7], 4;

1

uimcbf

Ipcjndices [7], 1-0;

2

uimcbf

Ipc indices [9];

}

mcjndex, 3;

for (subframe = 0; subframe < nrof_subframes;

1

uimcbf

1

uimcbf

subframe++) {

2

uimcbf

shape_delay[subframe], 5-4; gain indexfsubframe], 1-0;

}

}

2

uimcbf

Таблица 36 — Синтаксис MPE_WideBand_ESC3 ()

Синтаксис

Количество

битов

Мнемосхема

MPE WideBand ESC3Q {

if (FineRateControl == ON) { if (LPC_Present == YES) {

Ipcjndices [3], 4-2;

3

uimcbf

Ipcjndices [3], 0;

1

uimcbf

Ipcjndices [5], 3;

1

uimcbf

Ipcjndices [6], 2;

1

uimcbf

Ipcjndices [7], 5;

1

uimcbf

Ipcjndices [7], 3-2;

2

uimcbf

Ipc indices [8], 4-1;

}

} else {

4

uimcbf

Ipcjndices [3], 4-2;

3

uimcbf

Ipcjndices [3], 0;

1

uimcbf

Ipcjndices [5], 3;

1

uimcbf

Ipcjndices [6], 2;

1

uimcbf

Ipcjndices [7], 5;

1

uimcbf

Ipcjndices [7], 3-2;

2

uimcbf

Ipc indices [8], 4-1;

}

for (subframe = 0; subframe < nrof_subframes; subframe++) {

4

uimcbf

shape_delay[subframe], 3-2;

2

uimcbf

shape signsfsubframe];

3 ... 12

uimcbf

gain indexfsubframe], 2;

1

uimcbf

}

}

Синта ксис

Количество

битов

Мнемосхема

МРЕ WideBand ESC4Q {

if (FineRateControl == ON) {

if (LPC_Present == YES) {

Ipc indices [3], 5;

1

uimcbf

Ipc indices [8], 0;

}

} else {

1

uimcbf

Ipc indices [3], 5;

1

uimcbf

Ipc indices [8], 0;

}

me index, 2-0;

1

uimcbf

3

uimcbf

for (subframe = 0; subframe < nrof_subframes; subframe++) {

shape_delay[subframe], 1-0;

2

uimcbf

shape positionsfsubframe];

14 ... 32

uimcbf

gain indexfsubframe], 6-3;

}

}

4

uimcbf

3.2.2.1.3 Широкополосный синтаксис RPE (см. таблицы 38, 39, 40,41,42)

Таблица 38 — Синтаксис RPEWideBandESCO ()

Синта ксис

Количество

битов

Мнемосхема

RPE WideBand ESCOQ {

if (FineRateControl == ON){

interpolation flag;

1

uimcbf

LPC Present;

1

uimcbf

if (LPC_Present == YES) {

Lpc indices [0];

5

uimcbf

Ipc indices [1], 1-0;

2

uimcbf

Ipc indices [2], 6;

1

uimcbf

Ipc indices [2], 4-0;

5

uimcbf

Ipc indices [4];

1

uimcbf

Ipc indices [5], 0;

}

} else {

1

uimcbf

Ipc indices [0];

5

uimcbf

Ipc indices [1], 1-0;

2

uimcbf

Ipc indices [2], 6;

1

uimcbf

Ipc indices [2], 4-0;

5

uimcbf

Ipc indices [4];

1

uimcbf

Ipc indices [5], 0;

}

for (subframe = 0; subframe < nrof_subframes; subframe++) {

1

uimcbf

gain_indices[0][subframe], 5-3; if (subframe == 0) {

3

uimcbf

gainjndicesf 1 ([subframe], 4-3; } else {

2

uimcbf

gain indices[1 ([subframe], 2;

}

}

}

1

uimcbf

Синтаксис

Количество

битов

Мнемосхема

RPE WideBand ESC1 ()

{

if (FineRateControl == ON) { if (LPC_Present == YES) {

Ipc indices [1], 3-2;

2

uimcbf

Ipc indices [2], 5;

1

uimcbf

Ipc indices [5], 1;

1

uimcbf

Ipc indices [6], 1-0;

}

} else {

2

uimcbf

Ipc indices [1], 3-2;

2

uimcbf

Ipc indices [2], 5;

1

uimcbf

Ipc indices [5], 1;

1

uimcbf

Ipc indices [6], 1-0;

{

for (subframe = 0; subframe < nrof subframes; subframe++) {

shape delayfsubframe], 7-5;

}

}

2

uimcbf

3

uimcbf

Таблица 40 — Синтаксис RPE_WideBand_ESC2 ()

Синтаксис

Количество

битов

Мнемосхема

RPE WideBand ESC2Q {

if (FineRateControl == ON) { if (LPC_Present == YES) { Ipcjndices [1], 4;

1

uimcbf

Ipcjndices [3], 6;

1

uimcbf

Ipcjndices [3], 1;

1

uimcbf

Ipc indices [5], 2;

1

uimcbf

Ipcjndices [6], 3;

1

uimcbf

Ipcjndices [7], 6;

1

uimcbf

Ipc indices [7], 4;

1

uimcbf

Ipcjndices [7], 1-0;

2

uimcbf

Ipc indices [9];

}

} else {

1

uimcbf

Ipcjndices [1], 4;

1

uimcbf

Ipc indices [3], 6;

1

uimcbf

Ipcjndices [3], 1;

1

uimcbf

Ipc indices [5], 2;

1

uimcbf

Ipcjndices [6], 3;

1

uimcbf

Ipcjndices [7], 6;

1

uimcbf

Ipc indices [7], 4;

1

uimcbf

Ipcjndices [7], 1-0;

2

uimcbf

Ipc indices [9];

}

for (subframe = 0; subframe < nrof subframes; subframe++)

1

uimcbf

{

2

uimcbf

shape_delay[subframe], 4-3;

1

uimcbf

gainjndices[0][subframe], 2; if (subframe == 0) {

1

uimcbf

ГОСТ Р 53556.3-2012

Содержание

1    Область применения....................................... 1

1.1    Общее описание декодера CELP................................ 1

1.2    Функциональные возможности MPEG-4 CELP......................... 1

2    Термины и определения...................................... 4

3    Синтаксис потока бит...................................... 5

3.1    Тип объекта CELP....................................... 5

3.2    Тип объекта ER-CELP..................................... 9

4    Семантики............................................. 20

4.1    Семантики заголовка...................................... 20

4.2    Семантика фрейма...................................... 23

5    Инструменты декодера MPEG-4 CELP............................... 28

5.1    Введение в набор инструментов декодера CELP MPEG-4................... 28

5.2    Конфигурация масштабируемого AAC/CELP.......................... 29

5.3    Переменные помощи...................................... 29

5.4    Элементы потока бит для набора инструментов MPEG-4 CELP................. 30

5.5    Демультиплексор потока бит CELP............................... 30

5.6    Декодер CELP LPC и интерполятор.............................. 30

5.7    Генератор возбуждения CELP................................. 45

5.8    Фильтр синтеза CELP LPC................................... 62

5.9    Инструмент сжатия тишины CELP............................... 63

Приложение А (справочное) Инструменты декодера MPEG-Л CELP................. 69

Приложение В (справочное) Инструменты кодера MPEG-Л CELP................... 71

Библиография............................................ 96

III

Синтаксис

Количество

битов

Мнемосхема

gainindices[ 1 ][subframe], 2; } else {

gain indices[1][subframe], 1;

}

}

}

1

uimcbf

Таблица 41 — Синтаксис RPE_WideBand_ESC3 ()

Синтаксис

Количество

битов

Мнемосхема

RPE WideBand ESC3Q {

if (FineRateControl == ON) {

if (LPC_Present == YES) { Ipcjndices [3], 4-2;

3

uimcbf

Ipcjndices [3], 0;

1

uimcbf

Ipcjndices [5], 3;

1

uimcbf

Ipcjndices [6], 2;

1

uimcbf

Ipcjndices [7], 5;

1

uimcbf

Ipcjndices [7], 3-2;

2

uimcbf

Ipc indices [8], 4-1; }

} else {

4

uimcbf

Ipcjndices [3], 4-2;

3

uimcbf

Ipcjndices [3], 0;

1

uimcbf

Ipcjndices [5], 3;

1

uimcbf

Ipcjndices [6], 2;

1

uimcbf

Ipcjndices [7], 5;

1

uimcbf

Ipcjndices [7], 3-2;

2

uimcbf

Ipc indices [8], 4-1;

}

for (subframe = 0; subframe < nrof subframes; subframe++)

4

uimcbf

{

2

uimcbf

shape delayfsubframe], 2-1;

}

}

Таблица 42 — Синтаксис RPE_WideBand_ESC4 ()

Синтаксис

Количество

битов

Мнемосхема

RPE WideBand ESC4Q {

if (FineRateControl == ON) { if (LPCJPresent == YES) { Ipcjndices [3], 5;

1

uimcbf

Ipc indices [8], 0;

}

} else {

Ipcjndices [3], 5;

1

uimcbf

1

uimcbf

Ipc indices [8], 0;

}

for (subframe = 0; subframe < nrof_subframes; subframe++) { shape_delay[subframe], 0;

1

uimcbf

1

uimcbf

18

НАЦИОНАЛЬНЫЙ СТАНДАРТ РОССИЙСКОЙ ФЕДЕРАЦИИ

Звуковое вещание цифровое КОДИРОВАНИЕ СИГНАЛОВ ЗВУКОВОГО ВЕЩАНИЯ С СОКРАЩЕНИЕМ ИЗБЫТОЧНОСТИ ДЛЯ ПЕРЕДАЧИ ПО ЦИФРОВЫМ КАНАЛАМ СВЯЗИ Ч а с т ь 3 (MPEG-4 AUDIO)

Кодирование речевых сигналов с использованием линейного предсказания — CELP

Sound broadcasting digital. Coding of signals of sound broadcasting with reduction of redundancy for transfer on digital communication channels. Part 3 (MPEG-4 audio). Code excited linear prediction

Дата введения — 2013—09—01

1 Область применения

1.1    Общее описание декодера CELP

Здесь дается краткий обзор декодера CELP (Code Excited Linear Prediction (Линейное предсказание с кодированием)).

Декодер CELP прежде всего состоит из генератора возбуждения и фильтра синтеза. Дополнительно декодеры CELP часто включают в свой состав постфильтр. У генератора возбуждения имеется адаптивная книга шифров для моделирования периодических компонент, фиксированные книги шифров для моделирования случайных компонент и декодер усиления, чтобы представлять уровень речевого сигнала. Индексы для книг шифров и коэффициентов усиления предоставляются кодером. Индексы книги шифров (индекс задержки шага для адаптивной книги шифров и индекс формы для фиксированной книги шифров) и индексы усиления (коэффициенты усиления адаптивной и фиксированной книг шифров) используются, чтобы генерировать сигнал возбуждения. Затем он фильтруется фильтром линейного прогнозирующего синтеза (фильтр синтеза LP). Коэффициенты фильтра реконструируются, используя индексы LPC, затем интерполируются коэффициентами фильтра последовательных фреймов анализа. И наконец, опционно может быть применен постфильтр, чтобы улучшить качество речи.

1.2    Функциональные возможности MPEG-4 CELP

MPEG-4 CELP представляет собой универсальный алгоритм кодирования с новыми функциональными возможностями. Обычные кодеры CELP предлагают сжатие при одной битовой скорости и оптимизированы для определенных приложений. Сжатие является одной из функций, предоставленных CELP MPEG-4, позволяющей использовать один базовый кодер для различных приложений. Это обеспечивает масштабируемость по битовой скорости и полосе пропускания, а также возможность генерировать потоки бит с произвольной битовой скоростью. Кодер CELPMPEG-4 поддерживает две частоты дискретизации, а именно 8 и 16 кГц. Соответствующие полосы пропускания равны 100—3400 Гцдля частоты дискретизации 8 кГц и 50— 7000 Гцдля частоты дискретизации 16 кГц. Кроме того, заново приняты сжатие молчание и переупорядочение эластичного потока бит ошибок.

1.2.1 Конфигурация кодера CELP MPEG-4

Чтобы генерировать сигнал возбуждения, могут использоваться два различных инструмента. Это инструмент Multi-Pulse Excitation (Мультиимпульсное возбуждение) (МРЕ) или инструмент Regular-Pulse Excitation (Возбуждение регулярным импульсом) (RPE). МРЕ используется для дискретизации речи на частотах 8 кГц или 16 кГц. RPE используется только для дискретизации на частоте 16 кГц. Два возможных режима кодирования сведены в таблице 1.

Издание официальное

Таблица 1 — Режимы кодирования в кодере CELP MPEG-4

Режим кодирования

Инструмент возбуждения

Частота дискретизации

1

RPE

16 кГц

II

МРЕ

8,16 кГц

1.2.2 Особенности кодера CELP MPEG-4

Кодер CELP MPEG-4 предлагает следующие функциональные возможности в зависимости от режима кодирования (см. таблицу 2).

Таблица 2 — Функциональные возможности кодера CELP MPEG-4

Режим кодирования

Функциональность

1

Несколько битовых скоростей, управление FineRate

II

Несколько битовых скоростей, масштабируемость битовой скорости, масштабируемость полосы пропускания, управление FineRate

Для обоих режимов кодирования доступны сжатие молчания и переупорядочение эластичного потока битошибок.

Доступные битовые скорости зависят от режима кодирования и частоты дискретизации. Поддерживаются следующие фиксированные битовые скорости (см. таблицы 3,4).

14400, 16000, 18667, 22533


Таблица 3 — Фиксированные битовые скорости для режима I кодера Битовые скорости для частоты дискретизации 16 кГц, бит/с

Таблица 4 — Фиксированные битовые скорости для режима II кодера

Битовые скорости для частоты дискретизации 8 кГц (бит/с)

Битовые скорости для частоты дискретизации 16 кГц (бит/с)

3850, 4250, 4650, 4900, 5200, 5500, 5700, 6000, 6200, 6300, 6600, 6900, 7100, 7300, 7700, 8300, 8700, 9100, 9500, 9900, 10300, 10500, 10700, 11000, 11400, 11800, 12000, 12200

10900, 11500, 12100, 12700, 13300, 13900, 14300, 14700, 15900, 17100, 17900, 18700, 19500, 20300, 21100, 13600, 14200, 14800, 15400, 16000, 16600, 17000, 17400, 18600, 19800, 20600, 21400, 22200, 23000, 23800

Во время неактивных фреймов используется инструмент сжатия тишины и кодер CELP работает на битовых скоростях, показанных в таблице 5. Битовая скорость зависит от режима кодирования, частоты дискретизации и длины фрейма.

Таблица 5 — Битовые скорости для инструмента сжатия тишины

Режим

кодирования

Частота взятия выборок, кГц

Масштабируемость ширины полосы

Длина фрейма

Битовая скорость, бит/с

TXJlag

HD-SID

LR-SID

1 (RPE)

16

15

133

2533

400

10

200

3800

600

II (МРЕ)

8

On, Off

40

50

525

150

30

67

700

200

20

100

1050

300

10

200

2100

600

Режим

кодирования

Частота взятия выборок, кГц

Масштабируемость ширины полосы

Длина фрейма

Битовая скорость, бит/с

TXJlag

HD-SID

LR-SID

16

Off

20

100

1900

300

10

200

3800

600

On

40

50

1050

150

30

67

1400

200

20

100

2100

300

10

200

4200

600

Управление скоростью: обеспечивает управление битовой скоростью малыми шажками (давая возможность работать на варьируемой битовой скорости). Это достигается только за счет управления скоростью передачи параметров LPC, используя комбинации двух элементов потока бит interpolationflag и флажок LPC_present. Для изменения отношения фреймов LPC к общему числу фреймов между 50 % и 100 % можно использовать управление FineRate. Это позволяет уменьшить битовую скорость относительно битовой скорости привязки, как определено в семантике.

Масштабируемость битовой скорости обеспечивается добавлением уровней расширения. Уровни расширения могут быть добавлены с шагом 2000 бит/сдпя сигналов, дискретизированных с частотой 8 кГц или 4000 бит/с для сигналов, дискретизированных на 16 кГц. С любой битовой скоростью, выбранной из таблицы 4, можно объединить максимум три уровня расширения.

Масштабируемость полосы пропускания с охватом обеих частот дискретизации достигнута включением инструмента расширения полосы пропускания в кодере CELP. Это инструмент расширения, поддерживаемый в Режиме II, который может быть добавлен, если требуется масштабирование с переходом от частоты дискретизации 8 кГц к частоте дискретизации 16 кГц. Полный кодер с масштабируемостью полосы пропускания состоит из основного кодера CELP для частоты дискретизации 8 кГц и инструмента расширения полосы пропускания для обеспечения одного уровня масштабируемости. Основной кодер CELP для частоты дискретизации 8 кГц может включить несколько уровней. Кодер частоты дискретизации 8 кГц с этим инструментом отличается от кодера частоты дискретизации 16 кГц. Обе конфигурации (кодер частоты дискретизации 8 кГц с масштабируемостью полосы пропускания и кодер частоты дискретизации 16 кГц) предлагают большую ясность и естественность декодированной речи, чем дает один только кодер 8 кГц, потому что они разворачивают полосу пропускания до 7 кГц. Дополнительная битовая скорость, требующаяся для инструмента масштабируемости полосы пропускания, может быть выбрана из четырех дискретных шагов для каждой битовой скорости основного уровня, как показано в таблице 6.

Таблица 6 — Битовые скорости для режима масштабируемой полосы пропускания

Битовая скорость основного уровня, бит/с

Дополнительная битовая скорость, бит/с

3850 — 4650

+9200, +10400, +11600, +12400

4900 — 5500

+9467, +10667, +11867, +12667

5700 — 10700

+10000, +11200, +12400, +13200

11000 — 12200

+11600, +12800, +14000, +14800

Инструмент сжатия тишины может использоваться, чтобы уменьшить битовую скорость для входных сигналов с небольшой голосовой активностью. В течение таких неактивных периодов декодер заменяет регулярный сигнал возбуждения искусственно сгенерированным шумом. Для периодов голосовой активности всегда используется регулярный процесс синтеза речи. Инструмент сжатия тишины доступен, когда используется тип объекта ER-CELP.

Переупорядочение эластичного потока бит ошибок позволяет эффективно использовать усовершенствованные техники кодирования канала как неравномерная защита от ошибок (UEP). Основная идея состоит в том, чтобы перестроить контент звукового фрейма в зависимости от его чувствительности к ошиб-

з

кам в одном или более случаях, принадлежащих различным категориям чувствительности к ошибкам (ESC). Эта перестановка воздействует на данные поэлементно или даже поразрядно. Фрейм эластичного потока бит ошибок строится, связывая эти случаи. Эти функциональные возможности доступны, когда используется тип объекта ER-CELP.

1.2.3 Алгоритмическая задержка режимов CELP MPEG-4

Алгоритмическая задержка кодера CELP исходит из длины фрейма и длины дополнительного предвидения. Длина фрейма зависит от режима кодирования и битовой скорости. Длина предвидения, которая является информативным параметром, также зависит от режима кодирования. Задержки, представленные ниже, применимы к режимам, где управление FineRate Control выключено (см. таблицы 7, 8, 9). Когда управление FineRate Control включено, вносится дополнительная задержка на один фрейм. Масштабируемость полосы пропускания в кодере режима II требует дополнительного предвидения на 5 мс из-за субдискретизации.

Таблица 7 — Задержка и длина фрейма для кодера режима I частоты дискретизации 16 кГц

Битовая скорость для режима 1, бит/с

Задержка, мс

Длина фрейма, мс

14400

26,25

15

16000

18,75

10

18667

26,56

15

22533

26,75

15

Таблица 8 — Задержка и длина фрейма для кодера режима II частоты дискретизации 8 кГц

Битовая скорость для режима II, бит/с

Задержка, мс

Длина фрейма, мс

3850, 4250, 4650

45

40

4900, 5200, 5500, 6200

35

30

5700, 6000, 6300, 6600, 6900, 7100, 7300, 7700, 8300, 8700, 9100, 9500, 9900, 10300, 10500, 10700

25

20

11000, 11400, 11800, 12000, 12200

15

10

Таблица 9 — Задержка и длина фрейма для кодера режима II частоты дискретизации

Битовая скорость для режима II, бит/с

Задержка, мс

Длина фрейма, мс

10900, 11500, 12100, 12700, 13300, 13900, 14300,14700, 15900, 17100, 17900, 18700, 19500, 20300, 21100

25

20

13600, 14200, 14800, 15400, 16000, 16600, 17000,17400, 18600, 19800, 20600, 21400, 22200, 23000, 23800

15

10

В случае, если сжатие тишины используется, алгоритмическая задержка такая же, как без сжатия тишины, посколку используются такая же длина фрейма и такая же дистанция дополнительного упреждающего просмотра.

2 Термины и определения

Термины и определения в соответствии с ГОСТ Р 53556.0-2009

ГОСТ Р 53556.3-2012

3 Синтаксис потока бит

3.1    Тип объекта CELP

3.1.1    Синтаксис заголовка

CelpSpecificConfig ()

Для типа объекта CELP требуется следующий CelpSpecificConfig () (см. таблицы 10,11,12)

Таблица 10 — Синтаксис CelpSpecificConfig ()

Синтаксис

Количество

битов

Мнемосхема

CelpSpecificConfig (uint(4) samplingFrequencylndex) {

isBaseLayer if (isBaseLayer)

{

CelpHeader (samplingFrequencylndex);

}

else

{

isBWSLayer; if (isBWSLayer)

{

CelpBWSenhHeader ();

}

else

{

1

uimsbf

CELP-BRS-id;uimcbf

}

}

}

2

uimsbf

Таблица 11 — Синтаксис CelpHeader ()

Синтаксис

Количество

битов

Мнемосхема

CelpHeader (samplingFrequencylndex) {

Excita tion Mode;

1

uimcbf

SampleRateMode;

1

uimcbf

FineRate Control;

1

uimcbf

if (ExcitationMode == RPE) { RPE Configuration;

}

if (ExcitationMode == MPE) {

3

uimcbf

MPEConfiguration;

5

uimcbf

NumEnhLayers;

2

uimcbf

BandwidthScalabilityMode;

}

}

1

uimcbf

Таблица 12 — Синтаксис CelpBWSenhHeader ()

Синтаксис

Количество

битов

Мнемосхема

CelpBWSenhHeader ()

{

В WSconfiguration;

2

uimcbf

3.1.2 Синтаксис фрейма

Передача потоков бит CELP

Каждый уровень потока бит аудио CELP MPEG-4 передается в элементарном потоке. В sIPacketPayload должны быть включены следующие динамические данные для Аудио CELP:

Базовый уровень CELP — полезная нагрузка модуля доступа sIPacketPayload {

CelpBaseFrame ();

}

Уровень расширения CELP—полезная нагрузка модуля доступа

Чтобы анализировать и декодировать уровень расширения CELP, требуется информация, декодированная из базового уровня CELP. Для масштабируемого режима битовой скорости должны быть включены следующие данные для уровня расширения CELP: sIPacketPayload {

CelpBRSenhFrame ();

}

Для масштабируемого режима полосы пропускания должны быть включены следующие данные для уровня расширения CELP: sIPacketPayload {

CelpBWSenhFrame 0;

}

В случае, если масштабирование битовой скорости и масштабирование полосы пропускания используются одновременно, сначала должны быть переданы все уровни расширения битовой скорости, а затем уровень масштабируемости полосы пропускания (см. таблицы 13,14,15,16,17,18,19,20)

Таблица 13 — Синтаксис CelpBaseFrame ()

Синтаксис

Количество

битов

Мнемосхема

CelpBaseFrameQ

{

Celp_LPC();

if (ExcitationMode == MPE) {

MPE frameQ;

}

if ((ExcitationMode==RPE) && (SampleRateMode==16Kru,)) { RPE frameQ;

}

}

Таблица 14 — Синтаксис CelpBRSenhFrame ()

Синтаксис

Количество

битов

Мнемосхема

CelpBRSenhFrameQ

{

for (subframe = 0; subframe < nrof_subframes; subframe++) { shape_enh_positions [subframe][enh_layer]; shape_enh_signs [subframe][enh_layer]; gain enh index [subframe][enh layer];

}

}

4, 12 2, 4 4

uimcbf

uimcbf

uimcbf

Таблица 15 — Синтаксис CelpBWSenhFrame ()

Синтаксис

Количество

битов

Мнемосхема

CelpBWSenhFrameQ

{

BandScalable_LSP()

for (subframe=0; subframe<nrof subframe bws; subframe++)

{

shape_bws_delay [subframe]; shapebwsjpositions [subframe]; shape_bws_signs [subframe]; gain bws index [subframe];

}

}

3

22, 26, 30, 32 6, 8, 10, 12 11

uimcbf

uimcbf

uimcbf

uimcbf

3.1.2.1 Синтаксис LPC

Таблица 16 — Синтаксис CelpJLPC ()

Синтаксис

Количество

битов

Мнемосхема

Celp LPC()

{

if (FineRateControl == ON){

interpolationflag;

1

uimcbf

LPCPresent; if (LPC Present == YES) { LSP VQ();

}

} else {

LSP VQQ

}

}

1

uimcbf

Таблица 17 — Синтаксис LSPVQ ()

Синтаксис

Количество

битов

Мнемосхема

LSP VQ()

{

if (SampleRateMode == 8кГц) [ NarrowBand_ LSP();

} else {

WideBand LSP();

}

}

Таблица 18 — Синтаксис NarrowBand_LSP ()

Синтаксис

Количество

битов

Мнемосхема

NarrowBand LSPQ {

Ipc indices [0];

4

uimcbf

Ipc indices [1];

4

uimcbf

Ipc indices [2];

7

uimcbf

Ipc indices [3];

6

uimcbf

Ipc indices [4];

1

uimcbf

}