НПО Системы Безопасности
(499)340-94-73 График работы:
ПН-ПТ: 10:00-19:00
СБ-ВС: выходной

Главная » Периодика » Безопасность

0 ... 34353637383940 ... 262


Возбуждение

Генератор

H(z)

сигнала

Вход -

Декодер .

Фильтр НЧ

Параметры фильтра

Выход

Рис. 3.5.10. Блок-схема синтезатора сигнала (декодера источника) для ЛКП системы

Генератор

белого шума

Период высоты звука I

Переключатель голосовых и неголосовых звуков

Периодический

импульсный

генератор


Всеполюсный

Сигнал

/

фильтр

речи

Усиление

Рис. 3.5.11. Блок-схема модели генерации сигнала речи

Когда ВЫХОД источника стационарен, параметры порождающего фильтра должны быть определены лишь однажды. Однако большинство источников, встречающихся на практике, в лучшем случае квазистационарны. В связи с этим обстоятельством необходимо периодически получать новые оценки для коэффициентов фильтра, для усиления G, вида возбуждающей функции и передавать эти данные к приёмнику.

Пример 3.5.1. Блок-схема рис. 3.5.11 иллюстрирует модель источника речи. Здесь имеются две взаимоисключающе возбуждающие функции для моделирования голосовых (вокализованных) и неголосовых (невокализованных) звуков речи. В пределах короткого интервала времени голосовая речь является периодической с основной частотой /д или с периодом повторения 1 д (основной тон), который зависит от говорящего. Таким образом, речь генерируется возбуждением модели (голосового тракта) фильтра с одними полюсами посредством периодической импульсной последовательности с периодом, равным требуемому периоду повторения. Невокализованные звуки генерируются путём возбуждения модели фильтра случайным шумом. Кодер речи в передатчике должен определить правильный тип возбуждающей функции, основной тон, параметр усиления G и коэффициенты предсказания. Эти параметры кодируются двоичными символами и передаются приёмнику. Как правило, информация о типе звука (вокализованный или невокализованный) требует для передачи 1 бит, период повторения основного тона адекватно представляется 6 битами, параметр усиления G может быть представлен 5 битами после того, как его динамический диапазон тдларйфлггчсскйСЖйт. Кзэффйцг/гй..чз. предсказания требуют 8...10 бит/коэфф. для адекватного представления (см. Рабинер и



Шафер, 1978). Смысл в такой высокой точности представления тот, что относительно малые изменения в коэффициентах предсказания ведут к большим изменениям в положении полюсов фильтра H{z) . Требования к точности могут быть ослаблены путём передачи коэффициентов "отражения а,,, которые имеют меньший динамический диапазон. Они могут быть адекватно представлены 6 битами. Таким образом, для предсказателя порядка р = \0 [пять полюсов в H{z)] общее число битов равно 72. С учётом квазистационарной природы сигналов речи линейная модель системы должна обновляться периодически, как правило, один раз кахсдые 15...30 мс. Поэтому битовая скорость кодера источника находится в диапазоне 4800.. .2400 бит/с.


Генератор импульсов


Выход

Рис. 3.5.12. Всеполюсный решётчатый фильтр для синтеза сигнала речи

Если К декодеру передаются коэффициенты отражения, нет надобности пересчитывать их в коэффициенты предсказания для того, чтобы реализовать синтезатор речи. Синтез выполняется путём реализации лестничного фильтра, показанного на рис. 3.5.12, который использует коэффициенты отражения непосредственно и который эквивалентен линейному фильтру предсказания.

Линейная модель с одними полюсами, для которой коэффициенты фильтра оцениваются посредством линейного предсказания, являются простейшей линейной моделью для источника. Более общая модель источника - линейный фильтр, который содержит и полюса, и нули. В нуль-полюсной модели выход источника х„ удовлетворяет разностному уравнению

где и„ - входная возбуждающая последовательность. Задача теперь заключается в оценке параметров фильтра {а} и {б} на основе данных х,, / = 0. 1,..., TV-l, выдаваемых источником. Однако критерий СКО, использованный для минимизации ошибки е„ = X, - х„, где х„ - оценка х„, сводится теперь к решению совокупности нелинейных уравнений относительно параметров {а} и {Ь}, что выполняется громоздко и математически трудно. Чтобы избежать решения нелинейных уравнений, разработан ряд субоптимальных методов для нуль-полюсного моделирования. Обсуждение этой техники, однако, уведёт нас далеко от предмета.

ЛКП, описанные выше, формируют основу для более сложных модельных методов кодирования источника. Модельные методы, используемые для кодирования речи, обычно называют вокодерами (voice coders). В дополнение к традиционным ЛКП вокодерам, описанным выше, разработаны другие типы вокодеров: остаточно возбуждённые ЛКП (ЛКОВ), многоимпульсные ЛКП вокодеры, кодовозбуждаемый ЛКП (ЛККВ) вокодер, и



векторно-суммарно-возбуждаемый ЛКП (ЛКВСВ) вокодер. ЛККВ и ЛКВСВ вокодеры используют векторно-квантованные возбулсдающие кодовые слова для достижения высокого качества передачи речи при низкой битовой скорости кодирования.

Перед тем как закончить этот раздел, рассмотрим использование кодирования сигналов и ЛКП для кодирования сигналов речи и сравним битовые скорости этих методов кодирования.

Методы кодирования, применяемые для речевых сигналов. Передача речевых сигналов по телефонным линиям, радиоканалам и спутниковым каналам составляет наибольшую часть наших ежедневных связей. Поэтому понятно, что за последние три десятилетия большинство исследований было направлено на кодирование речи, а не на другие типы сигналов, передающих информацию. Действительно, вся техника кодирования, описанная в этом разделе, была использована для кодирования сигналов речи. Поэтому полезно сравнить эффективность этих методов через битовую скорость, требуемую для передачи сигнала речи. Предполагается, что сигнал речи ограничен полосой частот 200...3200 Гц и стробируется с номинальной скоростью 8000 отсч./с для всех кодеров, исключая ДМ, для которой скорость стробирования равна битовой скорости. Предполагается, что в ЛКП кодере используются параметры, данные в примере 3.5.1.

Таблица 3.5.2 суммирует средние характеристики методов кодирования, описанйые в этом разделе, и требуемые битовые скорости.

Таблица 3.5.2. Техника кодирования, применяемая для сигналов речи

Метод кодирования

Квантователь

Кодер

Скорость передачи, бит/с

Линейный

12 бит

96 ООО

ЛогИКМ

Логарифмический

7...8 бит

56 ООО...64 ООО

ДИКМ

Логарифмический

4...6 бит

32 ООО...48 ООО

АДИКМ

Адаптивный

З...4бит

24 ООО...32 ООО

Двоичный

1 бит

32 ООО...64 ООО

Адаптивный двоичный

1 бит

16 ООО...32 ООО

2400...4800

С учётом качества синтеза сигнала речи в приёмнике посредством двоичных последовательностей, переданных по каналу без ошибок, все методы кодирования речи (ИКМ, ДИКМ, АДИКМ. ДМ, АДМ) обеспечивают по телефону качественную речь. Другими словами, слушателю будет затруднительно заметить разницу между цифровой речью и аналоговой формой речи. АДИКМ и АДМ являются особенно эффективной техникой кодирования. Статистическое кодирование позволяет снизить скорость передачи до 9600 бит/с с заметным искажением. Действительно, на скоростях ниже 16 000 бит/с искажения, обусловленные кодерами сигнала, возрастают существенно. Следовательно, эта техника не используется на скоростях ниже 9600 бит/с. Для скоростей ниже 9600 бит/с обычно используется техника кодирования типа ЛКП, которая базируется на линейных моделях источника. Синтезированная речь, полученная посредством техники кодирования этого класса, понятна. Однако сигнал речи имеет синтетическое качество, и искажения заметны.



0 ... 34353637383940 ... 262