Выпуск #8/2004
В.Джиган, Т.Солохина, Я.Петричкович.
Подавление электрического эха на базе контроллеров серии "Мультикор"
Подавление электрического эха на базе контроллеров серии "Мультикор"
Просмотры: 3312
Статья рассказывает о причинах возникновения сигналов электрического эха в каналах связи и возможности их подавления с помощью адаптивных фильтров. Рассматриваются факторы, влияющие на качество работы адаптивных фильтров, а также основные разновидности алгоритмов адаптивной фильтрации. Результаты моделирования демонстрируют преимущества сложных адаптивных RLS-алгоритмов перед простыми NLMS-алгоритмами с точки зрения длительности переходного процесса и достижимого подавления эхо-сигналов. Исследуется эффективность реализации адаптивных алгоритмов для ИМС базовой отечественной серии сигнальных контроллеров “Мультикор-12”, разработанной дизайн-центром ГУП НПЦ “ЭЛВИС” (г. Зеленоград).
ВВЕДЕНИЕ
В областях связи, радиолокации, гидроакустики, обработки речи и т. п. множество задач решается с помощью адаптивных фильтров. Среди них – и широко распространенная задача подавления сигналов электрического эха. Рассмотрим основные принципы решения данной задачи с помощью адаптивных фильтров с конечной импульсной характеристикой (КИХ), а также вопросы реализации таких фильтров на базе отечественной серии ИС сигнальных контроллеров “Мультикор”, в частности – “Мультикор-12” (МС-12) [1, 2].
Электрическое эхо – результат несбалансированности так называемых гибридных схем, которые в системах проводной связи обеспечивают переход между двух- и четырехпроводными линиями (в оборудовании телефонных станций, в модемах, устройствах громкоговорящей связи и т. п.) (рис.1). Гибридная схема – это пассивный трансформаторный или резисторный мост [3]. Он подключается к линиям связи, которые представляют собой витые пары проводников. Так как витые пары имеют комплексный входной импеданс, то сбалансировать мост во всем диапазоне рабочих частот невозможно, особенно при использовании простых стандартных согласующих цепей. Это порождает сигналы электрического эха, которые ухудшают качество связи при передаче как голоса, так и данных. Мы затронем только проблему подавления эхо-сигналов речи, поскольку при передаче данных с этим явлением борются аналогичным образом.
На приемной стороне канала связи сигналы задерживаются относительно передаваемых сигналов. Причиной задержки является конечная скорость распространения сигналов, а также задержки, вносимые оборудованием. Например, в спутниковых каналах связи задержка прямого и обратного распространения сигнала может достигать 0,5 с. Как следствие, если образуется эхо-сигнал, то абонент слышит свой собственный голос, задержанный на время прямого и обратного распространения сигнала. В результате качество связи ухудшается пропорционально величине задержки [4]. Поэтому при увеличении задержки возрастает и необходимый уровень ослабления эхо-сигнала (рис.2), при котором влияние эхо-сигнала не сказывается на качестве разговора. Даже при задержке, равной нулю, эхо-сигнал должен быть на 1,4 дБ ниже уровня передаваемого сигнала.
ПРИНЦИП ПОДАВЛЕНИЯ ЭХО-СИГНАЛОВ
Уровень эхо-сигнала зависит от степени несбалансированности гибридной схемы, что определяется ее типом, а также типом подключенных к ней проводных линий связи и согласующей цепи. Если параметры всех этих устройств известны, то уровень эхо-сигнала можно оценить путем моделирования [3, 5]. Некоторые типичные примеры порождения эхо-сигналов рассмотрены в стандарте ITU-T G.168 [6]. Из данного документа следует, что “существенная часть” импульсного отклика гибридной схемы, порождающего эхо-сигнал, может достигать 0,016 с. При частоте дискретизации 8 кГц, стандартной для оцифровки сигналов в телефонных каналах связи, длительность такого импульсного отклика равна 128 выборкам. Это означает, что адаптивный фильтр, чтобы компенсировать эхо-сигналы, должен содержать приблизительно такое же число весовых коэффициентов N (“длина” фильтра).
Рассмотрим модель системы подавления сигналов электрического эха (рис.3). Паразитная связь между входящим и исходящим каналом моделируется фильтром с импульсным откликом w (в общем случае неизвестным). Свертка сигнала x(t), поступающего от удаленного абонента, с импульсным откликом w порождает эхо-сигнал d(t). Предполагается, что сигнал в канале связи дискретизирован, т. е. имеет вид x(k), где k – номер отсчета сигнала (дискретное время). Интервал между отсчетами равен Ts = 1/Fs, где Fs – частота дискретизации. Цифроаналоговый преобразователь (ЦАП) преобразует дискретный сигнал x(k) в непрерывный сигнал x(t), поскольку гибридная схема является аналоговым устройством. Исходящий сигнал преобразуется в цифровую форму с помощью аналого-цифрового преобразователя (АЦП). Для подавления эхо-сигнала используется КИХ-фильтр. Предположим, что сигнал со стороны ближнего абонента n(t) (полезный сигнал и шум канала) отсутствует.
Импульсный отклик КИХ-фильтра можно записать как вектор-столбец hN(k) = [h0(k), h1(k),…, hN-1(k)]T. Индекс N означает, что вектор содержит N компонентов (весовых коэффициентов). Тогда выходной сигнал этого фильтра определяется как
d’(k) = hNT (k–1) xN(k), т. е. он равен скалярному произведению вектора весовых коэффициентов hN(k–1) на вектор N отсчетов входного сигнала xN(k) = [x(k), x(k – 1),…, x(k–N + 1)]Т. Запись hN (k–1) означает, что весовые коэффициенты КИХ-фильтра определяются на основе результатов обработки предыдущей (k–1) выборки.
Если hN(k) = wN для любого k, то выходной сигнал КИХ-фильтра будет равен сигналу, порождаемому гибридной схемой: d(k) = wTN xN(k). Тогда подавленное эхо e(k) = d(k) – d’(k) = 0. На практике импульсный отклик w неизвестен. В этом случае для подавления эхо-сигналов используют адаптивный КИХ-фильтр (рис.4). Он, посредством алгоритма адаптации на основе обработки сигналов x(k) и e(k) подстраивает свои весовые коэффициенты так, что hN(k)»w.
КаЧество адаптивного подавлениЯ эхо-сигналов
На качество работы адаптивных фильтров при подавлении сигналов электрического эха обычно влияет ряд факторов. Один из них – шум канала. Он состоит из теплового шума и электрических наводок с витых пар других каналов связи (расположенных в одном кабеле с витой парой, подключенной к рассматриваемому ближнему абоненту). Обычно мощность шума такова, что он практически не влияет на адаптацию.
Однако процесс адаптации может быть нарушен сигналом ближнего абонента n(k), воспринимаемым как случайный шум, т. е. n(k) для адаптивного фильтра – это шумовой сигнал. Чтобы избежать его воздействия, в составе эхоподавителя включают детектор активности ближнего абонента [7]. Если детектор обнаруживает сигнал от ближнего абонента, то адаптивный фильтр прекращает обновление весовых коэффициентов hN(k). При этом копия эхо-сигнала по-прежнему вырабатывается КИХ-фильтром на основе раннее вычисленных значений весовых коэффициентов, и подавление эхо-сигнала продолжается в неадаптивном режиме.
Другой фактор, влияющий на качество работы адаптивного фильтра, – различие между длиной импульсного отклика адаптивного фильтра N и длиной импульсного отклика N1 паразитной связи в гибридной схеме, порождающего эхо-сигнал. Если N < N1, то очевидно, что полного подавления эхо-сигнала не будет, даже если текущие значения весовых коэффициентов КИХ-фильтра hi = wi для всех i = 0…N – 1.
Если импульсный отклик w известен, можно оценить, как длина адаптивного фильтра влияет на уровень остаточного (некомпенсированного) эхо-сигнала. Для такой оценки используется параметр, называемый Echo Return Loss Enhancement (ERLE). Он представляет собой отношение энергий неподавленного и остаточного эхо-сигналов:
ERLE (k) = 10log10 (E {d(k)2} / E {e(k)2}). (1)
Запись E {…} означает усреднение параметра, в данном случае – значений d(k)2 и e(k)2 на интервале стационарности сигнала.
Если выборки сигнала x(k) статистически независимы, то выражение (1) принимает вид:
...
Выражение (2) несправедливо, если входной сигнал x(k) – коррелированный, например речь. В таком случае достижимое значение ERLE можно оценить путем непосредственного измерения с последующим вычислением по формуле (1) на скользящем окне длиной В отсчетов. Эта длина определяется интервалом стационарности сигнала x(k). Например, интервал стационарности сигналов речи считается равным примерно 30 мс. При частоте дискретизации Fs = 8 кГц В = 0,03ґ8000 = 240 отсчетов.
В действительности оценки ERLE, вычисленные в соответствии с (1) и (2), получаются несколько завышенными. Проблема в том, что при N <N1 некомпенсированный остаток эхо-сигнала воздействует на алгоритм адаптации подобно сигналу от абонента (шуму) n(k), т. е. нарушает процесс адаптации.
Если адаптивный фильтр обрабатывает реальные сигналы, то мгновенные значения сигнала n(k) неизвестны, следовательно, их невозможно вычесть из зашумленного остаточного эха e(k) и из смеси сигналов d(k) + n(k). В этом случае, если значение дисперсии шума sn2 известно, то ERLE можно вычислить на основе измерений по формуле
...
Дисперсия сигнала от ближнего абонента sn2 при этом определяется статистически, например путем непосредственных измерений при x(k) = 0, т. е. когда d(k) + n(k) = n(k).
АДАПТИВНЫЕ АЛГОРИТМЫ
Для подавления сигналов электрического эха используют самые разнообразные алгоритмы адаптивной фильтрации [8]. Это простейшие алгоритмы по критерию наименьшего среднеквадратичного отклонения (Least Mean Square, LMS), нормализованные LMS-алгоритмы (NLMS), алгоритмы аффинных проекций (affine projection, AP) и быстрые AP-алгоритмы (fast AP, FAP), рекурсивные алгоритмы по критерию наименьших квадратов (Recursive Least Squares, RLS) и быстрые RLS-алгоритмы. Все они различаются качеством и вычислительной сложностью. Под качеством понимается значение уровня остаточного эха в установившемся режиме и длительность переходного процесса. Вычислительная сложность – это число арифметических операций (умножений и сложений), необходимых для выполнения одной итерации алгоритма в течение одного периода частоты дискретизации (1/Fs). Более высокое качество требует применения более сложных алгоритмов.
Мы не будем рассматривать АР- и FAP-алгоритмы, поскольку их вычислительная сложность становится приемлемой (меньше сложности RLS-алгоритмов) лишь при большом числе весовых коэффициентов фильтра (N > 1000), что характерно при подавлении акустических эхо-сигналов. При подавлении сигналов электрического эха число весовых коэффициентов существенно меньше (в рассматриваемом случае N Ј 128) и вычислительная сложность FAP-алгоритма сравнима с вычислительной сложностью более эффективных быстрых RLS-алгоритмов. Поэтому далее сосредоточим внимание на простейших NLMS-алгоритмах и более сложных RLS-алгоритмах как наиболее эффективных для подавления сигналов электрического эха. Обычно в литературе простейшие алгоритмы адаптивной фильтрации описывают с точки зрения теории градиентного поиска. Мы же представим их как частный случай RLS-алгоритмов.
RLS-алгоритм. Цель адаптивной фильтрации по критерию наименьших квадратов (Least Squares, LS) [9] – минимизация энергии ошибок на выходе адаптивного фильтра на интервале наблюдения, т. е. минимизация функционала
...
где 0 << l < 1 – взвешивающий параметр, предназначенный для уменьшения вклада “старых” значений сигналов с целью обеспечения следящих свойств адаптивного фильтра при обработке нестационарных сигналов. Допустимое значение параметра l определяется, исходя из числа весовых коэффициентов адаптивного фильтра как (1 – 0,4 /N) < 1. Минимизация функционала (3) позволяет получить вектор оптимальных весовых коэффициентов адаптивного фильтра в виде
hN(k) = RN–1(k) rN(k), (4)
где RN(k) = l RN(k –1) + xN(k) xN(k)T – корреляционная матрица входных сигналов, а rn(k) = l rn(k–1) + xN(k) d(k) – вектор взаимной корреляции xN(k) и d(k). Вычислительная сложность уравнения (4) пропорциональна O(N3) арифметических операций. Это обусловлено операцией обращения матрицы RN(k).
Термин Recursive Least Squares в названии RLS-алгоритма адаптивной фильтрации означает, что для обращения матрицы RN(k) в уравнении (4) используется рекурсивный алгоритм, основанный на лемме об инверсии матрицы [9] (см. врезку “RLS-алгоритм”). Вычислительная сложность такого алгоритма пропорциональна O(N2) арифметических операций.
В RLS-алгоритме весовые коэффициенты адаптивного фильтра определяются как
hN(k) = hN(k – 1) + gN(k) e(k), (5)
где gN(k) – вектор коэффициентов Калмана, вычисляемый с помощью вышеприведенного рекурсивного алгоритма. Отметим, что
gN(k) = RN–1(k) xN(k). (6)
Еще более упростить вычислительную сложность данного RLS-алгоритма можно, используя свойства инвариантности значений сигнала x(k) к сдвигу [9]. Следствием такого упрощения являются быстрые RLS-алгоритмы с вычислительной сложностью О(N) арифметических операций. Эта сложность находится в диапазоне от 7N до нескольких десятков N арифметических операций, в зависимости от алгоритма. Многообразие быстрых RLS-алгоритмов также включает лестничные алгоритмы и алгоритмы на основе прямого или обратного QR-разложения матрицы значений входного сигнала адаптивного фильтра [10].
NLMS-алгоритм. Используя (6), уравнение (5) можно представить в виде
hN(k) = hN(k – 1) + RN–1(k) xN(k) e(k). (7)
Если в этом уравнении аппроксимировать RN(k) сначала диагональной матрицей, т. е. оставить только элементы, находящиеся на главной диагонали, а затем вместо этой матрицы использовать сумму диагональных элементов, то будет получен упрощенный алгоритм
hN(k) = hN(k – 1) + [xN(k) e(k)] / [xTN(k) xN(k)]. (8)
Уравнение (8) – это NLMS-алгоритм, который часто представляется в виде
...
где 1/[xTN(k) xN(k) + d] – динамически регулируемый шаг сходимости, зависящий от значений входного сигнала, 0 < m Ј 2 – масштабирующий множитель, который может быть использован для дополнительной регулировки следящих свойств адаптивного алгоритма. Если множитель m имеет маленькое значение, то остаточная ошибка (эхо-сигнал) e(k) также будет иметь маленькое значение в установившемся режиме, но длительность переходного процесса будет большой, и наоборот.
Вычислительная сложность NLMS-алгоритма равна 2N арифметических операций. Это обусловлено тем, что переменная
P(k) = xTN(k)xTN(k)
может быть вычислена рекурсивно как
P(k) = P(k – 1) + x2(k) – x2(k – N).
Видно, что арифметическая сложность этого вычисления не зависит от N.
Если сигнал x(k) является стационарным и известным, то можно получить LMS-алгоритм: hN(k) = hN(k – 1) + mxN(k) e(k), где шаг сходимости m может быть определен заранее и выбран в пределах значений 0 < m Ј 2 / [xNT(k) xN(k)] = 2/Nsx2.
Здесь sx2 – дисперсия сигнала x(k). Однако LMS не вполне хорошо работает с нестационарными сигналами. Поэтому данный алгоритм в основном применяется для подавления электрического эха в модемах, где используются стационарные сигналы.
Таким образом, NLMS-алгоритм можно рассматривать как частный случай RLS-алгоритма, а LMS-алгоритм – как частный случай NLMS-алгоритма. У RLS-алгоритмов нет такого параметра, как шаг сходимости. Эти алгоритмы обновляют значения весовых коэффициентов фильтра на основе статистики входного сигнала – см. уравнения (5) и (6). Как следствие, качество RLS-алгоритмов значительно превосходит качество простейших адаптивных алгоритмов. Цена такого улучшения – большая вычислительная сложность RLS-алгоритмов по сравнению с простейшими LMS- и NLMS-алгоритмами. Однако благодаря современным достижениям в технологии быстродействующих процессоров цифровой обработки сигналов (DSP), большая вычислительная сложность уже не является непреодолимым препятствием на пути реализации таких алгоритмов [1, 2].
РЕЗУЛЬТАТЫ МОДЕЛИРОВАНИЯ
Рассмотрим качество работы NLMS- и RLS-алгоритмов при подавлении сигналов электрического эха. На рис.5 показаны параметры гибридной схемы самого худшего качества из ряда схем, определяемых стандартом ITU-T G.168 [6]. Импульсный отклик этой схемы (рис.5a), порождает эхо-сигнал с ERLE » 7,6 дБ. В данном случае ERLE определяется как отношение энергии сигналов x(k) и d(k). Длина импульсного отклика равна 64 весовым коэффициентам. Это означает, что и адаптивный фильтр эхоподавителя должен иметь по меньшей мере 64 весовых коэффициента. Рис.6 представляет NLMS-алгоритм при m = 0,1, а рис.7 – RLS-алгоритм с l = 0,9999. В обоих случаях N = 64 и m = 0,01. Аддитивный шум n(k) в экспериментах составлял примерно –30 дБ относительно среднего уровня эхо-сигналов. При вычислении ERLE использовалось значение В = 256, а сигнал x(k) дискретизировался на частоте Fs = 8 кГц.
Если сравнить рис.6а и рис.7а, то складывается впечатление, что и простой и сложный алгоритмы подавляют эхо-сигналы примерно с одинаковым качеством. Однако это не так. Более точно оценить это качество можно либо путем измерения ERLE, либо на слух (в случае сигналов речи), либо сравнивая крупномасштабные графики незашумленного остаточного эха e(k) – n(k), наложенные на графики зашумленного эха e(n).
Для начала сравним графики ERLE. Из рис.6б и 7б следует, что в рассматриваемых экспериментах RLS-алгоритм обеспечивает меньшую длительность переходного процесса и примерно на 20 дБ большее значение ERLE по сравнению с NLMS-алгоритмом при m = 0,1. Однако качество NLMS-алгоритма можно регулировать с помощью параметра m. Это подтверждает рис.8, на котором приведены графики ERLE для RLS- и NLMS-алгоритмов при разных значениях m. Действительно, изменяя значение m в NLMS-алгоритме, можно варьировать длительность переходного процесса в адаптивном фильтре и достижимое значение ERLE. Последнее, однако, во всех случаях не превышает значения ERLE, обеспечиваемого RLS-алгоритмами.
Более высокое качество RLS-алгоритма подтверждает сопоставление сигналов остаточного эха для RLS-алгоритма и NLMS-алгоритмов при разных значениях параметра m (рис.9). Из рисунка следует, что наименьший остаточный уровень эхо-сигнала обеспечивает RLS-алгоритм. Длительность переходного процесса в этом случае также наименьшая. Можно предположить, что в данном эксперименте значение m = 0,1 обеспечивает компромисс между уровнем остаточного эхо-сигнала и длительностью переходного процесса для NLMS-алгоритма.
Теоретически, решение задачи с помощью NLMS-алгоритма при очень маленьком значении m приближается к решению, которое можно получить с помощью алгоритма на основе LS-критерия [9]. Однако, как следует из рис. 9з, это решение может быть и не достигнуто за короткий временной интервал. При этом эхо-сигнал будет подавляться лишь незначительно, что практически означает отсутствие подавления. Поэтому RLS-алгоритмы – наиболее привлекательное решение задачи подавления сигналов электрического эха.
РЕАЛИЗАЦИЯ НА ПЛАТФОРМЕ “МУЛЬТИКОР”
Оценим возможность реализации рассмотренных алгоритмов на основе нового цифрового сигнального контроллера “Мультикор-12” [1, 2] при использовании вычислений в арифметике с плавающей точкой.
Сигнальный микроконтроллер “Мультикор-12” (см. врезку 2) спроектирован как однокристальная двухпроцессорная система на кристалле на базе IP-ядерной (intellectual property) платформы “МУЛЬТИКОР”, разработанной в ГУП НПЦ “ЭЛВИС”. MC-12 содержит RISC-ядро управляющего процессора и DSP-ядро. DSP-ядро – это производительный процессор-акселератор цифровой обработки сигналов с плавающей/фиксированной точкой, который обеспечивает обработку информации с переменными форматами данных – от битовых форматов до данных с плавающей точкой в формате стандарта IEEE 754. По общей классификации СБИС, разрабатываемых на базе платформы “МУЛЬТИКОР”, MC-12 относится к сигнальным контроллерам мини-конфигурации с плавающей/фиксированной точкой.
MC-12 сочетает в себе лучшие качества двух классов приборов – микроконтроллеров и DSP, что особенно важно для микроминиатюрных встраиваемых применений, когда приходится решать одновременно задачи управления и высокоточной обработки информации, включая обработку сигналов и изображений. В частности, МС-12 предоставляет уникальную возможность – применять новые алгоритмы на основе параллельных процедур обработки сигналов, реализуемых одной СБИС.
Рис.10 показывает зависимость числа тактов, которые требуются для реализации различных типов NLMS-алгоритма в DSP-ядре МС-12 в зависимости от N. Для максимального значения N = 128 реализация адаптивного фильтра c действительными весовыми коэффициентами на основе NLMS-алгоритма требует приблизительно 400 тактов. При тактовой частоте 100 МГц минимальная длительность итерации алгоритма равна 400/(100·106) = 4 мкс. Соответственно максимальная частота дискретизации сигналов Fs = 1 / (4·106) = 250 кГц. Данное значение в 250 / 8 » 31 раз превышает требуемую частоту дискретизации 8 кГц. Это значит, что при Fs = 8 кГц и N = 128 МС-12 позволяет реализовать 31 NLMS-алгоритм с указанным числом весовых коэффициентов или реализовать адаптивный алгоритм с вычислительной сложностью, почти в 31 раз превышающей вычислительную сложность такого NLMS-алгоритма. Например, для одноканального варианта стабилизированного и регуляризированного быстрого RLS-алгоритма [11] требуется 14N арифметических операций на одну итерацию, что лишь в 7 раз превышает вычислительную сложность рассмотренного NLMS-алгоритма. Следовательно, при реализации такого RLS-алгоритма будет использовано лишь 7/31 » 23% вычислительных ресурсов DSP-ядра МС-12.
Заметим, что новый серийный сигнальный контроллер разработки ГУП НПЦ “ЭЛВИС” – “Мультикор-24” (МС-24) – обладает вдвое большей вычислительной мощностью. К примеру, при Fs = 8 кГц
и N = 128 в МС-24 можно реализовать 62 NLMS-алгоритма.
Литература
1. Солохина Т., Петричкович Я., Глушков А., Александров Ю. и др. Мультикор12S – сигнальный процессор с плавающей точкой для высокоточных встраиваемых применений. – Chip news: Инженерная микроэлектроника, 2003, № 8, с. 4–15.
2. Петричкович Я. Я., Солохина Т. В. Цифровые сигнальные контроллеры “МУЛЬТИКОР” – новые отечественные серии систем на кристалле. – Доклады 6-й Международной конференции “Цифровая обработка сигналов и ее применения (DSPA-2004)” (Москва, 31 марта – 2 апреля 2004 г.), 2004. Т. 1. С. 8–15.
3. Chen W. Y. Simulation techniques and standards development for digital subscriber line systems. – Indianapolis: Macmillan Technical Publishing, 1998.
4. Huntly H. R. Transmission design of intertoll telephone trunks. – Bell System Technical Journal, Vol. 32, Sept. 1953, p. 1019–1036.
5. Джиган В. И. Расчет параметров четырехполюсника дифференциальной системы и линейного усилителя с синтетически согласованной нагрузкой. – Известия высших учебных заведений. Электроника, 2003 № 6, с. 76–80.
6. Digital network echo cancellers. ITU-T Recommendation G.168. – Geneva, 04/2000.
7. Sovka P., Pollak P. The study of speech/pause detectors for speech enhancement methods. – Eurospeech 95 Proceedings, Berlin: ESCA, 1995, р. 1575–1578.
8. Джиган В. И. Библиотека алгоритмов адаптивной фильтрации. – Доклады 6-й Международной конференции “Цифровая обработка сигналов и ее применения (DSPA-2004)” (Москва, 31 марта – 2 апреля 2004 г.), 2004. Т. 1. С. 89–94.
9. Sayed A. H. Fundamentals of adaptive filtering. – John Wiley and Sons, 2003.
10. Джиган В. И. Многоканальные RLS- и быстрые RLS-алгоритмы адаптивной фильтрации. – Успехи современной радиоэлектроники, 2004, № 11, с. 47–79.
11. Джиган В. И. Быстрый многоканальный RLS-алгоритм с регуляризацией и стабилизацией. – Известия высших учебных заведений. Электроника, 2004, № 1, с. 83–90.
В областях связи, радиолокации, гидроакустики, обработки речи и т. п. множество задач решается с помощью адаптивных фильтров. Среди них – и широко распространенная задача подавления сигналов электрического эха. Рассмотрим основные принципы решения данной задачи с помощью адаптивных фильтров с конечной импульсной характеристикой (КИХ), а также вопросы реализации таких фильтров на базе отечественной серии ИС сигнальных контроллеров “Мультикор”, в частности – “Мультикор-12” (МС-12) [1, 2].
Электрическое эхо – результат несбалансированности так называемых гибридных схем, которые в системах проводной связи обеспечивают переход между двух- и четырехпроводными линиями (в оборудовании телефонных станций, в модемах, устройствах громкоговорящей связи и т. п.) (рис.1). Гибридная схема – это пассивный трансформаторный или резисторный мост [3]. Он подключается к линиям связи, которые представляют собой витые пары проводников. Так как витые пары имеют комплексный входной импеданс, то сбалансировать мост во всем диапазоне рабочих частот невозможно, особенно при использовании простых стандартных согласующих цепей. Это порождает сигналы электрического эха, которые ухудшают качество связи при передаче как голоса, так и данных. Мы затронем только проблему подавления эхо-сигналов речи, поскольку при передаче данных с этим явлением борются аналогичным образом.
На приемной стороне канала связи сигналы задерживаются относительно передаваемых сигналов. Причиной задержки является конечная скорость распространения сигналов, а также задержки, вносимые оборудованием. Например, в спутниковых каналах связи задержка прямого и обратного распространения сигнала может достигать 0,5 с. Как следствие, если образуется эхо-сигнал, то абонент слышит свой собственный голос, задержанный на время прямого и обратного распространения сигнала. В результате качество связи ухудшается пропорционально величине задержки [4]. Поэтому при увеличении задержки возрастает и необходимый уровень ослабления эхо-сигнала (рис.2), при котором влияние эхо-сигнала не сказывается на качестве разговора. Даже при задержке, равной нулю, эхо-сигнал должен быть на 1,4 дБ ниже уровня передаваемого сигнала.
ПРИНЦИП ПОДАВЛЕНИЯ ЭХО-СИГНАЛОВ
Уровень эхо-сигнала зависит от степени несбалансированности гибридной схемы, что определяется ее типом, а также типом подключенных к ней проводных линий связи и согласующей цепи. Если параметры всех этих устройств известны, то уровень эхо-сигнала можно оценить путем моделирования [3, 5]. Некоторые типичные примеры порождения эхо-сигналов рассмотрены в стандарте ITU-T G.168 [6]. Из данного документа следует, что “существенная часть” импульсного отклика гибридной схемы, порождающего эхо-сигнал, может достигать 0,016 с. При частоте дискретизации 8 кГц, стандартной для оцифровки сигналов в телефонных каналах связи, длительность такого импульсного отклика равна 128 выборкам. Это означает, что адаптивный фильтр, чтобы компенсировать эхо-сигналы, должен содержать приблизительно такое же число весовых коэффициентов N (“длина” фильтра).
Рассмотрим модель системы подавления сигналов электрического эха (рис.3). Паразитная связь между входящим и исходящим каналом моделируется фильтром с импульсным откликом w (в общем случае неизвестным). Свертка сигнала x(t), поступающего от удаленного абонента, с импульсным откликом w порождает эхо-сигнал d(t). Предполагается, что сигнал в канале связи дискретизирован, т. е. имеет вид x(k), где k – номер отсчета сигнала (дискретное время). Интервал между отсчетами равен Ts = 1/Fs, где Fs – частота дискретизации. Цифроаналоговый преобразователь (ЦАП) преобразует дискретный сигнал x(k) в непрерывный сигнал x(t), поскольку гибридная схема является аналоговым устройством. Исходящий сигнал преобразуется в цифровую форму с помощью аналого-цифрового преобразователя (АЦП). Для подавления эхо-сигнала используется КИХ-фильтр. Предположим, что сигнал со стороны ближнего абонента n(t) (полезный сигнал и шум канала) отсутствует.
Импульсный отклик КИХ-фильтра можно записать как вектор-столбец hN(k) = [h0(k), h1(k),…, hN-1(k)]T. Индекс N означает, что вектор содержит N компонентов (весовых коэффициентов). Тогда выходной сигнал этого фильтра определяется как
d’(k) = hNT (k–1) xN(k), т. е. он равен скалярному произведению вектора весовых коэффициентов hN(k–1) на вектор N отсчетов входного сигнала xN(k) = [x(k), x(k – 1),…, x(k–N + 1)]Т. Запись hN (k–1) означает, что весовые коэффициенты КИХ-фильтра определяются на основе результатов обработки предыдущей (k–1) выборки.
Если hN(k) = wN для любого k, то выходной сигнал КИХ-фильтра будет равен сигналу, порождаемому гибридной схемой: d(k) = wTN xN(k). Тогда подавленное эхо e(k) = d(k) – d’(k) = 0. На практике импульсный отклик w неизвестен. В этом случае для подавления эхо-сигналов используют адаптивный КИХ-фильтр (рис.4). Он, посредством алгоритма адаптации на основе обработки сигналов x(k) и e(k) подстраивает свои весовые коэффициенты так, что hN(k)»w.
КаЧество адаптивного подавлениЯ эхо-сигналов
На качество работы адаптивных фильтров при подавлении сигналов электрического эха обычно влияет ряд факторов. Один из них – шум канала. Он состоит из теплового шума и электрических наводок с витых пар других каналов связи (расположенных в одном кабеле с витой парой, подключенной к рассматриваемому ближнему абоненту). Обычно мощность шума такова, что он практически не влияет на адаптацию.
Однако процесс адаптации может быть нарушен сигналом ближнего абонента n(k), воспринимаемым как случайный шум, т. е. n(k) для адаптивного фильтра – это шумовой сигнал. Чтобы избежать его воздействия, в составе эхоподавителя включают детектор активности ближнего абонента [7]. Если детектор обнаруживает сигнал от ближнего абонента, то адаптивный фильтр прекращает обновление весовых коэффициентов hN(k). При этом копия эхо-сигнала по-прежнему вырабатывается КИХ-фильтром на основе раннее вычисленных значений весовых коэффициентов, и подавление эхо-сигнала продолжается в неадаптивном режиме.
Другой фактор, влияющий на качество работы адаптивного фильтра, – различие между длиной импульсного отклика адаптивного фильтра N и длиной импульсного отклика N1 паразитной связи в гибридной схеме, порождающего эхо-сигнал. Если N < N1, то очевидно, что полного подавления эхо-сигнала не будет, даже если текущие значения весовых коэффициентов КИХ-фильтра hi = wi для всех i = 0…N – 1.
Если импульсный отклик w известен, можно оценить, как длина адаптивного фильтра влияет на уровень остаточного (некомпенсированного) эхо-сигнала. Для такой оценки используется параметр, называемый Echo Return Loss Enhancement (ERLE). Он представляет собой отношение энергий неподавленного и остаточного эхо-сигналов:
ERLE (k) = 10log10 (E {d(k)2} / E {e(k)2}). (1)
Запись E {…} означает усреднение параметра, в данном случае – значений d(k)2 и e(k)2 на интервале стационарности сигнала.
Если выборки сигнала x(k) статистически независимы, то выражение (1) принимает вид:
...
Выражение (2) несправедливо, если входной сигнал x(k) – коррелированный, например речь. В таком случае достижимое значение ERLE можно оценить путем непосредственного измерения с последующим вычислением по формуле (1) на скользящем окне длиной В отсчетов. Эта длина определяется интервалом стационарности сигнала x(k). Например, интервал стационарности сигналов речи считается равным примерно 30 мс. При частоте дискретизации Fs = 8 кГц В = 0,03ґ8000 = 240 отсчетов.
В действительности оценки ERLE, вычисленные в соответствии с (1) и (2), получаются несколько завышенными. Проблема в том, что при N <N1 некомпенсированный остаток эхо-сигнала воздействует на алгоритм адаптации подобно сигналу от абонента (шуму) n(k), т. е. нарушает процесс адаптации.
Если адаптивный фильтр обрабатывает реальные сигналы, то мгновенные значения сигнала n(k) неизвестны, следовательно, их невозможно вычесть из зашумленного остаточного эха e(k) и из смеси сигналов d(k) + n(k). В этом случае, если значение дисперсии шума sn2 известно, то ERLE можно вычислить на основе измерений по формуле
...
Дисперсия сигнала от ближнего абонента sn2 при этом определяется статистически, например путем непосредственных измерений при x(k) = 0, т. е. когда d(k) + n(k) = n(k).
АДАПТИВНЫЕ АЛГОРИТМЫ
Для подавления сигналов электрического эха используют самые разнообразные алгоритмы адаптивной фильтрации [8]. Это простейшие алгоритмы по критерию наименьшего среднеквадратичного отклонения (Least Mean Square, LMS), нормализованные LMS-алгоритмы (NLMS), алгоритмы аффинных проекций (affine projection, AP) и быстрые AP-алгоритмы (fast AP, FAP), рекурсивные алгоритмы по критерию наименьших квадратов (Recursive Least Squares, RLS) и быстрые RLS-алгоритмы. Все они различаются качеством и вычислительной сложностью. Под качеством понимается значение уровня остаточного эха в установившемся режиме и длительность переходного процесса. Вычислительная сложность – это число арифметических операций (умножений и сложений), необходимых для выполнения одной итерации алгоритма в течение одного периода частоты дискретизации (1/Fs). Более высокое качество требует применения более сложных алгоритмов.
Мы не будем рассматривать АР- и FAP-алгоритмы, поскольку их вычислительная сложность становится приемлемой (меньше сложности RLS-алгоритмов) лишь при большом числе весовых коэффициентов фильтра (N > 1000), что характерно при подавлении акустических эхо-сигналов. При подавлении сигналов электрического эха число весовых коэффициентов существенно меньше (в рассматриваемом случае N Ј 128) и вычислительная сложность FAP-алгоритма сравнима с вычислительной сложностью более эффективных быстрых RLS-алгоритмов. Поэтому далее сосредоточим внимание на простейших NLMS-алгоритмах и более сложных RLS-алгоритмах как наиболее эффективных для подавления сигналов электрического эха. Обычно в литературе простейшие алгоритмы адаптивной фильтрации описывают с точки зрения теории градиентного поиска. Мы же представим их как частный случай RLS-алгоритмов.
RLS-алгоритм. Цель адаптивной фильтрации по критерию наименьших квадратов (Least Squares, LS) [9] – минимизация энергии ошибок на выходе адаптивного фильтра на интервале наблюдения, т. е. минимизация функционала
...
где 0 << l < 1 – взвешивающий параметр, предназначенный для уменьшения вклада “старых” значений сигналов с целью обеспечения следящих свойств адаптивного фильтра при обработке нестационарных сигналов. Допустимое значение параметра l определяется, исходя из числа весовых коэффициентов адаптивного фильтра как (1 – 0,4 /N) < 1. Минимизация функционала (3) позволяет получить вектор оптимальных весовых коэффициентов адаптивного фильтра в виде
hN(k) = RN–1(k) rN(k), (4)
где RN(k) = l RN(k –1) + xN(k) xN(k)T – корреляционная матрица входных сигналов, а rn(k) = l rn(k–1) + xN(k) d(k) – вектор взаимной корреляции xN(k) и d(k). Вычислительная сложность уравнения (4) пропорциональна O(N3) арифметических операций. Это обусловлено операцией обращения матрицы RN(k).
Термин Recursive Least Squares в названии RLS-алгоритма адаптивной фильтрации означает, что для обращения матрицы RN(k) в уравнении (4) используется рекурсивный алгоритм, основанный на лемме об инверсии матрицы [9] (см. врезку “RLS-алгоритм”). Вычислительная сложность такого алгоритма пропорциональна O(N2) арифметических операций.
В RLS-алгоритме весовые коэффициенты адаптивного фильтра определяются как
hN(k) = hN(k – 1) + gN(k) e(k), (5)
где gN(k) – вектор коэффициентов Калмана, вычисляемый с помощью вышеприведенного рекурсивного алгоритма. Отметим, что
gN(k) = RN–1(k) xN(k). (6)
Еще более упростить вычислительную сложность данного RLS-алгоритма можно, используя свойства инвариантности значений сигнала x(k) к сдвигу [9]. Следствием такого упрощения являются быстрые RLS-алгоритмы с вычислительной сложностью О(N) арифметических операций. Эта сложность находится в диапазоне от 7N до нескольких десятков N арифметических операций, в зависимости от алгоритма. Многообразие быстрых RLS-алгоритмов также включает лестничные алгоритмы и алгоритмы на основе прямого или обратного QR-разложения матрицы значений входного сигнала адаптивного фильтра [10].
NLMS-алгоритм. Используя (6), уравнение (5) можно представить в виде
hN(k) = hN(k – 1) + RN–1(k) xN(k) e(k). (7)
Если в этом уравнении аппроксимировать RN(k) сначала диагональной матрицей, т. е. оставить только элементы, находящиеся на главной диагонали, а затем вместо этой матрицы использовать сумму диагональных элементов, то будет получен упрощенный алгоритм
hN(k) = hN(k – 1) + [xN(k) e(k)] / [xTN(k) xN(k)]. (8)
Уравнение (8) – это NLMS-алгоритм, который часто представляется в виде
...
где 1/[xTN(k) xN(k) + d] – динамически регулируемый шаг сходимости, зависящий от значений входного сигнала, 0 < m Ј 2 – масштабирующий множитель, который может быть использован для дополнительной регулировки следящих свойств адаптивного алгоритма. Если множитель m имеет маленькое значение, то остаточная ошибка (эхо-сигнал) e(k) также будет иметь маленькое значение в установившемся режиме, но длительность переходного процесса будет большой, и наоборот.
Вычислительная сложность NLMS-алгоритма равна 2N арифметических операций. Это обусловлено тем, что переменная
P(k) = xTN(k)xTN(k)
может быть вычислена рекурсивно как
P(k) = P(k – 1) + x2(k) – x2(k – N).
Видно, что арифметическая сложность этого вычисления не зависит от N.
Если сигнал x(k) является стационарным и известным, то можно получить LMS-алгоритм: hN(k) = hN(k – 1) + mxN(k) e(k), где шаг сходимости m может быть определен заранее и выбран в пределах значений 0 < m Ј 2 / [xNT(k) xN(k)] = 2/Nsx2.
Здесь sx2 – дисперсия сигнала x(k). Однако LMS не вполне хорошо работает с нестационарными сигналами. Поэтому данный алгоритм в основном применяется для подавления электрического эха в модемах, где используются стационарные сигналы.
Таким образом, NLMS-алгоритм можно рассматривать как частный случай RLS-алгоритма, а LMS-алгоритм – как частный случай NLMS-алгоритма. У RLS-алгоритмов нет такого параметра, как шаг сходимости. Эти алгоритмы обновляют значения весовых коэффициентов фильтра на основе статистики входного сигнала – см. уравнения (5) и (6). Как следствие, качество RLS-алгоритмов значительно превосходит качество простейших адаптивных алгоритмов. Цена такого улучшения – большая вычислительная сложность RLS-алгоритмов по сравнению с простейшими LMS- и NLMS-алгоритмами. Однако благодаря современным достижениям в технологии быстродействующих процессоров цифровой обработки сигналов (DSP), большая вычислительная сложность уже не является непреодолимым препятствием на пути реализации таких алгоритмов [1, 2].
РЕЗУЛЬТАТЫ МОДЕЛИРОВАНИЯ
Рассмотрим качество работы NLMS- и RLS-алгоритмов при подавлении сигналов электрического эха. На рис.5 показаны параметры гибридной схемы самого худшего качества из ряда схем, определяемых стандартом ITU-T G.168 [6]. Импульсный отклик этой схемы (рис.5a), порождает эхо-сигнал с ERLE » 7,6 дБ. В данном случае ERLE определяется как отношение энергии сигналов x(k) и d(k). Длина импульсного отклика равна 64 весовым коэффициентам. Это означает, что и адаптивный фильтр эхоподавителя должен иметь по меньшей мере 64 весовых коэффициента. Рис.6 представляет NLMS-алгоритм при m = 0,1, а рис.7 – RLS-алгоритм с l = 0,9999. В обоих случаях N = 64 и m = 0,01. Аддитивный шум n(k) в экспериментах составлял примерно –30 дБ относительно среднего уровня эхо-сигналов. При вычислении ERLE использовалось значение В = 256, а сигнал x(k) дискретизировался на частоте Fs = 8 кГц.
Если сравнить рис.6а и рис.7а, то складывается впечатление, что и простой и сложный алгоритмы подавляют эхо-сигналы примерно с одинаковым качеством. Однако это не так. Более точно оценить это качество можно либо путем измерения ERLE, либо на слух (в случае сигналов речи), либо сравнивая крупномасштабные графики незашумленного остаточного эха e(k) – n(k), наложенные на графики зашумленного эха e(n).
Для начала сравним графики ERLE. Из рис.6б и 7б следует, что в рассматриваемых экспериментах RLS-алгоритм обеспечивает меньшую длительность переходного процесса и примерно на 20 дБ большее значение ERLE по сравнению с NLMS-алгоритмом при m = 0,1. Однако качество NLMS-алгоритма можно регулировать с помощью параметра m. Это подтверждает рис.8, на котором приведены графики ERLE для RLS- и NLMS-алгоритмов при разных значениях m. Действительно, изменяя значение m в NLMS-алгоритме, можно варьировать длительность переходного процесса в адаптивном фильтре и достижимое значение ERLE. Последнее, однако, во всех случаях не превышает значения ERLE, обеспечиваемого RLS-алгоритмами.
Более высокое качество RLS-алгоритма подтверждает сопоставление сигналов остаточного эха для RLS-алгоритма и NLMS-алгоритмов при разных значениях параметра m (рис.9). Из рисунка следует, что наименьший остаточный уровень эхо-сигнала обеспечивает RLS-алгоритм. Длительность переходного процесса в этом случае также наименьшая. Можно предположить, что в данном эксперименте значение m = 0,1 обеспечивает компромисс между уровнем остаточного эхо-сигнала и длительностью переходного процесса для NLMS-алгоритма.
Теоретически, решение задачи с помощью NLMS-алгоритма при очень маленьком значении m приближается к решению, которое можно получить с помощью алгоритма на основе LS-критерия [9]. Однако, как следует из рис. 9з, это решение может быть и не достигнуто за короткий временной интервал. При этом эхо-сигнал будет подавляться лишь незначительно, что практически означает отсутствие подавления. Поэтому RLS-алгоритмы – наиболее привлекательное решение задачи подавления сигналов электрического эха.
РЕАЛИЗАЦИЯ НА ПЛАТФОРМЕ “МУЛЬТИКОР”
Оценим возможность реализации рассмотренных алгоритмов на основе нового цифрового сигнального контроллера “Мультикор-12” [1, 2] при использовании вычислений в арифметике с плавающей точкой.
Сигнальный микроконтроллер “Мультикор-12” (см. врезку 2) спроектирован как однокристальная двухпроцессорная система на кристалле на базе IP-ядерной (intellectual property) платформы “МУЛЬТИКОР”, разработанной в ГУП НПЦ “ЭЛВИС”. MC-12 содержит RISC-ядро управляющего процессора и DSP-ядро. DSP-ядро – это производительный процессор-акселератор цифровой обработки сигналов с плавающей/фиксированной точкой, который обеспечивает обработку информации с переменными форматами данных – от битовых форматов до данных с плавающей точкой в формате стандарта IEEE 754. По общей классификации СБИС, разрабатываемых на базе платформы “МУЛЬТИКОР”, MC-12 относится к сигнальным контроллерам мини-конфигурации с плавающей/фиксированной точкой.
MC-12 сочетает в себе лучшие качества двух классов приборов – микроконтроллеров и DSP, что особенно важно для микроминиатюрных встраиваемых применений, когда приходится решать одновременно задачи управления и высокоточной обработки информации, включая обработку сигналов и изображений. В частности, МС-12 предоставляет уникальную возможность – применять новые алгоритмы на основе параллельных процедур обработки сигналов, реализуемых одной СБИС.
Рис.10 показывает зависимость числа тактов, которые требуются для реализации различных типов NLMS-алгоритма в DSP-ядре МС-12 в зависимости от N. Для максимального значения N = 128 реализация адаптивного фильтра c действительными весовыми коэффициентами на основе NLMS-алгоритма требует приблизительно 400 тактов. При тактовой частоте 100 МГц минимальная длительность итерации алгоритма равна 400/(100·106) = 4 мкс. Соответственно максимальная частота дискретизации сигналов Fs = 1 / (4·106) = 250 кГц. Данное значение в 250 / 8 » 31 раз превышает требуемую частоту дискретизации 8 кГц. Это значит, что при Fs = 8 кГц и N = 128 МС-12 позволяет реализовать 31 NLMS-алгоритм с указанным числом весовых коэффициентов или реализовать адаптивный алгоритм с вычислительной сложностью, почти в 31 раз превышающей вычислительную сложность такого NLMS-алгоритма. Например, для одноканального варианта стабилизированного и регуляризированного быстрого RLS-алгоритма [11] требуется 14N арифметических операций на одну итерацию, что лишь в 7 раз превышает вычислительную сложность рассмотренного NLMS-алгоритма. Следовательно, при реализации такого RLS-алгоритма будет использовано лишь 7/31 » 23% вычислительных ресурсов DSP-ядра МС-12.
Заметим, что новый серийный сигнальный контроллер разработки ГУП НПЦ “ЭЛВИС” – “Мультикор-24” (МС-24) – обладает вдвое большей вычислительной мощностью. К примеру, при Fs = 8 кГц
и N = 128 в МС-24 можно реализовать 62 NLMS-алгоритма.
Литература
1. Солохина Т., Петричкович Я., Глушков А., Александров Ю. и др. Мультикор12S – сигнальный процессор с плавающей точкой для высокоточных встраиваемых применений. – Chip news: Инженерная микроэлектроника, 2003, № 8, с. 4–15.
2. Петричкович Я. Я., Солохина Т. В. Цифровые сигнальные контроллеры “МУЛЬТИКОР” – новые отечественные серии систем на кристалле. – Доклады 6-й Международной конференции “Цифровая обработка сигналов и ее применения (DSPA-2004)” (Москва, 31 марта – 2 апреля 2004 г.), 2004. Т. 1. С. 8–15.
3. Chen W. Y. Simulation techniques and standards development for digital subscriber line systems. – Indianapolis: Macmillan Technical Publishing, 1998.
4. Huntly H. R. Transmission design of intertoll telephone trunks. – Bell System Technical Journal, Vol. 32, Sept. 1953, p. 1019–1036.
5. Джиган В. И. Расчет параметров четырехполюсника дифференциальной системы и линейного усилителя с синтетически согласованной нагрузкой. – Известия высших учебных заведений. Электроника, 2003 № 6, с. 76–80.
6. Digital network echo cancellers. ITU-T Recommendation G.168. – Geneva, 04/2000.
7. Sovka P., Pollak P. The study of speech/pause detectors for speech enhancement methods. – Eurospeech 95 Proceedings, Berlin: ESCA, 1995, р. 1575–1578.
8. Джиган В. И. Библиотека алгоритмов адаптивной фильтрации. – Доклады 6-й Международной конференции “Цифровая обработка сигналов и ее применения (DSPA-2004)” (Москва, 31 марта – 2 апреля 2004 г.), 2004. Т. 1. С. 89–94.
9. Sayed A. H. Fundamentals of adaptive filtering. – John Wiley and Sons, 2003.
10. Джиган В. И. Многоканальные RLS- и быстрые RLS-алгоритмы адаптивной фильтрации. – Успехи современной радиоэлектроники, 2004, № 11, с. 47–79.
11. Джиган В. И. Быстрый многоканальный RLS-алгоритм с регуляризацией и стабилизацией. – Известия высших учебных заведений. Электроника, 2004, № 1, с. 83–90.
Отзывы читателей