Выпуск #2/2014
В.Кочемасов, Д.Скок, А.Черкашин
Цифровые вычислительные синтезаторы – современные решения
Цифровые вычислительные синтезаторы – современные решения
Просмотры: 5724
Один из основных типов синтезаторов частот (ЦВС) – цифровые вычислительные синтезаторы. Высокое разрешение по частоте и фазе, максимально быстрый переход на другую частоту без разрыва фазы, возможность управления частотой, фазой, а иногда и амплитудой по цифровому интерфейсу постоянно расширяют сферу применения ЦВС в различных областях радиотехники В статье рассказывается о технических решениях, используемых при создании современных ЦВС.
Теги: code pool digital computing synthesizers functional generator накопитель кода фазы функциональный преобразователь. цифровой вычислительный синтезатор
основные сведения о ЦВС
Со времени первого опубликования [4] структурная схема ЦВС не претерпела коренных изменений. В состав ЦВС (рис.1) входят следующие блоки: накопитель кода фазы (НКФ), функциональный преобразователь (ФП) фаза–синус, цифроаналоговый преобразователь (ЦАП). На выходе ЦВС ставится фильтр нижних частот (ФНЧ). Отметим, что в зарубежных источниках вместо термина ЦВС, как правило, используется близкий по содержанию термин Direct Digital Synthesizer (DDS), а для обозначения схемы ЦВС без ЦАП применяется аббревиатура NCO – Numerically Controlled Oscillator.
Процесс синтеза частоты выглядит следующим образом. НКФ формирует код фазы Kϕ, значение которого изменяется линейно от периода к периоду с шагом, равным коду частоты Kf. Затем код фазы преобразуется в код амплитуды Ka в соответствии с гармонической функцией. Далее на основании кода амплитуды ЦАП формирует аналоговый сигнал, который после фильтрации в ФНЧ подается на выход. Выходная частота определяется по формуле:
.
Если возникает необходимость управления амплитудой выходного сигнала (в соответствии с еще одним кодом – Ку), в разрыв между функциональным и цифроаналоговым преобразователями включается перемножитель кодов Ка и Ку и на цифроаналоговый преобразователь подается код Кау = КаКу.
В истории развития ЦВС можно выделить два основных этапа.
Первый этап – с начала 70-х до конца 90-х годов прошлого века. В этот период формируются основные структуры ЦВС, проводятся работы по созда-
нию новых схемотехнических решений и алгоритмов, обеспечивающих необходимое быстродействие и высокую точность формирования отсчетов на выходе ЦАП, апробируются различные виды интегральных технологий (ЭСЛ, GaAs, КМОП и др.) при создании реальных изделий. Основными производителями интегральных ЦВС на этом этапе были компании Qualcomm, Stanford Telecom и Analog Devices. Многие технические решения отрабатывались на ПЛИС. Более того, из-за отсутствия или недоступности интегральных ЦВС во многих радиоэлектронных изделиях нашли широкое применение ЦВС на ПЛИС.
Второй этап (с начала 90-х годов прошлого века и до сегодняшнего дня) знаменовался интенсивным развитием КМОП-технологии и значительным прогрессом в части построения быстродействующих многоразрядных ЦАП, цифровых интеграторов для накопителей кода фазы, схем памяти. На этом этапе также вырабатывались решения, обеспечивающие работу ЦВС с тактовой частотой в сотни или тысячи мегагерц. Коммерчески успешной среди зарубежных производителей оказалась лишь компания Analog Devices со своей линейкой ЦВС, включающей микросхему AD9914 с тактовой частотой до 3,5 ГГц [5]. Менее известна продукция компаний Teledyne Research (микросхема RDS010 с частотой тактирования до 900 МГц в керамическом корпусе) и Euvis. В России единственным конкурентом зарубежных производителей можно считать компанию ЭЛВИС. В 2011 году компания выпустила микросхему 1508ПЛ8Т [6], которая благодаря своим возможностям оказалась вполне конкурентной с продукцией Analog Devices. Можно констатировать, что появление этой микросхемы позволит решить многие задачи, возникающие при построении радиолокационных и связных комплексов.
Сегодня проводятся дальнейшие исследования и разработки, направленные, прежде всего, на увеличение тактовой частоты и улучшение спектральных характеристик ЦВС. Судя по публикациям, в основном эти исследования ведутся специалистами США, Южной Кореи, Италии, КНР. В США поставлена задача – довести тактовую частоту интегральных ЦВС до 100 ГГц. Столь амбициозные планы связаны с открывающимися стратегическими возможностями при создании перспективных радиолокационных и связных комплексов.
Рассмотрим принципы построения узлов, входящих в состав ЦВС, за исключением ФНЧ.
Накопители кода фазы
В простейшем случае N-разрядный накопитель кода фазы (НКФ) состоит из последовательно со-
единенных N-разрядного сумматора и регистра (элемента задержки) D (рис.2). Структура простейшего N-разрядного сумматора представляет собой цепочку из одноразрядных сумматоров. Выход разряда переноса Cout каждого из них соединен с соответствующим входом последующего Cin (рис.3). Поскольку значение переноса вычисляется последовательно для каждого из разрядов, общее время вычисления суммы S будет пропорционально числу разрядов слагаемых:
Tс = (N – 1) Tпер + Tсум,
где Tпер – время, необходимое для формирования разряда переноса, Tсум – время, необходимое для суммирования. Следовательно, при разрядности современных НКФ 32–48 бит их быстродействие будет крайне низким.
Основной задачей при построении НКФ является повышение скорости функционирования (тактовой частоты). Для достижения этой цели применяются конвейерные сумматоры (в иностранной литературе – pipelined adder), а также сумматоры с параллельным (ускоренным) переносом (CLA, carry look ahead), сумматоры Брента-Кунга (BK) и схемы условного суммирования (CA). Следует отметить, что сумматоры с последовательным переносом (ripple carry adder, RCA) не нашли применения в быстродействующих накопителях кодов из-за неэффективности реализации этой структуры на высоких частотах тактирования.
Принцип работы сумматора с конвейеризацией (рис.4а) состоит в следующем. На каждом шаге конвейера происходит суммирование одного разряда. Остальные разряды остаются неизменными и хранятся в регистрах F. В то время как происходит сложение второго разряда первой пары чисел, может начинаться суммирование первого разряда второй пары чисел. Отметим, что время суммирования одной пары по сравнению с обычным сумматором не изменяется, однако интервал изменения выходного кода сумматора теперь равен Тс/n, где n – число ступеней конвейера. То есть при суммировании потока данных конвейерный сумматор в n раз быстрее обычного.
Схема сумматора с параллельным переносом (рис.4б) состоит из нескольких сумматоров с меньшей разрядностью и схемы ускоренного переноса [7]. В общем случае для сигнала переноса i-го разряда справедливо соотношение: Ci = gi–1 + pi–1Ci–1, где gi–1 = Ai–1Bi–1, pi–1 = Ai–1 + Bi–1. Сигнал gi называют функцией генерации переноса. Сигнал pi показывает, передается ли полученный в младшем разряде сигнал переноса Ci дальше, поэтому он называется функцией распространения переноса. Как следует из приведенных выражений, время формирования сигнала переноса в любой разряд с помощью вспомогательных функций gi и pi определяется только временем задержки распространения сигнала на двух логических элементах И и ИЛИ, где вычисляется значение Ci.
Архитектура Брента-Кунга представляет собой также схему с ускоренным переносом, но оптимизированную по площади ИС за счет небольшого снижения быстродействия [8].
Сравнение различных реализаций НКФ (табл.1) позволяет сделать вывод, что переход от технологии 0,25 мкм к технологии 0,18 мкм дает при прочих равных условиях приблизительно троекратный выигрыш в потреблении и двукратный выигрыш в площади. Кроме того, в 1,5–2 раза повышается предельное быстродействие. С точки зрения архитектуры наилучшими характеристиками обладают сумматоры с ускоренным переносом (CLA) и сумматоры Брента-Кунга. Архитектура условного суммирования (CA) дает, как правило, худшие результаты как по площади ИС, так и по быстродействию. Следует отметить, что выбор той или иной архитектуры зависит от многих факторов: разрядности накопителя, соотношения тактовой частоты и задержки в различных логических элементах, критериев оптимизации (по площади, быстро-
действию, потребляемой мощности в динамическом режиме, мощности токов утечки) и др.
Функциональные преобразователи
В классическом ЦВС (см. рис.1) функциональный преобразователь реализован на основе ПЗУ, хранящего табличную функцию синуса. Желание повысить точность преобразования фазы в синус (косинус), а значит, улучшить спектральные характеристики выходного сигнала ведет к существенному увеличению объема памяти и, как следствие, к увеличению энергопотребления и снижению быстродействия. Практическое применение нашли два способа построения ФП, позволяющие добиться улучшения характеристик ЦВС: сокращение объема ПЗУ (компрессия) и использование аппроксимационных вычислительных методов. Кроме того, используются комбинации этих способов.
Простейший способ уменьшения необходимого объема памяти заключается в использовании свойства симметричности функции синуса. При этом в ПЗУ записываются значения синуса на интервале, равном четверти периода (квадранте), т.е. вместо функции sin(p · 2π) используют функцию sin(p · π/2), где 0 ≤ p ≤ 1. При этом код фазы на входе ФП уменьшается на два разряда (Q = P–2).
Формирование полного периода гармонической функции возможно также, если известно ее значение на интервале [0, π/4] [9]. В этом случае используются два ПЗУ, где хранятся табличные значения функций sin и cos на данном интервале. Если требуется, например, найти отсчеты гармонической функции во втором октанте (интервал [π/4, π/2]), для изменения знака входного кода производится его двоичное дополнение. Кроме того, выходные сигналы меняются местами, при этом отсчеты берутся из блока со значениями косинуса, т.к. cos(π/4 +x) = sin(π/4–x). Подобные операции выполняются для получения значений гармонической функции во всех октантах, кроме первого.
Большое количество методов сжатия памяти основано на применении интерполяции синусоидальной функции. В этом случае один блок памяти разбивается на два или более блоков. Такой способ был предложен Сандерлендом [10]. Пусть блок памяти без сжатия имеет разрядность 12 бит. Эта разрядность (от старшего разряда к младшему) разбивается на три сегмента – A, B и C – по четыре бита каждый со следующими значениями фазы: . Результирующее значение синусоидальной функции приближенно находится из выражения:
fаппр(x) = sin(x1+x2)+cos x1sin x3.
Таким образом, исходный блок памяти разделяется на два блока с восьмибитной адресацией (рис.5а): ПЗУ, содержащее 11-разрядные отсчеты первого слагаемого, и ПЗУ, в котором расположены четырехразрядные отсчеты второго слагаемого. Такой способ позволяет уменьшить объем требуемой памяти в 11,7 раза.
Альтернативный способ с двумя ПЗУ был предложен Николасом (Nicholas) (рис.5б) [11]. В нем, как и в архитектуре Сандерленда, фазовое слово разбивается на три, с разрядностями A, B и C. Квадрант гармонической функции разбивается по фазе на 2A интервалов, а каждый из них – на 2B подынтервалов. Приближенное значение синуса получается на основе отсчетов, хранимых в ПЗУ 1, на вход которого поступают значения старших разрядов фазы A+B. Далее происходит уточнение значений синуса путем добавления или вычитания поправочных значений, хранимых в ПЗУ 2, на вход которого поступают слова A и C. За счет использования схемы суммирования и вычитания (вместо простого суммирования, как в схеме Сандерленда) и в силу того, что абсолютные значения положительных и отрицательных поправок равны, объем ПЗУ уменьшается в два раза.
Большая группа работ по реализации ФП посвящена методам полиномиальной аппроксимации гармонической функции. Существуют несколько критериев оптимальности выбора аппроксимирующего полинома. Так, по критерию минимума абсолютной ошибки формирования сигнала (отличия формируемой гармонической функции от эталонной, MAE) оптимальным является использование полиномов Чебышева [12]. Полиномы Лежандра оптимальны с точки зрения минимизации соот-
ношения сигнал/шум (SNR) [13]. Максимум значения наибольшего динамического диапазона, свободного от побочных дискретных составляющих (SFDR), можно получить, например, используя минимизацию членов (кроме основной гармоники) в разложении выходного сигнала ЦВС в ряд Фурье.
Большинство работ в этой группе реализует общий подход: один квадрант гармонической функции равномерно или неэквидистантно разбивается по фазе на n сегментов, внутри которых производится интерполяция гармонической функции отрезками полиномиальных функций различных порядков. С ростом порядка полинома и числа сегментов существенно улучшаются потенциальные значения показателей качества формирования сигнала (рис.6) [14]. Однако при этом возрастает сложность практической реализации ФП, что негативно сказывается на быстродействии ЦВС. Нахождение полиномиальных коэффициентов при оптимизации по критерию минимума SFDR часто производят с помощью метода Нелдера-Мида [15]. Для упрощения аппаратной реализации ФП применяются специальные алгоритмы вычисления полиномиальных функций и способы построения вычислительных узлов. Далее рассмотрены различные варианты полиномиальной интерполяции. Следует отметить, что во многих зарубежных работах, посвященных способам построения ФП, ЦАП является внешним устройством и не включается в состав тестовой ИС. Таким образом, значения SFDR, приведенные в этом разделе, непосредственно отражают вклад ФП в данный параметр.
Один из способов реализации функционального преобразователя основан на аппроксимации (интерполяции) синусоидальной функции рядом Тейлора [16]. При этом входной код фазы Q делится на два двоичных слова: A, содержащее старшие разряды, и B = Q – A, включающее младшие разряды. Ряд Тейлора раскладывается вокруг значений x1, соответствующих старшим разрядам фазы:
,
где . Таким образом, одно ПЗУ заменяется на два при линейной аппроксимации и на три – при квадратичной (рис.7).
В методе равных сегментов [17] четверть периода гармонической функции разбивается на n эквидистантных сегментов (рис.8а). При этом значение амплитуды на выходе ФП записывается в виде: fаппр(x) = b(k)+Δxm(k), где k = 0, 1, ..., n–1 – номер сегмента, b(k) = sin(πk/(2n)) – начальное значение амплитуды в каждом сегменте, – значение фазы, определяемое кодом KФП на входе функционального преобразователя, KФП = 0, 1, 2, ..., 2Q – 1, – разность фаз между заданным значением фазы на входе ФП и начальным значением фазы в сегменте, – наклон аппроксимирующего отрезка, – длина сегмента. Описанный метод реализуется с помощью трех ПЗУ (рис.8б), в которых хранятся коэффициенты b(k), m(k) и значения коэффициентов
компенсации ошибок аппроксимации гармонической функции . Разрядность и объем ПЗУ 3, в котором хранятся коэффициенты D(x), определяется числом сегментов и требуемой точностью воспроизведения гармонической функции. Показано [17], что этот способ позволяет уменьшить объем требуемой памяти в десять раз.
Метод, описанный в [9], подразумевает, что в каждом из сегментов аппроксимирующая функция представляет собой два линейных отрезка, имеющих разный наклон и общую точку в середине данного сегмента.
В [18] представлена аппроксимация косинусоидальной функции следующего вида:
fаппр(x) = 0,99941104599607–1,22565453358226 x2+
+0,22882340561354 x4.
Соответствующая этой аппроксимации схема NCO позволяет получить значение SFDR = 72,2 дБн.
Квазилинейный полиномиальный метод интерполяции гармонической функции [19] подразумевает сочетание кусочно-линейной и кусочно-параболической аппроксимации. Для каждого сегмента разбиения квадранта аппроксимирующая функция имеет вид:
,
где k – номер сегмента, с0–с2 – полиномиальные коэффициенты, выбираемые из условия максимума SFDR во всем рабочем диапазоне частот, и g – номер сегмента, в котором происходит смена вида полинома от линейного к параболическому и наоборот (рис.9). Этот метод учитывает тот факт, что вблизи значения x = 0 функция косинуса сходна по форме с параболой, в то время как при приближении к значению x = π/2 функция все ближе к прямой линии.
Аппроксимация гармонической функции
может быть также выполнена с помощью неэквидистантной кусочно-линейной интерполяции [20]. В таком методе гармоническая функция представляется совокупностью нескольких линейных сегментов различной длины. Этот способ требует значительно меньшего количества сегментов по сравнению с интерполяцией сегментами равной длины при одинаковых значениях SFDR. Так, например, для получения SFDR = 84,2 дБн необходимо 17 сегментов с различной длиной или 32 равных сегмента.
В работе [21] использовалась полиномиальная аппроксимация 8-й степени. После приведения к виду, удобному для практической реализации, выражение для такой аппроксимации имеет вид:
.
В [22] представлена двухсегментная аппроксимация гармонической функции, в которой один сегмент определяется на интервале [0, π/4], а второй – на интервале [π/4, π/2] (рис.10):
В результате реализации этого метода получено значение SFDR = 90 дБн.
Таким образом, существует множество способов построения функциональных преобразователей (табл.2). Разработчики продолжают создавать новые варианты, стремясь минимизировать уровень паразитных составляющих в выходном сигнале и максимально повысить рабочую частоту.
Продолжение следует.
Литература
Кочемасов В.Н., Белов Л.А., Оконешников В.С. Формирование сигналов с линейной частотной модуляцией. – М.: Радио и связь, 1983.
Кочемасов В.Н., Долбня Е.В., Соболь Н.В. Акустоэлектронные Фурье-процессоры. — М.: Радио и связь, 1987.
Walls F.L. Local oscillator requirements and strategies for the next generation of high-stability frequency standards. – Proc. 1992 IEEE Freq. Contr. Symposium. USA, 1992, p.2–5.
Tierney J., Rader C.M., Gold B. A digital frequency synthesizer. – IEEE Trans. Audioelectroacoust, March 1971, vol.Au-19, p.48.
AD9914. Data Sheet. Analog Devices, 2014. –
www.analog.com/static/imported-files/data_sheets/AD9914.pdf.
Микросхема интегральная 1508ПЛ8Т. Техническое описание. 2012,
http://multicore.ru/index.php?id=466.
Bhupatiraju R.D. A comparative study of high speed adders. Ohio University, 1999.
Ibrahim S.H., Ali S.H.M., Islam M.S. High speed direct digital frequency synthesizer with pipelining phase accumulator based on Brent-Kung adder. – ICSE, 2012, p.547–550.
De Caro D., Strollo A.G.M. High-performance direct digital frequency synthesizers in 0.25 mm CMOS using dual-slope approximation. – IEEE J. Solid-State Circuits, Nov.2005, vol.40, no.11, p.2220–2227.
Sunderland D.A., Strauch R.A., Wharfield S.S. et al. CMOS/SOS frequency synthesizer LSI circuit for spread spectrum communications. – IEEE J. of Solid State Circuits, Aug. 1984, vol.SC-19, p.497–505.
Vankka J., Halonen K. Direct digital synthesizers. theory, design and applications. – Boston: Kluwer Academic, 2001.
Ashrafi A., Adhami R., Joiner L., Kaveh P. Arbitrary waveform DDFS utilizing Chebyshev polynomials interpolation. – IEEE Trans. Circuits and Systems, 2004, vol.51, no.8, p.1468–1475.
Wen C.-H., Hsu H.-Y., Ko H.Y., Wu A.-Y. Least squares approximation-based ROM-free direct digital frequency synthesizer. – Proceedings of ISCAS ‘04, 2004, p.II-701–II-704.
De Caro D., Strollo A.G.M. High-performance direct digital frequency synthesizers using piece-wise-polynomial approximation. – IEEE Trans. Circuits Syst. I, Feb. 2005, vol.52, p.324–336.
De Caro D., Napoli E., Strollo A.G.M. Direct digital frequency synthesizers with polynomial hyperfolding techniqueю – IEEE Trans.Circuits Syst. II Exp. Briefs, Jul. 2004, vol.51, no.7, p.337–344.
Palomaki K.I., Niittylahti J. Methods to improve the performance of quadrature phase-to-amplitude conversion based on Taylor series approximation. – Proceedings of the 43rd IEEE Midwest Symposium on Circuits and Systems, 2000, p.14–17.
Shiann-Shiun J., Hsing-Chen L., Chen-Yu W. High-performance DDFS design using the equi-section division method. – IEEE Transactions on Ultrasonics Ferroelectrics and Frequency Control, Dec. 2010, vol.57, no.12, p.2616–2626.
Ashrafi A., Adhami R. Theoretical upperbound of the spurious free dynamic range in direct digital frequency synthesizers realized by polynomial interpolation methods. – IEEE Trans. Circuit Syst. I, Reg.Papers, Oct. 2007, vol.54, no.10, p.2252–2261.
Ashrafi A., Adhami R., Milenkovic A. A direct digital frequency synthesizer based on the Quasi-linear interpolation method. – IEEE Trans. Circuit Syst. I, Reg. Papers, Apr. 2010, vol.57, no.4, p.863–872.
Caro D., Petra N., Strollo A. Direct digital frequency synthesizer using nonuniform piecewise-linear approximation. – IEEE Trans. Circuit Syst. I, Reg. Papers, Oct. 2011, vol.58, no.10, p.2409–2419.
Chen Y.H., Chau Y.A. A direct digital frequency synthesizer based on a new form of polynomial approximations. – IEEE Trans. Consum. Electron., May 2010, vol.56, no.2, p.436–440.
Li Xiaojin, Lai Linhui, Lei Ao, Lai Zongsheng. A direct digital frequency synthesizer based on two segment fourth-order parabolic approximation. – IEEE Transactions on Consumer Electronics, June 2009, p.322–326.
De Caro D., Petra N., Strollo A.G.M. Reducing look-up table size in direct digital frequency synthesizers using optimized multipartite table method. – IEEE Trans. Circuits Syst. I, Reg. Papers, Aug. 2008, vol.55, no.7, p.2116–2127.
Со времени первого опубликования [4] структурная схема ЦВС не претерпела коренных изменений. В состав ЦВС (рис.1) входят следующие блоки: накопитель кода фазы (НКФ), функциональный преобразователь (ФП) фаза–синус, цифроаналоговый преобразователь (ЦАП). На выходе ЦВС ставится фильтр нижних частот (ФНЧ). Отметим, что в зарубежных источниках вместо термина ЦВС, как правило, используется близкий по содержанию термин Direct Digital Synthesizer (DDS), а для обозначения схемы ЦВС без ЦАП применяется аббревиатура NCO – Numerically Controlled Oscillator.
Процесс синтеза частоты выглядит следующим образом. НКФ формирует код фазы Kϕ, значение которого изменяется линейно от периода к периоду с шагом, равным коду частоты Kf. Затем код фазы преобразуется в код амплитуды Ka в соответствии с гармонической функцией. Далее на основании кода амплитуды ЦАП формирует аналоговый сигнал, который после фильтрации в ФНЧ подается на выход. Выходная частота определяется по формуле:
.
Если возникает необходимость управления амплитудой выходного сигнала (в соответствии с еще одним кодом – Ку), в разрыв между функциональным и цифроаналоговым преобразователями включается перемножитель кодов Ка и Ку и на цифроаналоговый преобразователь подается код Кау = КаКу.
В истории развития ЦВС можно выделить два основных этапа.
Первый этап – с начала 70-х до конца 90-х годов прошлого века. В этот период формируются основные структуры ЦВС, проводятся работы по созда-
нию новых схемотехнических решений и алгоритмов, обеспечивающих необходимое быстродействие и высокую точность формирования отсчетов на выходе ЦАП, апробируются различные виды интегральных технологий (ЭСЛ, GaAs, КМОП и др.) при создании реальных изделий. Основными производителями интегральных ЦВС на этом этапе были компании Qualcomm, Stanford Telecom и Analog Devices. Многие технические решения отрабатывались на ПЛИС. Более того, из-за отсутствия или недоступности интегральных ЦВС во многих радиоэлектронных изделиях нашли широкое применение ЦВС на ПЛИС.
Второй этап (с начала 90-х годов прошлого века и до сегодняшнего дня) знаменовался интенсивным развитием КМОП-технологии и значительным прогрессом в части построения быстродействующих многоразрядных ЦАП, цифровых интеграторов для накопителей кода фазы, схем памяти. На этом этапе также вырабатывались решения, обеспечивающие работу ЦВС с тактовой частотой в сотни или тысячи мегагерц. Коммерчески успешной среди зарубежных производителей оказалась лишь компания Analog Devices со своей линейкой ЦВС, включающей микросхему AD9914 с тактовой частотой до 3,5 ГГц [5]. Менее известна продукция компаний Teledyne Research (микросхема RDS010 с частотой тактирования до 900 МГц в керамическом корпусе) и Euvis. В России единственным конкурентом зарубежных производителей можно считать компанию ЭЛВИС. В 2011 году компания выпустила микросхему 1508ПЛ8Т [6], которая благодаря своим возможностям оказалась вполне конкурентной с продукцией Analog Devices. Можно констатировать, что появление этой микросхемы позволит решить многие задачи, возникающие при построении радиолокационных и связных комплексов.
Сегодня проводятся дальнейшие исследования и разработки, направленные, прежде всего, на увеличение тактовой частоты и улучшение спектральных характеристик ЦВС. Судя по публикациям, в основном эти исследования ведутся специалистами США, Южной Кореи, Италии, КНР. В США поставлена задача – довести тактовую частоту интегральных ЦВС до 100 ГГц. Столь амбициозные планы связаны с открывающимися стратегическими возможностями при создании перспективных радиолокационных и связных комплексов.
Рассмотрим принципы построения узлов, входящих в состав ЦВС, за исключением ФНЧ.
Накопители кода фазы
В простейшем случае N-разрядный накопитель кода фазы (НКФ) состоит из последовательно со-
единенных N-разрядного сумматора и регистра (элемента задержки) D (рис.2). Структура простейшего N-разрядного сумматора представляет собой цепочку из одноразрядных сумматоров. Выход разряда переноса Cout каждого из них соединен с соответствующим входом последующего Cin (рис.3). Поскольку значение переноса вычисляется последовательно для каждого из разрядов, общее время вычисления суммы S будет пропорционально числу разрядов слагаемых:
Tс = (N – 1) Tпер + Tсум,
где Tпер – время, необходимое для формирования разряда переноса, Tсум – время, необходимое для суммирования. Следовательно, при разрядности современных НКФ 32–48 бит их быстродействие будет крайне низким.
Основной задачей при построении НКФ является повышение скорости функционирования (тактовой частоты). Для достижения этой цели применяются конвейерные сумматоры (в иностранной литературе – pipelined adder), а также сумматоры с параллельным (ускоренным) переносом (CLA, carry look ahead), сумматоры Брента-Кунга (BK) и схемы условного суммирования (CA). Следует отметить, что сумматоры с последовательным переносом (ripple carry adder, RCA) не нашли применения в быстродействующих накопителях кодов из-за неэффективности реализации этой структуры на высоких частотах тактирования.
Принцип работы сумматора с конвейеризацией (рис.4а) состоит в следующем. На каждом шаге конвейера происходит суммирование одного разряда. Остальные разряды остаются неизменными и хранятся в регистрах F. В то время как происходит сложение второго разряда первой пары чисел, может начинаться суммирование первого разряда второй пары чисел. Отметим, что время суммирования одной пары по сравнению с обычным сумматором не изменяется, однако интервал изменения выходного кода сумматора теперь равен Тс/n, где n – число ступеней конвейера. То есть при суммировании потока данных конвейерный сумматор в n раз быстрее обычного.
Схема сумматора с параллельным переносом (рис.4б) состоит из нескольких сумматоров с меньшей разрядностью и схемы ускоренного переноса [7]. В общем случае для сигнала переноса i-го разряда справедливо соотношение: Ci = gi–1 + pi–1Ci–1, где gi–1 = Ai–1Bi–1, pi–1 = Ai–1 + Bi–1. Сигнал gi называют функцией генерации переноса. Сигнал pi показывает, передается ли полученный в младшем разряде сигнал переноса Ci дальше, поэтому он называется функцией распространения переноса. Как следует из приведенных выражений, время формирования сигнала переноса в любой разряд с помощью вспомогательных функций gi и pi определяется только временем задержки распространения сигнала на двух логических элементах И и ИЛИ, где вычисляется значение Ci.
Архитектура Брента-Кунга представляет собой также схему с ускоренным переносом, но оптимизированную по площади ИС за счет небольшого снижения быстродействия [8].
Сравнение различных реализаций НКФ (табл.1) позволяет сделать вывод, что переход от технологии 0,25 мкм к технологии 0,18 мкм дает при прочих равных условиях приблизительно троекратный выигрыш в потреблении и двукратный выигрыш в площади. Кроме того, в 1,5–2 раза повышается предельное быстродействие. С точки зрения архитектуры наилучшими характеристиками обладают сумматоры с ускоренным переносом (CLA) и сумматоры Брента-Кунга. Архитектура условного суммирования (CA) дает, как правило, худшие результаты как по площади ИС, так и по быстродействию. Следует отметить, что выбор той или иной архитектуры зависит от многих факторов: разрядности накопителя, соотношения тактовой частоты и задержки в различных логических элементах, критериев оптимизации (по площади, быстро-
действию, потребляемой мощности в динамическом режиме, мощности токов утечки) и др.
Функциональные преобразователи
В классическом ЦВС (см. рис.1) функциональный преобразователь реализован на основе ПЗУ, хранящего табличную функцию синуса. Желание повысить точность преобразования фазы в синус (косинус), а значит, улучшить спектральные характеристики выходного сигнала ведет к существенному увеличению объема памяти и, как следствие, к увеличению энергопотребления и снижению быстродействия. Практическое применение нашли два способа построения ФП, позволяющие добиться улучшения характеристик ЦВС: сокращение объема ПЗУ (компрессия) и использование аппроксимационных вычислительных методов. Кроме того, используются комбинации этих способов.
Простейший способ уменьшения необходимого объема памяти заключается в использовании свойства симметричности функции синуса. При этом в ПЗУ записываются значения синуса на интервале, равном четверти периода (квадранте), т.е. вместо функции sin(p · 2π) используют функцию sin(p · π/2), где 0 ≤ p ≤ 1. При этом код фазы на входе ФП уменьшается на два разряда (Q = P–2).
Формирование полного периода гармонической функции возможно также, если известно ее значение на интервале [0, π/4] [9]. В этом случае используются два ПЗУ, где хранятся табличные значения функций sin и cos на данном интервале. Если требуется, например, найти отсчеты гармонической функции во втором октанте (интервал [π/4, π/2]), для изменения знака входного кода производится его двоичное дополнение. Кроме того, выходные сигналы меняются местами, при этом отсчеты берутся из блока со значениями косинуса, т.к. cos(π/4 +x) = sin(π/4–x). Подобные операции выполняются для получения значений гармонической функции во всех октантах, кроме первого.
Большое количество методов сжатия памяти основано на применении интерполяции синусоидальной функции. В этом случае один блок памяти разбивается на два или более блоков. Такой способ был предложен Сандерлендом [10]. Пусть блок памяти без сжатия имеет разрядность 12 бит. Эта разрядность (от старшего разряда к младшему) разбивается на три сегмента – A, B и C – по четыре бита каждый со следующими значениями фазы: . Результирующее значение синусоидальной функции приближенно находится из выражения:
fаппр(x) = sin(x1+x2)+cos x1sin x3.
Таким образом, исходный блок памяти разделяется на два блока с восьмибитной адресацией (рис.5а): ПЗУ, содержащее 11-разрядные отсчеты первого слагаемого, и ПЗУ, в котором расположены четырехразрядные отсчеты второго слагаемого. Такой способ позволяет уменьшить объем требуемой памяти в 11,7 раза.
Альтернативный способ с двумя ПЗУ был предложен Николасом (Nicholas) (рис.5б) [11]. В нем, как и в архитектуре Сандерленда, фазовое слово разбивается на три, с разрядностями A, B и C. Квадрант гармонической функции разбивается по фазе на 2A интервалов, а каждый из них – на 2B подынтервалов. Приближенное значение синуса получается на основе отсчетов, хранимых в ПЗУ 1, на вход которого поступают значения старших разрядов фазы A+B. Далее происходит уточнение значений синуса путем добавления или вычитания поправочных значений, хранимых в ПЗУ 2, на вход которого поступают слова A и C. За счет использования схемы суммирования и вычитания (вместо простого суммирования, как в схеме Сандерленда) и в силу того, что абсолютные значения положительных и отрицательных поправок равны, объем ПЗУ уменьшается в два раза.
Большая группа работ по реализации ФП посвящена методам полиномиальной аппроксимации гармонической функции. Существуют несколько критериев оптимальности выбора аппроксимирующего полинома. Так, по критерию минимума абсолютной ошибки формирования сигнала (отличия формируемой гармонической функции от эталонной, MAE) оптимальным является использование полиномов Чебышева [12]. Полиномы Лежандра оптимальны с точки зрения минимизации соот-
ношения сигнал/шум (SNR) [13]. Максимум значения наибольшего динамического диапазона, свободного от побочных дискретных составляющих (SFDR), можно получить, например, используя минимизацию членов (кроме основной гармоники) в разложении выходного сигнала ЦВС в ряд Фурье.
Большинство работ в этой группе реализует общий подход: один квадрант гармонической функции равномерно или неэквидистантно разбивается по фазе на n сегментов, внутри которых производится интерполяция гармонической функции отрезками полиномиальных функций различных порядков. С ростом порядка полинома и числа сегментов существенно улучшаются потенциальные значения показателей качества формирования сигнала (рис.6) [14]. Однако при этом возрастает сложность практической реализации ФП, что негативно сказывается на быстродействии ЦВС. Нахождение полиномиальных коэффициентов при оптимизации по критерию минимума SFDR часто производят с помощью метода Нелдера-Мида [15]. Для упрощения аппаратной реализации ФП применяются специальные алгоритмы вычисления полиномиальных функций и способы построения вычислительных узлов. Далее рассмотрены различные варианты полиномиальной интерполяции. Следует отметить, что во многих зарубежных работах, посвященных способам построения ФП, ЦАП является внешним устройством и не включается в состав тестовой ИС. Таким образом, значения SFDR, приведенные в этом разделе, непосредственно отражают вклад ФП в данный параметр.
Один из способов реализации функционального преобразователя основан на аппроксимации (интерполяции) синусоидальной функции рядом Тейлора [16]. При этом входной код фазы Q делится на два двоичных слова: A, содержащее старшие разряды, и B = Q – A, включающее младшие разряды. Ряд Тейлора раскладывается вокруг значений x1, соответствующих старшим разрядам фазы:
,
где . Таким образом, одно ПЗУ заменяется на два при линейной аппроксимации и на три – при квадратичной (рис.7).
В методе равных сегментов [17] четверть периода гармонической функции разбивается на n эквидистантных сегментов (рис.8а). При этом значение амплитуды на выходе ФП записывается в виде: fаппр(x) = b(k)+Δxm(k), где k = 0, 1, ..., n–1 – номер сегмента, b(k) = sin(πk/(2n)) – начальное значение амплитуды в каждом сегменте, – значение фазы, определяемое кодом KФП на входе функционального преобразователя, KФП = 0, 1, 2, ..., 2Q – 1, – разность фаз между заданным значением фазы на входе ФП и начальным значением фазы в сегменте, – наклон аппроксимирующего отрезка, – длина сегмента. Описанный метод реализуется с помощью трех ПЗУ (рис.8б), в которых хранятся коэффициенты b(k), m(k) и значения коэффициентов
компенсации ошибок аппроксимации гармонической функции . Разрядность и объем ПЗУ 3, в котором хранятся коэффициенты D(x), определяется числом сегментов и требуемой точностью воспроизведения гармонической функции. Показано [17], что этот способ позволяет уменьшить объем требуемой памяти в десять раз.
Метод, описанный в [9], подразумевает, что в каждом из сегментов аппроксимирующая функция представляет собой два линейных отрезка, имеющих разный наклон и общую точку в середине данного сегмента.
В [18] представлена аппроксимация косинусоидальной функции следующего вида:
fаппр(x) = 0,99941104599607–1,22565453358226 x2+
+0,22882340561354 x4.
Соответствующая этой аппроксимации схема NCO позволяет получить значение SFDR = 72,2 дБн.
Квазилинейный полиномиальный метод интерполяции гармонической функции [19] подразумевает сочетание кусочно-линейной и кусочно-параболической аппроксимации. Для каждого сегмента разбиения квадранта аппроксимирующая функция имеет вид:
,
где k – номер сегмента, с0–с2 – полиномиальные коэффициенты, выбираемые из условия максимума SFDR во всем рабочем диапазоне частот, и g – номер сегмента, в котором происходит смена вида полинома от линейного к параболическому и наоборот (рис.9). Этот метод учитывает тот факт, что вблизи значения x = 0 функция косинуса сходна по форме с параболой, в то время как при приближении к значению x = π/2 функция все ближе к прямой линии.
Аппроксимация гармонической функции
может быть также выполнена с помощью неэквидистантной кусочно-линейной интерполяции [20]. В таком методе гармоническая функция представляется совокупностью нескольких линейных сегментов различной длины. Этот способ требует значительно меньшего количества сегментов по сравнению с интерполяцией сегментами равной длины при одинаковых значениях SFDR. Так, например, для получения SFDR = 84,2 дБн необходимо 17 сегментов с различной длиной или 32 равных сегмента.
В работе [21] использовалась полиномиальная аппроксимация 8-й степени. После приведения к виду, удобному для практической реализации, выражение для такой аппроксимации имеет вид:
.
В [22] представлена двухсегментная аппроксимация гармонической функции, в которой один сегмент определяется на интервале [0, π/4], а второй – на интервале [π/4, π/2] (рис.10):
В результате реализации этого метода получено значение SFDR = 90 дБн.
Таким образом, существует множество способов построения функциональных преобразователей (табл.2). Разработчики продолжают создавать новые варианты, стремясь минимизировать уровень паразитных составляющих в выходном сигнале и максимально повысить рабочую частоту.
Продолжение следует.
Литература
Кочемасов В.Н., Белов Л.А., Оконешников В.С. Формирование сигналов с линейной частотной модуляцией. – М.: Радио и связь, 1983.
Кочемасов В.Н., Долбня Е.В., Соболь Н.В. Акустоэлектронные Фурье-процессоры. — М.: Радио и связь, 1987.
Walls F.L. Local oscillator requirements and strategies for the next generation of high-stability frequency standards. – Proc. 1992 IEEE Freq. Contr. Symposium. USA, 1992, p.2–5.
Tierney J., Rader C.M., Gold B. A digital frequency synthesizer. – IEEE Trans. Audioelectroacoust, March 1971, vol.Au-19, p.48.
AD9914. Data Sheet. Analog Devices, 2014. –
www.analog.com/static/imported-files/data_sheets/AD9914.pdf.
Микросхема интегральная 1508ПЛ8Т. Техническое описание. 2012,
http://multicore.ru/index.php?id=466.
Bhupatiraju R.D. A comparative study of high speed adders. Ohio University, 1999.
Ibrahim S.H., Ali S.H.M., Islam M.S. High speed direct digital frequency synthesizer with pipelining phase accumulator based on Brent-Kung adder. – ICSE, 2012, p.547–550.
De Caro D., Strollo A.G.M. High-performance direct digital frequency synthesizers in 0.25 mm CMOS using dual-slope approximation. – IEEE J. Solid-State Circuits, Nov.2005, vol.40, no.11, p.2220–2227.
Sunderland D.A., Strauch R.A., Wharfield S.S. et al. CMOS/SOS frequency synthesizer LSI circuit for spread spectrum communications. – IEEE J. of Solid State Circuits, Aug. 1984, vol.SC-19, p.497–505.
Vankka J., Halonen K. Direct digital synthesizers. theory, design and applications. – Boston: Kluwer Academic, 2001.
Ashrafi A., Adhami R., Joiner L., Kaveh P. Arbitrary waveform DDFS utilizing Chebyshev polynomials interpolation. – IEEE Trans. Circuits and Systems, 2004, vol.51, no.8, p.1468–1475.
Wen C.-H., Hsu H.-Y., Ko H.Y., Wu A.-Y. Least squares approximation-based ROM-free direct digital frequency synthesizer. – Proceedings of ISCAS ‘04, 2004, p.II-701–II-704.
De Caro D., Strollo A.G.M. High-performance direct digital frequency synthesizers using piece-wise-polynomial approximation. – IEEE Trans. Circuits Syst. I, Feb. 2005, vol.52, p.324–336.
De Caro D., Napoli E., Strollo A.G.M. Direct digital frequency synthesizers with polynomial hyperfolding techniqueю – IEEE Trans.Circuits Syst. II Exp. Briefs, Jul. 2004, vol.51, no.7, p.337–344.
Palomaki K.I., Niittylahti J. Methods to improve the performance of quadrature phase-to-amplitude conversion based on Taylor series approximation. – Proceedings of the 43rd IEEE Midwest Symposium on Circuits and Systems, 2000, p.14–17.
Shiann-Shiun J., Hsing-Chen L., Chen-Yu W. High-performance DDFS design using the equi-section division method. – IEEE Transactions on Ultrasonics Ferroelectrics and Frequency Control, Dec. 2010, vol.57, no.12, p.2616–2626.
Ashrafi A., Adhami R. Theoretical upperbound of the spurious free dynamic range in direct digital frequency synthesizers realized by polynomial interpolation methods. – IEEE Trans. Circuit Syst. I, Reg.Papers, Oct. 2007, vol.54, no.10, p.2252–2261.
Ashrafi A., Adhami R., Milenkovic A. A direct digital frequency synthesizer based on the Quasi-linear interpolation method. – IEEE Trans. Circuit Syst. I, Reg. Papers, Apr. 2010, vol.57, no.4, p.863–872.
Caro D., Petra N., Strollo A. Direct digital frequency synthesizer using nonuniform piecewise-linear approximation. – IEEE Trans. Circuit Syst. I, Reg. Papers, Oct. 2011, vol.58, no.10, p.2409–2419.
Chen Y.H., Chau Y.A. A direct digital frequency synthesizer based on a new form of polynomial approximations. – IEEE Trans. Consum. Electron., May 2010, vol.56, no.2, p.436–440.
Li Xiaojin, Lai Linhui, Lei Ao, Lai Zongsheng. A direct digital frequency synthesizer based on two segment fourth-order parabolic approximation. – IEEE Transactions on Consumer Electronics, June 2009, p.322–326.
De Caro D., Petra N., Strollo A.G.M. Reducing look-up table size in direct digital frequency synthesizers using optimized multipartite table method. – IEEE Trans. Circuits Syst. I, Reg. Papers, Aug. 2008, vol.55, no.7, p.2116–2127.
Отзывы читателей