Продолжится ли масштабирование ИС? Дебаты на конференции ISSCC
2002 года 49-й конференции попытались ответить на них, сосредоточив внимание на таких проблемах, как последствия масштабирования и вызываемого им снижения рабочего напряжения транзисторов и увеличения токов утечки. И, конечно, ведущие полупроводниковые фирмы постарались приурочить к этому событию разработку новых перспективных приборов.
Международные конференции ISSCC проводятся с 1965 года, и каждый год главное событие – обсуждение наболевших проблем отрасли. Не нарушила традицию и конференция этого года. Доброжелательная, проникнутая атмосферой шуток, каламбуров, анекдотов, веселых воспоминаний аудитория, тем не менее, сумела обсудить животрепещущие проблемы современной микроэлектроники. Во вступительном слове на предыдущей конференции 2001 года руководитель технологических разработок фирмы Intel Пэт Гельзингер предупредил, что следование закону Мура будет способствовать не только дальнейшему повышению уровня интеграции, но и приведет к экспоненциальному росту потребляемой ИС мощности. Действительно, на нынешней конференции самые острые обсуждения касались проблем, связанных с переходом к субмикронной технологии, т.е. так называемых проблем закона Мура. Последствия масштабирования КМОП ИС и обусловленные им снижение напряжения питания, увеличение токов утечки и потребляемой мощности участники конференции начали обсуждать еще до ее открытия.
Естественно, производители оборудования заинтересованы в дальнейшем уменьшении размеров кристалла, снижении потребляемой мощности и стоимости ИС, отметил вице-президент по исследовательским работам фирмы Philips Фред Бьекхорст. В первую очередь это касается систем с так называемым "всеобъемлющим" интеллектом (ambient intellegence), т.е. систем, способных подстраиваться к требованиям пользователя в соответствии с ситуацией. Пример такой системы – музыкальные DVD-системы, способные идентифицировать искомую мелодию по ее напеву. Для нахождения за 0,5 с нужной мелодии в базе данных, содержащей 20 тыс. записей, необходимо выполнить 3.109 операций в 1 с (Gops). Такие системы будут существенно отличаться от современных: с одной стороны на входе должны применяться датчики и актюаторы со скоростью передачи данных 1 бит/с или менее, а с другой – выходные устройства, обеспечивающие сопряжение с ТВЧ-системами отображения, скорость передачи которых должна достигать 5 Гбит/с. В результате диапазон полосы пропускания системы должен перекрывать девять порядков, а диапазон допустимой рассеиваемой мощности – шесть порядков. И еще, лет через пять стоимость ИС, предназначенных для таких систем, не должна превышать 20 центов, стоимость батареи – 10 центов, корпуса – еще 10 центов. Сейчас же, как отметил Бьекхорст, только ставится задача достижения минимальной стоимости перспективных систем стандарта Bluetooth, равной 5 долларам.
В ходе обсуждения специалисты разделились на два лагеря – разработчиков цифровой техники, привыкших рассматривать любую передачу данных как обмен логическими "0" и "1" с определенной частотой ошибок по битам, и создателей аналоговых устройств – "динозавров" электроники, помнящих вакуумные трубки и четырехтранзисторную ячейку Джильберта. Правда, разногласия между ними отражали не столько различие точек зрения, сколько различие подходов к решению возникающих проблем. Разработчики цифровых систем считают даже самые сложные ИС, состоящие по их представлению из объединения регистров и логических устройств, идеальными устройствами, вырабатывающими определенные сигналы в предсказуемые временные интервалы. ЗУ и схемы смешанной обработки сигнала, по их мнению, – это черные ящики, далеко не простые, но на работу которых можно полагаться.
Однако и для цифровых ИС существуют свои проблемы. По мере их масштабирования проводники перестают быть просто проводниками, превращаясь в емкостные и индуктивные элементы. И транзисторы уже не просто транзисторы. Это подчеркнул на воскресном заседании-презентации ISSCC вице-президент по вопросам технологии фирмы Texas Instruments Денис Басс. В докладе, озаглавленном "Когда МОП-ключи становятся МОП-регуляторами света", он указал, что МОП-транзисторы никогда не бывают полностью отключены. По мере масштабирования их каналы становятся короче, толщина затворного окисла уменьшается, а металлические токопроводящие линии превращаются в высокие тонкие стенки. И чем меньше пороговое напряжение транзистора, тем больший ток требуется для его переключения. Растет и ток утечки транзистора. В результате при неизменной длине канала ток, потребляемый КМОП ИС с 0,09-мкм элементами и напряжением питания 1,2 В, на два порядка выше, чем у микросхемы с 0,25-мкм топологией и напряжением питания 2,5 В. С этим утверждением согласен и руководитель перспективных линейных разработок фирмы Analog Devices Тед Конт, заявивший, что идея создания процессора на частоту 300 МГц и ток 1 мА – мечта и фантазия. "Токи утечки просто обожгут вам пальцы", – говорит он. А по мнению разработчиков Intel, рассеиваемая мощность цифровых микросхем, выполненных по субмикронной технологии, в один прекрасный день может оказаться сопоставимой с энергией атомной электростанции или даже энергией солнечного излучения.
Но вместе с тем, как отметил Басс, низковольтные КМОП-элементы – самые перспективные приборы для построения современных портативных систем. Где же выход? По мнению докладчика, – в поиске инновационных решений, в том числе новых архитектур цифровых устройств, способных выполнять аналоговые функции. Придется менять архитектуру ВЧ-схем с тем, чтобы они могли работать совместно с КМОП-устройствами. Существует множество архитектур, позволяющих объединять аналоговые и высоковольтные устройства с низковольтными КМОП-элементами. Возможно, например, формирование поликремниевых имплантированных резисторов и изолирующих барьеров на чипе. Можно использовать диэлектрики с высокой диэлектрической постоянной для создания конденсаторов с требуемыми значениями емкости. Правда, применение таких диэлектриков приводит к увеличению тока возбуждения, т.е. только делает еще больше "плохих новостей". По утверждению Басса, даже система управления питанием может быть реализована с помощью КМОП-технологии.
Более спорным оказался вопрос о возможности создания soft-приемника. Как сообщил профессор Боб Бродерсен, возглавляющий Исследовательский центр беспроводной связи Берклийского университета шт. Калифорния, самая высокая эффективность средств обработки, измеряемая в 106 операций в 1 с (Mops) в пересчете на милливатт потребляемой мощности, получена для архитектур с большим параллелизмом в пересчете на единицу площади кристалла. Это утверждение основано на изучении процессоров, представленных за более чем 20 лет на конференциях ISSCC. Худшую эффективность имеют универсальные процессоры на высокие частоты с большим объемом программной поддержки. Самая высокая эффективность присуща специализированным процессорам, предназначенным, например, для схем декодирования данных MPEG-2 и 802.11 форматов. Поэтому идея создания приемника, в сильной степени зависящего от программного обеспечения, – идея "плохая".
Еще одна группа во главе со специалистом в области схем смешанной обработки сигнала фирмы Philips Research Labs Маартеном Вертрегтом и ведущим инженером компании Hitachi Масао Хотта отстаивала необходимость реконструирования аналоговых устройств с целью обеспечения их совместимости с цифровыми КМОП-элементами. К тому же, по утверждению М. Вертрегта, аналоговые микросхемы намного опережают цифровые по темпам масштабирования КМОП-транзисторов. Если, согласно закону Мура, увеличение плотности размещения транзисторов должно ежегодно возрастать на 59%, то для ИС процессоров этот рост составляет всего 15%, тогда как для АЦП – 26%. В качестве примера удачного применения цифровых устройств для выполнения аналоговых функций приводился сигма-дельта преобразователь, что вызвало саркастическое восклицание – "Скажем спасибо цифровому сообществу за продвижение технологии КМОП-процессоров (в мир аналоговой техники)".
Но возрастающая рассеиваемая мощность – не единственный гоблин, прячущийся в темных углах ISSCC. Для многих создателей аналоговых устройств масштабирование КМОП-транзисторов – просто губительно. Как отметила группа специалистов, возглавляемая Л. Контом и руководителем работ в области средств обработки сигналов фирмы Maxim Integrated Products Тедом Тьюксбери, с уменьшением рабочего напряжения и ростом тока утечки снижается допустимый коэффициент шума транзисторов. И это наряду с увеличением шумов, вносимых межсоединениями. Тьюксбери считает, что сегодня "жизнь по Муру" диктует необходимость "дезинтеграции" и создания отдельных усилительных микросхем, выполняющих аналоговые функции. А это ставит под вопрос возможность создания столь широко обсуждаемой в последнее время системы-на-кристалле (СнК). И, как ехидно отметил Л. Конт, даже широко обсуждавшаяся на конференции цифровая КМОП СБИС сотового телефона фирмы Texas Instruments для 2,5G/3G-систем, в котором ВЧ-трансиверы, кодеки (ВЧ- и голосовые) и устройства распределения питания выполнены на КМОП, БиКМОП и SiGe-элементах, все-таки требует применения внешнего элемента – драйвера усилителя мощности антенны. На одном чипе с остальной схемой его выполнить не удалось.
Этой группе вторит профессор Калифорнийского университета в Лос-Анджелесе Асад Абиди, отметивший, что снижение напряжения ограничивает динамический диапазон ВЧ-схем. Для обеспечения надлежащей работы ВЧ-усилителей, фильтров, смесителей и генераторов необходимы МОП-транзисторы с длинным каналом и окислом достаточной толщины. А такие транзисторы лучше всего работают при напряжении 2,5 В и выше. Предлагаемые новые архитектуры приемников, наподобие устройств прямого преобразования без ПЧ, при низких значениях напряжения не свободны от избыточного токового шума и не отвечают требованиям GPS-систем. Более совершенная архитектура – двухкаскадный непрямой преобразователь с понижением частоты – требует применения традиционных фильтров, напряжение которых превышает 1,8 В. По-видимому, в портативных ВЧ-устройствах будущего найдут применение как низковольтные КМОП-транзисторы, так и транзисторы с длинным каналом.
Примирительную позицию заняли руководитель исследовательских работ подразделения микроэлектроники фирмы IBM Керри Бернштейн и председатель отделения электротехники Станфордского Университета Брюс Волли, отметившие, что разработчики аналоговой техники должны сотрудничать с цифровым сообществом и стремиться к преобразованию аналогового элемента в цифровой. По-видимому, изготовителям микросхем все-таки придется считаться с прогнозом Ассоциации полупроводниковой промышленности (SIA), согласно которому к 2013 году минимальные топологические нормы будут равны 10 нм (0,01 мкм), и активно искать новые решения, приводящие к объединению аналоговых и цифровых функций с минимумом затрат. Но вопрос об использовании той или иной технологии может быть решен только на основе экономических факторов. Это мнение обосновал руководитель группы высокоскоростных преобразователей фирмы Analog Devices Давидом Робертсоном, который провел аналогию между развитием технологий реактивных самолетов и микроэлектроники. Согласно представленному им графику, до достижения скорости полета 600-700 миль/ч зависимость, названная Робертсоном "технологической кривой", была линейной. Но уже со второй половины XX столетия скорость полетов коммерческих реактивных самолетов не превышает 1000 миль/ч. Такая же технологическая кривая определяет и развитие микроэлектроники. Технология развивается, но экономика иногда диктует необходимость "сойти с данного поезда", т.е. при принятии того или иного решения следует руководствоваться "правилом банкира" – насколько это решение экономически оправдано.
Но конструкторы цифровых систем упорно ищут решения возникающих проблем. И, пожалуй, наилучших результатов на сегодняшний день достигла фирма Intel.
ЧТО НОВОГО В ПРОЦЕССОРНОЙ ТЕХНОЛОГИИ?
Естественно, наибольшее внимание привлекли работы "предводителя" процессорной технологии – фирмы Intel. Поэтому неудивителен интерес, проявленный к методу снижения токов утечки за счет подачи прямого и обратного смещения на подложку, разработанный Intel совместно с учеными Массачусетского технологического института. Метод рассматривался в нескольких докладах специалистов фирмы. Они показали, что при подаче на подложку прямого смещения 450 мВ относительно кармана n- или p-типа мощность, потребляемая в рабочем режиме, уменьшается на 23%, а при подаче обратного смещения – в полтора раза снижается ток утечки. Возможности метода были продемонстрированы на примере таких компоновочных блоков, как АЛУ на частоту 6,5 ГГц,
32-разрядный целочисленный исполнительный блок на 5 ГГц
и КМОП-чип трассировщика на 1 ГГц. Последний выполнен по 0,15-мкм технологии, содержит 6,6 млн. транзисторов, размещенных на кристалле размером 10,1х10,1 мм. Напряжение питания АЛУ составляет 1,1 В (в отсутствие смещения подложки – 1,25 В), потребляемая мощность – 120 мВт. Исполнительный блок выполнен по 0,13-мкм КМОП-технологии на кристалле размером 1,16х1,44 мм. Потребляемая мощность его равна 267 мВт. Фирма рассчитывает к 2003 году реализовать коммерческий процессор на базе представленных блоков с 0,09-мкм нормами, а к 2005-му – с 0,065-мкм нормами.
Большую аудиторию собрали и доклады (их было шесть), посвященные новой серии 64-разрядных процессоров McKinley фирмы Intel. Процессор этой серии, оцениваемый аналитиками как "правильно сделанный Itanium", разработан совместно со специалистами Hewlett-Packard. На его создание было затрачено 1 млрд. долл. Характеристики McKinley, содержащего 221 млн. транзисторов, значительно улучшены по сравнению с Itanium. Эффективность его кэша третьего уровня (L3) емкостью 3 Мбайт составляет 85% (против 70% для памяти того же уровня Itanium емкостью 4 Мбайт), на кристалле он занимает на 20% меньшую площадь. Пропускная способность L2 кэша (64 Гбит/с) в четыре раза выше, чем у RISC-процессоров, а функциональная задержка L1 кэша длительностью в один цикл обеспечивает повышение быстродействия на 15–25%. Но не только кэш-память процессора ответственна за повышение в полтора-два раза быстродействия McKinley в сравнении с Itanium: скорость передачи его шины шириной 128 бит (против 64 бит у Itanium) составляет 400 МГц (против 266 МГц). Ядро процессора работает на тактовой частоте 1 ГГц против 800 МГц для Itanium. Фирма рассчитывает, что процессор McKinley сможет удачно конкурировать с 64-разрядными чипами фирм Advanced Micro Devices, IBM, MIPS и Sun Microsystems. Отгрузки процессора планируется начать в середине 2002 года.
В кулуарах конференции обсуждались слухи о новой разработке Intel 32/64-разрядного процессора под кодовым названием Yamhill (картофельная лунка), о котором специалисты фирмы предпочитали пока ничего конкретного не говорить. Известно лишь, что Yamhill – это программные и аппаратные средства, которые позволят добавить х86-архитектуре (32-разрядной) возможности 64-разрядного устройства.
Привлек внимание собравшихся совместный доклад специалистов Toshiba, ArTile Microsystems и Simplex Solutions "Архитектура диагональных межсоединений и ее применение в RISC-ядре". Работа проводилась в рамках инициативы "Х-архитектура". В этом проекте, запущенном в июне 2001 года и предусматривающем применение диагональных соединительных линий вместо традиционных ортогональных, сегодня уже участвуют 32 компании. Предложенный метод основан на использовании так называемой плиточной концепции проектирования, разработанной фирмой ArTile – дочерней компанией Toshiba America Electronic Components. Метод предусматривает реализацию произвольных логических "плит", на базе которых затем создаются блоки устройств, представляющих собой интеллектуальную собственность. Эти блоки в свою очередь объединяются с помощью обычных ортогональных межсоединений. Трассировка диагональных соединений выполнялась по разработанной на фирме Simplex Solutions технологии "жидкостной маршрутизации". По этой технологии на базе 750 тыс. произвольных логических вентилей был изготовлен RISC-процессор на частоту 200 МГц. Процессор содержит также несколько СОЗУ и специализированных блоков. Выполнен он по 0,18-мкм КМОП-технологии (зазор между сигнальными линиями – 0,28 мкм) и размещен на кристалле площадью 4,8 мм2. По данным разработчиков, применение диагональных соединений позволило уменьшить длину токопроводящих линий на 20% и площадь, занимаемую схемой, – на 10%. Кроме того, удалось добиться 20%-ного улучшения производительности всех блоков процессора. Ведущий специалист в области разработки СБИС-систем фирмы Toshiba Такаши Митсухаси выразил уверенность в том, что через несколько лет Х-архитектура будет использоваться в большинстве конструкций с пятью и более слоями металлизации.
ОАЗИС ПАМЯТИ
Не всех производителей ИС волнуют проблемы масштабирования элементов. В первую очередь – это разработчики схем памяти, воодушевленно рассказавшие об успехах масштабирования ДОЗУ, СОЗУ и даже упрямых ячеек флэш-памяти. Основные потребители схем ОЗУ, емкость которых к концу десятилетия достигнет, согласно прогнозам, 16 Гбит, – производители универсальных компьютеров и серверов. Но разработчики сотовых телефонов и цифровых помощников активно стимулируют создание микросхем памяти с малой потребляемой мощностью. Хотя на конференции не были представлены какие-то крупные достижения в области повышения плотности элементов ДОЗУ, в кулуарах их разработчики оживленно обсуждали архитектуры ячеек, выполненных по 0,09-мкм и менее технологии. А специалисты Toshiba предложили новое оригинальное решение проблемы создания ДОЗУ с проектными нормами менее 0,1 мкм за счет исключения конденсатора из ячейки памяти и создания ячейки с плавающим основанием (Floating-Body Cell – FBC). FBC-ячейка содержит n-канальный МОП-транзистор, изготовленный на КНИ-подложке, состоящей из пластины p-типа с диффузионным n+-слоем, поверх которой нанесены пленки оксида и кремния. Исток транзистора формируется в верхнем слое кремния и присоединяется к шине заземления. Сток присоединен к разрядной шине, а затвор – к шине слов. В диффузионном n+-слое созданы мелкие изолирующие канавки, заполненные поликремниевыми столбиками, на которые подается отрицательный потенциал, обеспечивающий поступление дырок в основание структуры. Таким образом, поликремниевые столбики выполняют функцию конденсаторов, присоединенных к основанию структуры. Пороговое напряжение транзистора в такой ячейке равно 250 мВ. Продолжительность хранения информации ячейкой при комнатной температуре составляет несколько секунд, при 85оС – 100 мс. Такие показатели, конечно, не достаточны для автономного ДОЗУ, но приемлемы для встроенной памяти. Разработчики считают созданную структуру перспективной для СнК и намерены впервые создать такую систему, объединяющую FBC ДОЗУ емкостью в несколько сотен мегабит и логические устройства. Первое изделие такого типа, выполненное по 0,07-мкм технологии, должно появиться в 2004 году.
Кроме того, специалисты Toshiba и Samsung представили созданные ими микросхемы флэш-памяти NAND-типа емкостью 1 Гбит. Минимальная ширина линии в обеих схемах равна
0,13-мкм. Сегодня эти нормы широко применяются производителями ЗУ. Такие микросхемы, монтируемые с каждой боковой стороны типичной платы памяти, используемой в цифровых фотокамерах или портативных аудиосистемах, могут хранить до 256 Мбайт.
Флэш-память фирмы Samsung содержит 32 банка элементов памяти, в центре кристалла размещен декодер строк. При размере страницы 2 Кбайт пропускная способность схемы составляет 7 Мбайт/с. Это позволяет на 75% сократить время, требуемое для записи данных в существующие флэш NAND-типа, оперирующие с 512-Кбайт страницами. Напряжение питания равно 1,8 В. Для увеличения напряжения до 20 В, что требуется для программирования памяти, инженерами фирмы разработана диодная схема накачки заряда. Диоды формируются на основе p-канальных МОП-транзисторов. В схеме памяти используется кэш-память, в которую в процессе работы с одной страницей загружается следующая. Скорость считывания при х8-организации памяти равна 16 Мбайт/с, при х16-организации – 27 Мбайт/с. Время цикла – 50 нс. Разработчики не указали размер чипа, сообщив только, что площадь ячейки 0,076 мкм2.
Ячейка флэш-памяти фирмы Toshiba занимает примерно такую же площадь (0,077 мкм2), а площадь чипа – 125 мкм2. Напряжение схемы – 2,7 В. В ней использованы кэш записи и считывания, поддерживающие, соответственно, скорость записи 10,6 Мбайт/с и скорость считывания 20 Мбайт/с. Размер страницы изменяется в пределах 512–2 Кбайт. В общем случае для записи данных в ячейку требуется четыре цикла длительностью 50 нс каждый. Но, как правило, достаточно трех циклов.
Но пока ни одна из фирм не сообщила о планируемом сроке выпуска новых микросхем флэш-памяти.
Не были обойдены вниманием и другие типы энергонезависимой памяти. Разработчики фирмы Samsung доложили о создании сегнетоэлектрического ОЗУ, которое можно вставлять в слоты СОЗУ. Хотя назначение микросхемы не указывалось, по-видимому, она найдет применение в буферной памяти коммуникационных систем. Специалисты Intel сообщили о результатах разработки так называемой OUM-памяти на основе поликристаллических халькогенидов, отметив, что они удовлетворены полученной плотностью упаковки элементов 4-Мбит схемы, выполняемой по 0,18-мкм технологии. Пока основная проблема этой схемы памяти – большой потребляемый ток, превышающий 1 мА.
По мере продвижения промышленной технологии в область 0,09-мкм топологических норм ситуация в промышленности усложняется. Синхронность разработок аналоговых и цифровых микросхем нарушается все больше. Создатели ВЧ- и прецизионных аналоговых СнК пока не спешат отказываться от 0,18-мкм технологии. А самые активные разработчики цифровых ИС усиленно продвигают 0,13-мкм нормы в производство и готовятся к освоению 0,1- и 0,09-мкм норм.
Возможность выполнения аналоговых устройств по КМОП-технологии продемонстрировали специалисты фирмы Broadcom, создавшие КМОП-микросхемы передатчика и приемника для сетей Sonet со скоростью передачи 10 Гбит/с. Сегодня схемы с таким быстродействием изготавливаются на арсениде галлия или на базе биполярных транзисторов. Сложность разработки КМОП-устройств заключается в воздействии шума, генерируемого высокочастотными логическими схемами, на аналоговые блоки и связанные с этим проблемы пульсации. Разработчики Broadcom решили эту задачу, применив существующие средства выделения паразитных параметров КМОП-транзисторов, что позволило достичь предельных значений их быстродействия. Напряжение питания микросхемы передатчика, изготовленной по 0,18-мкм технологии, составляет 1,8 В (против 3,3 В для других типов ИС), рассеиваемая мощность – 450 мВт. Секции передатчика с меньшим быстродействием выполнены на базе стандартных КМОП-блоков.
Во втором докладе фирмы была представлена ИС 16-канального приемника для систем связи стандарта ОС-192, также выполненная по 0,18-мкм технологии на кристалле размером 2,5х2,1 мм и рассчитанная на напряжение 1,8 В. Данные от присоединенного к оптическому контуру фотодиода поступают в приемник, где они преобразуются в параллельные и передаются в соответствующие каналы. При этом пиковая пульсация составляет 40 пс. Рассеиваемая мощность приемника – 870 мВт. Обе микросхемы монтируются в дешевые пластмассовые корпуса. Производство их передано фирме Taiwan Semiconductor Manufacturing.
Участники конференции весьма скептически отнеслись к возможности применения оптических межсоединений в кремниевых ИС. Мнение специалистов фирм Intel, IBM, Hewlett-Packard, Станфордского университета и Университета Линкопинга (Швеция) было единым – металлические проводящие линии могут быть масштабированы и обеспечивать приемлемые характеристики на частотах до 10–15 ГГц. Поэтому маловероятно, что в текущем десятилетии дорогостоящая и сложная технология формирования оптических волноводов на кремниевых подложках найдет применение. К тому же оптические соединительные линии не превосходят металлические: и электроны и фотоны движутся со скоростью, близкой к скорости света, а мощность, потребляемая оптическими линиями, выше.
Подводя итоги конференции, можно привести мнение Басса, согласно которому следование закону Мура имеет как отрицательную, так и положительную стороны. Отрицательная – в том, что это может привести к сокращению доходов фирм-разработчиков и в конечном итоге действие закона может прекратиться. Положительная сторона – для создания "чудес" на базе КМОП-технологии осталось еще пять-десять лет.