Международная конференция ISSCC 2011. От микросхем больших объемов до имплантируемых устройств
К тому же, для того чтобы можно было оказывать медицинскую помощь не в больнице, а в домашних условиях, потребуются новые сверхмалых габаритов процессоры, радиопередатчики и приемники, батареи, средства аккумулирования энергии (energy harvesting), а также системы интерпретации и представления данных. Вот почему большое внимание на конференции уделялось и новейшим разработкам в области традиционной полупроводниковой технологии, которые в будущем cмогут найти применение в медицинской электронике.
Пленарное заседание ISSCC, в которой приняли участие около 3 тыс. представителей полупроводниковой промышленности, открыли три вступительных доклада. Первый доклад – "Формирование новых интерфейсов тела с помощью имплантируемых систем" сделал представитель компании Medtronics доктор С.Эстерл. Затем с докладом "Качественно новые возможности для беспроводной поддержки здравоохранения и здорового образа жизни" выступил старший вице-президент центра Holst Бельгийской исследовательской организации IMEC профессор Де Бойк. Глава полупроводникового подразделения компании Samsung Electronics Оу-Хьюн Квон представил свои соображения на тему "Экологически дружественные технологии, обеспечивающие здоровый образ жизни".
С.Эстерл в своем докладе о влиянии имплантируемых электронных приборов на здоровье пациентов [1] отметил, что для поддержания работы имплантата необходимо обратить особое внимание на три ключевые проблемы: обеспечение интерфейса с прибором, передачу и обработку данных и управление энергопотреблением. Единое инновационное решение этих трех проблем в виде хорошо отработанной системы позволит все чаще получать положительные результаты лечения.
Де Бойк, как и Эстрел, отметил необходимость совершенствования методов обработки данных, генерируемых имплантатами и нательными электродными накладками, а также более внимательного изучения способов преобразования поступающих данных в достоверную клиническую информацию [1, 2]. Будущие сенсоры должны контролировать диету пациента, прием им лекарств, его сон, деятельность и даже дыхание. С инженерной точки зрения, такие датчики получают большой объем данных, которые не всегда можно выразить в виде достоверной и удобной для восприятия информации. Для питания таких датчиков потребуются новые батареи и технологии аккумуляции энергии. Беспроводная электродная накладка, потреблявшая два года назад ∼1 Вт, теперь, выполненная на современных компонентах с высокими характеристиками, потребляет
100 мВт. Но в будущем для ее питания нужна будет печатная батарея площадью 6 мм2 и мощностью
50 мкВт. Для этого потребуются новые технологии средств питания сустройств обработки все увеличивающегося объема данных сенсоров и выполнения все более сложных алгоритмов. Совершенствование электродных накладок, схем обработки аналоговых сигналов, настраиваемых в соответствии с мощностью сигнальных процессоров, маломощных беспроводных сетей, локализованных на теле человека (Wireless Area Network, WBAN), технологии аккумуляции энергии, интегрированных многосенсорных систем – все это приведет к созданию новых устройств, которые смогут улавливать запах, слышать и даже воспринимать эмоции и, тем самым, способствовать улучшению нашего здоровья и образа жизни.
В качестве примера таких устройств Де Бойк привел описанный в докладе специалистов Бельгийского исследовательского центра IMEC первый в мире пластмассовый восьмиразрядный микропроцессор (рис.1) [3, 4]. Разработан микропроцессор совместными усилиями специалистов Центра нанотехнологии IMEC, исследовательской организации TNO и компании Polymer Vision (обе в Нидерландах). Изготовлен он на двух пластмассовых листах полиэтиленнафталата (polyethylene naphthalate, PEN) размером 2×2 см и содержит
4 тыс. p-канальных транзисторов с двойным затвором. Общая толщина процессорной структуры – 25 мкм.
При создании микропроцессора поверх одного из пластмассовых листов последовательно наносились первый слой золотых электродов толщиной 25 нм, изолирующий слой и второй слой золотых электродов. Для формирования транзисторов после удаления под воздействием лазерного облучения ненужных участков золотого покрытия первоначально путем центрифугирования капли жидкого органического вещества получали тонкое органическое покрытие пластины. При нагреве оно преобразовывалось в пентацен – органический материал, используемый сегодня при изготовлении органических полупроводниковых приборов. Окончательная структура микропроцессора изготавливалась методами фотолитографии и травления.
Создание органических микропроцессоров с примелемыми характеристиками затруднено из-за разброса значений порога срабатывания транзисторов, формируемых набором смешанных аморфных кристаллов пентацена. Поэтому надежность такого органического микропроцессора не велика. Для решения этой проблемы в структуру органического транзистора был введен дополнительный управляющий электрод, который позволил улучшить управление электрическим полем и исключить его случайные переключения.
Блоки хранения жестко закодированной программы (правда, программа содержит всего 16 команд), выполненные на второй пластине, могут присоединяться к микросхеме процессора и обеспечивать "загрузку" программы. В результате процессор способен рассчитывать скользящее среднее значение входного сигнала, т.е. выполнять функцию обработки сигнала сенсора. Правда, скорость расчета не превышает 6 Гц (в 106 раз меньше, чем у современных ПК). При этом напряжение питания составляет 10 В. Тестирование изготовленного пластмассового процессора показало, что его производительность равна 6 инструкций/с.
Таким образом, по вычислительной мощности микропроцессор сопоставим с микропроцессорами 1970-х годов. Но несомненные достоинства – низкая стоимость (в десять раз ниже традиционных процессоров) и гибкость – делают его перспективным для применения там, где использование кремниевых микросхем ограничено из-за их стоимости или физических возможностей. Пластмассовая электроника позволит встраивать одноразовые функционирующие без внешних устройств активные наклейки, например в продуктовые упаковки, и при нажатии кнопки смартфона получать дополнительные сведения о покупаемом продукте. Пластмассовый микропроцессор можно будет встраивать и в одежду для контроля физического состояния человека.
Освоение методов печати таких процессоров с рулона на рулон будет способствовать дальнейшему снижению их стоимости. И по мнению Де Бойка, вероятно, через 20 лет половина разработок, представляемых на ISSCC, будет выполнена на кремнии, а вторая половина – на пластмассе.
Третий вступительный доклад главы полупроводникового подразделения компании Samsung Electronics Квона [1] был посвящен тому, как изделия полупроводниковой промышленности смогут непосредственно или косвенно улучшать жизнь человека. Квон отметил следующие четыре основные задачи, которые потребуется решить при проектировании и масштабировании интегральных микросхем следующих поколений [5].
1. Энергопотребление. Не приходится говорить о том, что энергопотребление интегральных схем велико. При переходе к каждому новому поколению микросхем (от 180-нм топологических норм к 90-нм нормам) производителям удавалось сокращать потребляемую мощность на 30%. Однако при дальнейшем масштабировании эффекты короткого канала затрудняют уменьшение рабочего напряжения. Обостряется и проблема тока утечки затвора. Изготовление структуры затвора на основе диэлектрика с высокой диэлектрической постоянной k и металлического электрода позволяет сократить энергопотребление еще на 20%. Но этого недостаточно. Перед полупроводниковой промышленностью стоит задача в последующем десятилетии достичь 20%-ного совокупного среднегодового темпа снижения потребляемой мощности.
При этом Квон отметил, что полупроводниковая промышленность не сможет добиться успеха в создании «зеленых» изделий и сокращении потребляемой мощности электронных устройств (от смартфонов до серверов), если она не приведет в порядок собственное производство. По его данным, промышленность ежегодно потребляет 40 ТВт-ч. Уровень энергопотребления в 2008 году был на 47% выше, чем в 2001. В последние два года ежегодный прирост потребляемой электронными устройствами энергии составил 7%. В 1990-е годы представители промышленности не обратили особого внимания на предупреждение главы компании STMicroelectronics Паскуаля Писторио о необходимости сокращения энергопотребления. Но сегодня к мнению лидера в области производства микросхем памяти в полупроводниковой промышленности вынуждены прислушаться.
Проведенный компанией Samsung анализ оборудования, используемого для выполнения одной и той же операции на различных предприятиях, показал существенное отличие его энергопотребления. И здесь немаловажную роль играет так называемая «мощность-вампир». Примерно 73,9% потребляемой предприятием энергии приходится на долю энергопотребления в режиме простоя, т.е. заводское оборудование практически работает лишь примерно 4 ч в день. В результате улучшения связи между системами автоматической загрузки-разгрузки материала и соблюдения более эффективного графика поступления обрабатываемой партии за счет совершенствования средств управления технологическим процессом и программного обеспечения компания Samsung рассчитывает сократить отношение между временем простоя и работой до 50% и получить ежегодную экономию потребляемой энергии ∼2,32 ТВт-ч.
Однако необходимо и более тесное сотрудничество всех служб, обеспечивающих производство полупроводниковых приборов газообразными веществами, чистой водой и другими материалами. Так, давление воды, используемой для охлаждения различного оборудования, может колебаться от 3 до 6 кгс/м2. Сократить этот разброс на 20%, по мнению Квона, можно за счет разработки соответствующих стандартов [6, 7].
И наконец, по данным организации надзора за энергопотреблением в Сан-Франциско, энергию, расходуемую на операции осаждения двуоксида кремния, можно уменьшить на 80% путем снижения температуры процесса с 780 до 300°С. Такое уменьшение температуры необходимо и с точки зрения риска повреждения приборов с неглубокими p-n-переходами при высокой температуре обработки. Правда, снижение температуры процесса может привести к увеличению концентрации примесей тонких пленок в структуре прибора. Для решения этой проблемы нужны новые материалы, позволяющие получать беспримесные тонкие пленки при низких температурах обработки.
И сегодня в полупроводниковой промышленности решением проблем уменьшения энергопотребления заняты различные активно действующие сообщества. Это и мозговой трест Sematech, и различные альянсы полупроводниковых компаний, такие как альянс Common Platform (Общая платформа), образованный Samsung, концерном IBM и крупной фирмой-производителем микросхем GlobalFoundaries, или Joint Process Development Agreement (Cоглашение по совместной разработке технологических процессов), в котором участвуют компании Freescale Semiconductor, Renesas, Toshiba, Infineon Technologies и STMicroelectronics.
2. Создание транзисторов и микросхем памяти следующих поколений. При переходе к топологическим нормам менее 20 нм интерес к дальнейшему совершенствованию современных планарных транзисторов пропадет. Освоение 14-нм норм потребует разработки новых структур транзисторов. Так же, как и президент Института перспективной технологии компании Samsung К.Кинама, выступавший на конференции IEDM [8], Квон считает, что наиболее перспективен полевой транзистор «плавникового» типа (FinFET) со структурой затвора на основе диэлектрика с высоким k и металлического электрода. Такие транзисторы, по мнению экспертов компании Samsung, позволят сократить потребляемую мощность на 10% при улучшении характеристик приборов на 20%.
Что касается микросхем памяти (ДОЗУ, флеш-памяти NAND- и NOR-типов), то пока непонятно, насколько возможно их дальнейшее масштабирование и какому новому типу памяти будет отдано предпочтение. Samsung разрабатывает ряд новых типов памяти – трехмерную флеш-память NAND-типа, магниторезистивную память (MRAM), память с изменением фазового состояния (PCM, или PRAM), резистивную память (ReRAM). Но основное препятствие к продвижению новых типов памяти – нежелание системных компаний их осваивать, поскольку, по их мнению, "они не совместимы с существующей технологией". Квон рекомендовал изготовителям комплектного оборудования теснее взаимодействовать с компаниями-производителями микросхем памяти для более полного ознакомления с новыми типами запоминающих устройств. Компания Samsung считает, что наиболее перспективный тип энергонезависимой памяти, способной заменить как ДОЗУ, так и флеш-память, – PCM-тип. Об этом свидетельствует представленная компанией на конференции 1-Гбит память PCM-типа.
3. Переход к трехмерным структурам. Освоение технологии 3D-микросхем с использованием сквозных отверстий через кремний (Through-Silicon-Vias, TSV) [7] длится дольше, чем ожидалось. Этот процесс может ускорить выпуск компанией Samsung сформированного с помощью TSV-технологии
1-Гбит ДОЗУ с топологическими нормами 50–58 нм [9]. Интерфейс ДОЗУ, поддерживающий ввод-вывод данных с 512 выводов со скоростью 12,8 Гбайт/с, позволил сократить потребляемую энергию до 72% за счет уменьшения емкости нагрузки межсоединений и схем ввода-вывода данных.
Микросхема занимает площадь кристалла в 64,34 мм2, что примерно на 25% больше площади 1-Гбайт маломощного DDR2 ДОЗУ компании. Диаметр TSV-отверстия составляет 7,5 мкм, его сопротивление – 0,22–0,24 Ом, емкость – 4,47 фФ.
Предназначена микросхема памяти для смартфонов и планшетных компьютеров. Отгрузки ее планируются на 2013 год [4, 5].
4. Прорыв в области проектирования микросхем. Схемы, структуры которых чувствительны к вариациям технологического процесса, при низких напряжениях нестабильны, и предел снижения их напряжения питания ограничен. К таким схемным структурам относятся встраиваемые СОЗУ. Для повышения их стабильности необходимы средства содействия считыванию и записи. Перспективен и переход от шеститранзисторной ячейки памяти к восьмитранзисторной.
Так каковы же на сегодняшний день достижения электроники, способствующие поддержанию здорового образа жизни?
Медицинская техника на ISSCC 2011
Тематике конференции были посвящены доклады, прозвучавшие на различных секциях.
Интерес участников конференции вызвало сообщение ученых Университета Вашингтона о создании беспроводного глюкометра, непрерывно измеряющего содержание глюкозы в крови без укола для взятия капли крови [10]. Разработчики воспользовались тем, что концентрацию глюкозы в крови можно непосредственно измерить в слезе глаза. Предложенный ими глюкометр встроен в контактную линзу и не требует применения внешних компонентов. Электрохимический датчик, ток которого пропорционален концентрации глюкозы в слезе, имеет три электрода – рабочий, считывания и опорный. Изготовлен он осаждением на прозрачную подложку полиэтилентетрафталата трех пленок металла – титана (толщиной 10 нм), палладия (10 нм) и платины (100 нм). Датчику придается форма линзы диаметром 1 см. Поверх него для получения мембраны, позволяющей измерять концентрацию глюкозы с чувствительностью 1,67 мкА⋅мм-2⋅ммоль-1, наносятся глюкозооксидаза и изопропоксид титана. Датчик присоединяется к КМОП-микросхеме глюкометра, содержащей блок управления режимом питания, схему считывания, интерфейс беспроводной связи и конденсаторы накопления энергии. Поскольку датчик, монтируемый в контактную линзу, не может иметь встроенного источника питания или батареи, для его питания использован изотромический излучающий на частоте 2,4 ГГц источник мощностью 0,1 Вт, располагаемый на расстоянии 15 см от линзы. Сигнал источника преобразуется трехкаскадным выпрямителем в постоянное напряжение питания.
При потребляемой мощности 3 мкВт чувствительность глюкометра равна 0–2 ммоль/л. Площадь встраиваемой в контактную линзу системы глюкометра составляет 0,5 мм2.
Внимание участников конференции привлекло сообщение ученых Мичиганского университета о создании беспроводного энергетически автономного монитора внутриглазного давления (Intraocular Pressure Monitor, IOPM) объемом 1,5 мм3, практически представляющего собой компьютер миллиметрового размера, который выполняет функции сбора, хранения и передачи информации другому прибору [11].
Монитор предназначен для наблюдения за развитием глаукомы – болезни, способной привести к слепоте. Устройство имплантируется в радужную оболочку глаза с помощью минимально инвазивной процедуры создания разреза, используемой при операции катаракты. Удерживается IOPM на месте благодаря упругости ткани и тактильной обратной связи, обеспечиваемой корпусом индикатора. В результате он не повреждает окружающую ткань глаза и легко удаляется.
Биосовместимый корпус монитора содержит вертикально смонтированные солнечную батарею, тонкопленочную литиевую батарею, МЭМС емкостной датчик давления и маломощную КМОП-микросхему, которая включает микроконтроллер, память и беспроводной трансивер, передающий сигнал расположенному вблизи глаза считывающему устройству (рис.2). В основе монитора — экспериментальная микросхема Phoenix третьего поколения, о разработке которой ученые Мичиганского университета сообщали в 2008 году. Особенность трансивера – антенна собственной разработки, которая интегрирована в микросхему и самостоятельно настраивается на нужную частоту.
Микросхема "просыпается" каждые 15 мин для измерения внутриглазного давления, фиксируемого МЭМС емкостным датчиком давления. Датчик соединен с Σ∆-преобразователем емкостного сопротивления на напряжение 3,6 В и потребляемую мощность 7 мкВт. Измерения выполняются на протяжении всего интервала "сна" микросхемы, задаваемого управляющим контроллером (WUC). Преобразователь сравнивает значение зависимого от внутриглазного давления тока с фиксированным значением генерируемого им тока. Разрешение составляет 0,5 мм рт. ст. против 1 мм для обычных тонометров.
Результаты измерений с помощью микропроцессора (при потребляемой мощности 90 нВт) записываются в СОЗУ емкостью 4 Кбит, в котором данные могут храниться три дня. Чтобы продлить длительность хранения данных до недели, микропроцессор может выполнить функцию сжатия данных. Система большую часть времени работает в режиме ожидания, и ее энергопотребление не превышает 3,65 нВт, в режиме обработки и передачи данных – 5,3 нВт. Для зарядки литиевой батареи на ток 1 мА монитор должен ежедневно находиться в течение 10 ч в освещенном помещении или в течение 1,5 ч на солнце. Но поскольку он имплантирован в глаз, это не должно вызывать затруднений. Серийное производство монитора ожидается через несколько лет.
По мнению разработчиков, "устройство может стать ключом к организации беспроводных сенсорных сетей с компонентами миллиметрового размера. Эти сети могут в один прекрасный день отслеживать загрязнения, проверять структурную целостность сооружений, выполнять иные наблюдения или сделают контролируемым практически любой объект". Такие беспроводные сети датчиков можно будет локализовать на теле человека, и они смогут работать без протокола управления передачей данных или межсетевого протокола.
Проблема разработки стандарта на беспроводные сети, локализованные на теле человека (Wireless Area Network, WBAN), вторая версия которого должна быть принята в 2012 году, вызвала оживленную дискуссию на ISSCC [7]. Этот документ должен представлять собой стандарт на беспроводные маломощные и высоконадежные средства связи малой дальности, которые могут функционировать вблизи или непосредственно на теле человека. Стандарт найдет применение при создании сетей на основе сенсоров для контроля пульса, стимуляторов деятельности мозга, купирования болевого синдрома, настройки электрокардиостимуляторов и др.
Стандарт задает ряд критериев WBAN-сетей. Основные из них – малое энергопотребление и высокая надежность. Определены и средства обеспечения совместимости компонентов сети с другими беспроводными приборами, обеспечения безопасности пациента и отклика на сигнал предупреждения об опасном для жизни пациента состоянии менее чем за 1 с. Но основное назначение стандарта – упрощение сети WBAN. Так, один общий уровень управления доступом к сетевой среде (MAC), предлагаемый рабочей группой IEEE 802.15 TG6, имеет привычную звездную топологию с двумя режимами пересылки принятого сообщения в сеть. Определен центральный концентратор, к которому подключаются все узлы сети. В соответствии с требованиями врача или видом оповещения, предоставляемого сетью, возможны три вида доступа – регулярный, произвольный и выборочный. Помимо MAC три физических уровня поддерживают широко- и узкополосные каналы связи, а также локализованный на теле человека канал связи. По оценкам компании Texas Instruments, для медицинских систем наиболее приемлем узкополосный канал, легко реализуемый существующими ВЧ-микросхемами.
Стандарт должен способствовать лечению больных на основе данных, поступающих от сетей WBAN. В лечебных заведениях будет сокращено непосредственное наблюдение медицинских сестер за больными, пациенты будут освобождены от их попечительства и строгого постельного режима, а их состояние будет постоянно контролироваться. Это, конечно, выполнить не легко, но предполагаемая экономия средств служит серьезным стимулом для создания сетей WBAN.
Ежегодные конференции ISSCC предоставляют ведущим полупроводниковым компаниям возможность продемонстрировать свое превосходство в области новейших микропроцессоров, памяти, высокочастотных устройств и т.п. Каким же технологиям была присуждена пальма первенства в этом году?
Самые, самые, самые
На конференции этого года внимание участников привлекли сообщения о новых разработках микропроцессоров компаний IBM, Intel, AMD и…Китая.
Самый быстрый микропроцессор z196, уже поставляемый для мейнфремов семейства System zEnterprise 196, представила компания IBM. Четырехъядерный КМОП-микропроцессор с CISC-архитектурой и нестандартным суперскалярным конвейером (инструкции выполняются в порядке поступления данных, а не в порядке, задаваемом программой) – первый в мире процессор на частоту 5,2 ГГц (по-видимому, сегодня это самая высокая базовая частота, реализованная на микропроцессорах) [12]. Процессор выполнен по КНИ-технологии с топологическими нормами 45 нм и 13 уровнями медной металлизации.
Каждое ядро процессора содержит L1 кеш программ емкостью 64 Кбайт, L1 кеш данных емкостью 128 Кбайт и L2 кеш емкостью 1,8 Мбайт. Кроме того, процессор имеет L3 кеш на основе встроенного ДОЗУ емкостью 24 Мбайт. По сравнению с предыдущим процессором z10 мейнфрема, новая микросхема выполняет 100 новых инструкций и операции подстройки конвейера, позволяющие переупорядочивать инструкции для повышения его эффективности. Конвейер суперскалярного процессора за один такт декодирует три инструкции и выполняет до пяти операций.
Микросхема z196 процессора содержит 1,4 млрд. транзисторов, размещенных на площади 512,3 мм2. Монтируется в корпус с матричным расположением золотых столбиковых выводов.
Процессор с самым большим числом транзисторов – 3,1 млрд. на кристалле размером 18,2×29,9 мм в процессоре Poulson компании Intel, представляющем собой следующее поколение серверных процессоров семейства Itanium [13]. Разработка процессора с самого начала велась с учетом возможности освоения его в производстве по 32-нм технологии. По-видимому, создание этого процессора подтверждает мнение экспертов относительно того, что Intel – больше производящая, чем разрабатывающая компания – считает наличие собственного производства положительным фактором, способствующим развитию технологии и улучшению эффективности управления ценовой политикой.
Процессор предшествующего поколения McKinley был выпущен на рынок около девяти лет назад. При таком же долголетии процессора Poulson топологические нормы микросхем в соответствии с Международной дорожной картой развития полупроводниковой технологии (ITRS) будут менее 11 нм. Но схемы таких размеров уже будут изготавливаться на новых материалы и по новым технологиям.
Poulson – восьмиядерный процессор со структурой затвора на основе диэлектрика с высоким k и металлическим электродом. Общий объем его кеш-памяти составляет 54 Мбайт (кэш-памяти данных второго уровня – 2 Мбайт, кэш-памяти программ второго уровня – 4 Мбайт, кеш третьего уровня – 32 Мбайт). Такие характеристики должны обеспечить ему достаточно развитые вычислительные возможности. Скорость передачи данных, обеспечиваемая кольцевым интерфейсом и 12-ступенным конвейером, равна 700 Гбайт/с. Несмотря на столь большое число транзисторов процессора, в ядрах используются лишь 712 млн. Большую часть оставшихся транзисторов (2,17 млрд.) можно найти в кэш-памяти третьего уровня.
Рабочее напряжение ядер равно 0,85–1,2 В, потребляемая энергия ∼95 Вт. Рабочее напряжение кэш-памяти третьего уровня – 0,9–1,1 В, потребляемая энергия – 5 Вт. Для питания цепей, связывающих ядра и L3 кэш-память, требуется напряжение 0,9–1,1 В, их энергопотребление – ∼50 Вт. Напряжение питания блоков ввода-вывода – 1,05–1,1 В, их энергопотребление – ∼20 Вт. Таким образом, процессор Poulson может обеспечить существенный рост производительности системы, а также рост показателя производительности на 1 Вт затраченной энергии, по сравнению с процессором Tukwila семейства Itanium 9300, даже если перевести его на 32-нм техпроцесс (рис.3).
Процессор Poulson по разъемам и выводам совместим с процессором Itanium 9300 CPU, а это означает, что он найдет широкое применение в серверах HP-UX и NonStop компании Hewlett Packard. Вместе с тем высказывается предположение, что он позволит реализовать амбиции компании Intel в области облачных вычислений и поддержки телевидения высокой четкости.
С учетом того, что Intel приводит размеры процессора нового поколения, очевидно уже имеются его функционирующие образцы. Согласно планам компании, Poulson в начале 2012 года заменит четырехъядерный процессор Tukwila.
Процессор с самым большим числом ядер – опять процессор компании Intel. Это серверный процессор E7 семейства Xeon с десятью х86 ядрами (кодовое имя Westmere-EX) и общей кэш-памятью третьего уровня емкостью до 30 Мбайт (рис.4) [14]. Процессор изготовлен по 32-нм технологии с девятью уровнями металлизации. Максимальная тактовая частота процессора – 2,4 ГГц, потребляемая мощность – 130 Вт. Его быстродействие до 40% выше, чем у процессора предыдущего поколения семейства Xeon – 7500.
В процессоре E7 реализованы технологии Turbo Boost, Hyper-Threading и Virtualization Technology (VT), позволяющие повышать производительность системы при увеличении нагрузки и поддерживать обработку до 20 программных потоков, а также облегчить управление ресурсами в корпоративной среде. Кроме того, в нем используется разработанная компанией технология интеллектуального управления питанием (Intelligent Power), которая задает потребляемую энергию в соответствии с приложенной нагрузкой.
В E7 также реализован ряд технологий безопасности. Так, набор команд стандарта Advanced Encryption Standard New Instruction, AES-NI повышает скорость шифрования и расшифровки данных в различных приложениях и при решении различных задач, а выверенная технология Trusted Execution Technology, TXT изолирует платформу от вредоносного ПО в момент запуска. Эти компоненты значительно расширяют возможности управления вычислительными ресурсами систем. Благодаря функциям обеспечения надежности, доступности и удобства обслуживания (RAS) процессор E7 может стать альтернативой процессорам семейства Itanium, использующим другую систему команд.
В начале апреля компания сообщила о намерении производителей компьютерной техники выпустить более 35 систем на базе процессора E7. Среди производителей – Bull Information Systems, Cisco, Cray, Dawning, Dell, Fujitsu, Hitachi, HP, Huawei, IBM. По данным компании Dell, соотношение производительности и потребляемой энергии ее серверов на основе процессора E7 на 49% лучше, чем у серверов предыдущего поколения. О поддержке новых процессоров заявили также ведущие поставщики ПО – IBM, Microsoft, Oracle, Red Hat, SAP AG и VMware.
Самая инновационная процессорная микроархитектура Bulldozer – двухъядерное модульное ядро "зеленого" процессора компании Advanced Micro Devices (AMD) [15]. Процессоры AMD по такому показателю, как отношение энергопотребления к производительности, уступают процессорам компании Intel. Поэтому при создании нового поколения процессоров специалисты компании уделили большое внимание улучшению "утилизации" питания.
AMD отмечает четыре фактора, которые обеспечивают высокую энергоэффективность новой микроархитектуры. Первый – это технология изготовления двухъядерного модуля Bulldozer по 32-нм КНИ-технологии с 11 уровнями металлизации и структурой затвора на основе диэлектрика с высоким k и металлическим электродом. Модуль содержит 213 млн. транзисторов. Рабочее напряжение составляет 0,8–1,3 В, рабочая частота превышает 3,5 ГГц. Площадь его с учетом кэш-памяти второго уровня емкостью 2 Мбайт – 30,9 мм2. Построение модульного ядра на основе n-канальных полевых транзисторов по КНИ-технологии позволило до 90% снизить значения паразитных токов, а реализация блока полного отключения питания ядра в режиме ожидания практически сводит к нулю энергопотребление логики при простое.
Второй фактор – инновационный подход к повышению производительности многопоточных вычислений, уравновешивающий выделенные и общие вычислительные ресурсы и позволяющий создать компактную, многоядерную конструкцию, которую легко выполнить на кристалле. По расчетам AMD, ключевые логические блоки процессора простаивают больше, чем конвейеры ядер, следовательно их ресурсы должны быть общими для двух ядер. Два ядра модуля совместно пользуются ключевыми логическими блоками – выборки инструкций, декодером, кэш-памятью второго уровня и 128-бит блоком арифметики с плавающей запятой (FPU) с двумя разблокированными множителями/сумматорами (Fused Multiply-Accumulate, FMAC). Такая структура позволяет экономить на "повторяющихся" блоках. FPU поддерживает такие х86 инструкции, как SSE3, SSE4.1, SSE4.2, AVX и AES.
Поскольку процессор в основном работает с целыми числами, в модуле реализованы два блока с четырьмя целочисленными конвейерами в каждом, а также работающий с ними нестандартный целочисленный планировщик, который поддерживает четыре операции за такт, операцию активизации тоже за один такт и L1 кэш-память данных (рис.5). Эти блоки представляют собой “специализированные компоненты”, выделенные для обработки потоков команд процессора. Для разделения потоков между “специализированными” (целочисленными) блоками компания использовала технологию одновременной многопоточности (Simultaneous Multi-Threading, SMT). Таким образом, двухъядерный модуль поддерживает исполнение двух потоков команд одновременно.
Третий фактор улучшения энергопотребления – повышение эффективности элементов и цепей на всех уровнях. Во-первых, это разработка низковольтного триггера, обеспечивающего линейный рост производительности в диапазоне напряжений 0,8–1,3 В. Во-вторых, как считают в компании, может быть, самый значительный фактор, это усоверенствование цепей синхронизации – одного из самых “прожорливых” элементов процессора. Чтобы исключить потребление в моменты переходных процессов (при спаде и нарастании сигнала), когда логический сигнал неустойчив и возникает вероятность ошибки, разработчики постарались не только подогнать работу логики под "устойчивый" гребень синхроимпульса, но и предусмотреть возможность прекращения синхронизации логики на время переходных процессов. Для этого они пошли на беспрецедентный шаг – ввели в архитектуру Bulldozer свыше 30 тыс. индивидуальных "выключателей" линий тактовых цепей. "Вывод" тактовых цепей из цепи потребления в моменты переходных процессов обеспечило 7–9% экономию энергопотребления по сравнению с современными ядрами (рис.6).
И, наконец, в архитектуру Bulldozer введен эквивалент технологии Intel Turbo Boost, позволяющий процессору при выполнении интенсивно нагружающих его программ (если TDP находится в пределах, обозначенных в спецификациях) дополнительно "разгонять себя" на частоту до 500 МГц и "сбрасывать скорость" до значения, требуемого для обеспечения максимальной эффективности.
С помощью технологии Bulldozer компания AMD намерена наподобие бульдозера "расчищать" объем работ современных вычислительных систем любого типа – от настольных ПК до серверов. Первые процессоры на основе модулей Bulldozer, производство которых передано компании GlobalFoundries, AMD намерена выпускать для серверов.
Самая высокая энергоэффективность у 64-разрядного восьмиядерного процессора Godson-3B разработки Пекинского института компьютерных технологий. Универсальный восьмиядерный процессор Godson-3B, изготовленный по 65-нм технологии с семью слоями медной металлизации, занимает площадь 299,8 мм2 и содержит 582 млн. транзисторов (с учетом транзисторов L2 кэш-памяти емкостью 4 Мбайт) [16]. Максимальная частота его составляет 1,05 ГГц, максимальная производительность – 128 Gflops (при двойной точности) или 256 Gflops (при одинарной точности) при потребляемой мощности 40 Вт. Рекордным параметром является энергоэффективность процессора – 3,2 Gflops/Вт.
Процессор содержит две секции, в каждую из которых входят четыре ядра, четыре банка L2 кэш-памяти, HyperTransport (HT) контроллер, контроллер DDR2/3 ОЗУ и внутренняя цепь соединений этих компонентов с 128-бит стандартным интерфейсом AXI. Указывается, что возможно расширение до 16 секций. Базируются Godson-3B на системе команд MIPS, к которой инженеры китайского института компьютерных технологий добавили более 300 инструкций.
Предназначен процессор для первого суперсервера Dawning, который будет выполнен полностью на отечественных компонентах. Запустить сервер планируется летом 2011 года.
Сейчас ведется разработка 16-ядерного процессора серии Godson-3B, который будет выполнен по 28-нм технологии. Процессор должен работать на частоте 1,5 ГГц и потреблять мощность 15 Вт. Его расчетная производительность – 384 Gflops. Процессор будет содержать четыре контроллера DDR3 ОЗУ и четыре HT-контроллера. Первые образцы этого процессора должны быть выпущены в этом году крупнейшим производителем микросхем – тайваньской компанией TSMC (вместо ранее предполагавшегося производителя STMicroelectronics).
Отмечается, что финансирование проекта разработки суперсервера и процессоров для него ведется в рамках Китайской инициативы на 2006–2020 годы, предусматривающей создание крупных летательных аппаратов и ИЗС, ведущих зондирование Земли с высоким разрешением.
К процессорам с самым низким энергопотреблением можно отнести и сигнальный процессор, изготовленный по 28-нм технологии специалистами компании Texas Instruments и Массачусетского технологического института [17]. Процессор может работать в высокопроизводительном режиме на частоте 587 МГц при напряжении 1 В (мощность – 113 мВт) и в режиме сверхнизкого энергопотребления при напряжении 0,5 В (максимальная рабочая частота 43,4 МГц).
Микросхема выполнена на основе четвертой версии 32-регистрового сигнального процессора компании Texas Instruments TMS320C64x и содержит L1 кэш емкостью 32 Кбайт, L2 кэш емкостью 128 Кбайт, а также интерфейсы I2S, SPI, UART, интерфейсы мультимедиа карт и внешней памяти. В микросхему входят более 600 тыс. специализированных логических ячеек на низкое напряжение и 43 секции СОЗУ емкостью 1,6 Мбит. Предназначен сигнальный процессор для мобильных систем.
Самая суровая конкуренция. Какая крупная олимпиада в области компьютерных компонентов может обойтись без выяснения результатов конкуренции между Intel и AMD? На ISSCC обе компании представили графические процессоры, позиционируемые как несопоставимые друг с другом.
Процессор Sandy Bridge, созданный в конструкторском бюро компании Intel в Хайфе (Израиль), содержит четыре x86 ядра, графический процессор с оптимизированными параметрами, DDR3 ОЗУ, контроллеры PCIe и общий L3 кэш емкостью 8 Мбайт (рис.7) [18]. Процессор занимает площадь в 216 мм2, на которой размещены 1,16 млрд. транзисторов.
В ячейку Sandy Bridge введен ряд поправок, позволяющих повысить производительность процессора без увеличения потребляемой им мощности. Так, улучшена точность предсказателя переходов, поддерживаются улучшенные векторные расширения (AVX), предусмотрена возможность хранения декодированных микроопераций. Кэш-память третьего уровня разделена на четыре модуля, по одному емкостью 2 Мбайт на ядро. Вместе с тем они полностью используются графическими средствами процессора.
Кольцевая структура межсоединений объединяет все компоненты микросхемы. А поскольку структура модульная, четрехъядерная микросхема легко переводится в двухъядерную путем "вырубания" двух ядер и двух модулей L3 кэша. Рассеиваемая мощность процессора Sandy Bridge составляет 95 Вт для четырехъядерного варианта, используемого в настольных компьютерах высших моделей, и 17 Вт – для двухъядерного устройства, работающего в мобильном приборе.
Процессор предназначен для серверов, рабочих станций, ноутбуков и настольных компьютеров.
Процессор Zacate компании AMD – первый представитель разрабатываемых ею в рамках проекта AMD Fusion процессоров APU (Accelerated Processing Unit, ускоренный процессорный элемент) [19]. Суть проекта AMD Fusion – объединение центрального многозадачного универсального процессора с графическим параллельным многоядерным процессором на одном кристалле. На кристалле процессора Zacate расположены два х82 процессорных ядра с архитектурой Bobcat, L2 кэш емкостью 1 Мбайт (по 512 Кбайт для каждого ядра), клиентский северный мост (CNB), графический контроллер Radeon HD 6000 с поддержкой технологии DirectX 11 и интегрированный унифицированный модуль видеодекодера (Unified Video Decoder, UVD), отвечающий за обработку видео высокой четкости. В конструкции процессора использованы перспективные методы управления питанием, в том числе раздельные шины питания центрального и графического ядер.
Каждое процессорное ядро и его L2 кэш совместно пользуются единой секцией шины питания. Секции шин двух ядер подключены к шине регулируемого напряжения VDD. Значения тактовой частоты двух ядер задаются незавимо друг от друга, VDD устанавливается по значению минимального напряжения, требуемого для получения максимальной тактовой частоты ядер. Если одно из ядер находится в режиме ожидания, его кэш можно очистить, сохранить его состояние в памяти и отключить питание, подаваемое на секцию шины ядра. Если оба ядра находятся в режиме ожидания, VDD можно уменьшить на большее значение для сокращения тока утечки (даже в структурах управления питанием). В результате максимальное значение выделяемой энергии процессора составляет 18 Вт.
Выполнена микросхема по 32-нм КМОП-технологии с десятью уровнями металлизации и содержит 450 млн. транзисторов. Разработчики рассматривают процессор Zacate как решение для компактных ноутбуков, и в прессе он уже получил прозвище "убийцы Intel Atom".
* * *
На конференции ISSCC 2011 было продемонстрировано много интересных новых будущих микропроцессорных архитектур. Не менее интересные доклады касались новейших типов энергонезависимой памяти, способных заменить флеш-память NOR- и NAND-типов, высокочастотных микросхем, 20-нм и менее технологии. Эти вопросы будут рассмотрены в следующих номерах журнала.
Литература
1. Plenary Session – Invited Papers. – www.miracd.com/ISSCC2011/WebAP/PDF/AP_Session1.pdf.
2. SSET seminar: Game-changing opportunities for wireless personal healthcare and lifestyle.– www.imec.be/tcmwebapp/internet/course.tcm?L=EN_GB&K=MTC&Course=AAAAIIG
3. The First Plastic or organic Computer Processor.– www.xangolover.com/tag/isscc-conference.
4. Flexible Microprocessor Hints at Computerized Clothing, Packaging. –www.pleasingnews.com/flexible-microprocessor-hints-at-computerized-clothing-packaging/587642896/
5. LaPedus M. Samsung CEO: Four challenges seen for ICs. – www.eetimes.com/electronics-news/4213367/Samsung--Four-challenges-seen-for-ICs-
6. LaPedus M. Samsung CEO: Green fab tools wanted.– www.eetimes.com/electronics-news/4213361/Samsung-CEO--Green-fab-tools-wanted
7. Intel, Samsung and healthcare made headlines at the International Solid-State Circuits Conference (ISSCC). – eandt.theiet.org/magazine/2011/03/isscc-2011.cfm
8. Гольцова М. IEDM 2010. Новые процессы, новые материалы.– ЭЛЕКТРОНИКА: НТБ, 2011, №1, с.124.
9. Samsung wide I/O DRAM for Mobile Applications. –www.electroiq.com/index/packaging/packaging-blogs/ap-blog-display/blogs/ap-blog/post987_4239121460555413910.html
10. Liao Yu-Te, Yao Huanfen, Parviz B., Otis B. A 3μW Wirelessly Powered CMOS Glucose Sensor for an Active Contact Lens – wireless.ee.washington.edu/papers/YudoOtis_ISSCC2011.pdf
11. Chen G., Ghaed H., Razi-ul Haque et. al. A Cubic-Millimeter Energy-Autonomous Wireless Intraocular Pressure Monitor. – www.eecs.umich.edu/~dfick/files/chen_isscc2011_slides.pdf
12. IBM ships 5.2GHz chip, its fastest yet. – news.cnet.com/8301-13924_3-20015297-64.html
13. Karmehed A. Intel’s server processor Poulson gets 54MB cache and 8 cores. – http://www.nordichardware.com/news/69-cpu-chipset/42465-intels-server-processor-poulson-gets-54mb-cache-and-8-cores.html
14. Shvets G. Intel Xeon E7 microprocessors to launch next week.– www.cpu-world.com/news_2011/2011040302_Xeon_E7_microprocessors_to_launch_next_week.html/
15. Walrath J. Bulldozer at ISSCC 2011 - The Future of AMD Processors.– www.pcper.com/reviews/Processors/Bulldozer-ISSCC-2011-Future-AMD-Processors?aid=1083
16. Godson-3B and Godson-3c.– laotsao.wordpress.com/2011/02/25/godson-3b-and-godson-3c/
17. Update: MIT, TI tip 28-nm app processor. – www.eetimes.com/electronics-news/4213314/MIT--TI-tip-28-nm-app-processor-
18. Intel Sandy Bridge Review. – www.bit-tech.net/hardware/cpus/2011/01/03/intel-sandy-bridge-review/
19. AMD Zacate E-350 Processor Performance Preview. – http://hothardware.com/Reviews/AMD-Zacate-E350-Processor-Performance-Preview/