Выпуск #7/2020
Я. Петричкович, Т. Солохина, А. Беляев, Д. Кузнецов, Л. Меньшенин, Ф. Путря, А. Функнер, С. Фролова, В. Гусев, Е. Янакова
RoboDeus – 50-ЯДЕРНАЯ ГЕТЕРОГЕННАЯ СнК ДЛЯ ВСТРАИВАЕМЫХ СИСТЕМ И РОБОТОТЕХНИКИ
RoboDeus – 50-ЯДЕРНАЯ ГЕТЕРОГЕННАЯ СнК ДЛЯ ВСТРАИВАЕМЫХ СИСТЕМ И РОБОТОТЕХНИКИ
Просмотры: 1589
DOI: 10.22184/1992-4178.2020.198.7.52.63
RoboDeus – 50-ядерная гетерогенная СнК
для встраиваемых систем и робототехники
Я. Петричкович, д. т. н., Т. Солохина, к. т. н., А. Беляев, д. т. н.,
Д. Кузнецов, Л. Меньшенин, Ф. Путря, к. т. н., А. Функнер, С. Фролова,
В. Гусев, Е. Янакова, д. т. н.
Развитие технологий искусственного интеллекта требует внедрения решений для реализации сложных алгоритмов машинного обучения и высокопроизводительной обработки разнородной информации. Эти задачи наиболее эффективно решать с помощью многоядерных систем на кристалле, способных собирать данные с различных датчиков и исполнять различные типы алгоритмов – от обработки графики и видео до обучения нейросетей. В АО НПЦ «ЭЛВИС» создана 50-ядерная гетерогенная СнК RoboDeus, которая обеспечивает производительность алгоритмов искусственного интеллекта на основе нейронных сетей на уровне 16 TFlops и предназначена для построения интеллектуальных мультисенсорных встраиваемых систем. В статье представлены архитектурные особенности, ключевые характеристики, основные области применения новой СнК.
Перед разработчиком встраиваемой системы всегда возникал вопрос – как оптимальным образом распределить обработку данных в системе? Можно сосредоточить всю вычислительную мощность в центральном процессоре и подключаться к нему с помощью терминальных устройств, а можно наделить эти устройства недюжинной силой и не слишком зависеть от центрального мозга.
За последние 50 лет развитие архитектур вычислительных систем шло поэтапно: от ранних конфигураций типа клиент-сервер до тотального распространения все более мощных персональных компьютеров. В последнее время быстрыми темпами развиваются такие перспективные направления, как центры обработки данных и облачные вычисления.
Множество задач эффективнее решать в оконечных устройствах, вне крупных вычислительных систем. Такой тип обработки данных называется граничными вычислениями (edge computing). Пример такого подхода – смартфон, в котором сосредоточены огромные возможности по обработке данных: универсальные вычисления для приложений, графика, навигация, цифровые модемы, обработка изображений и даже вычисление нейросетей. В таких системах, как управление беспилотным автомобилем или робототехническим комплексом, также требуются все возможности по обработке данных смартфона, но, кроме того, в них нужно реализовать управление в режиме жесткого реального времени.
Реализация этих задач требует создания интегральных схем, способных быстро обрабатывать огромные массивы информации и оснащенных широкими коммуникационными возможностями. Многоядерные системы на кристалле (СнК) с гетерогенной архитектурой полностью отвечают этим требованиям.
Разработанная в АО НПЦ «ЭЛВИС» 50-ядерная СнК RoboDeus (1892ВМ248) позволяет собирать в одном чипе и обрабатывать информацию от всех типов датчиков (оптика, радары, лидары, тепловизоры, навигационные системы, датчики звука, битовые сенсоры и т. д.). Микросхема позволяет эффективно реализовать практически любой тип алгоритма (управление, графика, обработка сигналов, связь, решение навигационных задач, обработка и распознавание изображений и видео, распознавание звука и вычисление любых типов нейросетей). При этом можно решать все эти задачи в концепции fusion sensors, то есть обрабатывать информацию от всех типов датчиков одновременно для достижения синергетического результата.
Технологию искусственного интеллекта (ИИ) с вычислительной точки зрения можно разделить на две задачи: машинное обучение (machine learning) и логический вывод (inference). Машинное обучение, как правило, осуществляется мощными тензорными вычислителями. Мировой лидер в этой области – компания NVIDIA – справедливо считает проблему машинного обучения решенной. А вот исполнение обученных нейросетей в оконечных устройствах edge computing (то есть реализация логического вывода, inference) является принципиально новым направлением с огромным потенциальным спросом, поскольку ожидается широкое внедрение технологий ИИ в смартфоны, телекоммуникационное оборудование, бытовые приборы, автомобили, роботы.
Каждый день появляются новые виды нейросетей, число которых сегодня достигает сотен и продолжает расти. СнК RoboDeus способна поддерживать вычисление обученных нейросетей любых типов, при этом может вычислять одновременно десятки различных нейронных сетей.
Хотя микросхема ориентирована в первую очередь на применение в робототехнических системах, ее можно с успехом использовать в различных системах обработки информации (видеосерверы, телеком, вычислительные центры для анализа данных). Цель данной статьи – краткое знакомство с основными возможностями и особенностями новой микросхемы.
Ключевые особенности
Гетерогенная 50-ядерная СнК RoboDeus (1892ВМ248) разработана в дизайн-центре АО НПЦ «ЭЛВИС» и предназначена для широкого круга применений, в том числе для различного рода встраиваемых приложений, робототехнических систем и мультисенсорных серверных систем с искусственным интеллектом (ИИ).
Микросхема изготовлена на фабрике TSMC по проектным нормам 16 нм и содержит 10 млрд транзисторов, размещаемых на кристалле площадью 480 мм2.
Глубокая гетерогенность СнК определяется большим числом используемых в ней программируемых, специализированных и интерфейсных ядер. Микросхема содержит более 90 типов IP‑ядер (процессорных, периферийных и др.), при этом ряд ключевых IP‑ядер является собственной разработкой АО НПЦ «ЭЛВИС».
Специалистами АО НПЦ «ЭЛВИС» разработаны: высокопроизводительный многоядерный DSP‑кластер (Velcore3) на базе мощных процессорных ядер нового поколения Elcore50, процессорные 32-битные ядра (RISCore), запатентованное ядро контроллера многофункционального интерфейса (mfbsp), новое программно-расширяемое навигационное ядро (navicore5) для перспективных навигационных стандартов, контроллер потоков радиосигналов (Radio Stream Controller, RSC), инфраструктурные блоки и компоненты.
Для создания «высших» роботов СнК RoboDeus оснащена всем необходимым функционалом и содержит:
аппаратно-программную реализацию ИИ с машинным обучением (deep learning) на всех ресурсах микросхемы, в том числе в центральном процессоре (CPU), DSP‑кластере (Velcore3) и графическом процессоре (GPU), которые могут работать под управлением нескольких ОС реального времени и выполнять обработку сигналов и изображений с производительностью 16 TFlops (с возможностью обучения и дообучения, полностью программируемого исполнения заранее обученных (inference) нейронных сетей любых типов и топологий, как существующих, так и перспективных);
блоки для создания на базе RoboDeus «умных» видеокамер профессионального уровня для обработки видеопотоков 4К мультиспектральных стереовидеоизображений на базе встроенного многофункционального препроцессора обработки изображений (ISP), а также встроенного ядра аппаратно-программного видеоакселератора кодирования / декодирования видео (HEVC / H.264);
блоки для обработки видеопотоков расширены возможностями ввода сигналов из внешних сенсоров посредством блока Radio Stream Processor, что позволяет использовать RoboDeus в мультисенсорных приложениях;
блоки для обеспечения 12-канальных аудиопотоков;
4-стандартный (ГЛОНАСС / GPS / BeiDou / GALILEO) GNSS‑блок, который может быть перепрограммирован для перспективных стандартов навигационных систем (к примеру, для перспективной системы спутниковой навигации Индии).
Все эти возможности обеспечивают эффективное использование микросхемы в автономных робототехнических комплексах, автомобилестроении (ADAS, беспилотные автомобили), в семантических серверах нового поколения для распознавания видео, речи и текстов, в мультимедийных приложениях.
Состав СнК RoboDeus
СнК RoboDeus содержит шесть процессорных платформ, которые образуют многоядерную гетерогенную MIMD‑архитектуру на базе стандартных процессорных и специализированных ядер (рис. 1):
процессорный когерентный управляющий кластер из восьми ядер MIPS64 (MIPS Technologies) (два кластера I6500 Daimyo по четыре ядра со встроенным аппаратным менеджером когерентности); для каждого из 2-поточных ядер MIPS64r6 имеется арифметический сопроцессор, соответствующий стандарту IEEE 754 gen. 3, и 128-битный SIMD‑сопроцессор (MSA), кэш второго уровня общим объемом 4 Мбайт на кластер и кэш третьего уровня (LLC) общим объемом 16 Мбайт;
ядро CPU MIPS64 (Samurai) сервисного процессора для управления системой;
управляющее ядро навигационной системы (ядро MicroMIPS, MIPS Technologies);
четыре служебных процессорных 32-битных ядра (RISCore) разработки АО НПЦ «ЭЛВИС»;
процессорный кластер Velcore3 на базе 16 процессорных ядер ELcore50, каждое из них обеспечено ядром DSP‑сопроцессора; ядра конфигурируются как четыре когерентных кластера (Quelcore), объединяющих по четыре ядра ELcore50; поддержка форматов данных 8–64 разряда с плавающей и фиксированной точкой (аппаратная поддержка CV, AI, DSP);
четыре когерентных кластера PowerVR Series8XT (Imagination Technologies), которые поддерживают стандарты OpenGL, OpenCL, OpenVG, Vulkan; обеспечивают поддержку режима программируемого вычислителя (pGPU) с API OpenCL.
Внутренний интерконнект микросхемы построен по принципу сети на кристалле (NOC). Сеть поддерживает баланс и гарантированную полосу пропускания потоков данных внутри микросхемы, между внешними интерфейсами и внешними устройствами памяти, содержит встроенную подсистему обеспечения безопасности и виртуализации.
Система ввода-вывода изображений
Микросхема содержит препроцессор для предварительной обработки изображений (ISP), а также набор блоков ввода и обработки мультиспектральных стерео-видеоизображений, особенностями которых являются:
В режиме кодирования поддерживается:
многостандартный кодек форматов H.264 и H.265 (HEVC) с поддержкой всех основных профилей и скоростей кодирования:
1 × 4K UHD (3 840 × 1 080) 60 кадров / с,
2 × 4K UHD (3 840 × 1 080) 30 кадров / с,
16 × 1080p Full HD (1 920 × 1 080) 30 кадров / с;
отдельный блок кодирования в стандартах JPEG и M-JPEG: скорость до 1 Гпиксель / с, разрешение UHD60 кадров / с.
В режиме декодирования поддерживается:
многостандартный декодер форматов H.264 и H.265 (HEVC) с поддержкой всех основных профилей;
для режимов кодера / декодера:
поддержка разрешения – до 8К,
глубина цвета – до 10 бит на канал,
поддержка цветовой субдискретизации 4 : 0 : 0, 4 : 2 : 0, 4 : 2 : 2;
встроенные микроконтроллеры для управления параметрами кодирования и декодирования.
Микросхема содержит многофункциональный контроллер c поддержкой видеовывода через интерфейс HDMI с разрешением 3840 × 2160 p60.
Встроенная система безопасности
Важная особенность СнК – поддержка технологий OTP и eFuse для обеспечения защиты загрузки микросхемы. В состав средств обеспечения аппаратной безопасности входят:
аппаратный доверенный контур;
все ядра собственной разработки в составе доверенного контура;
концепция корня аппаратной безопасности Root Of Trust;
аппаратные фильтры доступа, защита карты памяти;
зашивка ROM c поддержкой проверки целостности загружаемого кода;
доверенная загрузка и настройка микросхемы;
аппаратная изоляция компонентов и разграничение зон;
аппаратный генератор случайных чисел;
хранилище ключевой информации;
крипто DMA;
мониторы температуры и напряжения;
гипервизор безопасности;
ОС / гипервизор обеспечивает защиту хранения и передачи данных.
Для эффективного использования средств аппаратной безопасности микросхема может поставляться совместно с набором встроенного программного обеспечения безопасности, функционирующего на базе KasperskyOS.
KasperskyOS обеспечивает встроенную безопасную операционную среду для выполнения служебных сервисов и сервисов безопасности СнК. При разработке KasperskyOS учтена архитектура СнК и реализован функционал доменов безопасности, гарантирующих соблюдение высоких требований защищенности на уровне аппаратного обеспечения и выполнение российских и зарубежных требований и рекомендаций в области безопасности.
Интерфейсы
В составе СнК RoboDeus имеется мощная 4-портовая система организации доступа к внешней памяти: четыре контроллера DDR3 / DDR4 (72@3200 ECC), обеспечивающие скорость 100 Гбайт / с, и 16 Мбайт кэш третьего уровня (LLC).
Микросхема RoboDeus содержит широкий набор высокоскоростной и низкоскоростной периферии:
● четыре контроллера 4 lane PCI Express 4.0 с возможностью объединения одного контроллера на 16 линий PCIe4;
● два контроллера Ethernet MAC 1 Гбит / с;
● контроллер MAC Ethernet 10 Гбит / с, обеспеченный встроенным блоком физического уровня;
● встроенный сетевой процессор NPU для интерфейсов Ethernet;
● NOR / NAND флеш-контроллер с ECC (ONFI 2.2, 8 / 16 бит, 200 MT / с);
● два контроллера SATA 3.0 (6 Гбит / с);
● два порта USB3.1, обеспеченных встроенными блоками физического уровня;
● 64 линии ввода-вывода GPIO;
● два SD / MMC‑порта (SDHC / SDXC, UHS-I, 104 Мбит / с, один порт с поддержкой eMMC4.5);
● четыре универсальных асинхронных порта (UART) типа 16550А с поддержкой IrDA;
● пять портов I2C‑интерфейса (1 Мбит / с);
● два выделенных порта SPI‑интерфейса;
● выделенный порт I2S‑интерфейса;
● два многофункциональных порта MFBSP (LPORT, SPI, I2S, GPIO) со встроенным контроллером DMA;
● два порта MIPI CSI2 (4 линии, до 1,5 Гбит / с);
● набор интерфейсов для подключения мультиспектральных сенсоров: 2 × CMOS‑порта; 2 × HiSPI‑порта; 2 × LVDS‑порта.
Отладка
Микросхема RoboDeus обладает широкими возможностями по отладке и трассированию исполнения программ:
На уровне кластера Velcore3 имеется встроенный JTAG TAP‑контроллер для отладки кластера и блок трассы программы для кластера и его составных частей.
Программное обеспечение СнК RoboDeus
Успех продукта на рынке во многом определяется удобством и простотой его использования. Программное обеспечение предоставляет простой интерфейс для работы с аппаратной платформой, раскрывая все заложенные в нее возможности.
Общая структура программного обеспечения СнК RoboDeus приведена на рис. 2.
Основные компоненты ПО:
Предоставляемое вместе с микросхемой RoboDeus инструментальное ПО позволяет выполнить полный цикл разработки и отладки. В его состав входит компилятор C / C++ актуальных стандартов для ядер MIPS64r6 и для DSP‑ядер Elcore50. Инструментальные средства могут работать как под ОС Linux, так и ОС Windows, позволяя собирать ПО посредством кросс-компиляции или непосредственно на целевой платформе.
В DSP‑ядрах Elcore50 применен такой же подход к программированию, как и в ядрах общего назначения. Программа пишется на C / C++, может быть оптимизирована на ассемблере или посредством intrinsics. Программа может быть распараллелена через потоки и примитивы синхронизации и позволяет работать на любом из ядер Elcore50 из состава кластера DSP.
Для отладки ПО используется отладчик GDB, подключающийся к целевой платформе через интерфейс gdbserver и обеспечивающий отладку ядер MIPS и Elcore50 в едином контексте. Также возможна отладка на более низком уровне посредством аппаратного отладочного интерфейса EJTAG.
Кроме отладки на целевой платформе, возможна отладка и на имитационной модели, позволяющей эмулировать микросхему.
Графический процессор поддерживает интерфейсы программирования графики OpenGL и Vulkan, а также вычислений в соответствии с OpenCL 2.0 EP, что позволяет задействовать ресурсы графического ядра для вычислений общего назначения.
Все перечисленные возможности доступны под интерфейсом единой интегрированной среды разработки и отладки разработки IDE MCStudio4 (рис. 3), реализованной на основе Eclipse и поддерживающей все процессорные платформы RoboDeus, в том числе многоядерный кластер управляющей платформы (CPU), графическую платформу (GPU) и многоядерный DSP‑кластер Velcore3 на базе ядер Elcore50.
В качестве операционной системы на ядрах общего назначения используется Linux актуальных версий, а на кластере DSP – ОС реального времени. Дистрибутив Linux выполнен на основе buildroot и включает в свой состав драйверы для всех блоков и интерфейсов микросхемы.
Для кластера DSP доступен широкий набор высокопроизводительных оптимизированных библиотек, использующих все возможности процессора прозрачным для пользователя образом. В состав набора оптимизированных библиотек входят:
Для решения задач компьютерного зрения целесообразно использовать подход, который позволяет унифицировать код для любой платформы. К таким стандартам относится OpenVX. Стандарт включает в себя более 40 функций компьютерного зрения, интерфейс их взаимодействия с помощью графового представления и набор объектов памяти.
Стандарт OpenVX позволяет реализовывать функции компьютерного зрения, используя аппаратные ускорители или специализированные процессоры. Большинство функций стандарта представляет из себя элементарные операции над изображениями, такие как логические операции сложения, умножения, вычитания с различными режимами округления и сатурацией. Остальные функции – это сложные ядра, которые могут содержать или использовать некоторые простые функции стандарта. Входные и выходные массивы данных для функций – это либо изображения, либо массивы значений (координаты, структуры с точками интереса).
Помимо классических алгоритмов обработки, все более популярными становятся алгоритмы на основе глубоких нейронных сетей. Глубокие нейронные сети – основной инструмент для решения многих актуальных задач распознавания образов и применений ИИ. Недавние достижения в развитии глубоких сверточных нейронных сетей привели к значительному прогрессу в решении нетривиальных задач машинного обучения, связанных с распознаванием образов на изображениях и распознаванием речи. Во многом такой успех стал возможен благодаря значительному усложнению архитектуры, а именно увеличению количества внутренних слоев, увеличению количества фильтров на сверточных слоях, использованию гибридных архитектур, которые объединяют различные типы слоев сверточных нейронных сетей.
Работу с глубокими нейронными сетями можно разделить на два этапа: обучение и распознавание (рис. 4). Обучением называется процесс автоматического извлечения параметров сети (весов) через сопоставление пар «входные данные – ожидаемый результат». При наличии большой выборки обучающих данных и достаточной глубины сети можно обеспечить выдачу решения с высокой точностью путем извлечения слабых (не явных) признаков. Распознавание (inference, прямой ход) – процесс применения обученной сети к новым входным данным. В процессе распознавания нейронная сеть способна по совокупности слабых признаков выдать решение, которое крайне сложно формально описать набором фиксированных правил.
Для работы с нейронными сетями используется специальный пакет ПО – фреймворк (рис. 5). Популярными зарубежными фреймворками являются TensorFlow с интерфейсом Keras, Caffe, MXNet. Данные инструменты позволяют выполнить обучение нейронной сети на аппаратной платформе. Для поддержки процесса обучения в состав фреймворков входит библиотека поддержки вычислителей (backend), популярными вычислителями являются графические карты и центральные процессоры. Кроме зарубежных фреймворков, имеются также и российские разработки, такие как создаваемая ГосНИИАС система «Платформа ГНС».
После обучения во фреймворке получается модель с фиксированными весами, которую сохраняют (экспортируют) в специальном формате для запуска на целевом устройстве. Популярные форматы для хранения / обмена моделей между фреймворками – ONNX и NNEF. После экспорта модели в промежуточный формат выполняется процесс оптимизации модели под целевой вычислитель, учитывающий особенности платформы: предпочтительный тип хранения данных, размеры и скорости обмена с памятью. Процесс адаптации обученной модели называется развертыванием (DL deployment). Для него используются специальные инструменты – компиляторы нейронных сетей. В результате их работы получается модель, скомпилированная оптимальным образом и готовая к запуску на целевом вычислителе.
Для микросхемы RodoDeus разработано законченное решение, позволяющее с высокой эффективностью исполнить любую обученную нейронную сеть, используя все аппаратные ресурсы микросхемы. Поддерживается широкий набор моделей сверточных нейросетей (рис. 6).
Для демонстрации возможностей микросхемы доступен ряд приложений, например, реализация алгоритма распознавания лиц с использованием нейросетевого детектора на 16 видеопотоках в реальном времени. Данные приложения позволяют как оценить возможности микросхемы для тех или иных областей применения, так и выступить в качестве примеров программирования под данную платформу.
Пользовательская программно-аппаратная платформа RoboDeus
Пользовательская аппаратно-программная платформа для микросхемы RoboDeus состоит из материнской платы и стека программного обеспечения.
Ядро пользовательской платформы – процессор RoboDeus (1892ВМ248), установленный на материнской плате RoboDeus Single Head Board (Robodeus SHB) (рис. 7).
Форм-фактор платы RoboDeus SHB соответствует стандарту mATX, что позволяет использовать ее в широком спектре приложений – от серверного применения для обработки потокового видео, аудио и другой информации до применения в аналитических системах обработки и хранения, а также в высокотехнологичных роботах различного назначения.
Стек программного обеспечения пользовательской аппаратно-программной платформы RoboDeus (рис. 8) адаптирован для решения широкого круга задач. Гибкость и стандартизация решений позволяют применять существующие SDK и различные экосистемы для быстрого запуска ПО.
Применение СнК RoboDeus
СнК RoboDeus адаптирована для применения в робототехнических системах и приложениях. Гетерогенная архитектура СнК на базе семантического DSP‑процессора пятого поколения Elcore50 обеспечивает производительность алгоритмов искусственного интеллекта на основе нейронных сетей на уровне 16 TFlops.
Это дает возможность выполнять сложные задачи в области ИИ, обработки сигналов и изображений, прогнозирования и др. Тензорные и векторные команды DSP‑ядер, аппаратные видеокодеки с одновременной поддержкой 16 видеопотоков FullHD, а также специализированный графический процессор (GPU) предоставляют широкие возможности по машинному обучению.
Применения микросхемы RoboDeus (1892ВМ248) в промышленных и коммерческих целях связаны с серверными решениями для задач высокопроизводительной аналитики данных (High Performance Data Analytics, HPDA) с применением алгоритмов компьютерного зрения и искусственного интеллекта. Хранение и контроль доступа к данным обеспечивается на аппаратном уровне путем подключения большого числа запоминающих устройств.
Для решения задач HPDA разработана линейка однопроцессорных видеосерверов RoboDeus Solo Deep Vision (RoboDeus SDV) в форм-факторе 1U и 2U, предназначенных для применения в системах компьютерного зрения, СКУД‑системах, системах хранения, сбора и анализа информации, а также в мультисенсорном серверном оборудовании с ИИ (рис. 9). Характеристики видеосерверов RoboDeus SDV представлены в табл. 1.
Сервер RoboDeus SDV в форм-факторе 1U предназначен для решения задачи многопоточной обработки видео- и аудиосигналов с использованием алгоритмов машинного обучения с аналитической системой управления комплексированными устройствами и многопоточной технологией архивации данных.
Сервер RoboDeus SDV в форм-факторе 2U предназначен для решения задач хранения, обработки и передачи данных, включая работу с локальными базами данных, локальными файловыми сервисами и обработку медиаданных с использованием алгоритмов машинного обучения.
Управление и обработка информации материнской платы сервера RoboDeus SDV выполняется процессором RoboDeus. Загрузка, контроль и мониторинг осуществляются с использованием технологии IPMI (Intelligent Platform Management Interface, интеллектуальный интерфейс управления платформой), в которой BMC‑устройство (Baseboard Management Controller) разработано на основе собственного доверенного процессора MCom‑02 (1892ВМ14Я). Такое построение серверов обеспечивает надежность и безопасность на этапе их эксплуатации в составе комплексных систем.
Для задач хранения информации на основе линейки серверов RoboDeus SDV предлагается решение на основе сервера в форм-факторе 2U с поддержкой до 24 запоминающих устройств (HDD, SSD).
Для реализации различных конструктивных вариантов устройств разработан процессорный модуль для быстрой интеграции в различные коммерческие системы на модуле (system-on-module). При создании уникальных роботов специального применения процессорный модуль поддерживает подключение значительного количества датчиков (рис. 10).
Стабильная встроенная ОС Linux с набором прикладных библиотек, оптимизированная для продуктов на базе процессора 1892ВМ248, помогает разработчикам быстрее представить свои продукты на рынки устройств автоматизации производства, телекоммуникации, образования, развлечений, потребительских игрушек, умного дома и т. д. Одно из перспективных применений RoboDeus – управление сенсорами и устройствами умного автомобиля (рис. 11).
* * *
Разработанная в российском дизайн-центре АО НПЦ «ЭЛВИС» гетерогенная 50-ядерная СнК RoboDeus (1892ВМ248) и созданная для нее экосистема ПО способны придать импульс развитию интеллектуальных мультисенсорных встраиваемых систем для самого широкого круга применений, прежде всего, для робототехнических систем и видеосерверного оборудования с искусственным интеллектом. ●
для встраиваемых систем и робототехники
Я. Петричкович, д. т. н., Т. Солохина, к. т. н., А. Беляев, д. т. н.,
Д. Кузнецов, Л. Меньшенин, Ф. Путря, к. т. н., А. Функнер, С. Фролова,
В. Гусев, Е. Янакова, д. т. н.
Развитие технологий искусственного интеллекта требует внедрения решений для реализации сложных алгоритмов машинного обучения и высокопроизводительной обработки разнородной информации. Эти задачи наиболее эффективно решать с помощью многоядерных систем на кристалле, способных собирать данные с различных датчиков и исполнять различные типы алгоритмов – от обработки графики и видео до обучения нейросетей. В АО НПЦ «ЭЛВИС» создана 50-ядерная гетерогенная СнК RoboDeus, которая обеспечивает производительность алгоритмов искусственного интеллекта на основе нейронных сетей на уровне 16 TFlops и предназначена для построения интеллектуальных мультисенсорных встраиваемых систем. В статье представлены архитектурные особенности, ключевые характеристики, основные области применения новой СнК.
Перед разработчиком встраиваемой системы всегда возникал вопрос – как оптимальным образом распределить обработку данных в системе? Можно сосредоточить всю вычислительную мощность в центральном процессоре и подключаться к нему с помощью терминальных устройств, а можно наделить эти устройства недюжинной силой и не слишком зависеть от центрального мозга.
За последние 50 лет развитие архитектур вычислительных систем шло поэтапно: от ранних конфигураций типа клиент-сервер до тотального распространения все более мощных персональных компьютеров. В последнее время быстрыми темпами развиваются такие перспективные направления, как центры обработки данных и облачные вычисления.
Множество задач эффективнее решать в оконечных устройствах, вне крупных вычислительных систем. Такой тип обработки данных называется граничными вычислениями (edge computing). Пример такого подхода – смартфон, в котором сосредоточены огромные возможности по обработке данных: универсальные вычисления для приложений, графика, навигация, цифровые модемы, обработка изображений и даже вычисление нейросетей. В таких системах, как управление беспилотным автомобилем или робототехническим комплексом, также требуются все возможности по обработке данных смартфона, но, кроме того, в них нужно реализовать управление в режиме жесткого реального времени.
Реализация этих задач требует создания интегральных схем, способных быстро обрабатывать огромные массивы информации и оснащенных широкими коммуникационными возможностями. Многоядерные системы на кристалле (СнК) с гетерогенной архитектурой полностью отвечают этим требованиям.
Разработанная в АО НПЦ «ЭЛВИС» 50-ядерная СнК RoboDeus (1892ВМ248) позволяет собирать в одном чипе и обрабатывать информацию от всех типов датчиков (оптика, радары, лидары, тепловизоры, навигационные системы, датчики звука, битовые сенсоры и т. д.). Микросхема позволяет эффективно реализовать практически любой тип алгоритма (управление, графика, обработка сигналов, связь, решение навигационных задач, обработка и распознавание изображений и видео, распознавание звука и вычисление любых типов нейросетей). При этом можно решать все эти задачи в концепции fusion sensors, то есть обрабатывать информацию от всех типов датчиков одновременно для достижения синергетического результата.
Технологию искусственного интеллекта (ИИ) с вычислительной точки зрения можно разделить на две задачи: машинное обучение (machine learning) и логический вывод (inference). Машинное обучение, как правило, осуществляется мощными тензорными вычислителями. Мировой лидер в этой области – компания NVIDIA – справедливо считает проблему машинного обучения решенной. А вот исполнение обученных нейросетей в оконечных устройствах edge computing (то есть реализация логического вывода, inference) является принципиально новым направлением с огромным потенциальным спросом, поскольку ожидается широкое внедрение технологий ИИ в смартфоны, телекоммуникационное оборудование, бытовые приборы, автомобили, роботы.
Каждый день появляются новые виды нейросетей, число которых сегодня достигает сотен и продолжает расти. СнК RoboDeus способна поддерживать вычисление обученных нейросетей любых типов, при этом может вычислять одновременно десятки различных нейронных сетей.
Хотя микросхема ориентирована в первую очередь на применение в робототехнических системах, ее можно с успехом использовать в различных системах обработки информации (видеосерверы, телеком, вычислительные центры для анализа данных). Цель данной статьи – краткое знакомство с основными возможностями и особенностями новой микросхемы.
Ключевые особенности
Гетерогенная 50-ядерная СнК RoboDeus (1892ВМ248) разработана в дизайн-центре АО НПЦ «ЭЛВИС» и предназначена для широкого круга применений, в том числе для различного рода встраиваемых приложений, робототехнических систем и мультисенсорных серверных систем с искусственным интеллектом (ИИ).
Микросхема изготовлена на фабрике TSMC по проектным нормам 16 нм и содержит 10 млрд транзисторов, размещаемых на кристалле площадью 480 мм2.
Глубокая гетерогенность СнК определяется большим числом используемых в ней программируемых, специализированных и интерфейсных ядер. Микросхема содержит более 90 типов IP‑ядер (процессорных, периферийных и др.), при этом ряд ключевых IP‑ядер является собственной разработкой АО НПЦ «ЭЛВИС».
Специалистами АО НПЦ «ЭЛВИС» разработаны: высокопроизводительный многоядерный DSP‑кластер (Velcore3) на базе мощных процессорных ядер нового поколения Elcore50, процессорные 32-битные ядра (RISCore), запатентованное ядро контроллера многофункционального интерфейса (mfbsp), новое программно-расширяемое навигационное ядро (navicore5) для перспективных навигационных стандартов, контроллер потоков радиосигналов (Radio Stream Controller, RSC), инфраструктурные блоки и компоненты.
Для создания «высших» роботов СнК RoboDeus оснащена всем необходимым функционалом и содержит:
аппаратно-программную реализацию ИИ с машинным обучением (deep learning) на всех ресурсах микросхемы, в том числе в центральном процессоре (CPU), DSP‑кластере (Velcore3) и графическом процессоре (GPU), которые могут работать под управлением нескольких ОС реального времени и выполнять обработку сигналов и изображений с производительностью 16 TFlops (с возможностью обучения и дообучения, полностью программируемого исполнения заранее обученных (inference) нейронных сетей любых типов и топологий, как существующих, так и перспективных);
блоки для создания на базе RoboDeus «умных» видеокамер профессионального уровня для обработки видеопотоков 4К мультиспектральных стереовидеоизображений на базе встроенного многофункционального препроцессора обработки изображений (ISP), а также встроенного ядра аппаратно-программного видеоакселератора кодирования / декодирования видео (HEVC / H.264);
блоки для обработки видеопотоков расширены возможностями ввода сигналов из внешних сенсоров посредством блока Radio Stream Processor, что позволяет использовать RoboDeus в мультисенсорных приложениях;
блоки для обеспечения 12-канальных аудиопотоков;
4-стандартный (ГЛОНАСС / GPS / BeiDou / GALILEO) GNSS‑блок, который может быть перепрограммирован для перспективных стандартов навигационных систем (к примеру, для перспективной системы спутниковой навигации Индии).
Все эти возможности обеспечивают эффективное использование микросхемы в автономных робототехнических комплексах, автомобилестроении (ADAS, беспилотные автомобили), в семантических серверах нового поколения для распознавания видео, речи и текстов, в мультимедийных приложениях.
Состав СнК RoboDeus
СнК RoboDeus содержит шесть процессорных платформ, которые образуют многоядерную гетерогенную MIMD‑архитектуру на базе стандартных процессорных и специализированных ядер (рис. 1):
процессорный когерентный управляющий кластер из восьми ядер MIPS64 (MIPS Technologies) (два кластера I6500 Daimyo по четыре ядра со встроенным аппаратным менеджером когерентности); для каждого из 2-поточных ядер MIPS64r6 имеется арифметический сопроцессор, соответствующий стандарту IEEE 754 gen. 3, и 128-битный SIMD‑сопроцессор (MSA), кэш второго уровня общим объемом 4 Мбайт на кластер и кэш третьего уровня (LLC) общим объемом 16 Мбайт;
ядро CPU MIPS64 (Samurai) сервисного процессора для управления системой;
управляющее ядро навигационной системы (ядро MicroMIPS, MIPS Technologies);
четыре служебных процессорных 32-битных ядра (RISCore) разработки АО НПЦ «ЭЛВИС»;
процессорный кластер Velcore3 на базе 16 процессорных ядер ELcore50, каждое из них обеспечено ядром DSP‑сопроцессора; ядра конфигурируются как четыре когерентных кластера (Quelcore), объединяющих по четыре ядра ELcore50; поддержка форматов данных 8–64 разряда с плавающей и фиксированной точкой (аппаратная поддержка CV, AI, DSP);
четыре когерентных кластера PowerVR Series8XT (Imagination Technologies), которые поддерживают стандарты OpenGL, OpenCL, OpenVG, Vulkan; обеспечивают поддержку режима программируемого вычислителя (pGPU) с API OpenCL.
Внутренний интерконнект микросхемы построен по принципу сети на кристалле (NOC). Сеть поддерживает баланс и гарантированную полосу пропускания потоков данных внутри микросхемы, между внешними интерфейсами и внешними устройствами памяти, содержит встроенную подсистему обеспечения безопасности и виртуализации.
Система ввода-вывода изображений
Микросхема содержит препроцессор для предварительной обработки изображений (ISP), а также набор блоков ввода и обработки мультиспектральных стерео-видеоизображений, особенностями которых являются:
- встроенный многофункциональный препроцессор обработки изображений (ISP), HDR / WDR, AAA;
- встроенное ядро аппаратно-программного видеоакселератора кодирования-декодирования видео;
- максимальное разрешение изображений – до 32 мегапикселей.
В режиме кодирования поддерживается:
многостандартный кодек форматов H.264 и H.265 (HEVC) с поддержкой всех основных профилей и скоростей кодирования:
1 × 4K UHD (3 840 × 1 080) 60 кадров / с,
2 × 4K UHD (3 840 × 1 080) 30 кадров / с,
16 × 1080p Full HD (1 920 × 1 080) 30 кадров / с;
отдельный блок кодирования в стандартах JPEG и M-JPEG: скорость до 1 Гпиксель / с, разрешение UHD60 кадров / с.
В режиме декодирования поддерживается:
многостандартный декодер форматов H.264 и H.265 (HEVC) с поддержкой всех основных профилей;
для режимов кодера / декодера:
поддержка разрешения – до 8К,
глубина цвета – до 10 бит на канал,
поддержка цветовой субдискретизации 4 : 0 : 0, 4 : 2 : 0, 4 : 2 : 2;
встроенные микроконтроллеры для управления параметрами кодирования и декодирования.
Микросхема содержит многофункциональный контроллер c поддержкой видеовывода через интерфейс HDMI с разрешением 3840 × 2160 p60.
Встроенная система безопасности
Важная особенность СнК – поддержка технологий OTP и eFuse для обеспечения защиты загрузки микросхемы. В состав средств обеспечения аппаратной безопасности входят:
аппаратный доверенный контур;
все ядра собственной разработки в составе доверенного контура;
концепция корня аппаратной безопасности Root Of Trust;
аппаратные фильтры доступа, защита карты памяти;
зашивка ROM c поддержкой проверки целостности загружаемого кода;
доверенная загрузка и настройка микросхемы;
аппаратная изоляция компонентов и разграничение зон;
аппаратный генератор случайных чисел;
хранилище ключевой информации;
крипто DMA;
мониторы температуры и напряжения;
гипервизор безопасности;
ОС / гипервизор обеспечивает защиту хранения и передачи данных.
Для эффективного использования средств аппаратной безопасности микросхема может поставляться совместно с набором встроенного программного обеспечения безопасности, функционирующего на базе KasperskyOS.
KasperskyOS обеспечивает встроенную безопасную операционную среду для выполнения служебных сервисов и сервисов безопасности СнК. При разработке KasperskyOS учтена архитектура СнК и реализован функционал доменов безопасности, гарантирующих соблюдение высоких требований защищенности на уровне аппаратного обеспечения и выполнение российских и зарубежных требований и рекомендаций в области безопасности.
Интерфейсы
В составе СнК RoboDeus имеется мощная 4-портовая система организации доступа к внешней памяти: четыре контроллера DDR3 / DDR4 (72@3200 ECC), обеспечивающие скорость 100 Гбайт / с, и 16 Мбайт кэш третьего уровня (LLC).
Микросхема RoboDeus содержит широкий набор высокоскоростной и низкоскоростной периферии:
● четыре контроллера 4 lane PCI Express 4.0 с возможностью объединения одного контроллера на 16 линий PCIe4;
● два контроллера Ethernet MAC 1 Гбит / с;
● контроллер MAC Ethernet 10 Гбит / с, обеспеченный встроенным блоком физического уровня;
● встроенный сетевой процессор NPU для интерфейсов Ethernet;
● NOR / NAND флеш-контроллер с ECC (ONFI 2.2, 8 / 16 бит, 200 MT / с);
● два контроллера SATA 3.0 (6 Гбит / с);
● два порта USB3.1, обеспеченных встроенными блоками физического уровня;
● 64 линии ввода-вывода GPIO;
● два SD / MMC‑порта (SDHC / SDXC, UHS-I, 104 Мбит / с, один порт с поддержкой eMMC4.5);
● четыре универсальных асинхронных порта (UART) типа 16550А с поддержкой IrDA;
● пять портов I2C‑интерфейса (1 Мбит / с);
● два выделенных порта SPI‑интерфейса;
● выделенный порт I2S‑интерфейса;
● два многофункциональных порта MFBSP (LPORT, SPI, I2S, GPIO) со встроенным контроллером DMA;
● два порта MIPI CSI2 (4 линии, до 1,5 Гбит / с);
● набор интерфейсов для подключения мультиспектральных сенсоров: 2 × CMOS‑порта; 2 × HiSPI‑порта; 2 × LVDS‑порта.
Отладка
Микросхема RoboDeus обладает широкими возможностями по отладке и трассированию исполнения программ:
- обеспечена архитектура отладки и трассирования MIPS EJTAG;
- отладка по стандарту IEEE 1149.1 (JTAG);
- порт отладки c доступом к внутренней памяти микросхемы;
- подсистема сбора программной трассы от Samurai и Velcore3 в реальном времени;
- вывод трассы через внешний порт.
На уровне кластера Velcore3 имеется встроенный JTAG TAP‑контроллер для отладки кластера и блок трассы программы для кластера и его составных частей.
Программное обеспечение СнК RoboDeus
Успех продукта на рынке во многом определяется удобством и простотой его использования. Программное обеспечение предоставляет простой интерфейс для работы с аппаратной платформой, раскрывая все заложенные в нее возможности.
Общая структура программного обеспечения СнК RoboDeus приведена на рис. 2.
Основные компоненты ПО:
- инструментальное ПО;
- интегрированная среда разработки;
- операционные системы с пакетом поддержки процессора;
- оптимизированные библиотеки;
- примеры программирования.
Предоставляемое вместе с микросхемой RoboDeus инструментальное ПО позволяет выполнить полный цикл разработки и отладки. В его состав входит компилятор C / C++ актуальных стандартов для ядер MIPS64r6 и для DSP‑ядер Elcore50. Инструментальные средства могут работать как под ОС Linux, так и ОС Windows, позволяя собирать ПО посредством кросс-компиляции или непосредственно на целевой платформе.
В DSP‑ядрах Elcore50 применен такой же подход к программированию, как и в ядрах общего назначения. Программа пишется на C / C++, может быть оптимизирована на ассемблере или посредством intrinsics. Программа может быть распараллелена через потоки и примитивы синхронизации и позволяет работать на любом из ядер Elcore50 из состава кластера DSP.
Для отладки ПО используется отладчик GDB, подключающийся к целевой платформе через интерфейс gdbserver и обеспечивающий отладку ядер MIPS и Elcore50 в едином контексте. Также возможна отладка на более низком уровне посредством аппаратного отладочного интерфейса EJTAG.
Кроме отладки на целевой платформе, возможна отладка и на имитационной модели, позволяющей эмулировать микросхему.
Графический процессор поддерживает интерфейсы программирования графики OpenGL и Vulkan, а также вычислений в соответствии с OpenCL 2.0 EP, что позволяет задействовать ресурсы графического ядра для вычислений общего назначения.
Все перечисленные возможности доступны под интерфейсом единой интегрированной среды разработки и отладки разработки IDE MCStudio4 (рис. 3), реализованной на основе Eclipse и поддерживающей все процессорные платформы RoboDeus, в том числе многоядерный кластер управляющей платформы (CPU), графическую платформу (GPU) и многоядерный DSP‑кластер Velcore3 на базе ядер Elcore50.
В качестве операционной системы на ядрах общего назначения используется Linux актуальных версий, а на кластере DSP – ОС реального времени. Дистрибутив Linux выполнен на основе buildroot и включает в свой состав драйверы для всех блоков и интерфейсов микросхемы.
Для кластера DSP доступен широкий набор высокопроизводительных оптимизированных библиотек, использующих все возможности процессора прозрачным для пользователя образом. В состав набора оптимизированных библиотек входят:
- высокопроизводительные математические библиотеки: BLAS, LAPACK, GSL;
- библиотеки цифровой обработки сигналов;
- библиотеки обработки изображений, совместимые с OpenVX;
- библиотеки поддержки нейросетей;
- библиотеки криптографических примитивов.
Для решения задач компьютерного зрения целесообразно использовать подход, который позволяет унифицировать код для любой платформы. К таким стандартам относится OpenVX. Стандарт включает в себя более 40 функций компьютерного зрения, интерфейс их взаимодействия с помощью графового представления и набор объектов памяти.
Стандарт OpenVX позволяет реализовывать функции компьютерного зрения, используя аппаратные ускорители или специализированные процессоры. Большинство функций стандарта представляет из себя элементарные операции над изображениями, такие как логические операции сложения, умножения, вычитания с различными режимами округления и сатурацией. Остальные функции – это сложные ядра, которые могут содержать или использовать некоторые простые функции стандарта. Входные и выходные массивы данных для функций – это либо изображения, либо массивы значений (координаты, структуры с точками интереса).
Помимо классических алгоритмов обработки, все более популярными становятся алгоритмы на основе глубоких нейронных сетей. Глубокие нейронные сети – основной инструмент для решения многих актуальных задач распознавания образов и применений ИИ. Недавние достижения в развитии глубоких сверточных нейронных сетей привели к значительному прогрессу в решении нетривиальных задач машинного обучения, связанных с распознаванием образов на изображениях и распознаванием речи. Во многом такой успех стал возможен благодаря значительному усложнению архитектуры, а именно увеличению количества внутренних слоев, увеличению количества фильтров на сверточных слоях, использованию гибридных архитектур, которые объединяют различные типы слоев сверточных нейронных сетей.
Работу с глубокими нейронными сетями можно разделить на два этапа: обучение и распознавание (рис. 4). Обучением называется процесс автоматического извлечения параметров сети (весов) через сопоставление пар «входные данные – ожидаемый результат». При наличии большой выборки обучающих данных и достаточной глубины сети можно обеспечить выдачу решения с высокой точностью путем извлечения слабых (не явных) признаков. Распознавание (inference, прямой ход) – процесс применения обученной сети к новым входным данным. В процессе распознавания нейронная сеть способна по совокупности слабых признаков выдать решение, которое крайне сложно формально описать набором фиксированных правил.
Для работы с нейронными сетями используется специальный пакет ПО – фреймворк (рис. 5). Популярными зарубежными фреймворками являются TensorFlow с интерфейсом Keras, Caffe, MXNet. Данные инструменты позволяют выполнить обучение нейронной сети на аппаратной платформе. Для поддержки процесса обучения в состав фреймворков входит библиотека поддержки вычислителей (backend), популярными вычислителями являются графические карты и центральные процессоры. Кроме зарубежных фреймворков, имеются также и российские разработки, такие как создаваемая ГосНИИАС система «Платформа ГНС».
После обучения во фреймворке получается модель с фиксированными весами, которую сохраняют (экспортируют) в специальном формате для запуска на целевом устройстве. Популярные форматы для хранения / обмена моделей между фреймворками – ONNX и NNEF. После экспорта модели в промежуточный формат выполняется процесс оптимизации модели под целевой вычислитель, учитывающий особенности платформы: предпочтительный тип хранения данных, размеры и скорости обмена с памятью. Процесс адаптации обученной модели называется развертыванием (DL deployment). Для него используются специальные инструменты – компиляторы нейронных сетей. В результате их работы получается модель, скомпилированная оптимальным образом и готовая к запуску на целевом вычислителе.
Для микросхемы RodoDeus разработано законченное решение, позволяющее с высокой эффективностью исполнить любую обученную нейронную сеть, используя все аппаратные ресурсы микросхемы. Поддерживается широкий набор моделей сверточных нейросетей (рис. 6).
Для демонстрации возможностей микросхемы доступен ряд приложений, например, реализация алгоритма распознавания лиц с использованием нейросетевого детектора на 16 видеопотоках в реальном времени. Данные приложения позволяют как оценить возможности микросхемы для тех или иных областей применения, так и выступить в качестве примеров программирования под данную платформу.
Пользовательская программно-аппаратная платформа RoboDeus
Пользовательская аппаратно-программная платформа для микросхемы RoboDeus состоит из материнской платы и стека программного обеспечения.
Ядро пользовательской платформы – процессор RoboDeus (1892ВМ248), установленный на материнской плате RoboDeus Single Head Board (Robodeus SHB) (рис. 7).
Форм-фактор платы RoboDeus SHB соответствует стандарту mATX, что позволяет использовать ее в широком спектре приложений – от серверного применения для обработки потокового видео, аудио и другой информации до применения в аналитических системах обработки и хранения, а также в высокотехнологичных роботах различного назначения.
Стек программного обеспечения пользовательской аппаратно-программной платформы RoboDeus (рис. 8) адаптирован для решения широкого круга задач. Гибкость и стандартизация решений позволяют применять существующие SDK и различные экосистемы для быстрого запуска ПО.
Применение СнК RoboDeus
СнК RoboDeus адаптирована для применения в робототехнических системах и приложениях. Гетерогенная архитектура СнК на базе семантического DSP‑процессора пятого поколения Elcore50 обеспечивает производительность алгоритмов искусственного интеллекта на основе нейронных сетей на уровне 16 TFlops.
Это дает возможность выполнять сложные задачи в области ИИ, обработки сигналов и изображений, прогнозирования и др. Тензорные и векторные команды DSP‑ядер, аппаратные видеокодеки с одновременной поддержкой 16 видеопотоков FullHD, а также специализированный графический процессор (GPU) предоставляют широкие возможности по машинному обучению.
Применения микросхемы RoboDeus (1892ВМ248) в промышленных и коммерческих целях связаны с серверными решениями для задач высокопроизводительной аналитики данных (High Performance Data Analytics, HPDA) с применением алгоритмов компьютерного зрения и искусственного интеллекта. Хранение и контроль доступа к данным обеспечивается на аппаратном уровне путем подключения большого числа запоминающих устройств.
Для решения задач HPDA разработана линейка однопроцессорных видеосерверов RoboDeus Solo Deep Vision (RoboDeus SDV) в форм-факторе 1U и 2U, предназначенных для применения в системах компьютерного зрения, СКУД‑системах, системах хранения, сбора и анализа информации, а также в мультисенсорном серверном оборудовании с ИИ (рис. 9). Характеристики видеосерверов RoboDeus SDV представлены в табл. 1.
Сервер RoboDeus SDV в форм-факторе 1U предназначен для решения задачи многопоточной обработки видео- и аудиосигналов с использованием алгоритмов машинного обучения с аналитической системой управления комплексированными устройствами и многопоточной технологией архивации данных.
Сервер RoboDeus SDV в форм-факторе 2U предназначен для решения задач хранения, обработки и передачи данных, включая работу с локальными базами данных, локальными файловыми сервисами и обработку медиаданных с использованием алгоритмов машинного обучения.
Управление и обработка информации материнской платы сервера RoboDeus SDV выполняется процессором RoboDeus. Загрузка, контроль и мониторинг осуществляются с использованием технологии IPMI (Intelligent Platform Management Interface, интеллектуальный интерфейс управления платформой), в которой BMC‑устройство (Baseboard Management Controller) разработано на основе собственного доверенного процессора MCom‑02 (1892ВМ14Я). Такое построение серверов обеспечивает надежность и безопасность на этапе их эксплуатации в составе комплексных систем.
Для задач хранения информации на основе линейки серверов RoboDeus SDV предлагается решение на основе сервера в форм-факторе 2U с поддержкой до 24 запоминающих устройств (HDD, SSD).
Для реализации различных конструктивных вариантов устройств разработан процессорный модуль для быстрой интеграции в различные коммерческие системы на модуле (system-on-module). При создании уникальных роботов специального применения процессорный модуль поддерживает подключение значительного количества датчиков (рис. 10).
Стабильная встроенная ОС Linux с набором прикладных библиотек, оптимизированная для продуктов на базе процессора 1892ВМ248, помогает разработчикам быстрее представить свои продукты на рынки устройств автоматизации производства, телекоммуникации, образования, развлечений, потребительских игрушек, умного дома и т. д. Одно из перспективных применений RoboDeus – управление сенсорами и устройствами умного автомобиля (рис. 11).
* * *
Разработанная в российском дизайн-центре АО НПЦ «ЭЛВИС» гетерогенная 50-ядерная СнК RoboDeus (1892ВМ248) и созданная для нее экосистема ПО способны придать импульс развитию интеллектуальных мультисенсорных встраиваемых систем для самого широкого круга применений, прежде всего, для робототехнических систем и видеосерверного оборудования с искусственным интеллектом. ●
Отзывы читателей