DOI: 10.22184/1992-4178.2021.207.6.18.20
Нейропроцессоры помогают диагностировать коронавирус
Рассказывает заместитель генерального директора по развитию НТЦ «Модуль» А. Э. Мохнаткин
Научно-технический центр «Модуль» остается практически единственной компанией на российском рынке, предлагающей собственные аппаратно-программные решения для систем искусственного интеллекта. Нейропроцессоры с оригинальной архитектурой NeuroMatrix, вычислительные модули и комплекты программных средств для реализации глубоких нейронных сетей, созданные компанией, предназначены для широкого спектра применений – от авиационно-космических систем до медицинских и мультимедийных приложений. На Международном промышленном форуме «Интеллект машин и механизмов», который прошел с 30 мая по 1 июня 2021 года в Севастополе, НТЦ «Модуль» представил свои последние разработки. Об аппаратных решениях, реализованных на базе нейропроцессора NeuroMatrix последнего поколения, и перспективном нейросетевом программно-аппаратном комплексе для диагностирования вирусной пневмонии нам рассказал заместитель генерального директора по развитию НТЦ «Модуль» Алексей Эдуардович Мохнаткин.
Алексей Эдуардович, расскажите, пожалуйста, о нейропроцессорах НТЦ «Модуль» последнего поколения, которые вы представили на форуме.
На сегодняшний день это уже восьмое поколение процессора. Он представляет собой многоядерную кластерную систему-на-кристалле, в состав которой входит 16 процессорных ядер на фирменной архитектуре NeuroMatrix для задач искусственного интеллекта, пять ядер ARM Cortex-A5, которые выполняют функции управления и перераспределения потоков между ядрами NeuroMatrix. Эта система способна гораздо лучше, по сравнению с графическими ускорителями известных мировых производителей, справляться с задачами в области искусственного интеллекта (ИИ), хотя и обладает всеми возможностями для выполнения заданий на базе векторно-матричных вычислений в более широком спектре применений.
Это аппаратная платформа универсальна? На ней можно решать любые задачи ИИ?
Если мы говорим про глубокие сверточные нейронные сети, то практически любые. Мы разработали собственный конвертор сетей, который позволяет быстро портировать нейронные сети, созданные и обученные нашими партнерами, на архитектуру нашего процессора. Существует уже достаточно большая номенклатура архитектур нейронных сетей, портированных на наш процессор, что позволяет реализовывать большинство существующих сегодня задач на отечественной аппаратной платформе и создавать доверенные программно-аппаратные комплексы.
Как обстоят дела со средствами разработки для ваших процессоров?
К сожалению, сегодня это больное место российской экосистемы искусственного интеллекта, но, тем не менее, работы в этой области ведутся. Мы сотрудничаем с такими разработчиками средств глубокого обучения, как ФГУП «ГосНИИАС» и «Нейросети Ашманова». По сути все наши разработки интегрированы в единую нейроплатформу.
Следует сказать, что мировые вендоры создают собственные средства разработки. При этом стоимость их слишком высока. Например, стоимость разработки чипа на базе интегрированной среды компании NVIDIA составляет порядка 2 млрд долл. Это инвестиции, сравнимые с объемом финансирования всей российской микроэлектроники на несколько лет. Тем не менее, создавать собственные средства разработки принципиально важно, потому что именно эти средства определяют те самые ключевые 5–7, а то и 10% эффективности работы нейронных сетей, которые отличают хороший продукт от лучшего на рынке.
Какие решения на базе нейропроцессора NeuroMatrix вы предлагаете?
Мы не останавливаемся на разработке чипа, а создаем в партнерстве с широким кругом предприятий России законченные решения, которые предлагаем конечному заказчику. Кроме процессора мы выпускаем целую номенклатуру встраиваемых модулей, начиная от компактного решения в форм-факторе USB-флешки до серверных решений. Простые USB-модули можно подключать к любому компьютеру и использовать как устройства, ускоряющие работу несложных нейронных сетей и обработку изображений. Для более сложных задач предназначены встраиваемые модули, подключаемые к высокоскоростной шине PCIe. Эти устройства выпускаются серийно и пользуются высоким спросом. Есть более мощное серверное решение, в котором установлено несколько ускорителей. Они предназначены для вычислений сложных нейронных сетей, параллельно обработки нескольких видеопотоков и изображений высокого разрешения.
Как показала практика, сегодня конечный заказчик покупает не продукты, а сервисы.
Поэтому сегодня мы переходим на следующий этап – развиваем кооперацию с разработчиками программного обеспечения и предлагаем комплексные аппаратно-программные продукты. Хороший пример такого сотрудничества – разработка программно-аппаратного комплекса совместно с АО «МЦСТ», разработчиком операционной системы и производителем центральных процессоров с архитектурой «Эльбрус». Рабочее место, построенное на базе материнской платы для процессоров «Эльбрус» и нашего нейроускорителя, позволяет распознавать в режиме реального времени различные объекты и их характеристики.
Одно из перспективных направлений деятельности НТЦ «Модуль» – медицинские системы искусственного интеллекта. На форуме мы представили автоматизированное рабочее место (АРМ) врача-диагноста. ПО для этой системы было разработано нашей компанией в сотрудничестве с ведущими медицинскими учреждениями, в частности Государственным медицинским центром им. А. И. Бурназяна. АРМ позволяет врачу распознать COVID‑19 на основе КТ-снимков с вероятностью до 97%. Это существенно повышает эффективность диагностирования и снижает количество ошибок до минимума.
Как много времени потребовалось для обучения этой системы, ведь мы столкнулись с совершенно новым вирусом?
Если говорить честно и объективно, то 30 лет. Именно столько времени компания занимается векторно-матричными вычислениями, это тот путь, который позволил нам создать полностью российский продукт. Срок обучения конкретной нейронной сети зависит от объема так называемых датасетов (data set – набор данных). Чем больше количество снимков, чем более качественно они размечены, тем лучше результат. Важно обеспечить качество предварительной подготовки материалов. Именно в этом состоит основная задача, стоящая перед специалистами в области медицины, да и в целом, в сфере искусственного интеллекта. От доверенности и надежности исходных данных зависит минимизация количества ошибочных решений.
Если говорить конкретно об этом продукте, то как быстро он заработал?
Мы разрабатывали параллельно программно-аппаратный комплекс, программное обеспечение и интерфейс, поэтому суммарно до получения конечного продукта, который мы смогли показать врачам и специалистам, ушло восемь месяцев. Практика показывает, что серийное внедрение нового продукта начинается только с третьего поколения. Потому что после выхода первого поколения продукта разработчик получает обратную связь от пользователей, связанную, как правило, с замечаниями и предложениями. Второе поколение – это этап улучшения характеристик, удобства использования и т. д. А третье поколение выходит на массовое производство и завоевывает свое место на рынке. Мы находимся на этапе представления первых образцов. Врачи протестировали систему и сказали, что с ней можно работать. Сейчас мы передали ее в медицинские учреждения на апробацию, она работает с реальными снимками, с реальными пациентами и мы получаем обратную связь.
Насколько быстро эта система сможет переключиться на работу с новым вирусом или новым штаммом?
С точки зрения аппаратного обеспечения или пользовательского интерфейса все готово. Задержка может быть связана с датасетами, потому что, например, в первой волне пандемии проблема была в том, что врачи не могли идентифицировать вирус, они не понимали, как отличить коронавирус от пневмонии. И только накопление опыта и данных позволило это сделать. Сейчас знаний об этом вирусе значительно больше, и я думаю, что врачебное сообщество будет реагировать гораздо быстрее. Все зависит в данном случае от медиков. Именно поэтому важно уже сейчас начинать обеспечивать медицинские учреждения такими системами, на которые всегда можно загрузить актуальное ПО и быстро развернуть работу.
Видится ли в перспективе возможность для подобных систем определять какое-либо заболевание на основе полной базы данных, накопленной в мире, например, по КТ-снимку?
На самом деле мы уже максимально близки к этому. Вопрос в том, можно ли будет интегрировать медицинские показатели и истории болезни, накопленные в мире различными системами, и точно определить, к каким данным нужно обратиться, чтобы система смогла правильно выстроить алгоритм и подсказать врачу, что конкретно нужно делать. В любом случае сегодня мы говорим, что это система помощи в принятии медицинских решений, она не заменяет врача, а берет на себя часть рутинной работы. Что касается более интегрированного подхода, то нужно создать систему глубокого искусственного интеллекта, которая работает с сотнями и тысячами разных нейронных сетей, с сотнями и тысячами источников информации и на основе этого дает рекомендации врачу по действию относительно конкретного пациента. Не уверен, что такие системы появятся в ближайшие 5–7 лет, тем не менее сообщество специалистов активно обсуждает подобные перспективы.
Спасибо за интересный рассказ.
С А. Э. Мохнаткиным беседовал Ю. С. Ковалевский.
Материал подготовлен В. Б. Ежовым
Рассказывает заместитель генерального директора по развитию НТЦ «Модуль» А. Э. Мохнаткин
Научно-технический центр «Модуль» остается практически единственной компанией на российском рынке, предлагающей собственные аппаратно-программные решения для систем искусственного интеллекта. Нейропроцессоры с оригинальной архитектурой NeuroMatrix, вычислительные модули и комплекты программных средств для реализации глубоких нейронных сетей, созданные компанией, предназначены для широкого спектра применений – от авиационно-космических систем до медицинских и мультимедийных приложений. На Международном промышленном форуме «Интеллект машин и механизмов», который прошел с 30 мая по 1 июня 2021 года в Севастополе, НТЦ «Модуль» представил свои последние разработки. Об аппаратных решениях, реализованных на базе нейропроцессора NeuroMatrix последнего поколения, и перспективном нейросетевом программно-аппаратном комплексе для диагностирования вирусной пневмонии нам рассказал заместитель генерального директора по развитию НТЦ «Модуль» Алексей Эдуардович Мохнаткин.
Алексей Эдуардович, расскажите, пожалуйста, о нейропроцессорах НТЦ «Модуль» последнего поколения, которые вы представили на форуме.
На сегодняшний день это уже восьмое поколение процессора. Он представляет собой многоядерную кластерную систему-на-кристалле, в состав которой входит 16 процессорных ядер на фирменной архитектуре NeuroMatrix для задач искусственного интеллекта, пять ядер ARM Cortex-A5, которые выполняют функции управления и перераспределения потоков между ядрами NeuroMatrix. Эта система способна гораздо лучше, по сравнению с графическими ускорителями известных мировых производителей, справляться с задачами в области искусственного интеллекта (ИИ), хотя и обладает всеми возможностями для выполнения заданий на базе векторно-матричных вычислений в более широком спектре применений.
Это аппаратная платформа универсальна? На ней можно решать любые задачи ИИ?
Если мы говорим про глубокие сверточные нейронные сети, то практически любые. Мы разработали собственный конвертор сетей, который позволяет быстро портировать нейронные сети, созданные и обученные нашими партнерами, на архитектуру нашего процессора. Существует уже достаточно большая номенклатура архитектур нейронных сетей, портированных на наш процессор, что позволяет реализовывать большинство существующих сегодня задач на отечественной аппаратной платформе и создавать доверенные программно-аппаратные комплексы.
Как обстоят дела со средствами разработки для ваших процессоров?
К сожалению, сегодня это больное место российской экосистемы искусственного интеллекта, но, тем не менее, работы в этой области ведутся. Мы сотрудничаем с такими разработчиками средств глубокого обучения, как ФГУП «ГосНИИАС» и «Нейросети Ашманова». По сути все наши разработки интегрированы в единую нейроплатформу.
Следует сказать, что мировые вендоры создают собственные средства разработки. При этом стоимость их слишком высока. Например, стоимость разработки чипа на базе интегрированной среды компании NVIDIA составляет порядка 2 млрд долл. Это инвестиции, сравнимые с объемом финансирования всей российской микроэлектроники на несколько лет. Тем не менее, создавать собственные средства разработки принципиально важно, потому что именно эти средства определяют те самые ключевые 5–7, а то и 10% эффективности работы нейронных сетей, которые отличают хороший продукт от лучшего на рынке.
Какие решения на базе нейропроцессора NeuroMatrix вы предлагаете?
Мы не останавливаемся на разработке чипа, а создаем в партнерстве с широким кругом предприятий России законченные решения, которые предлагаем конечному заказчику. Кроме процессора мы выпускаем целую номенклатуру встраиваемых модулей, начиная от компактного решения в форм-факторе USB-флешки до серверных решений. Простые USB-модули можно подключать к любому компьютеру и использовать как устройства, ускоряющие работу несложных нейронных сетей и обработку изображений. Для более сложных задач предназначены встраиваемые модули, подключаемые к высокоскоростной шине PCIe. Эти устройства выпускаются серийно и пользуются высоким спросом. Есть более мощное серверное решение, в котором установлено несколько ускорителей. Они предназначены для вычислений сложных нейронных сетей, параллельно обработки нескольких видеопотоков и изображений высокого разрешения.
Как показала практика, сегодня конечный заказчик покупает не продукты, а сервисы.
Поэтому сегодня мы переходим на следующий этап – развиваем кооперацию с разработчиками программного обеспечения и предлагаем комплексные аппаратно-программные продукты. Хороший пример такого сотрудничества – разработка программно-аппаратного комплекса совместно с АО «МЦСТ», разработчиком операционной системы и производителем центральных процессоров с архитектурой «Эльбрус». Рабочее место, построенное на базе материнской платы для процессоров «Эльбрус» и нашего нейроускорителя, позволяет распознавать в режиме реального времени различные объекты и их характеристики.
Одно из перспективных направлений деятельности НТЦ «Модуль» – медицинские системы искусственного интеллекта. На форуме мы представили автоматизированное рабочее место (АРМ) врача-диагноста. ПО для этой системы было разработано нашей компанией в сотрудничестве с ведущими медицинскими учреждениями, в частности Государственным медицинским центром им. А. И. Бурназяна. АРМ позволяет врачу распознать COVID‑19 на основе КТ-снимков с вероятностью до 97%. Это существенно повышает эффективность диагностирования и снижает количество ошибок до минимума.
Как много времени потребовалось для обучения этой системы, ведь мы столкнулись с совершенно новым вирусом?
Если говорить честно и объективно, то 30 лет. Именно столько времени компания занимается векторно-матричными вычислениями, это тот путь, который позволил нам создать полностью российский продукт. Срок обучения конкретной нейронной сети зависит от объема так называемых датасетов (data set – набор данных). Чем больше количество снимков, чем более качественно они размечены, тем лучше результат. Важно обеспечить качество предварительной подготовки материалов. Именно в этом состоит основная задача, стоящая перед специалистами в области медицины, да и в целом, в сфере искусственного интеллекта. От доверенности и надежности исходных данных зависит минимизация количества ошибочных решений.
Если говорить конкретно об этом продукте, то как быстро он заработал?
Мы разрабатывали параллельно программно-аппаратный комплекс, программное обеспечение и интерфейс, поэтому суммарно до получения конечного продукта, который мы смогли показать врачам и специалистам, ушло восемь месяцев. Практика показывает, что серийное внедрение нового продукта начинается только с третьего поколения. Потому что после выхода первого поколения продукта разработчик получает обратную связь от пользователей, связанную, как правило, с замечаниями и предложениями. Второе поколение – это этап улучшения характеристик, удобства использования и т. д. А третье поколение выходит на массовое производство и завоевывает свое место на рынке. Мы находимся на этапе представления первых образцов. Врачи протестировали систему и сказали, что с ней можно работать. Сейчас мы передали ее в медицинские учреждения на апробацию, она работает с реальными снимками, с реальными пациентами и мы получаем обратную связь.
Насколько быстро эта система сможет переключиться на работу с новым вирусом или новым штаммом?
С точки зрения аппаратного обеспечения или пользовательского интерфейса все готово. Задержка может быть связана с датасетами, потому что, например, в первой волне пандемии проблема была в том, что врачи не могли идентифицировать вирус, они не понимали, как отличить коронавирус от пневмонии. И только накопление опыта и данных позволило это сделать. Сейчас знаний об этом вирусе значительно больше, и я думаю, что врачебное сообщество будет реагировать гораздо быстрее. Все зависит в данном случае от медиков. Именно поэтому важно уже сейчас начинать обеспечивать медицинские учреждения такими системами, на которые всегда можно загрузить актуальное ПО и быстро развернуть работу.
Видится ли в перспективе возможность для подобных систем определять какое-либо заболевание на основе полной базы данных, накопленной в мире, например, по КТ-снимку?
На самом деле мы уже максимально близки к этому. Вопрос в том, можно ли будет интегрировать медицинские показатели и истории болезни, накопленные в мире различными системами, и точно определить, к каким данным нужно обратиться, чтобы система смогла правильно выстроить алгоритм и подсказать врачу, что конкретно нужно делать. В любом случае сегодня мы говорим, что это система помощи в принятии медицинских решений, она не заменяет врача, а берет на себя часть рутинной работы. Что касается более интегрированного подхода, то нужно создать систему глубокого искусственного интеллекта, которая работает с сотнями и тысячами разных нейронных сетей, с сотнями и тысячами источников информации и на основе этого дает рекомендации врачу по действию относительно конкретного пациента. Не уверен, что такие системы появятся в ближайшие 5–7 лет, тем не менее сообщество специалистов активно обсуждает подобные перспективы.
Спасибо за интересный рассказ.
С А. Э. Мохнаткиным беседовал Ю. С. Ковалевский.
Материал подготовлен В. Б. Ежовым
Отзывы читателей