Создан первый монолитный 3D-чип для серийного производства

Он сулит десятикратное ускорение систем искусственного интеллекта.
Первый монолитный 3D-чип
Первый монолитный 3D-чип
Gorodenkoff/Shutterstock/FOTODOM

В США разработан пригодный к серийному производству монолитный 3D-чип, который обещает новую эру в развитии систем искусственного интеллекта.

Разработка, представленная на 71-й ежегодной конференции IEEE International Electron Devices Meeting, стала результатом совместных усилий инженеров Стэнфордского университета, Университета Карнеги–Меллона, Пенсильванского университета и Массачусетского технологического института совместно с крупнейшей в США фабрикой по контрактному производству чипов.

В отличие от нынешних, по сути плоских (2D) чипов, ключевые сверхтонкие компоненты нового прототипа расположены вертикально, как этажи в небоскребе, а межслойные соединения работают как многочисленные скоростные лифты, обеспечивая быструю передачу огромных объемов данных. Рекордная плотность вертикальных соединений и тщательно продуманное соединение блоков памяти и вычислений позволяют чипу обойти ограничения, которые долгое время сдерживали развитие плоских архитектур. В ходе аппаратных испытаний и моделирования новый 3D-чип превзошел 2D-чипы примерно на порядок.

Трехмерные чипы уже создавались, но все это были экспериментальные образцы, а новинка впервые изготовлена на коммерческой производственной линии.

«Именно такие прорывы позволят добиться тысячекратного увеличения производительности оборудования, которое потребуется будущим системам ИИ», — убежден профессор Шубхашиш Митра из Стэнфордского университета, главный автор исследования.

Проблемы плоских чипов

Современным ИИ-моделям, таким как ChatGPT и Claude, приходится перемещать колоссальные объемы данных между памятью, где хранится информация, и вычислительными блоками, которые ее обрабатывают.

На обычных 2D-чипах компоненты расположены на одной плоскости, память распределена по площади, и данным приходится путешествовать по немногочисленным длинным и перегруженным маршрутам. Поскольку вычислительные элементы работают намного быстрее, чем движется информация, а чип не может хранить достаточный объем памяти рядом с ними, система постоянно простаивает в ожидании данных. Инженеры называют это узкое место «стеной памяти» — моментом, когда скорость вычислений начинает опережать способность чипа поставлять данные.

Десятилетиями производители чипов боролись с проблемой «стены памяти», уменьшая размер транзисторов и размещая их все плотнее. Но эта стратегия приближается к непреодолимому физическому пределу, который исследователи называют «стеной миниатюризации».

Новый чип буквально возвышается над этими стенами. «Интегрируя память и вычисления по вертикали, мы можем перемещать гораздо больше данных намного быстрее. Это как несколько лифтов в небоскребе, позволяющие множеству жителей одновременно перемещаться между этажами», — пояснил старший автор Татхагата Шримани из Карнеги–Меллона.

«"Стена памяти" и "стена миниатюризации" образуют смертельную комбинацию, — отметил соавтор исследования Роберт М. Радвей из Пенсильванского университета. — Мы атаковали ее в лоб, тесно интегрировав память и логику, а затем начав строить вверх с чрезвычайно высокой плотностью. Это как Манхэттен в мире вычислений — мы можем разместить больше людей на меньшей площади».

Как создавался новый 3D-чип

До сих пор большинство попыток создания 3D-чипов сводилось к последовательной укладке готовых слоев. Такой подход работает, но соединения между «этажами» получаются грубыми, редкими и сами становятся узким местом.

Вместо того чтобы создавать отдельные чипы и затем соединять их, команда наращивает каждый слой непосредственно поверх предыдущего в едином непрерывном процессе. Этот «монолитный» метод использует достаточно низкие температуры, чтобы не повредить нижележащие схемы, что позволяет исследователям плотнее компоновать элементы и соединять их с гораздо большей плотностью.

Самым большим своим достижением разработчики считают осуществление полного производственного цикла на действующем заводе микроэлектроники.

«Превратить передовую академическую концепцию во что-то, что может изготовить коммерческая фабрика, — сложнейшая задача. Это доказывает, что такие передовые архитектуры возможны не только в лаборатории — их можно производить в промышленных масштабах», — подчеркнул соавтор Марк Нельсон, вице-президент по развитию технологий SkyWater Technology.

Производительность и потенциал чипа

Первые аппаратные тесты показывают, что прототип уже превосходит аналогичные 2D-чипы примерно в четыре раза. Моделирование более высоких, будущих версий с большим количеством слоев памяти и вычислений даст еще больший выигрыш. Конструкции с дополнительными ярусами демонстрируют до двенадцатикратного улучшения производительности на реальных задачах ИИ, основных на открытых версиях LLM.

Первый монолитный 3D-чип
Фото: Bella Ciervo/Penn Engineering
На такой установке проверяли кремниевую пластину с чипами

Самое впечатляющее, по словам исследователей, заключается в том, что эта архитектура открывает реалистичный путь к 100–1000-кратному улучшению произведения энергии на задержку — ключевого показателя, учитывающего баланс между скоростью и энергоэффективностью. За счет радикального сокращения расстояний для передачи данных и добавления множества вертикальных каналов чип может достичь как более высокой пропускной способности, так и меньших затрат энергии на операцию — комбинации, долгое время считавшейся недостижимой для традиционных плоских архитектур.

«Подобные прорывы, конечно, касаются производительности. Но они также касаются возможностей. Если мы сможем создавать передовые 3D-чипы, мы сможем быстрее внедрять инновации, быстрее реагировать на вызовы и строить будущее аппаратного обеспечения для ИИ», — заключил Х.-Ш. Филип Вонг, профессор инженерной школы Стэнфорда и главный исследователь Northwest-AI-Hub.

Подписывайтесь и читайте «Науку» в Telegram