Графические процессоры с триллионами транзисторов, лазерные чипы для резки стали, ускорители частиц, первый чип на основе графена и многое другое
Графические процессоры с триллионом транзисторов
В 1971 полупроводниковая промышленность продала более 1 триллиона транзисторов. Типичные графические процессоры, используемые для обучения ИИ, уже достигли предела плотности размещения элементов. Количество транзисторов в них составляет около 100 миллиардов. Для продолжения тенденции увеличения количества транзисторов потребуется несколько чипов, соединённых между собой с помощью 2,5- или 3-мерной интеграции, для выполнения вычислений. Интеграция нескольких чипов с помощью CoWoS или SoIC и связанных с ними передовых технологий упаковки позволяет увеличить общее количество транзисторов в системе по сравнению с одним чипом. Нужно будет соединить все эти чиплеты в трёхмерный массив, но, разработчики смогли уменьшить шаг вертикальных межсоединений, увеличив их плотность. И есть ещё много места для роста. Нет причин, по которым плотность межсоединений не может вырасти на порядок и даже больше. Если прогнозы руководителей TSMC верны, то в течение десяти лет в одном графическом процессоре будет 1 триллион транзисторов.
В эпоху искусственного интеллекта полупроводниковые технологии являются ключевым фактором, обеспечивающим новые возможности и приложения для ИИ. Новый графический процессор больше не ограничен стандартными размерами и форм-факторами прошлого. Новые полупроводниковые технологии больше не ограничиваются уменьшением размеров транзисторов следующего поколения в двумерной плоскости. Интегрированная система ИИ может состоять из такого количества энергоэффективных транзисторов, какое только возможно, иметь эффективную системную архитектуру для специализированных вычислительных задач и оптимизированное взаимодействие между программным и аппаратным обеспечением.
Изображение: Плотность вертикальных соединений в 3D- чипах увеличилась примерно так же, как и количество транзисторов в графическом процессоре.
Миниатюрный сверхмощный лазер, способный плавить сталь
До недавнего времени разрезание стали и другие оптические супергеройские трюки были прерогативой больших углекислотных лазеров и аналогичных громоздких систем. Но теперь к ним присоединились полупроводники сантиметрового масштаба. Эти устройства, называемые фотонными кристаллическими полупроводниковыми лазерами (PCSEL), используют сложную систему отверстий нанометрового размера внутри полупроводника, чтобы направлять больше энергии прямо из лазера. PCSEL, созданный в Японии, создаёт разрезающий сталь луч, расходящийся всего на 0,5 градуса.
Ученые создали фотонно-кристаллический поверхностно-излучающий лазер, (PCSEL) , яркость которого составляет 1 ГВт/см2/ср, что сопоставимо с яркостью газовых и волоконных лазеров. При диаметре излучения 3 мм он может непрерывно генерировать лазерное излучение мощностью до 50 Вт, поддерживая луч, расходящийся на ничтожную долю градуса. Его можно использовать даже для резки стали.
На полупроводниковой пластине созданы несколько фотонных кристаллических полупроводниковых лазеров шириной 3 миллиметра. Изображение: Сусуму Нода
Новая технология транзисторов и система подачи питания
В начале 2024 году у Intel были большие амбиции. Сейчас всё выглядит не так радужно. Тем не менее, Intel начала производить микросхемы, используя комбинацию двух новых технологий: нанолистовые транзисторы и новая схема подачи питания к транзистору. Хотя главный конкурент, TSMC, тоже переходит на нанолисты, компания откладывает внедрение новой схемы питания на потом. Но планы Intel не выдержали столкновения с клиентами и конкурентами. Вместо того, чтобы коммерциализировать первую версию этой комбинации под названием 20A, компания перешла к следующей версии под названием 18A.
RibbonFET, нанотранзистор от Intel, заменит сегодняшнюю технологию FinFET. Транзисторы FinFET обеспечивали процессорам низкое энергопотребление и более высокую плотность логических схем за счёт того, что затвор транзистора окружал область канала с трёх сторон, а не с одной. Но по мере уменьшения размеров FinFET эти устройства приблизились к пределу возможностей затворов по управлению током. Нанолистовые транзисторы, такие как многомостовые полевые транзисторы от Samsung, обеспечивают лучший контроль, поскольку их затворы полностью окружают область канала. Intel ожидает, что RibbonFET повысит энергоэффективность на 15 процентов, когда его внедрят в предстоящий технологический процесс Intel 20A — новейшую технологию производства полупроводников. Буква «A» в 20A означает ангстрем, хотя, как и «нанометр» в предыдущем обозначении чипов, она больше не относится к конкретному измерению в чипе.
Добавление подачи питания с тыльной стороны[нижняя половина] , новые транзисторы в исчезающе тонком слое кремния [центральная линия]. Изображение: Intel
Внедрение новой схемы подачи питания, которая обычно называется питанием с тыльной стороны и которую Intel называет PowerVia, — это более радикальное изменение. «С тех пор, как Роберт Нойс создал первую интегральную схему, всё было на лицевой стороне для межсоединений», — говорит Оут. Впервые производители будут использовать поверхность с другой стороны пластины, отделяя питание от обработки данных. Такое разделение важно, потому что силовые и сигнальные линии оптимизированы по-разному: в то время как силовые линии лучше всего работают с проводами малого сопротивления и большого сечения, сигнальным линиям требуется больше пространства между ними для обеспечения минимальных помех.
Первый чип на основе графена
Графен уже давно известен как интересный, но сложный материал для электроники будущего. Электроны проносятся сквозь него со скоростью, о которой кремний может только мечтать, и это привлекает исследователей потенциалом терагерцовых транзисторов. Но у него нет естественной запрещённой зоны, и оказалось очень трудно создать её. Однако исследователи из Технологического института Джорджии попробовали ещё раз и придумали довольно простой способ создать полупроводниковую версию на пластине из карбида кремния.
Этот прорыв обещает произвести революцию в мире электроники, сделав традиционные компьютеры быстрее и предложив новый материал для будущих квантовых компьютеров.
Исследователи из Технологического института Джорджии в Атланте разработали то, что они называют первым в мире функционирующим полупроводником на основе графена. Этот прорыв обещает произвести революцию в мире электроники, сделав традиционные компьютеры быстрее и предложив новый материал для будущих квантовых компьютеров.
Исследование, опубликованное 3 января в журнале Nature и проведённое Уолтом де Хиром, профессором физики в Технологическом институте Джорджии, посвящено использованию эпитаксиального графена— кристаллической структуры углерода, химически связанного с карбидом кремния (SiC). Этот новый полупроводниковый материал, названный полупроводниковым эпитаксиальным графеновым (SEC) обладает повышенной подвижностью электронов по сравнению с традиционным кремнием, что позволяет электронам перемещаться со значительно меньшим сопротивлением. В результате получаются транзисторы, способные работать на частотах в терагерцах, что в 10 раз быстрее, чем у кремниевых транзисторов, используемых в современных чипах.
Де Хир описывает используемый метод как модифицированную версию чрезвычайно простой технологии, известной уже более 50 лет. «При нагревании карбида кремния до температуры более 1000 °C кремний испаряется с поверхности, оставляя богатую углеродом поверхность, которая затем превращается в графен», — говорит де Хир.
Конкуренты Nvidia
Может ли кто-нибудь превзойти Nvidia? Очень вероятно.
Доминирование Nvidia в сфере ИИ, как и взрывной рост машинного обучения в целом, — это недавнее развитие событий. Но оно уходит корнями в многолетние усилия компании по созданию графических процессоров как универсального вычислительного оборудования, полезного для многих задач, помимо рендеринга графики. Эти усилия охватывают не только архитектуру графических процессоров компании, которая включает «тензорные ядра», способные ускорять работу ИИ, но и, что особенно важно, её программную платформу под названием Cuda, которая помогает разработчикам использовать преимущества оборудования.
CUDA, выпущенная в 2006 году, помогает разработчикам использовать множество ядер графического процессора Nvidia. Это оказалось важным для ускорения задач с высокой степенью параллелизма, в том числе для современного генеративного ИИ. Успех Nvidia в создании экосистемы CUDA делает её оборудование наиболее подходящим для разработки ИИ. Чипов Nvidia может не хватать, но единственное, что найти сложнее, чем оборудование для ИИ, — это опытных разработчиков ИИ, и многие из них знакомы с CUDA.
Это дает Nvidia глубокий и широкий ров для защиты своего бизнеса, но это не означает, что у нее нет конкурентов, готовых штурмовать крепость, и их тактика сильно различается. В то время как компании с многолетней историей, такие как AMD и Intel, стремятся использовать свои собственные графические процессоры, чтобы составить конкуренцию Nvidia, такие выскочки, как Cerebras и SambaNova, разработали радикальные архитектуры чипов, которые резко повышают эффективность генеративного обучения ИИ и логического вывода. Это конкуренты, которые, скорее всего, бросят вызов Nvidia.
AMD соперничает с Nvidia на рынке графических процессоров уже почти два десятилетия. Временами это была неравная борьба. Если говорить о графике, то графические процессоры AMD редко превосходили Nvidia по продажам или популярности. Тем не менее, у оборудования AMD есть свои преимущества. Широкий ассортимент графических процессоров компании включает в себя как встроенную графику для ноутбуков, так и графические процессоры для центров обработки данных с искусственным интеллектом, содержащие более 150 миллиардов транзисторов. Компания также была одним из первых сторонников и пользователей памяти HBM, которая сейчас используется в самых передовых графических процессорах в мире.
Cerebras — компания, специализирующаяся на искусственном интеллекте для суперкомпьютеров, произвела фурор в 2019 году, представив Wafer Scale Engine — гигантский кусок кремния размером с вафлю, на котором размещено 1,2 триллиона транзисторов. В последней версии, Wafer Scale Engine 3, количество транзисторов увеличено до 4 триллионов. Для сравнения: в самом большом и новом графическом процессоре Nvidia В200 всего 208 миллиардов транзисторов. Компьютер, построенный на основе этого монстра размером с вафлю, CS-3 от Cerebras, лежит в основе Condor Galaxy 3, который будет представлять собой суперкомпьютер с искусственным интеллектом мощностью 8 эксафлопс, состоящий из 64 CS-3. Конгломерат из Абу-Даби — G42, который надеется обучить передовые большие языковые модели завтрашнего дня, будет работать с этой системой.
Хотя у Intel нет точного соответствия CUDA от Nvidia и ROCm от AMD, в 2018 году она запустила единую платформу программирования с открытым исходным кодом, oneAPI. В отличие от CUDA и ROCm, oneAPI охватывает несколько категорий оборудования, включая процессоры, графические процессоры и ПЛИС. Таким образом, он может помочь разработчикам ускорить выполнение задач искусственного интеллекта (и многих других) на любом оборудовании Intel.
SambaNova, основанная в 2017 году, — ещё одна компания по разработке микросхем, которая занимается обучением ИИ с помощью нетрадиционной архитектуры микросхем. Её флагман, SN40L, имеет то, что компания называет «перестраиваемой архитектурой потока данных», состоящей из блоков памяти и вычислительных ресурсов. Связи между этими блоками можно изменять на лету, чтобы ускорить передачу данных для больших нейронных сетей.
Такая настраиваемая архитектура чипов может оказаться полезной для обучения больших языковых моделей, поскольку разработчики ИИ могут оптимизировать оборудование для разных моделей. Ни одна другая компания не предлагает таких возможностей.
Будущее закона Мура в ускорителях частиц?
Ультрафиолетовая литография сегодня основана на процедуре, похожей на «проблему Руба Голдберга», когда летящие капли расплавленного олова ударяются о лазеры мощностью в несколько киловатт, образуя светящиеся плазменные шары. Но для производства микросхем в будущем потребуется более яркий свет, чем может обеспечить такая система. Некоторые исследователи считают, что ответ заключается в гигантском ускорителе частиц, который экономит энергию, используя версию регенеративного торможения для физики высоких энергий.
Ещё до того, как первые EUV-устройства были установлены на фабриках, исследователи увидели возможности для EUV-литографии с использованием мощного источника света под названием лазер на свободных электронах (FEL), который генерируется ускорителем частиц. Однако, по словам учёных из KEK, подойдёт не любой ускоритель частиц. Они утверждают, что лучшим кандидатом для EUV-литографии является ускоритель частиц с регенеративным торможением. Известный как линейный ускоритель с рекуперацией энергии, он мог бы позволить лазеру на свободных электронах экономично генерировать десятки киловатт энергии EUV. Этого более чем достаточно для одновременного запуска не одной, а нескольких литографских машин следующего поколения, что снижает затраты на усовершенствованное производство микросхем.
Компьютеры на подложке
В апреле крупнейшая в мире компания по производству полупроводников TSMC обнародовала свои планы по производству усовершенствованной упаковки, и это будущее указывает на то, что компьютеры будут размером с пластину. Технически TSMC уже давно производит такие компьютеры для Cerebras, но то, что компания планирует предложить в ближайшие годы, будет гораздо более гибким и доступным для всех. В 2027 году эта технология может привести к созданию систем, вычислительная мощность которых будет в 40 раз выше, чем сейчас.
Технология интеграции TSMC в масштабе пластины
На протяжении десятилетий производители микросхем повышали плотность логических элементов в процессорах в основном за счёт уменьшения площади, которую занимают транзисторы, и размера межсоединений. Но эта схема уже давно исчерпала себя. Вместо этого отрасль переходит на передовые технологии упаковки, которые позволяют изготавливать один процессор из большой подложке из кремния. Размер одного чипа ограничен наибольшим рисунком, который может создать литографическое оборудование. В настоящее время этот предел, называемый размером маски, составляет около 800 квадратных миллиметров. Таким образом, если нужно больше кремния в вашем графическом процессоре можно сделать его из двух или более кристаллов. Главное — соединить эти кристаллы так, чтобы сигналы могли передаваться от одного к другому так же быстро и с таким же низким энергопотреблением, как если бы они были одним большим куском кремния.
Гибридное соединения в 3D-чипах
Упаковка микросхем — один из важнейших аспектов продолжения действия закона Мура, позволяющий создавать системы, состоящие из множества различных кремниевых пластин, соединённых между собой, как если бы они были одним гигантским чипом. А самой перспективной технологией в области упаковки является 3D-гибридное соединение. Эта технология позволяет размещать два или более чипа друг над другом в одном корпусе. Это позволяет производителям микросхем увеличивать количество транзисторов в своих процессорах и памяти, несмотря на общее замедление процесса уменьшения размеров транзисторов, который когда-то лежал в основе закона Мура.
При гибридном соединении медные накладки встраиваются на верхнюю поверхность каждого чипа. Медь окружена изоляцией, обычно из оксида кремния, а сами накладки слегка заглублены от поверхности изоляции. После химической модификации оксида две стружки прижимаются друг к другу лицом к лицу, так что углубленные подушечки на каждой из них выравниваются. Затем этот сэндвич медленно нагревается, в результате чего медь расширяется через зазор и плавится, соединяя две микросхемы.
По материалам IEEE Spectrum