Инженеры из университета Пенсильвании разработали первый программируемый чип, который может обучать нелинейные нейронные сети с помощью света. Эта разработка может значительно ускорить обучение ИИ, сократить потребление энергии и даже проложить путь к созданию полностью световых компьютеров.
Большинство современных систем искусственного интеллекта основаны на нейронных сетях — программном обеспечении, имитирующем биологическую нервную ткань. Подобно тому, как нейроны соединяются, позволяя биологическим существам мыслить, нейронные сети связывают между собой слои простых элементов, или «узлов», позволяя системам искусственного интеллекта выполнять сложные задачи.
Как в искусственных, так и в биологических системах эти узлы «запускаются» только при достижении порогового значения — нелинейного процесса, который позволяет небольшим изменениям на входе вызывать более значительные и сложные изменения на выходе. Без этой нелинейности добавление слоёв ничего не даст: система просто превратится в однослойную линейную операцию, где входные данные просто суммируются, и никакого реального обучения не происходит.
В то время как многие исследовательские группы, в том числе из Пенсильванского университета, разработали световые чипы, способные выполнять линейные математические операции, ни одна из них до сих пор не решила задачу представления нелинейных функций с помощью света.
«Без нелинейных функций фотонные чипы не могут обучать глубокие нейросети или выполнять по-настоящему интеллектуальные задачи», — говорит Тяньвэй Ву (Gr’24), научный сотрудник в области ESE и первый автор статьи.
Прорыв команды начинается со специального полупроводникового материала, который реагирует на свет. Когда луч «сигнального» света (несущий входные данные) проходит через материал, сверху на него падает второй «накачивающий» луч, регулирующий реакцию материала. Изменяя форму и интенсивность луча накачки, команда может контролировать, как поглощается, пропускается или усиливается световой сигнал в зависимости от его интенсивности и свойств материала. Этот процесс «программирует» чип на выполнение различных нелинейных функций.
«Мы не меняем структуру чипа, — говорит Фэн. — Мы используем сам свет для создания узоров внутри материала, которые затем изменяют то, как свет проходит через него». В результате получается реконфигурируемая система, которая может выполнять широкий спектр математических функций в зависимости от схемы насоса. Такая гибкость позволяет чипу обучаться в режиме реального времени, корректируя своё поведение на основе обратной связи с выходом.
Чтобы проверить потенциал чипа, команда использовала его для решения задач, связанных с искусственным интеллектом. Платформа достигла более 97% точности при решении простой нелинейной задачи определения границы и более 96% точности при работе с известным набором данных о цветке ириса — стандартом машинного обучения.
В обоих случаях фотонный чип соответствовал традиционным цифровым нейронным сетям или превосходил их, но при этом использовал меньше операций и не нуждался в энергозатратных электронных компонентах.
Один из поразительных результатов: всего четыре нелинейных оптических соединения на чипе были эквивалентны 20 линейным электронным соединениям с фиксированными нелинейными функциями активации в традиционной модели. Такая эффективность намекает на то, что возможно при масштабировании архитектуры.
В отличие от предыдущих фотонных систем, которые настраиваются после изготовления, чип Пенсильванского университета создаётся как чистый холст. Накачивающий свет действует как кисть, нанося на материал перепрограммируемые инструкции.
«Это настоящее доказательство концепции программируемого в полевых условиях фотонного компьютера, — говорит Фэн. — Это шаг к будущему, в котором мы сможем обучать ИИ со скоростью света».