• Виктор
  • Статьи
  • 1 мин. чтения

Нейросеть на оптической основе оказалась в 100 раз энергоэффективнее обычной


Оптоволоконные кабели / © pexels.com / Автор: Александр Литвинов

Современные генеративные модели искусственного интеллекта используют сотни миллиардов параметров для решения все более сложных задач. Обучение нейросетей таких масштабов требует огромных вычислительных мощностей, которые могут быть предоставлены только центрами обработки данных величиной с ангар, потребляющими энергию, эквивалентную потребностям в электричестве среднего по размеру города. Например, на обучение языковой модели GPT-3, которая имеет 175 миллиардов параметров, было потрачено 1,3 гигаватт-часа электроэнергии, что достаточно для полной зарядки 13 тысяч автомобилей Tesla Model S.

Для устойчивого развития искусственного интеллекта в его нынешнем темпе возникает необходимость переосмыслить как сами алгоритмы машинного обучения, так и требующееся для них вычислительное оборудование. Одним из решений может стать оптическая аппаратная реализация архитектуры нейронных сетей, то есть переход от опоры на чисто транзисторные вычислительные мощности к системам на оптоволоконной основе. В новом исследовании, опубликованном в журнале Advanced Photonics, группа ученых разработала такую нейросеть. 

Предложенная архитектура сочетает в себе оптическую составляющую с небольшим количеством программируемых в цифровом виде параметров. С помощью метода, известного как формирование волнового фронта, исследователи управляли ультракороткими импульсами в многомодовых волокнах — это волокна с большим диаметром сердцевины, проводящие лучи света благодаря эффекту полного внутреннего отражения. Такие оптические волокна поддерживают несколько поперечных мод для заданной оптической частоты и поляризации. С их помощью ученые осуществляли нелинейно-оптические вычисления со средней оптической мощностью, измеряемой всего в микроваттах. 

Схема архитектуры оптической нейросети. Пространственный модулятор света преобразует ультракороткие лазерные импульсы с помощью программируемой выборки данных. Луч идет по многомодовым волокнам, шаблон распространения записывается камерой. Обучаемый классификатор выходных данных вычисляет точность задачи, которая передается обратно в алгоритм суррогатной оптимизации. Этот алгоритм затем повышает производительность задачи за счет изучения различных программируемых параметров и уточнения потенциальных решений. / © Ilker Oguz et. al.

В результате производительность для задачи классификации изображений была сопоставима с цифровыми системами на транзисторной основе, имеющими в 100 с лишним раз большее количество параметров при одинаковом уровне точности. Ученые уменьшили количество параметров модели на 97 процентов, что привело к общему сокращению цифровых операций на 99 процентов по сравнению с аналогичной цифровой многослойной нейронной сетью, основанной на чисто транзисторной аппаратной части. Например, система приблизительно с двумя тысячами параметров работала так же хорошо, как типичная цифровая нейронная сеть более чем с 400 тысячами параметров.

Отдельно авторы рассмотрели вопрос скорости вычислений их нейросети, которая определяет итоговую скорость получения выводов от модели. Для их варианта сети она невысока и ограничена частотой обновления жидкокристаллического пространственного модулятора света. Это ограничение можно преодолеть, перейдя на более быстрый метод формирования волнового фронта: например, если использовать коммерческие цифровые микрозеркальные устройства и квадрантные фотодиоды — это фотодиоды, которые состоят из четырех оптически активных зон (излучающие диоды), разделенные между собой небольшим промежутком (их обычно используют для определения положения лазерных лучей друг относительно друга).

Реализуя ту же архитектуру оптических вычислений с набором коммерчески доступного высокоскоростного оборудования, можно было бы достичь производительности 25 терафлопс при общем энергопотреблении 12,6 ватта, что значительно ниже, чем потребление в 300 ватт классическим транзисторным графическим процессором с сопоставимой производительностью.

Обращает на себя внимание огромный разрыв в возможностях нейросетей на оптической элементной базе и на классической транзисторной. Если его удастся перенести в серийные коммерческие решения, то именно первые, по всей видимости, станут будущим в развитии больших языковых моделей, подобных GPT-4.


Source: https://lib.zaplata.ru/stepanich/neiroset-na-opticheskoi-osnove-okazalas-v-100-raz-energoeffektivnee-obychnoi.html

Межтекстовые Отзывы
Посмотреть все комментарии
guest

Китайские физики получили рекордно мощное постоянное магнитное поле

Гибридный магнит в Хэфэе / ©SHMFF / Автор: Euclio Drusus Установка постоянного высокого магнитного поля (Steady High Magnetic...

На корейском токамаке опробовали новый способ создания плазмы рекордной температуры

Конфигурация плазмы в KSTAR при использовании режима FIRE для повышения энергии плазмы. Шкала температуры плазмы приведена в килоэлектронвольтах,...

Физики впервые воссоздали экзотическую «частицу X» времен Большого взрыва

Детектор CMS / © Mike Procario / Flickr / Автор: Павел Сорокин Прежде чем сформировать стабильные частицы —...

Физики не увидели распад ложного вакуума — вопреки тому, что написали СМИ

© Newcastle University / Автор: Lampronia Auxilius Многие российские СМИ дали новости вроде «Физики увидели распад ложного вакуума»....

Японские ученые создали светящиеся квантовые точки из рисовой шелухи

©Greg Donohue, Flickr / Автор: Ptolemocratia Acerronius Квантовые точки — одна из самых перспективных технологий микроэлектроники. Так называют...

У ученых до сих пор нет единой теории происхождения шаровых молний

Шаровая молния на гравюре XIX века / Автор: Pinaria Caprarius Заместитель директора Московского института электроники и математики имени...

Физики создали «оптоволокно» из воздуха

©Douglas Muth / Автор: Дмитрий Жуков Оптоволоконные кабели помогают передавать цифровой сигнал с минимальными потерями. Их основу составляет...

Ученые превратили скандий в высокотемпературный сверхпроводник

Скандий — серебристый редкоземельный металл / ©Alchemist-hp, Wikimedia Commons / Автор: Godefridus Victorinus Сверхпроводники обладают нулевым электрическим сопротивлением,...

Кубиты идут на свист

Схематичное представление прецессии электронного спина в центре окраски. / © HZDR/Blaurock / Автор: Cloelia Andronicus В качестве кубитов...

Физики раскритиковали новый адронный коллайдер за 20 миллиардов евро

Будущий кольцевой коллайдер в представлении художника / © Cern / Автор: Sycophanta Duccius В 2008 году на границе...

Спад антропогенных выбросов СО2 во время пандемии никак не помешал росту его концентрации в атмосфере

Океан поглощает не менее четверти от антропогенных выбросов углекислого газа. Однако по мере потепления он будет делать это...

Китайские инженеры научились добывать водородное топливо из морской воды

©Nanjing Tech University / Автор: Caristania Fabricius Водород считается одним из самых перспективных видов топлива будущего. Его сжигание...

Ученые создали алмазные капсулы высокого давления и запечатали в них кристаллический аргон

Иллюстрация удержания и исследования фаз высокого давления в виде включений в нанокристаллическом алмазе / © Charles Zeng /...

Китай построит крупнейший в мире подводный телескоп для охоты за «призрачными частицами»

Японский нейтринный детектор Super-Kamiokande / © The University of Tokyo / Автор: Ольга Кузьмина Космические лучи — потоки...

Уникальный черновик величайшей работы Эйнштейна выставили на аукцион

Листы рукописи, датируемой 1913-1914 годами / ©Cristie’s / Автор: Михаил Григорьев Аукционный дом Christie’s ранее в этом ноябре...

Предложен эксперимент для измерения массы информации

©CERN / Автор: Ольга Кузьмина Еще в прошлом веке Рольф Ландауэр из IBM предположил, что при стирании информации...

От тестирования космической электроники до лечения рака: ренессанс старого ускорителя

Линейный ускоритель протонов в ИЯИ РАН в Троицке /©Елена Либрик, Научная Россия / Автор: Euclio Drusus Территория у...

Математики определили оптимальную форму тяжелых камней для «выпекания блинчиков» на воде

©Paul Rowlett, Flickr / Автор: Татьяна Соловьёва Бросание камня в воду так, чтобы тот несколько раз отскочил от...

Силы света: как путешествовать через вещество?

(с) minka2507/Pixabay. / Автор: Ирина Мельникова Простой, казалось бы, вопрос: как свет проходит через оконное стекло и почему...

Физикам впервые удалось создать квантовые «кольца Алисы»

Так называемое кольцо Алисы в представлении художника / © Wikimedia Commons / Автор: Сергей Данилов В физике существует...