• Виктор
  • Статьи
  • 1 мин. чтения

Нейросеть на оптической основе оказалась в 100 раз энергоэффективнее обычной


Оптоволоконные кабели / © pexels.com / Автор: Александр Литвинов

Современные генеративные модели искусственного интеллекта используют сотни миллиардов параметров для решения все более сложных задач. Обучение нейросетей таких масштабов требует огромных вычислительных мощностей, которые могут быть предоставлены только центрами обработки данных величиной с ангар, потребляющими энергию, эквивалентную потребностям в электричестве среднего по размеру города. Например, на обучение языковой модели GPT-3, которая имеет 175 миллиардов параметров, было потрачено 1,3 гигаватт-часа электроэнергии, что достаточно для полной зарядки 13 тысяч автомобилей Tesla Model S.

Для устойчивого развития искусственного интеллекта в его нынешнем темпе возникает необходимость переосмыслить как сами алгоритмы машинного обучения, так и требующееся для них вычислительное оборудование. Одним из решений может стать оптическая аппаратная реализация архитектуры нейронных сетей, то есть переход от опоры на чисто транзисторные вычислительные мощности к системам на оптоволоконной основе. В новом исследовании, опубликованном в журнале Advanced Photonics, группа ученых разработала такую нейросеть. 

Предложенная архитектура сочетает в себе оптическую составляющую с небольшим количеством программируемых в цифровом виде параметров. С помощью метода, известного как формирование волнового фронта, исследователи управляли ультракороткими импульсами в многомодовых волокнах — это волокна с большим диаметром сердцевины, проводящие лучи света благодаря эффекту полного внутреннего отражения. Такие оптические волокна поддерживают несколько поперечных мод для заданной оптической частоты и поляризации. С их помощью ученые осуществляли нелинейно-оптические вычисления со средней оптической мощностью, измеряемой всего в микроваттах. 

Схема архитектуры оптической нейросети. Пространственный модулятор света преобразует ультракороткие лазерные импульсы с помощью программируемой выборки данных. Луч идет по многомодовым волокнам, шаблон распространения записывается камерой. Обучаемый классификатор выходных данных вычисляет точность задачи, которая передается обратно в алгоритм суррогатной оптимизации. Этот алгоритм затем повышает производительность задачи за счет изучения различных программируемых параметров и уточнения потенциальных решений. / © Ilker Oguz et. al.

В результате производительность для задачи классификации изображений была сопоставима с цифровыми системами на транзисторной основе, имеющими в 100 с лишним раз большее количество параметров при одинаковом уровне точности. Ученые уменьшили количество параметров модели на 97 процентов, что привело к общему сокращению цифровых операций на 99 процентов по сравнению с аналогичной цифровой многослойной нейронной сетью, основанной на чисто транзисторной аппаратной части. Например, система приблизительно с двумя тысячами параметров работала так же хорошо, как типичная цифровая нейронная сеть более чем с 400 тысячами параметров.

Отдельно авторы рассмотрели вопрос скорости вычислений их нейросети, которая определяет итоговую скорость получения выводов от модели. Для их варианта сети она невысока и ограничена частотой обновления жидкокристаллического пространственного модулятора света. Это ограничение можно преодолеть, перейдя на более быстрый метод формирования волнового фронта: например, если использовать коммерческие цифровые микрозеркальные устройства и квадрантные фотодиоды — это фотодиоды, которые состоят из четырех оптически активных зон (излучающие диоды), разделенные между собой небольшим промежутком (их обычно используют для определения положения лазерных лучей друг относительно друга).

Реализуя ту же архитектуру оптических вычислений с набором коммерчески доступного высокоскоростного оборудования, можно было бы достичь производительности 25 терафлопс при общем энергопотреблении 12,6 ватта, что значительно ниже, чем потребление в 300 ватт классическим транзисторным графическим процессором с сопоставимой производительностью.

Обращает на себя внимание огромный разрыв в возможностях нейросетей на оптической элементной базе и на классической транзисторной. Если его удастся перенести в серийные коммерческие решения, то именно первые, по всей видимости, станут будущим в развитии больших языковых моделей, подобных GPT-4.


Source: https://oaoo.ru/stepanich/neiroset-na-opticheskoi-osnove-okazalas-v-100-raz-energoeffektivnee-obychnoi.html

Межтекстовые Отзывы
Посмотреть все комментарии
guest

Томские физики предложили «вечное» ядерное топливо

©Страна Росатом / Автор: Татьяна Соловьёва Множество изолированных энергосистем на Земле вынуждены использовать как основной источник электроэнергии дизель-генераторы....

Физики впервые воссоздали экзотическую «частицу X» времен Большого взрыва

Детектор CMS / © Mike Procario / Flickr / Автор: Павел Сорокин Прежде чем сформировать стабильные частицы —...

Энергия от окон: ученые изобрели почти прозрачные солнечные батареи

Небоскребы в Шанхае / ©Ermell, Wikimedia Commons / Автор: Ptolemocratia Acerronius Исследовательская группа из японского Университета Тохоку разработала...

Физики выяснили, почему поверхность айсбергов не гладкая

Форма тающего льда при разной температуре / © NYU’s Applied Mathematics Laboratory / Автор: Ольга Кузьмина В своем...

Уникальный черновик величайшей работы Эйнштейна выставили на аукцион

Листы рукописи, датируемой 1913-1914 годами / ©Cristie’s / Автор: Михаил Григорьев Аукционный дом Christie’s ранее в этом ноябре...

Умер российский физик-теоретик Валерий Рубаков

© Joachim Herz Stiftung / Автор: Godefridus Victorinus В городе Сарове Нижегородской области на 68-м году жизни скончался...

Ученые нашли материал с «памятью» о собственном прошлом

©POWERlab, EPFL / Автор: Telestis Scaevinius Диоксид ванадия (VO2) — материал, способный демонстрировать прямо противоположные свойства. При нагревании...

Для будущего токамака собрали магнит рекордной мощности

Магнит из высокотемпературного сверхпроводника: вид сверху / ©Gretchen Ertl, CFS, MIT-PSFC, 2021 / Автор: Telestis Scaevinius Управляемый термоядерный...

ЦЕРН приостанавливает сотрудничество с Россией из-за ситуации на Украине

Логотип Европейской организации по ядерным исследованиям на фоне макета нового образовательного и информационно-просветительского центра CERN Science Gateway /...

Умирающие звезды заподозрили в «засеве» космоса углеродными нанотрубками

Туманность Кольцо (NGC 6720, M 57 или Мессье 57) / ©AURA, STScI, NASA / Автор: Александр Литвинов Описание...

Почему во Вселенной нет антивещества? Ответ может дать космологический коллайдер

Карта температур реликтового излучения, синий и красный цвета отражают разницу температуры в 18 миллионных долей градуса. Для объяснения...

Мимоза подсказала идею материала, способного к пассивному охлаждению и нагреванию

©Sten, Wikimedia Commons / Автор: Pinaria Caprarius Глобальные изменения климата усиливают многие экстремальные погодные явления. Волны жары и...

Инженеры научились ускорять закипание воды

/ Автор: Regulus Tremerus Каждый из нас несколько раз в день включает чайник, чтобы вскипятить воду для любимого...

Объединяй и властвуй — как создать из квантовых компьютеров квантовый интернет

©Pixabay / Автор: Sycophanta Duccius (Окончание. Начало см. тут: 1, 2, 3). Это началось очень, очень давно. В 9 вечера...

Кандидат в унобтаний: при получении ридберговских поляритонов драгоценные камни оказались лучше искусственных кристаллов

Кристалл минерала куприта, обладающего множеством необычных полупроводниковых свойств / © pinterest.org / Автор: Андрей Чернов На первый взгляд...

В честь нового запуска БАК: как физики разобрали Вселенную на шестеренки

Большой адронный коллайдер – самый большой ускоритель в истории. /(с)Maximilien Brice/CERN. / Автор: Messiena Lucretius Большой адронный коллайдер...

Китай построит крупнейший в мире подводный телескоп для охоты за «призрачными частицами»

Японский нейтринный детектор Super-Kamiokande / © The University of Tokyo / Автор: Ольга Кузьмина Космические лучи — потоки...

Температура пленки мыльных пузырей оказалась ниже, чем окружающего воздуха

©Boulogne et al., 2022 / Автор: Godefridus Victorinus Заполненные газом пузырьки — не просто детское развлечение. Они возникают...

Двухступенчатые алмазные наковальни, или Как достичь давления в девять миллионов атмосфер

Расширение диапазона давлений, достижимых с помощью алмазной наковальни, позволяет исследовать экзотические кристаллические структуры, такие как нитрид рения Re7N3....

Физики предложили два новых способа превращать инфракрасный свет в видимый

© Wikimedia / Автор: Ирина Мельникова Инфракрасным светом называют электромагнитное излучение с длиной волны большей, чем у красного...