• Виктор
  • Статьи
  • 1 мин. чтения

Нейросеть на оптической основе оказалась в 100 раз энергоэффективнее обычной


Оптоволоконные кабели / © pexels.com / Автор: Александр Литвинов

Современные генеративные модели искусственного интеллекта используют сотни миллиардов параметров для решения все более сложных задач. Обучение нейросетей таких масштабов требует огромных вычислительных мощностей, которые могут быть предоставлены только центрами обработки данных величиной с ангар, потребляющими энергию, эквивалентную потребностям в электричестве среднего по размеру города. Например, на обучение языковой модели GPT-3, которая имеет 175 миллиардов параметров, было потрачено 1,3 гигаватт-часа электроэнергии, что достаточно для полной зарядки 13 тысяч автомобилей Tesla Model S.

Для устойчивого развития искусственного интеллекта в его нынешнем темпе возникает необходимость переосмыслить как сами алгоритмы машинного обучения, так и требующееся для них вычислительное оборудование. Одним из решений может стать оптическая аппаратная реализация архитектуры нейронных сетей, то есть переход от опоры на чисто транзисторные вычислительные мощности к системам на оптоволоконной основе. В новом исследовании, опубликованном в журнале Advanced Photonics, группа ученых разработала такую нейросеть. 

Предложенная архитектура сочетает в себе оптическую составляющую с небольшим количеством программируемых в цифровом виде параметров. С помощью метода, известного как формирование волнового фронта, исследователи управляли ультракороткими импульсами в многомодовых волокнах — это волокна с большим диаметром сердцевины, проводящие лучи света благодаря эффекту полного внутреннего отражения. Такие оптические волокна поддерживают несколько поперечных мод для заданной оптической частоты и поляризации. С их помощью ученые осуществляли нелинейно-оптические вычисления со средней оптической мощностью, измеряемой всего в микроваттах. 

Схема архитектуры оптической нейросети. Пространственный модулятор света преобразует ультракороткие лазерные импульсы с помощью программируемой выборки данных. Луч идет по многомодовым волокнам, шаблон распространения записывается камерой. Обучаемый классификатор выходных данных вычисляет точность задачи, которая передается обратно в алгоритм суррогатной оптимизации. Этот алгоритм затем повышает производительность задачи за счет изучения различных программируемых параметров и уточнения потенциальных решений. / © Ilker Oguz et. al.

В результате производительность для задачи классификации изображений была сопоставима с цифровыми системами на транзисторной основе, имеющими в 100 с лишним раз большее количество параметров при одинаковом уровне точности. Ученые уменьшили количество параметров модели на 97 процентов, что привело к общему сокращению цифровых операций на 99 процентов по сравнению с аналогичной цифровой многослойной нейронной сетью, основанной на чисто транзисторной аппаратной части. Например, система приблизительно с двумя тысячами параметров работала так же хорошо, как типичная цифровая нейронная сеть более чем с 400 тысячами параметров.

Отдельно авторы рассмотрели вопрос скорости вычислений их нейросети, которая определяет итоговую скорость получения выводов от модели. Для их варианта сети она невысока и ограничена частотой обновления жидкокристаллического пространственного модулятора света. Это ограничение можно преодолеть, перейдя на более быстрый метод формирования волнового фронта: например, если использовать коммерческие цифровые микрозеркальные устройства и квадрантные фотодиоды — это фотодиоды, которые состоят из четырех оптически активных зон (излучающие диоды), разделенные между собой небольшим промежутком (их обычно используют для определения положения лазерных лучей друг относительно друга).

Реализуя ту же архитектуру оптических вычислений с набором коммерчески доступного высокоскоростного оборудования, можно было бы достичь производительности 25 терафлопс при общем энергопотреблении 12,6 ватта, что значительно ниже, чем потребление в 300 ватт классическим транзисторным графическим процессором с сопоставимой производительностью.

Обращает на себя внимание огромный разрыв в возможностях нейросетей на оптической элементной базе и на классической транзисторной. Если его удастся перенести в серийные коммерческие решения, то именно первые, по всей видимости, станут будущим в развитии больших языковых моделей, подобных GPT-4.


Source: https://oaoo.ru/stepanich/neiroset-na-opticheskoi-osnove-okazalas-v-100-raz-energoeffektivnee-obychnoi.html

Межтекстовые Отзывы
Посмотреть все комментарии
guest

В составе астероидов заподозрили неизвестные типы «сверхплотной» материи

Астероид Психея в представлении художника / © NASA / Автор: Milonia Larcius В середине XX века советский физик-ядерщик...

Ученые узнали, почему так приятно разжевывать шоколад

Ученые узнали, почему так приятно разжевывать шоколад / ©Getty images / Автор: Иван Беляев Шоколад любит большинство россиян....

Землетрясение в Спитаке

Фото: Adam Jones from Kelowna, BC, wikimedia.org / Автор: Михаил Григорьев На исходе утра 7 декабря 1988 года...

Уточненная масса W-бозонов указала на физику за пределами стандартной модели

Детектор CDF-II / ©Fermilab / Автор: Андрей Чернов Анализ данных давно закрытого коллайдера позволил найти миллионы событий —...

Китай построит крупнейший в мире подводный телескоп для охоты за «призрачными частицами»

Японский нейтринный детектор Super-Kamiokande / © The University of Tokyo / Автор: Ольга Кузьмина Космические лучи — потоки...

В России выдан патент на вечный двигатель. Официально и по всем правилам

Едва ли не с момента зарождения инженерного дела в далеком прошлом человечество пытается строить машины, обеспечивающие вечное безостановочное...

Давление помогло превратить проводник в изолятор и обратно

Круглые ионы Mn окружены частицами дисульфида: слева направо плотность их расположения возрастает / ©Dean Smith, Argonne National Lab...

Физики предложили способ сделать квантовые компьютеры дешевле и практичнее

© Matthias Weinberger / flickr / Автор: Regulus Tremerus В своей работе исследователи использовали архитектуру квантового компьютера, основанную...

Получена новая кристаллическая форма кремния

Структура 4Н-кремния на фоне микрофотографии реального кристалла, полученной электронным микроскопом / ©Thomas Shiell, Timothy Strobel, Carnegie Institution for...

Предложен эксперимент для измерения массы информации

©CERN / Автор: Ольга Кузьмина Еще в прошлом веке Рольф Ландауэр из IBM предположил, что при стирании информации...

Новая теория квантовой гравитации утверждает, что ни один объект не имеет точно определенной массы

Художественная версия рисунка из первой статьи авторов новой гипотезы. На нем, крайне схематично, изображен эксперимент, в котором тяжелые...

Лазер помог направить движение молний

©TRUMPF / Автор: Иван Беляев Уже несколько столетий для защиты от молний используют громоотводы. Такие длинные металлические стержни...

Ученые превратили скандий в высокотемпературный сверхпроводник

Скандий — серебристый редкоземельный металл / ©Alchemist-hp, Wikimedia Commons / Автор: Godefridus Victorinus Сверхпроводники обладают нулевым электрическим сопротивлением,...

Ученые наблюдали новое квантовое состояние при комнатной температуре

Структура топологического изолятора из бромида висмута/ © Shafayat Hossain and M. Zahid Hasan of Princeton University / Автор:...

Физики вывели формулу для формы яблока и подтвердили ее экспериментально

Как физики видят яблоко / © Harvard SEAS / Автор: Milonia Larcius Форма яблока — одна из самых...

Новый керамический материал светится при деформации

©Lothar Wondraczek, Friedrich Schiller University Jena / Автор: Артем Фомин Немецкие ученые создали прозрачную и твердую стеклокерамику, которая...

Ученые обнаружили новую форму льда, которая может существовать в недрах Земли и на других планетах

© Flickr / Автор: Екатерина Лебедева Лед, как и другие твердые вещества, способен принимать разные формы, которые зависят...

ЦЕРН прекратит сотрудничество с Россией и Белоруссией

ALICE — один из семи экспериментальных детекторов, сооруженных на Большом адронном коллайдере в ЦЕРН / © Maximilien Brice,...

Квантовый компьютер с «классической» архитектурой — в тысячу раз меньше кубитов и неплохая эффективность

Предложенная архитектура квантового компьютера. / © Gouzien & Sangouard / Автор: Visellia Orfius Кубит — квантовый аналог бита,...

Сжимающаяся Вселенная столкнет нас в черную дыру. Но заметить конец света будет непросто

Пара из нейтронной звезды (на переднем плане) и черной дыры звездных масс (на заднем плане) перед их слиянием,...