• Виктор
  • Статьи
  • 1 мин. чтения

Нейросеть на оптической основе оказалась в 100 раз энергоэффективнее обычной


Оптоволоконные кабели / © pexels.com / Автор: Александр Литвинов

Современные генеративные модели искусственного интеллекта используют сотни миллиардов параметров для решения все более сложных задач. Обучение нейросетей таких масштабов требует огромных вычислительных мощностей, которые могут быть предоставлены только центрами обработки данных величиной с ангар, потребляющими энергию, эквивалентную потребностям в электричестве среднего по размеру города. Например, на обучение языковой модели GPT-3, которая имеет 175 миллиардов параметров, было потрачено 1,3 гигаватт-часа электроэнергии, что достаточно для полной зарядки 13 тысяч автомобилей Tesla Model S.

Для устойчивого развития искусственного интеллекта в его нынешнем темпе возникает необходимость переосмыслить как сами алгоритмы машинного обучения, так и требующееся для них вычислительное оборудование. Одним из решений может стать оптическая аппаратная реализация архитектуры нейронных сетей, то есть переход от опоры на чисто транзисторные вычислительные мощности к системам на оптоволоконной основе. В новом исследовании, опубликованном в журнале Advanced Photonics, группа ученых разработала такую нейросеть. 

Предложенная архитектура сочетает в себе оптическую составляющую с небольшим количеством программируемых в цифровом виде параметров. С помощью метода, известного как формирование волнового фронта, исследователи управляли ультракороткими импульсами в многомодовых волокнах — это волокна с большим диаметром сердцевины, проводящие лучи света благодаря эффекту полного внутреннего отражения. Такие оптические волокна поддерживают несколько поперечных мод для заданной оптической частоты и поляризации. С их помощью ученые осуществляли нелинейно-оптические вычисления со средней оптической мощностью, измеряемой всего в микроваттах. 

Схема архитектуры оптической нейросети. Пространственный модулятор света преобразует ультракороткие лазерные импульсы с помощью программируемой выборки данных. Луч идет по многомодовым волокнам, шаблон распространения записывается камерой. Обучаемый классификатор выходных данных вычисляет точность задачи, которая передается обратно в алгоритм суррогатной оптимизации. Этот алгоритм затем повышает производительность задачи за счет изучения различных программируемых параметров и уточнения потенциальных решений. / © Ilker Oguz et. al.

В результате производительность для задачи классификации изображений была сопоставима с цифровыми системами на транзисторной основе, имеющими в 100 с лишним раз большее количество параметров при одинаковом уровне точности. Ученые уменьшили количество параметров модели на 97 процентов, что привело к общему сокращению цифровых операций на 99 процентов по сравнению с аналогичной цифровой многослойной нейронной сетью, основанной на чисто транзисторной аппаратной части. Например, система приблизительно с двумя тысячами параметров работала так же хорошо, как типичная цифровая нейронная сеть более чем с 400 тысячами параметров.

Отдельно авторы рассмотрели вопрос скорости вычислений их нейросети, которая определяет итоговую скорость получения выводов от модели. Для их варианта сети она невысока и ограничена частотой обновления жидкокристаллического пространственного модулятора света. Это ограничение можно преодолеть, перейдя на более быстрый метод формирования волнового фронта: например, если использовать коммерческие цифровые микрозеркальные устройства и квадрантные фотодиоды — это фотодиоды, которые состоят из четырех оптически активных зон (излучающие диоды), разделенные между собой небольшим промежутком (их обычно используют для определения положения лазерных лучей друг относительно друга).

Реализуя ту же архитектуру оптических вычислений с набором коммерчески доступного высокоскоростного оборудования, можно было бы достичь производительности 25 терафлопс при общем энергопотреблении 12,6 ватта, что значительно ниже, чем потребление в 300 ватт классическим транзисторным графическим процессором с сопоставимой производительностью.

Обращает на себя внимание огромный разрыв в возможностях нейросетей на оптической элементной базе и на классической транзисторной. Если его удастся перенести в серийные коммерческие решения, то именно первые, по всей видимости, станут будущим в развитии больших языковых моделей, подобных GPT-4.


Source: https://lib.zaplata.ru/stepanich/neiroset-na-opticheskoi-osnove-okazalas-v-100-raz-energoeffektivnee-obychnoi.html

Межтекстовые Отзывы
Посмотреть все комментарии
guest

Уточненная масса W-бозонов указала на физику за пределами стандартной модели

Детектор CDF-II / ©Fermilab / Автор: Андрей Чернов Анализ данных давно закрытого коллайдера позволил найти миллионы событий —...

Физики решили парадокс Леонардо, описавшего странное движение пузырьков

©Elīna Baltiņa, Flickr / Автор: Ирина Мельникова Художник, инженер и скульптор Леонардо да Винчи стал одной из самых...

Большой адронный коллайдер «подсказал», где искать частицы темной материи

Визуализация продуктов столкновения двух пучков протонов в Большом адронном коллайдере. Идея искать следы частиц темной материи в данных,...

Новое устройство поможет проводить самые маломасштабные измерения силы гравитации

Все материальные объекты обладают собственным гравитационным притяжением, независимо от того, насколько они малы / © Karl Dolenc, BeholdingEye,...

Ученые научились создавать алмазы пониженной хрупкости

©Jared Tarbell, Flickr / Автор: Наталья Федосеева Алмаз — самый твердый минерал в природе. Однако оборотной стороной этого...

Это прорыв — созданы надежные кубиты в ультрахолодных полярных молекулах

Экспериментальная установка / © Gregory et al. / Автор: Владимир Богданов Одно из существенных ограничений при создании квантового...

Физики вывели формулу для формы яблока и подтвердили ее экспериментально

Как физики видят яблоко / © Harvard SEAS / Автор: Milonia Larcius Форма яблока — одна из самых...

Производство на потоке: целый миллиард кубитов в секунду

Представление кубитов на сфере Блоха. / © Констанцкий университет / Автор: Pinaria Caprarius Хотя потенциал квантовых вычислений не...

Будущий детектор гравитационных волн вновь подвергнет проверке теорию относительности

Близкий взгляд на один из трех аппаратов группировки LISA в представлении художника. / ©AEI/MM/exozet / Автор: Caristania Fabricius...

Таяние ледников укоротит земной год к 2029-му

Ледники стали таять быстрее, и скорость вращения Земли замедлилась сильнее, чем раньше / © pxhere.com Астрономический год, то...

Физики впервые воссоздали экзотическую «частицу X» времен Большого взрыва

Детектор CMS / © Mike Procario / Flickr / Автор: Павел Сорокин Прежде чем сформировать стабильные частицы —...

Глубокое обучение с подкреплением вводит квантовую систему в «состояние кота Шредингера»

Кот Шредингера, находящийся одновременно в двух квантовых состояниях, в представлении художника. / © Okinawa Institute of Science and...

Первые наблюдения сверхтяжелого кислорода-28 поставили под сомнение теории строения атомного ядра

Riken RI Beam Factory ускоряет тяжелые изотопы в кольцевом циклотроне, с помощью сверхпроводящих магнитов / © Riken, Nishina...

Физики синтезировали новый изотоп магния

©S.M. Wang, Fudan University & Facility for Rare Isotope Beams, MSU / Автор: Дмитрий Жуков Магний — 12-й...

Физики придумали, как искать корабли инопланетян с помощью детекторов гравитационных волн

Аэрофотосъемка франко-итальянского детектора гравитационных волн, расположенного в EGO (Европейская гравитационная обсерватория), которая находится в коммуне Кашина под Пизой...

Умер Алексей Старобинский, стоявший у истоков открытия излучения Хокинга и гипотезы инфляции

Профессор факультета физики НИУ ВШЭ, академик РАН Алексей Старобинский / © ВШЭ / Автор: Euclio Drusus Алексей Старобинский...

Лазер помог направить движение молний

©TRUMPF / Автор: Иван Беляев Уже несколько столетий для защиты от молний используют громоотводы. Такие длинные металлические стержни...

Инженер из США придумал, как создать прототип варп-двигателя в микрометровом масштабе

Схема эксперимента-прототипа варп-двигателя с полостью Казимира в центре / ©Limitless Space Institute / Автор: Михаил Григорьев Научная статья,...

Ученые обнаружили новую форму льда, которая может существовать в недрах Земли и на других планетах

© Flickr / Автор: Екатерина Лебедева Лед, как и другие твердые вещества, способен принимать разные формы, которые зависят...

ЦЕРН прекратит сотрудничество с Россией и Белоруссией

ALICE — один из семи экспериментальных детекторов, сооруженных на Большом адронном коллайдере в ЦЕРН / © Maximilien Brice,...