• Виктор
  • Статьи
  • 1 мин. чтения

Нейросеть на оптической основе оказалась в 100 раз энергоэффективнее обычной


Оптоволоконные кабели / © pexels.com / Автор: Александр Литвинов

Современные генеративные модели искусственного интеллекта используют сотни миллиардов параметров для решения все более сложных задач. Обучение нейросетей таких масштабов требует огромных вычислительных мощностей, которые могут быть предоставлены только центрами обработки данных величиной с ангар, потребляющими энергию, эквивалентную потребностям в электричестве среднего по размеру города. Например, на обучение языковой модели GPT-3, которая имеет 175 миллиардов параметров, было потрачено 1,3 гигаватт-часа электроэнергии, что достаточно для полной зарядки 13 тысяч автомобилей Tesla Model S.

Для устойчивого развития искусственного интеллекта в его нынешнем темпе возникает необходимость переосмыслить как сами алгоритмы машинного обучения, так и требующееся для них вычислительное оборудование. Одним из решений может стать оптическая аппаратная реализация архитектуры нейронных сетей, то есть переход от опоры на чисто транзисторные вычислительные мощности к системам на оптоволоконной основе. В новом исследовании, опубликованном в журнале Advanced Photonics, группа ученых разработала такую нейросеть. 

Предложенная архитектура сочетает в себе оптическую составляющую с небольшим количеством программируемых в цифровом виде параметров. С помощью метода, известного как формирование волнового фронта, исследователи управляли ультракороткими импульсами в многомодовых волокнах — это волокна с большим диаметром сердцевины, проводящие лучи света благодаря эффекту полного внутреннего отражения. Такие оптические волокна поддерживают несколько поперечных мод для заданной оптической частоты и поляризации. С их помощью ученые осуществляли нелинейно-оптические вычисления со средней оптической мощностью, измеряемой всего в микроваттах. 

Схема архитектуры оптической нейросети. Пространственный модулятор света преобразует ультракороткие лазерные импульсы с помощью программируемой выборки данных. Луч идет по многомодовым волокнам, шаблон распространения записывается камерой. Обучаемый классификатор выходных данных вычисляет точность задачи, которая передается обратно в алгоритм суррогатной оптимизации. Этот алгоритм затем повышает производительность задачи за счет изучения различных программируемых параметров и уточнения потенциальных решений. / © Ilker Oguz et. al.

В результате производительность для задачи классификации изображений была сопоставима с цифровыми системами на транзисторной основе, имеющими в 100 с лишним раз большее количество параметров при одинаковом уровне точности. Ученые уменьшили количество параметров модели на 97 процентов, что привело к общему сокращению цифровых операций на 99 процентов по сравнению с аналогичной цифровой многослойной нейронной сетью, основанной на чисто транзисторной аппаратной части. Например, система приблизительно с двумя тысячами параметров работала так же хорошо, как типичная цифровая нейронная сеть более чем с 400 тысячами параметров.

Отдельно авторы рассмотрели вопрос скорости вычислений их нейросети, которая определяет итоговую скорость получения выводов от модели. Для их варианта сети она невысока и ограничена частотой обновления жидкокристаллического пространственного модулятора света. Это ограничение можно преодолеть, перейдя на более быстрый метод формирования волнового фронта: например, если использовать коммерческие цифровые микрозеркальные устройства и квадрантные фотодиоды — это фотодиоды, которые состоят из четырех оптически активных зон (излучающие диоды), разделенные между собой небольшим промежутком (их обычно используют для определения положения лазерных лучей друг относительно друга).

Реализуя ту же архитектуру оптических вычислений с набором коммерчески доступного высокоскоростного оборудования, можно было бы достичь производительности 25 терафлопс при общем энергопотреблении 12,6 ватта, что значительно ниже, чем потребление в 300 ватт классическим транзисторным графическим процессором с сопоставимой производительностью.

Обращает на себя внимание огромный разрыв в возможностях нейросетей на оптической элементной базе и на классической транзисторной. Если его удастся перенести в серийные коммерческие решения, то именно первые, по всей видимости, станут будущим в развитии больших языковых моделей, подобных GPT-4.


Source: https://lib.zaplata.ru/stepanich/neiroset-na-opticheskoi-osnove-okazalas-v-100-raz-energoeffektivnee-obychnoi.html

Межтекстовые Отзывы
Посмотреть все комментарии
guest

Физики узнали, как правильно мыть руки

Кадр из фильма «Авиатор» (2004) / © Gifer / Автор: Павел Сорокин То, что соблюдение правил гигиены, особенно...

Производство на потоке: целый миллиард кубитов в секунду

Представление кубитов на сфере Блоха. / © Констанцкий университет / Автор: Pinaria Caprarius Хотя потенциал квантовых вычислений не...

Физики впервые воссоздали экзотическую «частицу X» времен Большого взрыва

Детектор CMS / © Mike Procario / Flickr / Автор: Павел Сорокин Прежде чем сформировать стабильные частицы —...

Опоздав на 10 лет, США, наконец, «зажгли плазму». Но выиграли от этого военные, а не термоядерная энергетика

Вакуумная камера National Ignition Facility. В отличие от токамаков и других термоядерных реакторов с магнитным удержанием плазмы, тут...

Microsoft закупила энергию от термоядерного реактора с 2028 года

Стартап разрабатывает весьма необычный типа термоядерного реактора / ©Helion Energy / Автор: Lampronia Auxilius Американский стартап Helion Energy...

Физики научились плести нити из нанотрубок

©Jeff Fitlow, Rice University / Автор: Visellia Orfius Углеродные нанотрубки представляют собой полые сверхтонкие структуры со стенками толщиной...

У ученых до сих пор нет единой теории происхождения шаровых молний

Шаровая молния на гравюре XIX века / Автор: Pinaria Caprarius Заместитель директора Московского института электроники и математики имени...

Кандидат в унобтаний: при получении ридберговских поляритонов драгоценные камни оказались лучше искусственных кристаллов

Кристалл минерала куприта, обладающего множеством необычных полупроводниковых свойств / © pinterest.org / Автор: Андрей Чернов На первый взгляд...

Обнаружена самая долгоживущая экзотическая частица, которая изменит современную физику

Схема дважды открыто очарованного тетракварка Tcc+ / ©CERN / Автор: Никита Тарасов Курс физики в общеобразовательной школе дает...

Прорезиненный бетон стал пластичнее и мало потерял в прочности

Прорезиненный бетон стал пластичнее и мало потерял в прочности / © Dhipan Aravind Singaravel et al. Бетон —...

Уникальный черновик величайшей работы Эйнштейна выставили на аукцион

Листы рукописи, датируемой 1913-1914 годами / ©Cristie’s / Автор: Михаил Григорьев Аукционный дом Christie’s ранее в этом ноябре...

Спад антропогенных выбросов СО2 во время пандемии никак не помешал росту его концентрации в атмосфере

Океан поглощает не менее четверти от антропогенных выбросов углекислого газа. Однако по мере потепления он будет делать это...

В составе астероидов заподозрили неизвестные типы «сверхплотной» материи

Астероид Психея в представлении художника / © NASA / Автор: Milonia Larcius В середине XX века советский физик-ядерщик...

Физики раскритиковали новый адронный коллайдер за 20 миллиардов евро

Будущий кольцевой коллайдер в представлении художника / © Cern / Автор: Sycophanta Duccius В 2008 году на границе...

Нобелевскую премию по физике — 2023 получили ученые из Швеции, Германии и США

© Nobel Prize Outreach / Автор: Milonia Larcius Нобелевский комитет по физике Шведской королевской академии наук сообщил, кому...

Физики не увидели распад ложного вакуума — вопреки тому, что написали СМИ

© Newcastle University / Автор: Lampronia Auxilius Многие российские СМИ дали новости вроде «Физики увидели распад ложного вакуума»....

Новый дизайн «спиральных» линз позволил четко видеть вдали и вблизи одновременно

Иллюстрация спиралевидной линзы / © Laurent Galinier Хрусталик нашего глаза в норме фокусирует свет на сетчатке, так что...

Американские физики на доли секунды создали «горящую» плазму, необходимую для термоядерного синтеза

Иллюстрация эксперимента: лучи лазера проникают в хольраум с обоих концов и нагревают мишень. / © Lawrence Livermore National...

Умер российский физик-теоретик Валерий Рубаков

© Joachim Herz Stiftung / Автор: Godefridus Victorinus В городе Сарове Нижегородской области на 68-м году жизни скончался...

Инженеры напечатали 3D-структуру прочнее «аэрокосмического» сплава

Образец нового метаматериала в руках у одного из авторов исследования / © RMIT Метаматериалы — это искусственные материалы,...