• Виктор
  • Статьи
  • 1 мин. чтения

Нейросеть на оптической основе оказалась в 100 раз энергоэффективнее обычной


Оптоволоконные кабели / © pexels.com / Автор: Александр Литвинов

Современные генеративные модели искусственного интеллекта используют сотни миллиардов параметров для решения все более сложных задач. Обучение нейросетей таких масштабов требует огромных вычислительных мощностей, которые могут быть предоставлены только центрами обработки данных величиной с ангар, потребляющими энергию, эквивалентную потребностям в электричестве среднего по размеру города. Например, на обучение языковой модели GPT-3, которая имеет 175 миллиардов параметров, было потрачено 1,3 гигаватт-часа электроэнергии, что достаточно для полной зарядки 13 тысяч автомобилей Tesla Model S.

Для устойчивого развития искусственного интеллекта в его нынешнем темпе возникает необходимость переосмыслить как сами алгоритмы машинного обучения, так и требующееся для них вычислительное оборудование. Одним из решений может стать оптическая аппаратная реализация архитектуры нейронных сетей, то есть переход от опоры на чисто транзисторные вычислительные мощности к системам на оптоволоконной основе. В новом исследовании, опубликованном в журнале Advanced Photonics, группа ученых разработала такую нейросеть. 

Предложенная архитектура сочетает в себе оптическую составляющую с небольшим количеством программируемых в цифровом виде параметров. С помощью метода, известного как формирование волнового фронта, исследователи управляли ультракороткими импульсами в многомодовых волокнах — это волокна с большим диаметром сердцевины, проводящие лучи света благодаря эффекту полного внутреннего отражения. Такие оптические волокна поддерживают несколько поперечных мод для заданной оптической частоты и поляризации. С их помощью ученые осуществляли нелинейно-оптические вычисления со средней оптической мощностью, измеряемой всего в микроваттах. 

Схема архитектуры оптической нейросети. Пространственный модулятор света преобразует ультракороткие лазерные импульсы с помощью программируемой выборки данных. Луч идет по многомодовым волокнам, шаблон распространения записывается камерой. Обучаемый классификатор выходных данных вычисляет точность задачи, которая передается обратно в алгоритм суррогатной оптимизации. Этот алгоритм затем повышает производительность задачи за счет изучения различных программируемых параметров и уточнения потенциальных решений. / © Ilker Oguz et. al.

В результате производительность для задачи классификации изображений была сопоставима с цифровыми системами на транзисторной основе, имеющими в 100 с лишним раз большее количество параметров при одинаковом уровне точности. Ученые уменьшили количество параметров модели на 97 процентов, что привело к общему сокращению цифровых операций на 99 процентов по сравнению с аналогичной цифровой многослойной нейронной сетью, основанной на чисто транзисторной аппаратной части. Например, система приблизительно с двумя тысячами параметров работала так же хорошо, как типичная цифровая нейронная сеть более чем с 400 тысячами параметров.

Отдельно авторы рассмотрели вопрос скорости вычислений их нейросети, которая определяет итоговую скорость получения выводов от модели. Для их варианта сети она невысока и ограничена частотой обновления жидкокристаллического пространственного модулятора света. Это ограничение можно преодолеть, перейдя на более быстрый метод формирования волнового фронта: например, если использовать коммерческие цифровые микрозеркальные устройства и квадрантные фотодиоды — это фотодиоды, которые состоят из четырех оптически активных зон (излучающие диоды), разделенные между собой небольшим промежутком (их обычно используют для определения положения лазерных лучей друг относительно друга).

Реализуя ту же архитектуру оптических вычислений с набором коммерчески доступного высокоскоростного оборудования, можно было бы достичь производительности 25 терафлопс при общем энергопотреблении 12,6 ватта, что значительно ниже, чем потребление в 300 ватт классическим транзисторным графическим процессором с сопоставимой производительностью.

Обращает на себя внимание огромный разрыв в возможностях нейросетей на оптической элементной базе и на классической транзисторной. Если его удастся перенести в серийные коммерческие решения, то именно первые, по всей видимости, станут будущим в развитии больших языковых моделей, подобных GPT-4.


Source: https://oaoo.ru/stepanich/neiroset-na-opticheskoi-osnove-okazalas-v-100-raz-energoeffektivnee-obychnoi.html

Межтекстовые Отзывы
Посмотреть все комментарии
guest

Физики научились плести нити из нанотрубок

©Jeff Fitlow, Rice University / Автор: Visellia Orfius Углеродные нанотрубки представляют собой полые сверхтонкие структуры со стенками толщиной...

Ученые наблюдали новое квантовое состояние при комнатной температуре

Структура топологического изолятора из бромида висмута/ © Shafayat Hossain and M. Zahid Hasan of Princeton University / Автор:...

Мокрая голова снизила риск летального исхода при ударе молнии

Фотография электрической вспышки над сухой моделью головы / © René Machts et al. Различают несколько видов поражения от...

Китай построит крупнейший в мире подводный телескоп для охоты за «призрачными частицами»

Японский нейтринный детектор Super-Kamiokande / © The University of Tokyo / Автор: Ольга Кузьмина Космические лучи — потоки...

В честь нового запуска БАК: как физики разобрали Вселенную на шестеренки

Большой адронный коллайдер – самый большой ускоритель в истории. /(с)Maximilien Brice/CERN. / Автор: Messiena Lucretius Большой адронный коллайдер...

Исследователи нашли потенциальный способ передачи звука в космосе

Эффект «вакуумного туннелирования фононов» в представлении художника / ©University of Jyväskylä / Автор: Messiena Lucretius Звук — упругие...

Производство на потоке: целый миллиард кубитов в секунду

Представление кубитов на сфере Блоха. / © Констанцкий университет / Автор: Pinaria Caprarius Хотя потенциал квантовых вычислений не...

В России научились производить собственные мощные клистроны

Прототип разработанного в ИЯФ СО РАН клистрона успешно прошел двухмесячные тесты на стенде / ©Егор Быковский / Автор:...

Физики создали квантовую нейросеть, способную к обучению

© Los Alamos National Laboratory / Автор: Pinaria Caprarius Квантовые нейронные сети вызывают ажиотаж вокруг возможности эффективного анализа...

Глаза трилобитов вдохновили ученых на создание камеры с рекордной глубиной резкости

Строение глаза Dalmanitina socialis/ ©NIST / Автор: Никита Тарасов Трилобиты — вымершие морские членистоногие, населявшие океаны 250-543 миллиона...

Создано двухмерное сверхтвердое тело

Создано двухмерное сверхтвердое тело / ©www.sciencealert.com / Автор: Visellia Orfius Существование сверхтвердых тел было предсказано в 1969 году...

Физики раскритиковали новый адронный коллайдер за 20 миллиардов евро

Будущий кольцевой коллайдер в представлении художника / © Cern / Автор: Sycophanta Duccius В 2008 году на границе...

Физикам впервые удалось создать квантовые «кольца Алисы»

Так называемое кольцо Алисы в представлении художника / © Wikimedia Commons / Автор: Сергей Данилов В физике существует...

Парадокс чайного листа Эйнштейна привел к самопроизвольному формированию ценного материала

© Flickr / Автор: Ptolemocratia Acerronius В 1926 году Альберт Эйнштейн представил доклад для Прусской академии наук, который...

Ученые создали простой материал для светофильтра с регулируемой длиной волны пропускания

Зависимость полосы пропускания видимого света материалом SeedGel от температуры. При 29 градусах гель пропускает только красный свет, а...

В погоне за миллионом кубитов

C. Lackner / Ars Electronica (CC BY-NC-ND) / Автор: Ptolemocratia Acerronius (Продолжение. Начало см. тут: 1, 2). В...

Удачный эксперимент на новосибирском электрон-позитронном коллайдере отодвинул границу «новой физики»

Комплекс ВЭПП-4 – ВЭПП / ©ИЯФ СО РАН / Автор: Messiena Lucretius Специалисты из Института ядерной физики имени...

Обнаружена самая долгоживущая экзотическая частица, которая изменит современную физику

Схема дважды открыто очарованного тетракварка Tcc+ / ©CERN / Автор: Никита Тарасов Курс физики в общеобразовательной школе дает...

Силы света: как путешествовать через вещество?

(с) minka2507/Pixabay. / Автор: Ирина Мельникова Простой, казалось бы, вопрос: как свет проходит через оконное стекло и почему...

Крошечные подводные дюны могут рассказать о формировании рельефа Марса

© Flickr / Автор: Дмитрий Жуков Ученые из Университета Кампинас (Бразилия) и Калифорнийского университета в Лос-Анджелесе (США) подробно...