Новейшие модели глубочайшего обучения: меньше нейронов, высочайшая эффективность, интерпретируемость

Системы искусственного ума (ИИ) издавна стали частью обыденности и используются в самых различных сферах, от поисковиков и автопереводчиков до беспилотных каров. Это почти во всем соединено со существенно возросшей в крайние годы вычислительной мощностью компов, позволяющей продуктивно эксплуатировать ресурсоёмкие технологии машинного обучения. Но новейшие результаты исследовательских работ в области ИИ демонстрируют, что и очень обыкновенные мелкие нейронные сети могут решать определённые задачки с весьма высочайшей степенью надёжности и эффективности.

Интернациональная экспериментальная группа из Венского технического института (TU Wien), Австрийского института науки и техники (IST Austria) и Массачусетского технологического института (MIT) разработала новейшую систему искусственного ума, смоделированную по подобию нервной системы крохотных звериных — нематод. Создатели разработки говорят, что эта система владеет решающими преимуществами по сопоставлению с прошлыми моделями глубочайшего обучения, в частности — отлично совладевает с зашумлённостью входящих данных. При всем этом она еще проще устроена — так, что процесс её работы не нужно разглядывать как некоторый «чёрный ящик», а можно тщательно разъяснить. Описание новейшей модели глубочайшего обучения размещено в журнальчике Nature Machine Intelligence, а код размещён на GitHub.

Подобно живому мозгу, искусственные нейронные сети состоят из огромного количества отдельных клеток. Когда клеточка активна, она отправляет сигнал иным клеточкам. Все сигналы, получаемые последующей клеточкой, соединяются воединыжды, чтоб решить, станет ли эта клеточка также активной. То, как одна клеточка влияет на активность последующей, описывает поведение системы — эти характеристики корректируются в автоматическом процессе обучения до того времени, пока нейронная сеть не сумеет решить определенную задачку.

«В течение почти всех лет мы следили, чему можем научиться у природы, чтоб сделать лучше глубочайшее обучение (педагогический процесс, в результате которого учащиеся под руководством учителя овладевают знаниями, умениями и навыками), — гласит доктор Раду Гросу (Radu Grosu), управляющий исследовательской группы «Киберфизические системы» в Венском техническом институте. — Нематода Caenorhabditis elegans, к примеру, владеет умопомрачительно малым количеством нейронов и, тем не наименее, указывает достойные внимания поведенческие закономерности. Нервная система нематоды отлично и гармонически обрабатывает информацию».

Для проверки новейших мыслях команда избрала тестовое задание. Нейронная сеть обязана была управлять авто так, чтоб они оставались на полосе. В качестве входного сигнала сеть получает изображения дороги с помощью камеры и автоматом решает, двигаться ли ей на право либо на лево.

«Современные модели глубочайшего обучения с многомиллионными параметрами нередко употребляются для исследования схожих задач, — гласит Матиас Лехнер (Mathias Lechner), выпускник Венского технического института и аспирант Австрийского института науки и техники. — Наши системы имеют лишь 75 000 обучаемых характеристик».

Входные данные камеры поначалу обрабатываются одной частью системы, так именуемой свёрточной нейронной сетью, которая принимает лишь зрительные данные для извлечения структурных особенностей из входящих пикселей. Она решает, какие части изображения увлекательны и важны, а потом передаёт сигналы «системе управления». Та, в свою очередь, управляет транспортным средством.

Обе подсистемы учатся сразу и обмениваются информацией. Исследователи собрали много часов видео вождения и загружают их в сеть вкупе с информацией о том, как управлять каром в хоть какой определенной ситуации — до того времени, пока система не научится автоматом соединять изображения с подходящим направлением руля и не сумеет без помощи других управляться с новенькими неуввязками.

Система управления, которая именуется нейронной цепью (neural circuit policy либо NCP), состоит всего из 19 нейронов. Матиас Лехнер разъясняет, что эта NCP до трёх порядков меньше, чем было бы может быть с наиболее ранешними современными моделями.

Благодаря маленьким размерам и простоте, говорят исследователи, эта новенькая нейронная сеть лучше интерпретирует данные, чем её предшественники побольше. Она фокусируется на специфичных частях изображения камеры и поточнее различает то, что лицезреет. Также учёные могут осознать функции и поведение отдельных клеток. Таковая степень интерпретируемости недоступна для наиболее больших моделей глубочайшего обучения. Большая часть прошлых моделей — это так именуемые «чёрные ящики», еще наименее прозрачные для исследования.

Исследователи уповают, что в будущем сумеют уменьшить время обучения моделей ИИ новейшего типа и станут внедрять их в относительно обыкновенные системы, от автоподъёмников на складах до устройств передвижения у ботов.

Источник: 22century.ru

Добавить комментарий