Фото: Yuichiro Chino / Getty Images

Повторение — мать машинного обучения?

Сегодня природоподобные технологии соединяют даже такие, казалось бы, совсем далекие друг от друга отрасли, как создание роботов и исследования мозга. Роботы отлично могут выполнять разные задачи в идеальных лабораторных условиях, но их гораздо сложнее использовать в реальном мире, где необходимо отвечать на сигналы из окружающей среды, принимать решения и контролировать мелкую моторику. А вот у живых организмов все это получается прекрасно. Именно поэтому Уоррен Маккалох и Уолтер Питтс, создатели первых нейросетей, в своих разработках опирались на архитектуру нервной системы.

Живые организмы ориентируются в пространстве, учитывая сигналы, полученные от разных органов чувств: глаз, ушей, носа, языка, кожи, и положение тела в пространстве. Но роботы не справляются с этими, казалось бы, простейшими задачами и не способны реагировать на изменчивое окружение. Автоматические системы, как правило, фиксируют информацию всего от одного «органа чувств».

Преодолеть эту проблему попытались создатели системы NeuroGPR. Она обладает мультимодальными сенсорами, в том числе динамическим визуальным, а также датчиками глубины и высоты. Данные с них параллельно обрабатывает нейроморфный чип Tianjic, способный функционировать на мультимодальных гибридных нейросетях. Ученые установили эту систему на четвероногом роботе и продемонстрировали, что он может относительно точно ориентироваться и передвигаться в помещении и на улице при разном освещении. Новый мультисенсорный подход позволил достичь большей точности в оценке местности, чем с датчиками одного типа, и при этом сэкономить энергию.

В одном из материалов научного журнала Science Robotics описана концепция иерархического контроля. В идеале такие разработки могут помочь в создании бионических протезов, которые позволят человеку чувствовать все, к чему он прикасается, и выполнять более ловкие и точные действия. Алгоритм здесь строится по аналогии с тем, как происходит анализ информации и контроль движения у живых организмов. В этом робототехникам помогает технология машинного обучения human-in-the-loop. Она сочетает работу нейросети и команды людей, которые в зависимости от задачи либо обучают нейросеть, либо помогают ей строить прогнозы. Если в типичном машинном обучении этапы процесса следуют один за другим, как в каскаде, то в данной системе цикл обратной связи более быстрый, и она обновляется по мере добавления новых данных. Это позволяет создавать работающие модели, используя меньший объем данных, и получать при этом более качественные и точные прогнозы.

Принцип свободной энергии и нейроробототехника

25 лет назад японский профессор Кендзи Доя предположил, что функции мозга млекопитающих построены вокруг трех модульных подсистем обучения: мозжечок отвечает за координацию движений и управляемое, или контролируемое, обучение с учителем, базальные ядра — за обучение с подкреплением, а кора головного мозга — за неконтролируемое обучение без учителя. Работа ученого и основанные на ней теории о том, как эта комбинация позволяет нам адаптировать свое поведение под условия среды, сформировали взгляд на функции мозга как на дополняющие друг друга подсистемы.

Новые данные, по мнению авторов обзора в Science Robotics, свидетельствуют в пользу того, что контроль за нашими действиями в ответ на полученные от органов чувств данные имеет несколько уровней или слоев: от быстрых, но жестких и не вариативных нижних до медленного, но гибкого верхнего — сознательного контроля. Любопытно, что при повреждении верхних уровней нижние продолжат работать. Например, если у человека будут проблемы с памятью, он не разучится дышать, глотать или моментально отдергивать руку от горячего. На основе этих знаний Кендзи Доя предложил первую модульную архитектуру для нейросетей — модель MOSAIC, которую сейчас считают классической.

Со временем моделей функционирования мыслительных процессов стало много, и понадобилась унифицирующая теория, способная подвести их под общий знаменатель. Своеобразный аналог так называемой «теории всего» — многим она знакома если не из уроков физики, то по фильму «Вселенная Стивена Хокинга». Такой объединяющей теорией для биофизики, когнитивных наук и искусственного интеллекта стал принцип свободной энергии, пришедший из термодинамики. Свободной энергией называют верхнюю границу «меры неожиданности» события. Стремление снизить свободную энергию приписывается всем системам, которые имеют черты живого, — и единичных клеток, и целого огромного мозга, позволяя свести их описание к математическим формулам.

«Гибридная, многослойная архитектура, включая компоненты, которые минимизируют свободную энергию, может стать самым перспективным путем к пониманию мозга через физическое моделирование. Этот подход может позволить нейроробототехническим платформам генерировать сложные поведенческие последовательности, которые удивят нас… и, вероятно, и их [платформы] тоже», — считают авторы исследования Тони Прескотт и Стюарт Вилсон.

Их слова дополняют Паван Рамдья и Ауке Ян Айшперт, авторы другого обзора в том же номере: «Мы представляем вдохновленных природой роботов как чаще избегающих ошибок, умеющих самостоятельно ремонтировать себя, словно саламандра, которая отращивает конечности, и возможно, даже разделяется на несколько частей, каждая из которых продолжает функционировать, как плоские черви».

Ученые предлагают «подсмотреть у природы» не только сенсорные системы и способность обработки информации, но и умение путешествовать на тысячи километров, как животные во время миграции, навык сжиматься и растягиваться, чтобы проникнуть даже в маленькие щели, а также выдерживать сильное давление. Наделенные подобными «сверхспособностями» роботы лучше подойдут для выполнения сложных, опасных или рутинных задач: от мониторинга окружающей среды до транспортировки грузов.