А.В.ТИМОФЕЕВ - Адаптивные роботехнические комплексы

Среди них нужно особо выделить рассматриваемый ниже оптимальный многошаговый алгоритм «с полной памятью». Этот алгоритм гарантирует точную идентификацию неизвестных параметров £, причем число его шагов не превышает размерности пространства настраиваемых параметров 1109].

Концепция дуального управления исходит, по существу, из постулата, что для эффективного управления нужно уметь идентифицировать динамическую модель РТК. Первоначально эта концепция зародилась в теории стохастического управления [101, 136]. Здесь принцип дуальности оказался особенно плодотворным, так как позволил «увязать» результаты классической теории управления с методами стохастической аппроксимации и оценивания. Важную роль дуальное управление сыграло и в становлении теории адаптивных систем.

Однако постепенно было осознано, что точная идентификация не является необходимым условием эффективного управления. Было четко установлено [101, 107, 132], что для успешного управления вовсе не требуется детально изучать динамические свойства объекта управления. На справедливость этого тезиса наводят и физиологические соображения: управляя рукой, мозг отнюдь не утруждает себя точной идентификацией массы или моментов инерции предмета, которым рука манипулирует.

Существуют и более веские доводы, свидетельствующие об ограниченности, а в ряде случаев непригодности концепции дуального управления в робототехнике. Один из них — трудоемкость и сложность осуществления точной идентификации — уже обсуждался выше. Другой связан с тем, что в ряде конкретных задач точная идентификация принципиально невозможна. К числу таких задач относятся, например, все задачи, в которых действуют неконтролируемые возмущения. В этих задачах движения РТК описываются уравнением (3.1), зависящим от постоянно действующих возмущений я (/). Для решения таких задач, особенно характерных для ГАП, приходится опираться на какие-то иные, «неидентификационные» принципы адаптации. Перейдем к рассмотрению этих принципов и реализующих их алгоритмов.

3.4. КОНЦЕПЦИЯ АЛГОРИТМИЧЕСКОГО КОНСТРУИРОВАНИЯ АДАПТИВНЫХ СИСТЕМ ПРОГРАММНОГО УПРАВЛЕНИЯ

Важнейшей чертой адаптивного программного управления является наличие некоторого алгоритма целенаправленной настройки параметров закона управления в процессе отработки ПД. По существу этот алгоритм представляет собой активный поиск недостающей информации (обучение) и коррекцию закона управления (адаптация) в соответствии с новой информацией, поступающей от системы «очувствления» РТК в ходе управления. Поскольку для высококачественного управления вовсе не требуется

73

<<< [-53-] [-54-] [-55-] [-56-] [-57-] [-58-] [-59-] [-60-] [-61-] [-62-] [-63-] [-64-] [-65-] [-66-] [-67-] [-68-] [-69-] [-70-] [-71-] [-72-] [-73-] [-74-] [-75-] [-76-] [-77-] [-78-] [-79-] [-80-] [-81-] [-82-] [-83-] [-84-] [-85-] [-86-] [-87-] [-88-] [-89-] [-90-] [-91-] [-92-] [-93-] [-94-] [-95-] [-96-] [-97-] [-98-] [-99-] [-100-] [-101-] [-102-] >>>