А.В.ТИМОФЕЕВ - Адаптивные роботехнические комплексы
Среди них нужно особо выделить рассматриваемый ниже оптимальный многошаговый алгоритм «с полной памятью». Этот алгоритм гарантирует точную идентификацию неизвестных параметров £, причем число его шагов не превышает размерности пространства настраиваемых параметров 1109].
Концепция дуального управления исходит, по существу, из постулата, что для эффективного управления нужно уметь идентифицировать динамическую модель РТК. Первоначально эта концепция зародилась в теории стохастического управления [101, 136]. Здесь принцип дуальности оказался особенно плодотворным, так как позволил «увязать» результаты классической теории управления с методами стохастической аппроксимации и оценивания. Важную роль дуальное управление сыграло и в становлении теории адаптивных систем.
Однако постепенно было осознано, что точная идентификация не является необходимым условием эффективного управления. Было четко установлено [101, 107, 132], что для успешного управления вовсе не требуется детально изучать динамические свойства объекта управления. На справедливость этого тезиса наводят и физиологические соображения: управляя рукой, мозг отнюдь не утруждает себя точной идентификацией массы или моментов инерции предмета, которым рука манипулирует.
Существуют и более веские доводы, свидетельствующие об ограниченности, а в ряде случаев непригодности концепции дуального управления в робототехнике. Один из них — трудоемкость и сложность осуществления точной идентификации — уже обсуждался выше. Другой связан с тем, что в ряде конкретных задач точная идентификация принципиально невозможна. К числу таких задач относятся, например, все задачи, в которых действуют неконтролируемые возмущения. В этих задачах движения РТК описываются уравнением (3.1), зависящим от постоянно действующих возмущений я (/). Для решения таких задач, особенно характерных для ГАП, приходится опираться на какие-то иные, «неидентификационные» принципы адаптации. Перейдем к рассмотрению этих принципов и реализующих их алгоритмов.
3.4. КОНЦЕПЦИЯ АЛГОРИТМИЧЕСКОГО КОНСТРУИРОВАНИЯ АДАПТИВНЫХ СИСТЕМ ПРОГРАММНОГО УПРАВЛЕНИЯ
Важнейшей чертой адаптивного программного управления является наличие некоторого алгоритма целенаправленной настройки параметров закона управления в процессе отработки ПД. По существу этот алгоритм представляет собой активный поиск недостающей информации (обучение) и коррекцию закона управления (адаптация) в соответствии с новой информацией, поступающей от системы «очувствления» РТК в ходе управления. Поскольку для высококачественного управления вовсе не требуется
73
