Оптимальність у системах керування
оптимальність у системах керування
1. Умови оптимальності у неавтономних системах керування
У
загальному випадку неавтономної системи
права частина закону руху й підінтегральна
функція цільового функціонала залежать
явно від часу
,
тобто закон руху має вигляд:
,
(1)
а цільовий функціонал дорівнює
.
(2)
Тут
функції
і
– неперервні по сукупності змінних і
неперервно диференційовані по змінних
,
,
.
Також
вважатимемо, що момент часу
,
який відповідає початковому стану
,
відомий, а момент часу
проходження через кінцеву точку
не заданий і повинен бути знайдений,
тобто сформульована задача – це задача
з вільним часом.
Поставлена
задача може бути зведена до автономної
задачі введенням додаткової змінної
.
До закону руху при цьому додається
рівняння
,
а
до початкових умов – співвідношення
.
Тепер систему (2) можна переписати у вигляді:
(3)
а
функціонал
дорівнюватиме
,
(4)
де
(відповідно до доданого у початкову
систему рівняння).
Отже,
неавтономну
-вимірну
задачу було зведено до автономної задачі
з розширеним фазовим простором. У новій
задачі потрібно знайти оптимальну
траєкторію, що поєднує точку
розширеного фазового простору з деякою
точкою
на прямій, яка проходить через точку
паралельно осі
.
Оскільки кінцеве значення
змінної
невідоме, то нова задача – це задача з
фіксованим лівим і рухомим правим
кінцями.
Якщо
в задачі оптимального керування (3) –
(4) відомі і початковий момент часу
й кінцевий момент часу
,
то задача називається задачею з фіксованим
часом. Перетворення цієї задачі введенням
додаткового змінного приводить до
задачі з фіксованими кінцями в такому
формулюванні. Потрібно знайти керування
,
що переводить фазову точку системи (2)
зі стану
в момент часу
у стан
в момент часу
,
причому функціонал (4) набуває найменшого
значення. Зауважимо, що момент часу
попадання в точку
можна не вважати фіксованим, оскільки
в силу тотожності
попадання в точку
може відбутися тільки в цей момент часу.
Таким чином, до даної задачі можна
застосувати теорему, відповідно до якої
для одержання необхідних умов екстремуму
функціонала необхідно максимізувати
функцію Понтрягіна
,
(5)
де
– загальний вигляд функції Понтрягіна
з теореми 1, у якій не врахована додаткова,
(
)-ша
змінна. Спряжена система для цієї задачі
за умов
набуває вигляду:
(6)
Має місце така теорема.
Припустимо,
,
– оптимальний процес для задачі з
фіксованим часом. Тоді існує ненульова
вектор-функція
,
що відповідає цьому процесу, така що:
1.
Для будь-якого
функція
змінної
набуває максимального значення в точці
,
тобто:
:
.
2.
,
.
Оскільки,
як і раніше,
,
то умову 2 цієї теореми достатньо
перевірити в якій-небудь одній точці
відрізка
.
Розглянемо
випадок, коли при фіксованому
правий кінець вільний. Ця задача полягає
в тому, щоб із заданого стану
за заданий час
пройти по траєкторії з довільним кінцевим
станом за умови мінімізації цільового
функціонала. Умови трансверсальності
для цієї задачі набувають вигляду:
,
.
(7)
Для
цього випадку необхідна умова оптимальності
полягає в тому, щоб функція
досягала максимального значення для
кожного
на оптимальному керуванні
і мала місце умова (7).
2 Поняття особливого керування
На
практиці часто зустрічаються задачі
оптимального керування, у яких функція
Понтрягіна лінійно залежить від всіх
керувань або від частини з них (наприклад,
в лінійних задачах оптимальної швидкодії).
Однак у нелінійних задачах оптимального
керування (якщо функція Понтрягіна є
нелінійною по одній або декількох
фазових змінних) можлива ситуація, коли
на оптимальній траєкторії коефіцієнт
при одній з компонент вектора керування
обертається на нуль всюди на деякому
інтервалі часу, і тоді умова максимуму
функції
за
не дозволяє однозначно визначити
оптимальне керування. Ця ситуація
називається особливим режимом керування.
Дослідимо її детальніше.
Розглянемо автономну задачу оптимального керування
,
Де
;
,
,
,
,
– довільна множина з
;
– лінійний простір
кусково-неперервних на
функцій.
Крайові умови задачі мають вигляд:
,
.
Потрібно
знайти таке припустиме керування
,
що переводить систему зі стану
у стан
,
причому відповідний припустимий процес
доставляє мінімальне значення функціоналу
,
де
функції
,
неперервні по сукупності всіх змінних
і неперервно-диференційовані по змінних
.
Вважатимемо,
що функція Понтрягіна
для цієї задачі є лінійною за частиною
компонент вектора
.
Виділимо із цих компонент групу з
керувань (з тих, за якими функція
лінійна) і позначимо їх через
,
а інші
керувань зберемо у вектор
(він також може включати компоненти, за
якими функція
лінійна). За таких умов закон руху набуває
вигляду:
,
де
.
Складемо функцію Понтрягіна для даної задачі:
.
Очевидно, що
,
.
(8)
Припустимо,
що процес
разом з розв’язком
спряженої системи
,
,
(9)
задовольняє
принципу максимуму і, крім того,
припустимо, що у всіх точках деякого
інтервалу
має місце рівність
,
(10)
або, враховуючи (10),
,
,
.
(11)
Ця
ситуація означає, що коефіцієнти при
на деякому часовому відрізку дорівнюють
0, і оптимальне керування визначити
неможливо. У цьому випадку вектор
керувань
називається особливим керуванням на
відрізку
,
процес
– особливим режимом, траєкторія
– траєкторією особливого режиму, а
відрізок часу
– ділянкою особливого керування.
З
формули (11) випливає, що на ділянці
особливого режиму функція Понтрягіна
не залежить від
.
Дійсно,
:
.
Тому
в даній ситуації умова максимуму по
не дає жодної інформації про конкретні
значення керувань
.
Оскільки на ділянці особливого режиму має місце співвідношення (11), то очевидно, що
,
і т.д. Останні співвідношення разом з умовою (10) дозволяють визначити всі особливі режими.
3. Лінійна задача оптимальної швидкодії
Розглянемо лінійну задачу оптимальної швидкодії:
,
,
(12)
де
,
,
,
– числові матриці розмірності
та
відповідно.
Область
керування задачі
– замкнутий обмежений багатогранник
в
:
,
,
(13)
Якщо
для будь-якого вектора
,
паралельного будь-якому ребру
багатогранника
,
система векторів
,
,
…,
(14) є лінійно незалежною,
то багатогранник
задовольняє умові спільності положення
відносно системи (14).
Для перевірки лінійної незалежності векторів (13) достатньо перевірити, чи матриця, стовпцями якої є стовпці (12), є невиродженою, тобто
.
Перепишемо формулу (10):
,
,
де
,
–
-і
рядки матриць
і
.
Функція Понтрягіна лінійної задачі оптимальної швидкодії має вигляд:
(15)
Оскільки
перший доданок у формулі (15) не залежить
від
,
то функція
досягає максимуму за змінною
одночасно з функцією
.
Спряжена система у цьому випадку може бути записана у вигляді:
,
,
або у векторній формі
.
(16)
Позначимо через
.
З теореми 2 випливає, що якщо
– оптимальне керування, то існує такий
ненульовий розв’язок
системи (16), для якого в кожний момент
часу функція
набуватиме максимального значення за
змінною
:
.
(17)
Оскільки
система (17) з постійними коефіцієнтами
не містить невідомих функцій
і
,
то всі її розв’язки можна легко знайти,
після чого, використовуючи їх для
розв’язання задачі максимізації функції
на множині
,
знаходимо оптимальні керування
.
Для
будь-якого нетривіального розв’язання
системи (11) співвідношення (14) однозначно
визначає керування
,
причому це керування кусково стале, а
значеннями керування в точках неперервності
є вершини багатогранника
.
Точки
розриву оптимальної функції керування
відповідають зміні значення керування
і називаються точками перемикання. Якщо
– точка перемикання, то ліворуч від неї
керування має одне значення, наприклад,
,
а праворуч інше –
.
Позначимо
через
підмножину у
виду
.
(18)
Якщо
всі корені характеристичного рівняння
матриці
з (14) є дійсними, то для будь-якого
розв’язання
рівняння (18) кожна з функцій
є кусково сталою і має не більше ніж
перемикань (
– порядок системи (16)).
Керування
називається екстремальним керуванням,
якщо воно задовольняє принципу максимуму.
Для
лінійної задачі оптимальної швидкодії
з областю керування – багатогранником
керування
є екстремальним, якщо існує таке
нетривіальне розв’язання
системи (17), для якого матиме місце
співвідношення (18).
Зрозуміло,
що будь-яке оптимальне керування є
екстремальним. Тому, щоб знайти оптимальне
керування, що переводить фазову точку
зі стану
у стан
,
треба відшукати всі екстремальні
керування з цими крайовими умовами, а
потім серед них вибрати те, що здійснює
перехід за найменший час.
У
загальному випадку можуть існувати
кілька оптимальних керувань, що переводять
фазову точку зі стану
у стан
,
але якщо початок координат у просторі
керувань є внутрішньою точкою
багатогранника
,
то екстремальне керування єдине. Отже,
у лінійних задачах оптимальної швидкодії
принцип максимуму дозволяє не тільки
визначити вид оптимальних керувань,
але й одержати умови єдиності оптимального
керування.
Припустимо,
що початок координат є внутрішньою
точкою багатогранника
припустимих керувань. Якщо
і
– два екстремальних керування, що
переводять фазову точку зі стану
у стан
за час
і
відповідно, то
і
,
.
У
теоремі має місце умова
.
Теорема.
Якщо існує хоча б одне керування, що
переводить систему (17) зі стану
у стан
,
то існує й оптимальне по швидкодії
керування, що також переводить систему
з
у
.
4. Умови оптимальності у задачі з рухомими кінцями
У
задачі з рухомими кінцями або початковий
стан
,
або кінцевий стан
,
або обидва ці стани невідомі. Задані
тільки множини
і
,
що містять точки
та
.
Гіперповерхня
– це множина всіх точок
,
які задовольняють співвідношенню
,
де
– скалярна диференційована функція.
Якщо
– лінійна функція, то гіперповерхня
називається гіперплощиною і описується
рівнянням
.
(19)
Якщо
,
то гіперплощина (19) є (
)-вимірним
лінійним підпростором в
.
Будь-який
()-вимірний
підпростір
може бути заданий як множина розв’язань
лінійної однорідної системи з
рівнянь із
невідомими, матриця якої має ранг
:
.
Такий
лінійний підпростір називається
-вимірною
площиною. Множина розв’язань системи
нелінійних рівнянь
де
функції
,
…,
диференційовані і ранг матриці Якобі
цієї системи функцій дорівнює
,
є
-вимірним
гладким різноманіттям.
Задача
оптимального керування з рухомими
кінцями полягає в тому, щоб знайти таке
припустиме керування
для системи із законом руху
,
,
,
яке
переводить фазову точку з деякого,
заздалегідь невідомого, стану
на
-вимірному
різноманітті
(
)
у деякий стан
на
-вимірному
різноманітті
(
)
і надає найменшого значення функціоналу
.
Задача
оптимального керування з фіксованими
кінцями є окремим випадком цієї задачі
при
,
тобто коли різноманіття
і
вироджуються в точку.
Відсутність рівнянь, що задають початковий і кінцевий стани, приводить до того, що система необхідних умов перестає бути повною. У цьому разі для одержання відсутніх рівнянь використовують умови, що називаються умовами трансверсальності.
Умови
трансверсальності. Вектор спряжених
змінних
із принципу максимуму задовольняє умові
трансверсальності на лівому кінці
траєкторії
,
якщо вектор
ортогональний дотичній площини до
різноманіття
в точці
,
тобто
,
(20)
де
– довільний вектор, що лежить у дотичній
площини. Аналогічно формулюється умова
на правому кінці.
Якщо
,
– оптимальний процес у задачі з рухомими
кінцями
,
,
то ненульова вектор-функція
,
що існує відповідно до теореми 3,
задовольняє на кожному з кінців траєкторії
умовам трансверсальності.
Розглянемо
окремий випадок задачі з рухомими
кінцями, коли, наприклад, правий кінець
траєкторії вільний (тобто
).
Тоді умови трансверсальності зводяться
до співвідношення
.
Повний вектор спряжених змінних
визначається
з точністю до довільної сталої, зокрема,
вважають, що
(відповідно до принципу максимуму
,
)
і тоді
.