Принцип максимума в задаче о быстродействии

ОПТИМИЗАЦИОННЫЙ ПОДХОД К СИНТЕЗУ СИСТЕМ УПРАВЛЕНИЯ РОБОТАМИ И РОБОТОТЕХНИЧЕСКИМИ СИСТЕМАМИ

В данном пособии приводятся основы оптимизационных подходов к синтезу систем управления роботами. Даются общие сведения об оптимальных подходах. Рассматриваются методы, процедуры и средства проектирования систем управления на основе принципа максимума и метода динамического программирования. Рассматривается метод АКОР. Приводятся примеры, даются проектные задания.

Общие сведения об оптимизационном подходе

Оптимизационный подход в теории управления является одним из самых распространенных [1 – 3]. Постановка задачи управления на основе такого подхода может быть сформулирована следующим образом.

Рассматривается математическая модель робота, описываемая уравнением

, (1.1)

где – вектор переменных состояния робота; – вектор управлений; – векторная функция, удовлетворяющая условиям существования решения системы (1.1); – время.

Требуется найти такое управление , которое при переводе робота (1.1) из начального состояния в конечное состояние обеспечивало минимум функционалу качества

. (1.2)

В зависимости от вида функционала и ограничений задачи оптимального управления можно разделить на несколько групп.

1) Задача Лагранжа, в которой критерием оптимальности является интегральный функционал вида

, (1.3)

где – дифференцируемая функция своих аргументов.

Задача (1.1), (1.3) при заданных начальных и конечных условиях и при отсутствии ограничений является классической вариационной задачей.

2) Задача Майера, в которой функционал качества задается в виде

. (1.4)

Задача Майера соответствует так называемой терминальной задаче управления, например, перемещение робота в заданное положение за заданный интервал времени.

3) Задача Больца, в которой для объекта (1.1) требуется определить управление , доставляющее экстремум функционалу вида

. (1.5)

где – так называемая терминальная часть функционала.

Задача Больца представляет собой объединение задач Лагранжа и Майера.

Среди методов синтеза оптимального управления можно выделить следующие:

– принцип максимума Понтрягина [4];

– метод динамического программирования Беллмана [5];

– метод аналитического конструирования оптимальных регуляторов (АКОР) Калмана-Летова [6];

– метод оптимизации по функционалу обобщенной работы А.А. Красовского [7].

Все перечисленные методы разработаны в 50-х – 70-х годах прошлого века и нашли широкое практическое применение.

Существует также большое число менее известных способов и методов синтеза оптимальных управлений, базирующихся на эвристических методиках или являющихся развитие одного из перечисленных методов.

Далее рассмотрим более подробно ряд базовых методов синтеза оптимального управления.

Принцип максимума Понтрягина

Рассматривается модель объекта, заданного дифференциальным уравнением (1.1). На управление накладываются ограничения вида

. (1.6)

, (1.7)

где момент времени может быть фиксирован.

Согласно принципу максимума вводится вектор вспомогательных переменных и формируется функция, называемая гамильтонианом:

, (1.8)

где – компоненты вектора модели (1.1).

Согласно принципу максимума для оптимальности системы, т.е. для получения минимума функционала (1.7) необходимо существование такого ненулевого вектора , удовлетворяющего уравнению

, (1.9)

что в любой момент времени функция H достигает максимума по управлению.

Принцип максимума дает только необходимые условия оптимальности. Установить их достаточно трудно. Поэтому на практике предполагают о достаточности этих условий из физических условий исследуемой системы.

Принцип максимума в задаче о быстродействии

Наиболее известным приложением принципа максимума является решение задачи о быстродействии, в которой функционал системы управления имеет вид:

. (1.10)

Решение данной задачи на основе принципа максимума дается следующей теоремой [8].

Теорема 1. (Принцип максимума Понтрягина). Пусть объект описывается уравнением (1.1), а на управление наложены ограничения вида (1.6). Предположим, что для заданного конечного состояния выполнено:

1. Существует оптимальный в смысле быстродействия процесс перехода их произвольной начальной точки в конечную точку .

2. Время перехода является непрерывно дифференцируемой функцией, т.е. существуют частные производные

. (1.11)

3. Время перехода имеет при вторые непрерывные производные по , а правые части уравнений (1.1) имеют первые непрерывные производные по .

Тогда если процесс , , осуществляющий перевод объекта (1.1) из состояния в состояние , является оптимальным, то существует такое нетривиальное решение системы (1.9), что для любого момента , выполнено условие максимума

, (1.12)

. (1.13)

Рассмотрим пример решения задачи об оптимальном быстродействии для объекта вида

, (1.14)

. (1.15)

Необходимо перевести объект (1.14), (1.15) из начального состояния в начало координат (0,0) за минимально возможное время.

Так как в рассматриваемом случае функция , то максимум функции Н (1.8) не зависит от постоянной составляющей. В этом случае можно рассматривать эту функцию без постоянной составляющей :

. (1.16)

Тогда согласно (1.9) из (1.16) получаем уравнения для сопряженных переменных

. (1.17)

Решая уравнения (1.17), получаем:

, (1.18)

где – постоянные интегрирования.

Т.к. функция H (1.16) зависит от управления линейно, то она достигает максимума на границах управления, т.е. при управлении, равном:

. (1.19)

Подставляя (1.8) в (1.19), получаем

. (1.20)

Из выражения (1.20) видно, что управление может менять знак только один раз. Т.е. оптимальное управление является кусочно постоянной функцией, принимающей значения +1 или -1 и меняет знак не более одного раза т.к. выражение меняет знак не более одного раза.

Таким образом, вначале управление постоянное и равно +1 или -1. Затем в момент времени управление меняет знак на противоположный. В конечный момент времени , когда система достигает нуля, управление равно нулю.

Выражение (1.20) задает только структуру управления, для нахождения управления необходимо вычислить его знак на первом интервале, момент переключения знака и момент обнуления управления .

Технология нахождения указанных параметров программного оптимального управления следующая.

1. Пусть заданы положительные начальные условия . Тогда на первом интервале управление должно быть отрицательным, т.е. . Если на первом этапе знак управления выбран неверно, то полученная в результате система уравнений не даст допустимых решений и приведенные ниже вкладки необходимо построить при другом начальном знаке управления.

Для первого интервала запишем систему (1.14)

. (1.21)

Решая систему (1.21), получаем

. (1.22)

Для второго интервала при из (1.14) получаем

. (1.23)

Решая систему (1.23), получаем

. (1.24)

Для нахождения постоянных интегрирования в решениях (1.22) и (1.24) воспользуемся начальными и конечными условиями. Так, подставляя начальные условия в (1.22), получаем

. (1.25)

В конечный момент времени , поэтому для момента времени из (1.24) получаем

. (1.26)

Подставляя постоянные интегрирования из (1.25), (1.26), перепишем выражения (1.22), (1.24) в виде

. (1.27)

. (1.28)

Так как выражения (1.27) и (1.28) являются одним решением дифференциального уравнения, то из условий непрерывности, получаем, что в момент времени решения (1.27) и (1.28) равны

. (1.29)

Решая систему (1.29), получаем искомые моменты времени и .

Пусть начальные условия равны . Подставив их в систему (1.29), получим следующие значения моментов времени и .

Проведем моделирование полученной системы управления в пакете Matlab. Файл – сценарий для моделирования имеет вид, представленный ниже.

%---------------------------------------------

clc

clear all

close all

x0=[1;1];

t1=1+0.5*(6)^(1/2);

t2=1+(6)^(1/2);

[t,x]=ode45('time_optimal1',[0 3.5],x0,[],t1,t2);

figure(1); hold on; grid on; plot(t,x(:,1));

figure(2); hold on; grid on; plot(t,x(:,2));

figure(3); hold on; grid on; plot(x(:,1),x(:,2));

%-------------------------------------------------

Вначале производится очистка экрана, переменных и закрытие графических окон.

Далее в программе задаются начальные условия и моменты переключения и снятия управления.

После этого с помощью функции ode45 решается система дифференциальных уравнений, размещенная в специальной ode-функции с именем time_optimal1.

В конце программы осуществляется построение переменных состояния и фазового портрета системы.

ode-функции с именем time_optimal1, оформляемая в отдельном файле с тем же именем, представлена ниже.

%---------------------------------------------

function y=time_optimal1(t,x,flag,t1,t2)

u=-1;

if(t>t1)

u=1;

end

if(t>t2)

u=0;

end

y=[x(2); u];

%-------------------------------------------------

В первой строке файла помещается заголовок функции, имя которой должно совпадать с именем файла и с именем, используемым при вызове данной функции. В качестве аргументов функции выступают время t, вектор переменных x, флаг flag, содержащий настройки параметров интегрирования и перечень входных параметров (в данном случае моменты t 1 и t 2).

Далее определяется оптимальное управление, как функция времени.

В конце функции задаются правые части уравнений объекта.

На рис. 1.1 – 1.3 представлены результаты моделирования оптимальной системы программного управления: переходные процессы по переменным и фазовая траектория.

Рисунок 1.1 – Переходный процесс по

Рисунок 1.2 – Переходный процесс по

На рис. 1.2 хорошо заметны моменты переключения и снятия управления. Также из результатов моделирования видно, что моделируемая система обладает некоторыми погрешностями, что связано с погрешностями интегрирования. Ошибки, присутствующие в системе управления, обусловлены тем, что используется программное управление.

Рисунок 1.3 – Фазовая траектория оптимальной системы

Рассмотрим процедуру построения фазового портрета оптимальной по быстродействию системы для рассмотренного объекта управления (1.14), (1.15).

Рассмотрим систему (1.23) при . Разделив первое уравнение (1.23) на второе, получим

. (1.30)

Решая уравнение (1.30), находим

. (1.31)

Т.е. при отрезок фазовой траектории представляет собой дугу параболы. Аналогично при , из (1.21) получаем

. (1.32)

. (1.33)

Семейство фазовых траекторий для оптимальной по быстродействию системы управления объектом (1.14) представлено на рис. 1.4.

Рисунок 1.4 – Фазовый потрет оптимальной системы

Проектное задание 1

Для объекта управления, описываемого системой (1.14), используя принцип максимума, синтезировать оптимальное по быстродействию управление для начальных условий и ограничений, заданных вариантом из табл. 1.1.

Используя приведенный пример, промоделировать полученную систему в Matlab.

Таблица 1.1 – Варианты заданий

№
1	2	3	2
2	4	2	1
3	5	3	3
4	3	3	4
5	4	1	2
6	1	5	3
7	2	6	1
8	-1	6	2
9	-2	9	3
10	-1	4	2
11	-4	1	4
12	-6	3	3
13	-7	2	1
14	-4	5	2
15	-8	-1	5
16	-1	-2	1
17	-2	-2	2

Продолжение таблицы 1.1

№
18	-3	-1	3
19	-4	-3	2
20	-6	-1	1
21	-2	-7	3
22	-5	-4	2
23	1	-2	3
24	2	-1	5
25	3	-1	6
26	5	-2	2
27	6	-8	1
28	7	-3	3
29	2	-6	2
30	4	-7	4

Дата добавления: 2021-11-30; просмотров: 29; Мы поможем в написании вашей работы!

Поделиться с друзьями:

12 3 Следующая ⇒

Мы поможем в написании ваших работ!

№
1	2	3	2
2	4	2	1
3	5	3	3
4	3	3	4
5	4	1	2
6	1	5	3
7	2	6	1
8	-1	6	2
9	-2	9	3
10	-1	4	2
11	-4	1	4
12	-6	3	3
13	-7	2	1
14	-4	5	2
15	-8	-1	5
16	-1	-2	1
17	-2	-2	2

№
18	-3	-1	3
19	-4	-3	2
20	-6	-1	1
21	-2	-7	3
22	-5	-4	2
23	1	-2	3
24	2	-1	5
25	3	-1	6
26	5	-2	2
27	6	-8	1
28	7	-3	3
29	2	-6	2
30	4	-7	4

№
1	2	3	2
2	4	2	1
3	5	3	3
4	3	3	4
5	4	1	2
6	1	5	3
7	2	6	1
8	-1	6	2
9	-2	9	3
10	-1	4	2
11	-4	1	4
12	-6	3	3
13	-7	2	1
14	-4	5	2
15	-8	-1	5
16	-1	-2	1
17	-2	-2	2

№
18	-3	-1	3
19	-4	-3	2
20	-6	-1	1
21	-2	-7	3
22	-5	-4	2
23	1	-2	3
24	2	-1	5
25	3	-1	6
26	5	-2	2
27	6	-8	1
28	7	-3	3
29	2	-6	2
30	4	-7	4

№
1	2	3	2
2	4	2	1
3	5	3	3
4	3	3	4
5	4	1	2
6	1	5	3
7	2	6	1
8	-1	6	2
9	-2	9	3
10	-1	4	2
11	-4	1	4
12	-6	3	3
13	-7	2	1
14	-4	5	2
15	-8	-1	5
16	-1	-2	1
17	-2	-2	2

№
18	-3	-1	3
19	-4	-3	2
20	-6	-1	1
21	-2	-7	3
22	-5	-4	2
23	1	-2	3
24	2	-1	5
25	3	-1	6
26	5	-2	2
27	6	-8	1
28	7	-3	3
29	2	-6	2
30	4	-7	4