С.Л. Блюмин, А.М. Шмырин, О.А. Шмырина
O v, x [a1] = {a 3}
a4
a1 a3
O v, x[a 2] = {a 3}
a5
O v, x [a 3] = {a1, a 2...
18 downloads
172 Views
1MB Size
Report
This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form
С.Л. Блюмин, А.М. Шмырин, О.А. Шмырина
O v, x [a1] = {a 3}
a4
a1 a3
O v, x[a 2] = {a 3}
a5
O v, x [a 3] = {a1, a 2 , a 4 , a 5 , a 6} a2
a6
Липецк 2006
M
O v , x[a 6] = {a 3, a 4 , a 5}
Липецкий государственный технический университет
С.Л. Блюмин, А.М. Шмырин, О.А. Шмырина
БИЛИНЕЙНЫЕ ОКРЕСТНОСТНЫЕ СИСТЕМЫ
Липецк 2006
ББК 22.18 УДК 519.854 Б712
Блюмин, С.Л. Билинейные окрестностные системы [Текст]: монография / С.Л. Блюмин, А.М. Шмырин, О.А. Шмырина.- Липецк: ЛГТУ, 2006.-131c. ISBN 5-88247-261-X В монографии представлено решение актуальной задачи введения в рассмотрение и систематического исследования нового класса моделей билинейных окрестностных систем, представляющих простейший вид нелинейных окрестностных моделей, объединяющих в себе особенности билинейных дискретных сосредоточенных и линейных окрестностных моделей, обеспечивающих гибкость структуры связей между подсистемами объекта. Для этого класса систем решены задачи идентификации и управления. Издание предназначено для научных работников и специалистов в области прикладной математики, систем искусственного интеллекта, занимающихся вопросами проектирования автоматизированных систем управления, а также студентам и аспирантам соответствующих направлений подготовки и специальностей. Табл. 4. Ил.20. Библиогр.: 110 назв. Рецензенты: заведующий кафедрой математического анализа, алгебры и геометрии Липецкого государственного педагогического университета А.С. Калитвин, д. ф.-м. н., проф.; заведующий кафедрой информатики Липецкого государственного технического университета Ю.И. Кудинов, д. т. н., проф. ISBN 5-88247-261-X
© Группа авторов:
С.Л. Блюмин, А.М. Шмырин, О.А. Шмырина, 2006 ©Липецкий государственный технический университет, 2006
3
ВВЕДЕНИЕ При разработке моделей сложных пространственно-распределенных систем возникает проблема выбора адекватной структуры математической модели. Проблема моделирования и управления такими объектами связана как с распределенностью системы, так и с наличием нелинейных связей между подсистемами. Ранее были введены линейные окрестностные модели [20], обобщающие как классические линейные дискретные модели, так и многоразмерностные, дискретно-аргументные и др. Окрестностные модели обеспечивают гибкость при описании структуры и характера связей по состоянию и входу сложного объекта. Однако линейный характер этих моделей не учитывает всей сложности реальных связей между подсистемами. Простейшим классом нелинейных моделей, непосредственно обобщающих линейные, являются билинейные, допускающие в простом варианте наличие произведения состояния на управление и линейные члены с состоянием и управлением, а в более общем случае – наличие и всех квадратичных слагаемых. В связи с этим актуальной является разработка нового класса билинейных окрестностных
моделей,
обобщающих
линейные
окрестностные
и
традиционные билинейные дискретные модели, допускающих неоднозначность трактовки характера переменных, отличающихся гибкостью описания с помощью окрестностей (шаблонов соседства) структуры связей между узлами системы по состоянию и входу и наличием выражений с произведением состояния на управление, что обеспечивает переменную динамическую структуру модели и позволяет улучшить управление объектом. Целью монографии является разработка и исследование нового класса билинейных окрестностных моделей, методов смешанной идентификации и управления для аэрационных систем цеха очистки сточных вод. В первой главе анализируется состояние проблем идентификации и управления линейными и нелинейными дискретными системами; дано
4
обоснование
разработки
класса
билинейных
окрестностных
моделей,
развивающих и расширяющих известные классы окрестностных линейных и классических билинейных моделей; поставлена задача параметрической идентификации и смешанного управления применительно к билинейным окрестностным системам, разработки модели ЦОСВ, критерия качества работы объекта и определения оптимальных режимов работы объекта. Во второй главе содержится постановка задачи параметрической идентификации дискретных билинейных окрестностных моделей; введен квадратичный критерий идентификации; разработаны алгоритмы линеаризации билинейных окрестностных систем; разработан алгоритм параметрической идентификации билинейных окрестностных систем; предложен адаптивный алгоритм идентификации билинейных окрестностных систем. В третьей главе рассмотрена постановка задачи смешанного управления билинейными окрестностными системами, разработаны алгоритмы смешанного управления, оптимального смешанного управления и допустимого смешанного управления билинейными окрестностными системами. В четвертой главе приведено описание цеха очистки сточных вод как объекта управления; оценена информативность переменных состояния и управления цеха очистки сточных вод (ЦОСВ); разработана методология двухуровнего управления распределенными системами, в которой классические модели могут связывать параметры в пределах одного узла (или укрупненного узла), а основной моделью является билинейная окрестностная; синтезированы математические модели оценки качества очистки сточных вод; построены линейная и билинейная окрестностные модели ЦОСВ; решена задача смешанного управления для цеха очистки сточных вод; синтезированы модели управления
аэрационными
сооружениями
на
основе
классических
и
окрестностных моделей с учётом энергозатрат на примере отделения аэротенков; предложен комбинированный критерий качества, учитывающий смешанный
характер
управления;
разработан
алгоритм
оптимального
смешанного управления аэротенком; проведено сравнение линейных и
5
нелинейных классических, линейных и билинейных окрестностных моделей пространственно-распределенных систем; получены оптимальные значения технико-экономических показателей работы ЦОСВ; предложено применение окрестностных систем для моделирования характеристик полимербетона. Предлагаемые математические модели и методы реализованы в виде комплекса программных продуктов, написанных на встроенном языке Mathcad, которые могут использоваться в качестве функциональных модулей при решении задач исследования, моделирования и управления промышленными объектами, в частности, цехом очистки сточных вод и отделением аэротенков.
6
1. СОСТОЯНИЕ ПРОБЛЕМЫ ИДЕНТИФИКАЦИИ И УПРАВЛЕНИЯ ДИСКРЕТНЫМИ БИЛИНЕЙНЫМИ СИСТЕМАМИ В данной главе рассмотрено состояние проблемы идентификации и управления классическими дискретными билинейными системами [105]. Обоснована
необходимость
разработки
моделей,
развивающих
и
расширяющих классы линейных окрестностных и дискретных билинейных моделей. Введен новый класс дискретных окрестностных билинейных моделей. Для таких систем предложена постановка задачи параметрической идентификации и новая постановка задачи управления, обобщающие известные. 1.1. Проблема математического описания дискретных билинейных объектов управления В работах [9,10,20] введен класс дискретных окрестностных линейных моделей, названных симметричными, обобщающих известные линейные дискретные сосредоточенные (1.1) и распределенные динамические системы (1.2): x[t + 1] = A ⋅ x[t ] + B ⋅ v[t ], x[0] = x 0, y[t ] = C ⋅ x[t ] + D ⋅ v[t ], t = 0,1,2K,
(1.1)
x[ s + 1] = A ⋅ x[ s ] + B ⋅ v[ s ], x[0] = x 0 y[ s] = C ⋅ x[ s ] + D ⋅ v[ s ], s = 0,1,2K,T .
(1.2)
где x[t ] – вектор переменных состояния; v[t ] – вектор входных (управляющих) воздействий; y[t ] – вектор выходных переменных; A, B, C , D – матрицы параметров, s – координата в дискретном (клеточном) пространстве S . Модели (1.1) и (1.2), а также ряд других дискретных моделей [6,20] (на рис. 1.1 представлены примеры простейших окрестностных систем) не позволяют адекватно моделировать сложные дискретные системы, имеющие многочисленные, произвольной структуры связи между подсистемами с аргументом произвольной природы и размерности.
7
Дискретно-временные:
1Д-дискретно-пространственные:
x[t ] =ϕ (x[t − 1], v[t ]).
x[ s] =ϕ (x[s − 1], v[s ]).
1Д-дискретно-пространственно-временные: x[t , s ] =ϕ (x[t − 1, s ]x[t , s − 1], v[ s1 , s 2 ]). 2Д-дискретно-пространственные однонаправленные: x[ s1 , s 2 ] =ϕ ( x[ s1 − 1, s 2 ], x[ s1 , s 2 − 1], v[ s1 , s 2 ]). (s1,s2) (s1-1,s2) (s1,s2-1)
2Д-дискретно-пространственные двунаправленные: x[ s1 , s 2 ] =ϕ ( x[ s1 − 1, s 2 ], x[s1 + 1, s 2 ], x[ s1 , s 2 − 1], x[ s1 , s 2 + 1], v[ s1 , s 2 ]). (s1,s2+1)
(s1-1,s2)
(s1+1,s2)
(s1,s2-1)
2Д-дискретно-пространственно-временные (клеточные автоматы): x[t ; s1 , s2 ] = ϕ ( x[t − 1, s1 , s 2 ]x[t − 1, s1 − 1, s2 ], x[t − 1; s1 + 1, s2 ], x[t − 1; s1 , s2 − 1], x[t − 1; s1 , s 2 + 1], v[t ; s1 , s 2 ]). (t; s1, s2) (клетка s в момент t)
(t – 1; s1, s2 – 1)
(t – 1; s1 + 1, s2) (t – 1; s) = (t –1; s1, s2)
(t – 1; s1 – 1, s2)
(t – 1; s1, s2 + 1)
Рис. 1.1. Примеры простейших окрестностных систем
8
Обобщением названных моделей является симметричная линейная окрестностная модель [20] ∑ Ω[a,α ]x[α ] = ∑ Ξ[a, β ]v[ β ] , α ∈ O x [a] β ∈ O v [a]
(1.3)
где v[a]∈ R m , x[a] ∈ R n –– вход и состояние в узле
a системы,
Ξ[a, β ]∈ Rc×m ,
Ω[a,α ]∈ Rc×n –– матрицы–параметры, O x [a ], O v [a ] – окрестность узла a по состоянию и входному воздействию соответственно; a ,α , β ∈ A , A = {a1,K, a N } – конечное множество значений дискретного аргумента системы, A = N . Дальнейшим развитием симметричной модели, учитывающим выходы системы, является смешанная модель, имеющая вид [20] ∑ Ξ[a,α ]v[α ] +
α∈O v[a ]
∑ Ω[a, β ]x[ β ] +
β ∈O x[ a ]
∑ Γ[a, γ ] y[γ ] = 0 ,
γ ∈O y[ a ]
(1.4)
где v[a]∈ R m , x[a]∈ R n , y[a]∈ R q –– вход, состояние и выход в узле a ;
Ξ[a, β ]∈ Rc×m ,
Ω[a,α ]∈ R c×n ,
Γ[a, γ ]∈ R c×q
––
постоянные
матрицы–
параметры; O v [a], O x [a], O y [a] –– окрестности по входу, состоянию и выходу; a,α , β , γ ∈ A , A = {a1, a 2 ,K, a N } – множество значений аргумента смешанной системы, A = N . Так как реальные процессы в большинстве случаев носят нелинейный характер, то оправданным является рассмотрение нелинейных моделей, обеспечивающих более адекватное описание объекта. Общий вид нелинейной модели следующий: F ( x , v, y ) = 0 , где x - состояние; v - вход; y - выход. В соответствии с [59], любая аналитическая причинная система представима в виде ряда Вольтерра ∞ i
i
i =0 k =1
r =1
y[n ] = ∑ ∑ hi [n, m1 ,..., mi ] ∏ x[mr ] или в дискретном варианте
(1.5)
9 t
t
y[t ] = h0 + ∑ h1[τ ] u [t − τ ] + ∑ τ =0
t
∑ h2 [τ 1 ,τ 2 ]u [t − τ 1 ]u [t − τ 2 ] + K
τ 1 = 0τ 2 = 0
t
t
n
τ1 =0
τ n =0
i =1
+ ∑ K ∑ hn [τ 1 ,K ,τ n ] ∏ u [t − τ i ] + K ,
(1.6)
где функции h1[τ ], h2 [τ1 ,τ 2 ],K, hn [τ 1 ,K,τ n ] - ядра Вольтерра, и может быть приближена его конечным отрезком, в частности классической билинейной системой. Поэтому нелинейные системы могут быть приближены с той или иной степенью точности дискретными билинейными системами. В свою очередь, обобщением классических дискретных билинейных систем являются дискретные билинейные окрестностные системы. Таким
образом,
моделирующим
наиболее
различную
простым
структуру
классом
связей
нелинейных систем,
между
подсистемами
с
аргументом произвольной природы и размерности, являются дискретные билинейные окрестностные системы. В работе предложены модели билинейных дискретных окрестностных систем [11-16, 20] вида (на рис. 1.2. представлен синтез билинейных окрестностных моделей ) r
∑
r
∑ wi [a,α ]u i [α ] + ∑
i =1 α∈Oui [a ]
Здесь a,
∑ wi [a,α , β ]u i [α ] ⋅ γ i [ β ] = 0. i =1 α∈Oui [ a ] β ∈Oγ i [ a ]
Ou i [a], Oγ i [a]
окрестности
(1.7)
ui , γ i
по
элемента
a ∈ A = {a1 ,..., a N }, ui ,γ i ∈U , wi [a,α ], wi [a,α , β ](i = 1, r ) - некоторые матрицы.
В частности, можно положить u = x, γ = v . В качестве примера «окрестностного» определения, предшествующего основным определениям из [10,20], напомним определение марковского случайного поля из [20] в используемых далее обозначениях. Пусть A – носитель – конечное или счетное множество значений системного
аргумента,
не
наделенное
какой-либо
структурой,
кроме
используемой далее окрестноcтной структуры; пусть a ,b,K элементы из A ;
10 Линейные сосредоточенные модели (1)
Билинейные дискретные сосредоточенные модели (2)
Линейные окрестностные модели (3)
Билинейные окрестностные модели
Традиционные линейные нестационарные сосредоточенные модели: x[t ] = A[t ]x[t − 1] + B[t ]v[t ], x[t 0 ] = x 0 y[t ] = C [t ]x[t ], t ∈{t , t + 1, t + 2,...}, далее: 0 0 0 x[t ] + w x [t , t − 1]x[t − 1] + wv [t , t ]v[t ] = 0 .
(1)
Билинейная дискретная сосредоточенная модель: x[t ] + w x [t , t − 1]x[t − 1] + wv [t , t ]v[t ] + w xv [t ; t − 1; t ]x[t − 1]v[t ] = 0 .
(2)
Линейная окрестностная распределенная модель: ∑ w x [a,α ]x[α ] + ∑ wv [a, β ]v[β ] = 0 , α∈Ox [a ] β ∈Ov [a ]
(3)
O x [ a ], O v [ a ] - окрестности по x, v элемента a , a ∈ A = {a1 ,..., a N } , A = N ; x[ a ]∈ R n , v[ a ]∈ R m - состояние и выход в узле a системы;
w x [a,α ]∈ R c×n , wv [a, β ]∈ R c×m , w xv [a,α , β ] = (w1xv ...wmxv )∈ R c×n×m . Пример графа окрестностной модели O v [a1] = {a 3} ,
a4
a1 a3
Ov [a 2] = {a3},
a5
Ov[a3] = {a1, a 2 , a 4 , a5 , a6} , a2
∑
α∈Ox [ a ]
M
a6
w x [a,α ]x[α ] +
∑
β ∈Ov [a ]
wv [a, β ]v[ β ] +
Ov[a 6] = {a3, a 4 , a5} , ∑ w xv [a,α , β ]x[α ] ⋅ v[ β ] = 0
α∈Ox [a ] β ∈Ov [a ]
Рис. 1.2. Синтез билинейных окрестностных моделей
11
x[a ] - состояние элемента a ; T , S ,K - подмножества множества A ; x[T ] совокупность состояний элементов множества T . Состояниями элементов
a∈ A являются случайные величины, так что {x[a ], a ∈ A} - случайное поле. Предполагается
заданным
согласованное
семейство
конечномерных
распределений его вероятностей, из которого, в частности, могут быть найдены условные вероятности P( x[a ] / x[ A \ a ]). Это случайное поле называется O марковским, если для каждого
a∈ A существует конечное множество
O(a ) ⊂ A \ a - окрестность элемента a - такое, что условные вероятности P ( x[a ] / x[ A \ a ]) = P( x[a ] / x[O(a )]) зависят лишь от x[a ] и x[b] при b∈ O(a ) . В [20] наряду c O(a ) используется и понятие расширенной окрестности O[a] = O (a ) U {a}. Для окрестностных структур вводится [20] “расстояние в шагах из окрестностей” между подмножествами N (a) B, C ∈ A : для любого B строится цепочка [B ]0 ⊂ [B]1 ⊂ ... ⊂ [B ]l расширенных окрестностей B ранга 0,1,...,l ,...в виде
[B]0 = B, [B]1 =
U N [b], [B ]l +1 = [[Bl ]]l = U N [b], l = 1,2 ..., b∈[B ]l
b∈B
после чего полагается r ( B, C ) = r ⇔ [B ]l I [C ]l = ∅, 0 ≤ l ≤ r , [B ]r I [C ]r ≠ ∅ . Системы, заданные на таких множествах, являются существенно нестационарными [20]. Несомненным возможность имеющих
достоинством
адекватного
окрестностных
моделирования
многочисленные,
систем
является
сложных дискретных систем,
произвольной
структуры
связи
между
подсистемами с аргументом произвольной природы и размерности. В данной работе по аналогии с линейным случаем [20] cтавятся задачи идентификации и смешанного управления:
12
1) задача параметрической идентификации билинейных окрестностных систем, в которой по известным vi , u i необходимо найти матрицы параметры wi [a,α ], wi [a,α , β ](i = 1, r ) при дополнительных условиях некоторые из матриц wi [a,α ], wi [a,α , β ](i = 1, r ) известны, некоторые wi [a,α ] = 0, wi [a,α , β ] = 0 . 2) задача смешанного управления для билинейных окрестностных систем, состоящая в нахождении неизвестных компонентов состояния
и
управления по известной их части. Исследование окрестностных систем и окрестностных моделей, как линейных, так и нелинейных, проводилось в различных направлениях [10, 20, 39].
Одно
из
направлений
связано
с
преобразованиями
билинейных
одноаргументных систем в линейные двухаргументные с использованием тензорных произведений. Основы таких преобразований заложены в [104] (см. также [5]) для случая билинейных стационарных 1D -систем и линейных однородных 2 D -систем и распространены на нестационарный (неоднородный) случай в [10] (см. [7-21], [33-36], [39], [77-100], [108]). Достоинством такой тензорной
линеаризации
является
то,
что,
в
отличие
от
других
распространенных подходов к линеаризации (например, тейлоровой или интерполяционной), она не является приближенной и позволяет сводить исследование специальных классов нелинейных систем – билинейных, …, m линейных – и общих нелинейных систем, представленных рядами Вольтерра [5, 20, 59] по этим специальным нелинейным системам, к исследованию их линейных, но многоразмерностных образов. 1.2. Связь билинейных окрестностных моделей с симметричными и смешанными окрестностными моделями Дискретная билинейная окрестностная система (1.7) обобщает известные модели дискретных систем, симметричные и смешанные системы [20] и относится к классу простейших нелинейных систем.
13
Полагая в (1.7) wi [a,α , β ] = 0, w1[a,α ] = Ω[a,α ], w2 [a, β ] = Ξ[a, β ],
u1[α ] = x[α ], u2[ β ] = v[ β ] , получаем симметричную окрестностную систему. Если же полагаем wi [a,α , β ] = 0, w1[a,α ] = Ω[a,α ], w2 [a, β ] = Ξ[a, β ], w3 [a,γ ] = Γ[a,γ ],
u1[α ] = x[α ], u2 [ β ] = v[ β ], u3[γ ] = y[γ ] , то получаем смешанную систему вида (1.4). В работе [20] было показано, что смешанная система обобщает сингулярные линейные модели, линейные сингулярные двумерные системы, линейные
комбинационные
цепи,
линейные
стационарные
дискретно-
временные динамические системы, одномерные однонаправленные линейные итеративные цепи, одномерные двунаправленные линейные итеративные цепи, модель Форназини-Маркезини, модель Россера и т.д. Так как билинейные окрестностные системы обобщают симметричные, то отсюда следует, что эти системы обобщают все названные классы линейных дискретных систем. 1.3. Методы идентификации систем управления В данном разделе рассмотрим постановку задачи идентификации для линейных и нелинейных систем, методы ее решения и исследуем возможность их применения к идентификации дискретных билинейных окрестностных систем. Термин «идентификация» появился в 60-х годах XX века. К настоящему времени теории и методам идентификации посвящено большое число работ в отечественной и зарубежной литературе, и в этом направлении разработаны свои принципы, подходы и методы [29, 30, 56, 67, 69, 101]. Под идентификацией в широком смысле понимается «получение или уточнение
по
экспериментальным
данным
модели
реального
объекта
(процесса), выраженной в тех или иных терминах (описанной на том или ином языке)» [69]. Идентификацией динамической системы (процесса) называется
14
получение или уточнение по экспериментальным данным математической модели этой системы или процесса, выраженной посредством того или иного математического аппарата [69]. Идентификацией по [30] является «определение параметров и структуры математической модели, обеспечивающих наилучшее совпадение выходных координат модели и процесса при одинаковых входных воздействиях». Классификация задач идентификации может осуществляться по целому ряду признаков: идентифицируемый объект или процесс; класс модели, в терминах которой осуществляется идентификация; условия наблюдения и возбуждающие процесс воздействия и т.д. [69]. По Эйкхоффу [101], задача идентификации формулируется следующим образом:
по
результатам
наблюдений
над
входными
и
выходными
переменными системы должна быть построена оптимальная в некотором смысле модель, т.е. формализованное представление этой системы. Отсюда видна преемственность между задачей идентификации и общей схемой установления закономерностей по результатам наблюдений. В зависимости от априорной информации об объекте управления различают задачи идентификации в узком и широком смысле [101]. Задача идентификации в узком смысле состоит в оценивании параметров и состояния системы
по
результатам
наблюдений
над
входными
и
выходными
переменными, полученными в условиях функционирования объекта. При этом известна структура системы и задан класс моделей, к которому данный объект относится. Априорная информация об объекте достаточно велика. Априорная информация об объекте при идентификации в широком смысле отсутствует или очень бедная, поэтому приходится предварительно решать большое число дополнительных задач [101]: выбор структуры системы и задание класса моделей, оценивание степени стационарности и линейности объекта и действующих переменных, оценивание степени и формы влияния входных переменных на выходные, выбор информативных переменных и другие.
15
В [109, 110] идентификацией называется “определение по входу и выходу системы из определенного класса систем, которой испытываемая система эквивалентна”. Следуя данной формулировке, необходимо определить класс систем,
класс
входных
сигналов
и
понятие
“эквивалентности”.
Эквивалентность часто понимается в смысле какого-либо критерия ошибки или функции потерь, являющейся функционалом от выхода объекта и выхода модели E = E ( y , y M ). Процедура идентификации включает следующие три этапа [20]: 1.
Выбор структуры модели на основании имеющейся априорной информации об исследуемом процессе и некоторых эвристических соображений.
2.
Выбор критерия близости объекта и модели, основанный на специфике задачи.
3.
Определение
параметров модели,
оптимальных с
точки зрения
выбранного критерия близости. Поскольку задача идентификации сводится, как упомянуто выше, к определению структуры модели объекта и восстановлению ее параметров, в качестве основы для классификации задач и методов идентификации обычно выбирают степень предварительной изученности объекта. По наличию априорной информации все объекты могут быть разделены на следующие группы [30]: 1) объекты, для которых описывающие их уравнения известны вплоть до приблизительных значений коэффициентов; 2) объекты, для которых описывающие их уравнения известны, а численные значения коэффициентов неизвестны; 3) объекты, для которых конкретный вид уравнения и численные значения параметров неизвестны, но имеется некоторая априорная информация (например, объект линеен, и переходные процессы в нем носят монотонный характер; объект содержит гладкие нелинейности и т.д.);
16
4) объекты, относительно которых отсутствуют какие-либо априорные сведения («черный ящик»). При этом провести четкую границу между любой парой смежных групп довольно затруднительно. Для объектов первой группы при известной структуре уравнения задача идентификации часто сводится к уточнению начальных значений параметров и отслеживанию их с помощью адаптивных моделей [29, 50, 101]. Для объектов второй группы процесс идентификации представляет собой восстановление неизвестных параметров модели известной структуры. Структура модели у объектов третьей группы выбирается на основании имеющейся априорной информации и может быть уточнена в процессе проведения эксперимента, после чего решается задача восстановления параметров. Таким образом, все методы идентификации объектов первых трех групп, как правило, являются параметрическими, т.е. сводятся к определению параметров заранее известной или выбранной из каких-либо соображений модели. На практике часто встречаются случаи, являющиеся переходными между третьей и четвертой группами, когда, вследствие недостатка априорной информации об объекте, идентификация осуществляется на основе прямых методов, т.е. определяются дискретные значения динамических характеристик в конечном числе точек путем подачи пробных сигналов специальной формы (активный
эксперимент)
или
решаются
соответствующие
уравнения
статистической динамики (пассивный эксперимент). Применение прямых методов идентификации целесообразно также для объектов
типа
“черный ящик”.
Для
этих объектов
возможна
также
параметризация на основе принятия какой-либо гипотезы, проверяемой в процессе эксперимента. Данная ситуация распространена чаще всего. Введенные дискретные билинейные окрестностные модели по наличию априорной информации можно отнести к промежуточному типу между первым
17
и вторым пунктом данной классификации. Структура и уравнение данной модели (1.7) считаются известными, а некоторые коэффициенты матрицпараметров wi могут быть заданными. В подходе, согласно Гропу [29], методы идентификации связаны с классификацией систем. Во-первых, различают линейные и нелинейные системы, причем линейные системы легче идентифицировать, поскольку они обладают
свойствами
стационарные
и
суперпозиции.
нестационарные
(к
Во-вторых, последним
различают относятся
системы
системы
с
изменяющимися во времени параметрами). В-третьих, системы делят на дискретные и непрерывные. В-четвертых, различают методы идентификации для систем с одним или несколькими входными воздействиями. Это деление целесообразно
ввиду
того,
что
методы
идентификации
значительно
упрощаются, если на систему подается одновременно лишь одно входное воздействие. Пятый вариант классификации предусматривает возможность идентификации детерминированных или стохастических процессов. Шестой вариант – классификация методов идентификации в зависимости от наличия априорной информации о системе. Другая классификация методов идентификации осуществляется по следующим признакам [20, 39]: 1) по способу представления характеристик объекта: -во временной области; -в частотной области; 2) по методу проведения эксперимента на объекте: -активные; -пассивные; -смешанные, при которых на объект подаются специальные пробные сигналы малой интенсивности, не нарушающие его нормальной работы; 3) по принятому критерию подобия объекта и модели; 4) по методам восстановления неизвестных параметров объекта:
18
-неитерационные (метод наименьших квадратов, корреляционный анализ и т.д.); -итерационные (методы теории статистических решений, стохастической аппроксимации и т.д.); 5) по наличию сравнения полученного математического описания с объектом: -разомкнутые; -замкнутые. В основу перечисленных способов классификации положена по существу степень сложности идентификации. Методы идентификации, для которых требуется меньше априорной информации, обладают меньшей точностью и большей скоростью сходимости при большей математической сложности и времени вычислений по сравнению с методами, использующими больший объем
априорной
информации.
Аналогично
методы,
применяемые
к
нелинейным или нестационарным процессам, более сложны и зачастую менее точны, чем методы идентификации, рассчитанные на линейные стационарные процессы [20]. Отчасти по этой причине в работе рассмотрен также метод тензорной линеаризации полилинейной системы. Среди статистических методов идентификации следует выделить метод наименьших квадратов, связанный с использованием квадратического критерия ошибки J = ∑ jj ==1n ( y ( j ) − y M ( j )) 2 , где n - размерность выхода модели объекта. Понятно, что ни один из упомянутых многочисленных методов идентификации не годится для идентификации всех видов систем. Каждый из них имеет свою область или области применения. Из приведенного обзора методов идентификации [30, 69, 101] следует, что введенный в разделе 1.1 данной главы класс дискретных билинейных окрестностных
моделей
требует
разработки
методов
параметрической
идентификации при частичном задании коэффициентов модели. Эти методы основаны на тензорной линеаризации и сведении билинейных моделей к
19
двухаргументным или применении адаптивных методов. Указанные методы описаны в главах 2, 3. 1.4. Методы синтеза алгоритмов управления В данном разделе рассмотрим известные постановки и алгоритмы задач управления. Процессы, происходящие в исследуемом объекте, протекают различным образом в зависимости от конкретного воздействия на них управляющей стороны. При этом естественным является стремление выбрать оптимальное управляющее воздействие, т.е. наилучшее по сравнению со всеми другими возможными способами управления [3]. Аналогично, в соответствии со [56], управление состоит в том, чтобы, оказывая на объект воздействие, изменять протекающие в нем процессы для достижения определенной цели. Постановки задач управления можно разделить на две большие группы: прямые и обратные задачи. Основными можно назвать две из них: прямая задача и задача управления как важнейшая из обратных задач. В прямой задаче по известным входам v[a ] и начальному состоянию x[0] определяются неизвестные состояния системы x[a ] и ее выходы y[a ] , где a∈ A - аргумент системы. В задаче управления по заданным состояниям x[a ] и выходам y[a ] определяется необходимое управление - входы v[a ] . В обратной задаче регулирования [56] требуется выбрать такое управление v[a ] , которое реализует близость основных координат состояния объекта к заданным xk [a ] . Важнейшая обратная задача управления, задача отыскания оптимальных управлений, формулируется следующим образом [45, 69]. В начальный момент времени t = t 0 положение системы в пространстве состояний определяется вектором x[t 0 ] = x0 . Требуется найти такие управления u1,..., u m , которые
20
переводят систему в точку x[t1 ] = x1 , при этом на траектории движения должно реализоваться наименьшее возможное значение функционала
1 J [u ] = ∑ [x[t ] − x1[t ]]2 . 2
(1.8)
В современной теории оптимального управления разработаны различные процедуры решения сформулированной задачи на основе принципа максимума, динамического программирования, метода функций Ляпунова, классического вариационного исчисления [69]. В результате применения этих методов отыскиваются оптимальные управляющие функции и траектории движений, на которых реализуются экстремальные значения оптимизируемых функционалов. При адаптивном управлении [56, 69] представляющем собой обратную задачу определения управления u[a ] в условиях априорной неопределенности описания объекта, параметры системы заранее неизвестны или изменяются в процессе работы системы. Частным случаем постановок задач регулирования является задача стабилизации, в которой требуется обеспечение постоянства координат состояния системы. Стабилизация билинейных систем на плоскости посредством постоянных релейных управлений рассмотрена в [51, 52]. Для билинейной системы со скалярным управлением
x& = Ax + uBx ,
(1.9)
где u ∈ R, x ∈ R 2 ; матрицы A и B постоянные, подбирается такое управление u , при котором точка x = 0 представляет собой асимптотически устойчивое положение равновесия системы во всей плоскости. При этом для двумерных систем типа (1.9) со скалярным выходом y показано, что задача наблюдения (т.е. задача восстановления фазового вектора x ) может быть сведена к задаче наблюдения для системы с вырожденной матрицей билинейности (т.е. rank B = 1 ). Для таких систем построены асимптотические наблюдатели, а на их основе синтезированы алгоритмы стабилизации двумерных систем по выходу.
21
В литературе рассматриваются вопросы управляемости систем. Система называется вполне управляемой, если она может быть переведена из произвольного начального состояния x0 ∈ R n , x0 ≠ ∞ в произвольное заданное конечное
состояние
x f ∈ Rn , x f ≠ ∞
за
конечное
время
с
помощью
допустимого управления [101]. Для управляемости [3] линейных стационарных систем вида
x (t ) = Ax(t ) + Bu(t ), x ∈ R n , u ∈ R m ,
(1.10)
где An×n и B m×m - постоянные матрицы, необходимо и достаточно, чтобы ранг матрицы K = ( B, AB, A 2 B,..., A n−1B) был равен n (размерности вектора x ). Для
управляемости
системы
(1.10)
при
наличии
ограничений
u (t ) ≤ C , C > 0 необходимо и достаточно, чтобы ранг матрицы управляемости был равен n и, кроме того, чтобы все собственные значения матрицы A лежали на мнимой оси. Для
управляемости
линейных
нестационарных
систем
x (t ) = A(t ) x (t ) + B(t )u (t ) достаточно, чтобы нашлась точка на [t 0 , t ] , в которой ранг матрицы K = ( K1 ,..., K n ) равен n ; здесь K1 (t ) = B (t ), K i (t ) = A(t ) K i−1 (t ) −
dK i−1 (t ) . dt
(1.11)
Теория управляемости нелинейных систем разработана не достаточно полно. Задача управляемости в окрестности заданной траектории получаемой при заданном
u = u 0 (t ),
x0 (t ),
может быть приведена к задаче
управляемости линейной нестационарной системы путем линеаризации [50]. Для уравнением
нелинейных
систем
с
x[k + 1] = f [ x[k ], u[k ], k ],
дискретным задачи
временем,
управляемости
описываемых в
принципе
приводятся к задачам разрешимости функциональных уравнений [69]. В работе [102] исследуются вопросы управляемости однородных и неоднородных дискретных билинейных систем.
22
Дискретная билинейная система определяется разностным уравнением вида
x k +1 = ( A + u k B ) x k + cu k , k = 0,1,2,...,
(1.12)
где x k ∈ R n - состояние системы в момент k , u k ∈ R1 - управление в момент k , c∈ R n - ненулевой вектор, An×n , B n×n - действительные постоянные матрицы и ранг [ B ÷ c] = 1 . Показано, что для однородной управляемой билинейной системы x k +1 = ( A + u k B) x k , k = 0,1,2,...,
(1.13)
матрица Γ( A, c ) = [c, A,K, An−1c] является неособенной. Если неоднородная билинейная система (1.12) является управляемой в R n , то Γ( A, c ) будет неособенной матрицей. К необходимым условиям полной управляемости билинейных систем можно отнести следующие. 1.Существуют значения управления u + и u − такие, что действительные части собственных значений матрицы системы, соответственно, положительны и отрицательны, и такие, что равновесные состояния xe (u + ), xe (u − ) содержатся в связных компонентах равновесного множества. 2. Для любого x из равновесного множества с равновесным управлением u e ( x) ∈ u , таким, что f ( x, u e ( x)) = 0, существует V ∈ R m такое, что g не лежит ни в каком инвариантном пространстве размерности не более чем (n − 1) матрицы E , где m
E = A + ∑ u k ( x ) Bk
(1.14)
k =1
и m
m
l =1
k =1
g = Cv − ∑ vl [ Bl ( A + ∑ u k Bk ) −1 Cu ].
(1.15)
23
Однако, по мнению Молера [105], практическое применение этого критерия
к
общим
билинейным
системам
представляется
весьма
затруднительным. Переменная структура билинейных систем позволяет им быть более управляемыми, чем линейные системы, что как раз часто и требуется от более точной модели. Молер [105] показывает, что линейная система не является вполне управляемой при ограниченном управлении, также и не каждая билинейная система вполне управляема. В работе [20] рассмотрен метод смешанного управления для линейных симметричных окрестностных систем, позволяющий определять неизвестные координаты управления и состояния по известной их части. Рассмотренные в данном разделе методы управления нелинейными дискретными распределенными и сосредоточенными объектами показывают, что для введенных в разделе 1.1. дискретных билинейных окрестностных моделей необходима разработка новых алгоритмов управления. Данные алгоритмы приведены в главе 3. 1.5. Прикладные задачи В
предыдущих
билинейные
разделах
данной
главы
введены
дискретные
окрестностные системы как обобщение симметричных
смешанных линейных дискретных систем и как простейший класс нелинейных
дискретных
систем.
Обсуждены
возможные
методы
идентификации и управления такими системами. Отмечено, что дискретные билинейные окрестностные системы обеспечивают произвольную структуру связей между подсистемами с аргументом произвольной природы и размерности, а также позволяют более адекватно моделировать сложные дискретные системы по сравнению с линейными системами. Примером систем со сложной окрестностной структурой и нелинейными связями между
подсистемами
могут
служить
объекты
металлургического
24
производства и объекты предприятий по очистке сточных вод, в частности цех очистки сточных вод (ЦОСВ). Современные очистные сооружения, предназначенные для очистки городских
сточных
промышленных
вод,
стоков,
состоящих являются
из
хозяйственно-бытовых
сложными,
и
многостадийными,
распределёнными системами. В свете возрастающих технико-экономических и экологических требований актуальными для данных систем являются задачи определения параметров тех узлов, для которых измерение является дорогим
и
затруднительным,
определение
параметров
входного
и
промежуточных участков по заданным инструкцией параметрам выхода из системы (норма на сброс в реку), определение параметров промежуточных участков по заданным экспертами (инструкцией) значениям параметров на входе и выходе из системы. Сооружения системы включают в себя подсистемы механической, биологической очистки, обеззараживания и обработки осадка. Механическая очистка
представлена
решётками,
песколовками,
усреднителями,
первичными отстойниками; биологическая – аэротенками, вторичными отстойниками; обеззараживание – контактными резервуарами; обработка осадков - илоуплотнителями, иловыми площадками, цехом механического обезвоживания. В наиболее простом варианте, допускающем измерение параметров, систему рассматривают как совокупность четырёх узлов: «вход на очистные сооружения», «после усреднения», «после механической очистки», «сброс в реку». Наличие большого числа факторов, влияющих на результаты очистки сточных вод, приводит к тому, что в настоящее время решение задач по управлению
работой
ЦОСВ
базируется
на
опыте
и
интуиции
квалифицированных работников. Отсутствие инструмента для анализа
и
синтеза управленческих решений, выдачи оптимальных режимов работы производственных подразделений ЦОСВ приводит к снижению качества
25
очистки сточных вод и в конечном итоге к экономическим потерям предприятия, загрязнению окружающей среды. В рамках действующей системы решения задач планирования, анализа и управления технико-экономическими показателями работы ЦОСВ задачу управления показателями позволяет решить создание математических моделей
цеха
в
целом
и
отдельных
подразделений,
разработка
автоматизированной системы управления работой ЦОСВ. Можно дать следующую формулировку задачи данной работы: для введенного класса дискретных окрестностных билинейных систем разработать
методы
идентификации,
методы
синтеза
смешанного
управления, получить билинейную окрестностную модель и оптимальные значения технико-экономических показателей ЦОСВ. В соответствии с приведенной формулировкой задачи в монографии поставлены следующие задачи исследования: 1) разработать алгоритмы тензорной линеаризации, параметрической и адаптивной идентификации билинейных окрестностных моделей; 2)
определить
критерий
качества
оптимального
смешанного
управления для билинейных окрестностных систем; 3) разработать алгоритм смешанного управления для данного класса моделей; 4) разработать метод квазиоптимального смешанного управления для билинейных окрестностных систем; 5) построить билинейные окрестностные модели отделения аэротенков и цеха очистки сточных вод АО «НЛМК»; 6)
получить
оптимальные
показателей цеха очистки сточных вод.
значения
технико-экономических
26
2. РАЗРАБОТКА АЛГОРИТМОВ ИДЕНТИФИКАЦИИ ДИСКРЕТНЫХ БИЛИНЕЙНЫХ ОКРЕСТНОСТНЫХ СИСТЕМ В главе 1 приведен обзор моделей дискретных симметричных, смешанных, классических билинейных систем и в их развитие введена дискретная билинейная окрестностная модель. В данной главе поставлена задача параметрической идентификации билинейных окрестностных систем, предложены методы
и получены
алгоритмы
тензорной линеаризации,
смешанной параметрической и адаптивной идентификации билинейных окрестностных систем. 2.1.Постановка задачи параметрической идентификации дискретных билинейных окрестностных систем В данном разделе сформулируем задачу параметрической идентификации для билинейных окрестностных систем и критерий идентификации. В соответствии с (1.7), предложенная в данной работе дискретная билинейная окрестностная система описывается уравнением r
∑
r
∑ wi [a,α ]u i [α ] + ∑
i =1 α∈Oui [ a ]
∑ wi [a,α , β ]ui [α ] ⋅ γ i [ β ] = 0. i =1 α∈Ou i [a ] β ∈Oγ i [ a ]
(2.1)
Здесь Ou i [ a ], Oγ i [ a ] окрестности по ui , γ i элемента a , a ∈ A = {a1 ,..., a N } множество
значений
аргумента
билинейной
окрестностной
системы,
A = N ; ui , γ i ∈U , wi [a,α ], wi [a,α , β ](i = 1, r ) - некоторые матрицы. Пусть для билинейной системы, заданной моделью (2.1), полностью определен набор всех ui [ a ] ∈ R ni во всех N узлах билинейной системы. Тогда необходимо знание (n1 + ... + nr ) ⋅ N компонент сигналов. В случае, если u1[a] = u[a]∈ R m , u 2 [a] = x[a] ∈ R n , необходимо знание (m + n) ⋅ N компонентов сигналов.
27
Требуется найти элементы матриц-параметров wi [a,α ], wi [a,α , β ] для всех узлов системы, описываемой моделью (2.1). Потребуем, чтобы часть элементов матриц-параметров была задана экспертами. Это требование позволит ограничить число решений данной задачи. В
качестве
критерия
идентификации
рассмотрим
следующий
квадратичный критерий
(
)2
u [ ai ] w [ a ,α ]u [α ] + ∑ deg u i [ ai ] ∑ degγ i [ ai ] w [ a ,α , β ] ) , J = ∑ iN=1(∑ ir=1 ∑αdeg i i i i i α =1 β =1 =1 i
(2.2)
где deg ui , degγ i -степени вершины a (число соседей) по преобразованиям ui , γ i .
Потребуем минимальности значения критерия.
2.2. Разработка алгоритмов линеаризации билинейных систем Для
разработки
алгоритмов
идентификации
билинейных
систем
рассмотрим теоретическое обоснование преобразования билинейных систем в двухаргументные линейные системы [7-18]. 2.2.1. Билинейные стационарные системы Билинейные системы являются простейшими нелинейными системами, наиболее близкими к линейным [5, 20, 104]. С другой стороны, двумерные системы являются простейшими распределёнными системами, наиболее близкими к сосредоточенным. Между этими классами систем существует важная взаимосвязь, для описания которой удобно ввести ряд понятий, знакомство с которыми полезно и само по себе. Пусть K - некоторое числовое поле, U - K -линейное пространство, состоящее из всех K -значных функций, заданных на множестве целых чисел Z и имеющих ограниченный слева носитель, так что для любой u∈U существует tu ∈ Z такое, что u[t ] = 0 при t < t u . Отображение f :U × U → U называется K -
28
билинейным,
если
для
каждого
фиксированного
u1 ∈U
отображения
U → U : u → f (u , u1 ), U → U : u → f (u1 , u ) являются K -линейными. Билинейное отображение f :U × U → U называется каузальным, если из u1[t ] = 0 при t < t1 следует f (u , u1 )[t ] = f (u1 , u ) = 0 при t < t1 . Билинейное отображение называется стационарным или инвариантным относительно временного сдвига, если для любых u1, u 2 ∈U выполняется соотношение: f (u1, u2 )[t −1] = f (uˆ1, uˆ2 )[t ], uˆi [t ] = ui [t − 1] .
(2.3)
Пусть L2cs (U ) обозначает множество, состоящее из всех билинейных казуальных
стационарных
отображений
f :U × U → U .
С
обычными
операциями над его элементами пространство L2cs (U ) является K -линейным пространством. Каждый элемент из L2cs (U ) может рассматриваться как отображение
отклика
(отображение
"вход-выход'')
некоторой
внешне-
билинейной каузальной стационарной дискретно-временной системы. обозначает
Пусть теперь V+
K -линейное пространство функций
v : Z × Z → K таких, что v[t1 , t 2 ] = 0 при t1 < 0 или t 2 < 0 . С использованием этих понятий
непосредственно
устанавливается
следующее
представление
билинейных отображений:
f ∈ L2cs (U ) существует единственный элемент w ∈V+ ,
для каждого
называемый ядром отображения f , такой что для любых u1, u 2 ∈U t
f (u1 , u 2 )[t ] = ∑
t
∑ w[t − t1 , t − t 2 ]u1 [t1 ]u 2 [t 2 ] ,
t1 = −∞ t2 = −∞
наоборот, каждое ядро
w ∈V+
(2.4)
определяет некоторое отображение
f w ∈ L2cs (U ) , задаваемое формулой (2.4). С использованием понятия тензорного произведения функций и образованных ими пространств каждый элемент из L2cs (U ) может быть расширен до линейного отображения. Рассмотрим это подробнее [15, 18]. Пусть V - K -линейное пространство, состоящее из всех K -значных
29
функций v , заданных на Z × Z и таких, что v[t , s ] = 0 при t < tv или s < sv . Следует отметить, что введенное выше пространство V+ являетcя линейным подпространством V . Для заданных u1, u 2 ∈U
тензорное произведение,
обозначаемое u1 ⊗ u 2 , определяется как элемент из V по формуле: (u1 ⊗ u 2 )[t , s ] = u1[t ]u 2 [ s].
(2.5)
Иначе говоря, тензорное произведение сигналов определяет разделимый или cепарабельный сигнал, зависящий от двух переменных; тензорное произведение пространства U на себя, обозначаемое через U ⊗ U , есть линейное подпространство V , порождённое всеми элементами вида u1 ⊗ u 2 . Иначе говоря любой элемент v ∈U ⊗ U может быть записан в виде r
v = ∑ u i ⊗ γ i для некоторых ui ,γ i ∈U . i =1
Теперь любое билинейное отображение f ∈ L2cs (u ) может быть расширено до линейного отображения f :U ⊗ U → U , задаваемого по формуле r r f ∑ u i ⊗ γ i = ∑ f (u i ,γ i ), u i ,γ i ∈ U . i =1 i =1 Из
представления
(2.3)
(2.6)
билинейных отображений
следует
такое
представление нового отображения f : t
f w (v )[t ] = ∑
t
∑ w[t − t1 , t − t 2 ]v[t1 , t 2 ],
(2.7)
t1 = −∞ t2 = −∞
где v - произвольный элемент из U ⊗ U . Отсюда следует, что билинейное отображение
fw
или
его
линейное
расширение
fw
могут
быть
проинтерпретированы в терминах отклика линейных двумерных систем. Чтобы это
установить,
рассмотрим
сначала
общее
представление
линейных
двумерных отображений в том же контексте, в котором ранее были рассмотрены билинейные (но одномерные, как теперь целесообразно добавить) отображения. Пусть g :V → V – K -линейное отображение; так как V состоит из
30
функций, заданных на Z × Z , то можно говорить о g как о линейном двумерном отображении. Отображение g :V → V каузально, если из v[t , s ] = 0 при t < tv или s < sv следует g (v)[t , s ] = 0 при t < tv или s < sv . Отображение g однородно
стационарности)
(аналог
или
инвариантно
относительно
g (v )[t −1, s −1] = g (v )[t , s ] , где
плоскостного сдвига, если для любого v∈V
vˆ[t , s ] = v[t − 1, s − 1]. С обычными операциями множество Lcs (V ) всех линейных каузальных однородных отображений пространством. Каждый элемент отображение
отклика
g :V → V
является
K –линейным
g ∈ Lcs (V ) может рассматриваться как
(отображение
"вход-выход") некоторой линейной
каузальной однородной двумерной дискретной системы. С использованием этих понятий непосредственно устанавливается следующее представление двумерных отображений: для
каждого
g ∈ Lcs (V ) существует единственный элемент
w ∈V+ ,
называемый весовой функцией отображения g , такой, что для любого v∈V t
s
g (v )[t , s ] = ∑
∑ w[t − t1 , s − s1 ] v[t1 , s1 ] ,
(2.8)
t1 =−∞ s1 =−∞
наоборот, каждая весовая функция
w ∈V+
определяет некоторое
отображение g w , задаваемое формулой (2.8). Заметим, что функция w равна g (l ) , где l - двумерный единичный импульс, т.е. l[t , s] = 1 при t = s = 0 и l[t , s ] = 0 при других t, s . Сопоставляя представления (2.4) и (2.8), заключаем, что справедливо соотношение
f w (u1, u 2 )[t ] = g w (u1 ⊗ u 2 )[t , t ] для любых u1, u 2 ∈U .
Кроме
того,
линейное
расширение
fw
задается
соотношением
f w (v )[t ] = g w (v )[t , t ] для всех v ∈U ⊗ U . 2.2.2. Билинейные нестационарные системы
31
Сделаем ряд предположений по аналогии с предыдущим разделом. Пусть K - некоторое числовое поле, U - K -линейное пространство, состоящее из всех K -значных функций, заданных на множестве целых чисел Z и имеющих ограниченный слева носитель, так что для любой u∈U существует tu ∈ Z такое, что u[t ] = 0 при t < t u . Отображение f :U × U → U называется K билинейным,
если
для
каждого
фиксированного
u1 ∈U
отображения
U → U : u → f (u , u1 ), U → U : u → f (u1 , u ) являются K -линейными. Билинейное отображение f :U × U → U называется каузальным, если из u1[t ] = 0 при t < t1 следует f (u , u1 )[t ] = f (u1 , u ) = 0 при t < t1 . Билинейное отображение является нестационарным или неинвариантным относительно временного сдвига, если оно задано на нестационарном отрезке, который для любого момента t имеет длину T (t ) и вид [t − T (t )] , в частности [0, t ] длины t , т.е. {0,K, t }, тогда для нестационарного
билинейного
отображения
для
любых
u1, u 2 ∈U
не
выполняется соотношение: f (u1 , u 2 )[t − 1] = f (uˆ1 , uˆ 2 )[t ], uˆ i [t ] = u i [t − 1].
(2.9)
Пусть L2cns (U ) обозначает множество, состоящее из всех билинейных каузальных
нестационарных
отображений
f :U × U → U .
С
обычными
операциями над его элементами пространство L2cns (U ) является K -линейным пространством. Каждый элемент из L2cns (U ) может рассматриваться как отображение отклика (отображение "вход-выход'') некоторой билинейной каузальной нестационарной дискретно-временной системы. Пусть теперь V+
обозначает
K -линейное пространство функций
v : Z × Z × Z → K таких, что v[t , t1 , t 2 ] = 0 при t < 0, t1 < 0, t 2 < 0 . С использованием этих понятий непосредственно устанавливается следующее представление нестационарных (неоднородных) билинейных отображений: для каждого
f ∈ L2cns (U ) существует единственный элемент w ∈V+ ,
называемый ядром отображения f , такой, что для любых u1, u 2 ∈U
32
f (u1 , u 2 )[t ] =
∑∑ w[t ,t1 , t 2 ]u1 (t1 )u 2 (t 2 ) ,
(2.10)
t1 ,t 2 ∈{0,...,t }
наоборот, каждое ядро
w ∈V+
определяет некоторое отображение
f w ∈ L2cns (U ) , задаваемое формулой (2.10). С использованием понятия тензорного произведения функций и образованных ими пространств каждый элемент из L2cns (U ) может быть расширен до линейного отображения. Пусть V - K -линейное пространство, состоящее из всех K -значных функций v , заданных на Z × Z , и таких, что v[t , s ] = 0 при t < tv или s < sv . Для u1, u 2 ∈U
заданных
тензорное
произведение,
обозначаемое
u1 ⊗ u 2 ,
определяется как элемент из V по формуле (u1 ⊗ u 2 )[t , s ] = u1[t ]u 2 [ s].
(2.11)
Тензорное произведение сигналов определяет cепарабельный сигнал, зависящий от двух переменных; тензорное произведение пространства U на себя, обозначаемое через
U ⊗ U , есть линейное подпространство V ,
порождённое всеми элементами вида u1 ⊗ u 2 . Любой элемент v ∈U ⊗ U может быть записан в форме r
v = ∑ u i ⊗ γ i для некоторых ui ,γ i ∈U . i =1
Теперь любое нестационарное билинейное отображение
f ∈ L2cns (u )
может быть расширено до линейного отображения f :U ⊗ U → U , задаваемого по формуле r r f ∑ u i ⊗ γ i = ∑ f (u i ,γ i ), u i ,γ i ∈ U . i =1 i =1
(2.12)
Из представления (2.10) следует представление нового отображения f
f w (v )[t ] =
∑∑ w[t ,t1 ,t 2 ]v[t1 , t 2 ]
t1 ,t 2 ∈{0,..., t }
где v - произвольный элемент из U ⊗ U . Отсюда следует, что билинейное неоднородное отображение f w или его линейное расширение f w могут быть
33
проинтерпретированы в терминах отклика линейных двумерных систем. По аналогии с предыдущим разделом рассмотрим общее представление линейных двумерных отображений. Пусть g :V → V – K - линейное отображение; так как v задано на Z × Z , то g - линейное двумерное отображение. Отображение g :V → V каузально, если из v[t , s ] = 0 при t < tv или s < sv следует g (v)[t , s ] = 0 при t < tv или s < sv . Отображение
g
неоднородно,
если
для
любого
v∈V
свойство
g (v )[t − 1, s − 1] = g (vˆ )[t , s ],где vˆ[t , s ] = v[t − 1, s − 1], не выполняется. С обычными операциями множество Lcns (V ) всех линейных каузальных неоднородных отображений g :V → V является K -линейным пространством. Каждый элемент g ∈ Lcns (V ) может рассматриваться как отображение отклика некоторой линейной каузальной неоднородной двумерной дискретной системы. ~ Пусть V+ обозначает K -линейное пространство
функций
v : Z × Z × Z × Z → K таких, что v[t , s, t1 , t 2 ] = 0 , при t , t1 ∉{0,K, t v }, s, s1 ∉{0,K, sv } . Определим следующее представление двумерных отображений:
~ для каждого g ∈ Lcns (V ) существует единственный элемент w∈V+ такой, что для любого v∈V
g (v )[t , s ] =
∑∑ w[t , s, t1 , s1 ]v(t1 , s1 ) .
(2.13)
t1∈{0,...,t } s1∈{0,...,s}
Здесь при отождествлении t и s имеем соответствие размерностей ~ V+ ~ V+ . Из (2.10) и (2.13) следует
f w (u1, u 2 )[t ] = g w (u1 ⊗ u 2 )[t , t ] для любых u1, u 2 ∈U .
Кроме
того,
линейное
расширение
fw
задается
соотношением
f w (v )[t ] = g w (v )[t , t ] для всех v ∈U ⊗ U . 2.2.3. Билинейные окрестностные системы В данном разделе намечено распространение изложенного выше подхода
34
на более общие классы окрестностных систем. Напомним кратко определение окрестности, приведенное в п. 1.1 и в [10, 20]. Рассматривается конечное или счётное множество A элементов a ,b,K и случайное поле на A (система случайных величин {x[a ], a ∈ A} ), называемое O марковским, если для каждого a ∈ A существует конечное множество O(a ) ⊂ A такое, что P ( x[a ] / x[ A \ a ]) = P ( x[a ] / x[O(a )]) зависит лишь от x[a ] и x[b] при b∈ O (a ) ; O[a ] называется окрестностью элемента a , O[a ] = O (a ) U {a} – расширенной окрестностью. В [10, 20] отмечено, что системы, заданные на таких множествах, являются существенно нестационарными. С учётом предположений, сделанных в предыдущем разделе, рассмотрим
L2cns (u )
-
множество,
нестационарных
состоящее
отображений
из
всех
f :U × U → U ;
билинейных каждый
каузальных
элемент
L2cns (u )
рассматривается как отображение отклика некоторой билинейной каузальной нестационарной одноаргументной окрестностной системы. Пусть V+ − K -линейное пространство функций v : Z × Z × Z → K таких, что v[a,α , β ] = 0 при некоторых a ,α , β . С учётом предположений и по аналогии с
предыдущим
разделом
устанавливается
следующее
представление
нестационарных (неоднородных) билинейных окрестностных отображений: для каждого
f ∈ L2cns (u ) существует единственный элемент w ∈V+ ,
называемый ядром отображения f , такой, что для любых u1, u 2 ∈U
f (u1, u2 )[a ] =
∑
∑ w[a,α , β ]u1[α ]u2 [ β ] .
Наоборот, каждое ядро
f w ∈ L2cns (u ) ,
(2.14)
α1∈Ou1 [a ] β ∈Ou2 [ a ]
задаваемое
w ∈V+
формулой
определяет некоторое отображение (2.14).
С
использованием
понятия
тензорного произведения функций каждый элемент из L2cns (u ) может быть расширен до линейного отображения.
35
Пусть V – K -линейное пространство, состоящее из всех K - значных функций v , заданных на Z × Z , и таких, что v[a, b] = 0 при некоторых a, b ∈ A . Для
заданных
u1, u 2
тензорное
произведение,
обозначенное
u1 ⊗ u 2 ,
определяется как элемент из V : (u1 ⊗ u 2 )[a, b] = u1[a ]u 2 [b ].
(2.15)
Тензорное произведение сигналов определяет сепарабельный сигнал, зависящий от двух переменных; тензорное произведение пространства U на себя, обозначаемое U ⊗ U , есть линейное подпространство V , порождённое всеми элементами вида u1 ⊗ u 2 . Любой элемент v ∈U ⊗ U может быть записан в форме r
v = ∑ u i ⊗ γ i для некоторых ui ,γ i ∈U . i =1
Теперь любое нестационарное билинейное отображение
f ∈ L2cns (u )
может быть расширено до линейного отображения f :U ⊗ U → U , задаваемого по формуле r r f ∑ ui ⊗ γ i = ∑ f (ui , γ i ), ui , γ i ∈U . i =1 i =1
(2.16)
Из представления (2.14) следует представление нового отображения f :
f w (v )[a] =
∑ w[a,α , β ]v[α , β ] ,
∑
(2.17)
α∈Ou1 [ a ] β ∈Ou2 [ a ]
где v -произвольный элемент из U ⊗ U . Отсюда отображение
следует,
что
билинейное
или
его
линейное
fw
неоднородное расширение
fw
окрестностное могут
быть
проинтерпретированы в терминах отклика линейных двухаргументных систем. По аналогии с предыдущим разделом рассмотрим общее представление линейных двухаргументных отображений. Пусть g :V → V – K -линейное отображение; так как v задано на Z × Z , то g - линейное двухаргументное отображение. Отображение g :V → V каузально, если из v[a, b] = 0 для некоторых элементов a, b следует g (v)[a , b] = 0
36
для тех же a, b . С обычными операциями множество Lcns (V ) всех линейных каузальных неоднородных отображений g :V → V является K – линейным пространством. Каждый элемент g ∈ Lcns (V ) может рассматриваться как отображение отклика некоторой линейной каузальной двухаргументной неоднородной окрестностной системы. ~ Пусть V+ обозначает K -линейное
пространство
функций
v : Z × Z × Z × Z → K таких, что v[a, b,α , β ] = 0 при некоторых a , b,α , β ∈ A . Определим следующее представление двухаргументных отображений:
~ для каждого g ∈ Lcns (V ) существует единственный элемент w∈V+ такой, что для любого v∈V g (v )[a, b] =
∑
∑ w[a,b,α , β ]v[α , β ].
α∈Oui [a ]β ∈Oγ i [a ]
(2.18)
Здесь при отождествлении a и b имеем соответствие размерностей ~ V+ ~ V+ . Из (2.14) и (2.18) следует f w (u1 , u 2 )[a ] = g w (u1 ⊗ u 2 )[a, a ]
(2.19)
для любых u1, u 2 ∈U . Кроме того, линейное расширение f w задаётся соотношением f w (v )[a] = g w (v )[a, a ] для всех v ∈U ⊗ U . 2.2.4. Алгоритм преобразования билинейных m-аргументных окрестностных систем в линейные 2m -аргументные Представляет интерес развитие данной методики на случай билинейных двухаргументных нестационарных систем с последующим преобразованием их в линейные четырёхаргументные неоднородные системы (см. также обобщение [11-18, 20, 80-81]). Система
37 r
∑
∑ wi [a,α1,α 2 ] ui [α1 ,α 2 ] +
i =1α1∈Oui [a ] αr 2 ∈u i [ a ]
+∑
∑ wi [a,α1 ,α 2 ,α 3 ,α 4 ] ui [α1 ,α 2 ]γ i [α 3 ,α 4 ] = 0
(2.20)
i=1α1∈Oui [a ], α 2∈Oui [a ] α 3∈Ori [ a ], α 4∈Ori [ a ]
при этом преобразуется в систему r
∑ wi [a ,α1,α 2 ] ui [α1,α 2 ]+ i =1α∈Oui [a ] ∑
r
∑ wi [a,α1 ,α 2 ,α 3 ,α 4 ] ui [α1 ,α 2 ] ⊗ γ i [α 3 ,α 4 ] = 0 . i=1α i ∈Ou i [a ], α 2∈Ou i [ a ] α 3∈Ori [ a ], α 4∈Ori [a ]
+∑
(2.21)
Проведём аналогичные рассуждения для билинейных m -аргументных окрестностных систем вида r
∑ wi [a,α1,...,αn ]ui [α1,K,α n ] + i =1α1,...,α n∈Oui [a ] ∑
r
∑ ∑ wi [a,α1,...,α2n ]ui [α1,...,α n ]γ i [α n+1,...,α 2n ] = 0 i =1α1,...,α n∈Oui [ a]α n+1,...,α 2n∈Oγ i [ a]
+∑
Нестационарные представленные
в (2.22),
билинейные расширяются
n -аргументные до
линейных
(2.22) отображения,
2m -аргументных
отображений. Система (2.22) принимает вид r
∑wi[a,α1,K,αn]ui[α1,K,αn]+ i=1α1,K,αn∈Oui [a] ∑
r
+∑
∑ ∑wi[a,α1,K,α2n]ui[α1,Kαn]⊗γi[αn+1,K,α2n]=0 i=1α1,K,αn∈Oui [a]αn+1,K,α2n∈Oγi [a]
(2.23)
2.2.5. Алгоритм преобразования билинейных ni -аргументных окрестностных систем в линейные (n1 + n2 ) -аргументные системы Рассмотрим случай билинейных ni -аргументных окрестностных систем:
38
r
∑
wi[a,α1,K,αn1]ui[α1,K,αn1]+
∑
i=1α1,K,αn1∈Oui [a] r
+∑
∑
wi[a,α1,K,αn1+n2]ui[α1,Kαn1]⋅γi[αn1+1,K,αn1+n2]=0.
∑
i=1α1,K,αn1∈Oui [a]αn1+1,K,αn1+n2∈Oγi [a]
Нестационарные
билинейные
отображения,
ni -аргументные
представленные в (2.24), расширяются до линейных
(2.24)
(n1 + n2 ) -аргументных
отображений. Система (2.24) принимает вид r
∑
wi[a,α1,K,αn1]ui[α1,K,αn1]+
∑
i=1α1,K,αn∈Oui [a] r
+∑
∑
∑
wi[a,α1,K,αn1+n2]ui[α1,Kαn1]⊗γi[αn1+1,K,αn1+n2]=0.
i=1α1,K,αn1∈Oui [a]αn1+1,K,αn1+n2∈Oγi [a]
(2.25)
2.3. Координатные формы билинейных окрестностных систем Для
получения
методики
решения
задачи
параметрической
идентификации билинейной системы, сформулированной в пункте 2.1, рассмотрим следующий прямой подход [20, 87, 92-94]. Предложенную в первой главе билинейную дискретную окрестностную систему вида r
∑
r
∑ wi [a,α ]ui [α ] + ∑
i =1 α∈Oui [a ]
∑ wi [a,α , β ]ui [α ] ⋅ γ i [ β ] = 0 i =1 α∈Ou i [ a ] β ∈O y i [a ]
(2.26)
представим в координатной форме. Так как элементы искомых матрицпараметров
wi [a,α ], wi [a ,α , β ]
линейно относительно
u i , u iγ i
входят в
уравнение (2.26), то «расшивая» уравнения всех узлов системы, переформируем их для получения систем линейных уравнений специальной блочной иерархической структуры относительно искомых величин. Заметим, что линейность относительно сигналов ui , uiγ i представляет собой нелинейное
39
соотношение относительно преобразований ui , γ i . Из сказанного следует, что искомые параметры системы (2.26) можно представить как элементы идентифицируемых матриц wu K [ ai , a j ] , wu iγ i [ a,α , β ] , где wu k [ai , a j ](1,1) K wu k [ai , a j ](1, m) . wu k [ai , a j ] = M M wu k [ai , a j ](c,1) K wu k [ai , a j ](c, m) Здесь
c
количество
–
преобразования
строк
матрицы,
(
wu k [ai , a j ]∈ R c×mk .
ui [a ] ∈ R ni , γ i [a ] ∈ R mi ,
wui [a,α ] ∈ R c×ni , wγ i [a,α ] ∈ R c×mi ,
(2.27)
двумерные
трехмерные
)
wu iγ i [a,α , β ] = w1ui γ i ...wmi u iγ i ∈ R c×ni ×mi ,
Пусть матрицы матрицы
wu i γ i [a ,α , β ]ui [α ]γ i [ β ]
слагаемое
представляет собой отображение R mi × R ni → R c .
mi ∑ wi [a,α , β ]ui [α ]γ i [ β ] = ∑ ∑ wlu iγ i [a,α , β ]γ i [α , l ]ui [β ], α∈Ou i [a ] α∈Ou i [ a ] l =1 β ∈O yi [ a ]
(2.28)
β ∈O yi [ a ]
[a,α , β ] где γ i [α , l ] - l -ая координата преобразования γ i [α ] , а матрица w luiγ i
(
)
является частью матрицы wuiγ i [ a,α , β ] = w1uiγ i ...wmiuiγ i . В координатной форме билинейный член ∑
α∈Oui [a ] β ∈O yi [a]
wuiγ i [a,α , β ]ui [α ]γ i [ β ] =
mi ni ∑ ∑ w1 jk u i γ i [a,α , β ]ui [α , j ]γ i [ β , k ] . M = ∑ km=i1 jnM=i1 α∈Oui [a] w [a,α , β ]u i [α , j ]γ i [ β , k ] β ∈O yi [a] ∑ ∑ cjk u i γ i k =1 j =1
(2.29)
Ясно, что в общем случае индексы преобразований ui ,γ i могут быть также различными, например i1,i2 . Для разработки алгоритмов параметрической идентификации будем считать, что количество строк искомых двумерных матриц wu iγ i [ a,α , β ] равно
40
c . Тогда s -ый слой трехмерной матрицы
wul γ l - двумерная матрица
wsu l γ l [ai , a j ](1,1) K wsu l γ l [ai , a j ](1, nl ) . wsu l γ l [ a,α , β ] = M M wsu l γ l [ai , a j ](c,1) K wsu l γ l [ai , a j ](c, nl ) Параметр
c
строк
(количество
искомых
матриц)
(2.30) определяется
физическим смыслом величин, составляющих, например, входное воздействие и состояние билинейной окрестностной системы. Для векторов в R 2 c = 2 и т.д. Запишем общую билинейную окрестностную систему (1.7) с учетом преобразования билинейных членов wu iγ i uiγ i в виде суммы двумерных матриц: r
∑
r
∑
i =1α∈Oui [ a ]
wu i [a,α ]ui [α ] + ∑
∑
i =1α∈Oui [ a ] β ∈Oγ i [a ]
Расписывая
внутреннюю
mi ∑ wlu iγ i [a,α , β ]γ i [α , l ]ui [ β ] = 0 . l =1
сумму
во
втором
слагаемом,
(2.31)
получим
следующий вид билинейной окрестностной модели с двумерными матрицами: r
∑
∑
i =1α∈Oui [ a ] r
+∑
wui [a,α ]ui [α ] +
∑
i=1α∈Ou i [ a ] β ∈Oγ i [ a ]
[w1u γ [a,α , β ]γ i [α ,1] + ... + wm u γ [a,α , β ]γ i [α , mi ]]ui [β ] = 0 . i i
i i i
(2.32)
Далее r
∑
∑
i =1α∈Oui [ a ] r
+∑
∑
wu i [a ,α , β ]ui [α ] + [ w1u iγ i [a,α , β ]γ i [α ,1]ui [ β ] + ...
i=1α∈Oui [ a ] β ∈Oγ i [ a ]
+ wmji u iγ i [a,α , β ]γ i [α , mi ]ui [ β ]] = 0 . Полагая
в
(2.33)
u1[a] = x[a], u2 [a] = v[a] ,
симметричной модели на билинейный случай:
(2.33) получаем
обобщение
41
∑ wx [a,α ]x[α ] + ∑ wv [a, β ]v[ β ] + α∈O x [ a] β ∈Ov [a ] +
+ +
+
∑
α∈O x [ a]
[w1xx[a,α ,α ]x[α ,1]x[α ] + ... + wm xx [a,α ,α ]x[α , mx ]x[α ]]+ x
∑
β ∈Ov [ a]
[w1vv[a, β , β ]v[β ,1]v[β ] + ... + wm vv[a, β , β ]v[β , mv ]v[β ]]+ v
[w1vx [a,α , β ]v[β ,1]x[α ] + ... + wm vx[a,α , β ]v[β , mv ]x[α ]]+
∑
v
α∈O x [ a] β ∈Ov [a ]
]
∑ [w1xv [a,α , β ]x[α ,1]v[β ] + ... + wm x xv [a,α , β ]x[α , m x ]v[β ] = 0. α∈O x [ a] β ∈Ov [a ] Полагая в (2.33)
u1[a ] = x[a ], u 2 [a ] = v[a ], u3 [a ] = y[a ],
(2.34) где
x, v, y -
состояние, вход, выход системы, получаем обобщение смешанной системы на билинейный случай ∑ w x [a,α ]x[α ] + ∑ wv [a, β ]v[ β ] + ∑ w y [a,γ ]y[γ ] + α∈Ox [a ] β ∈Ov [ a ] γ ∈O y [a ] + +
+
∑
[w1xx [a,α ,α ]x[α ,1]x[α ]+ ... + wm xx [a,α ,α ]x[α , mx ]x[α ]]+
∑
[w1vv [a, β , β ]v[ β ,1]v[β ] + ... + wm vv [a, β , β ]v[ β , mv ]v[ β ]]+
∑
[w1yy [a,γ ,γ ]y[γ ,1] y[γ ] + ... + wm
α∈O x [ a ]
β ∈Ov [ a ]
γ ∈Oγ [ a ]
x
v
y yy
]
[a, γ , γ ] y[γ , mγ ] y[γ ] +
]
+
∑ [w1vx [a,α , β ]v[β ,1]x[α ] + ... + wmv vx [a,α , β ]v[ β , mv ]x[α ] + α∈O x [ a ] β ∈Ov [a ]
+
∑ [w1xv [a,α , β ]x[α ,1]v[β ] + ... + wm x xv [a,α , β ]x[α , m x ]v[β ] + α∈O x [ a ] β ∈Ov [a
+
]
∑
α∈O x [ a ] γ ∈Oγ [ a ]
[w1yx [a,α ,γ ]y[γ ,1]x[α ] + ... + wm
y yx
]
[a,α , γ ] y[γ , m y ]x[α ] +
42
+
∑
α∈O x [ a ] γ ∈Oγ [ a ]
∑
β ∈Ov [ a ] γ ∈Oγ [a ]
+
[w1xy [a,α ,γ ]x[α ,1] y[γ ] + ... + wm xy [a,α ,γ ]x[α , mx ] y[γ ]]+ x
[w1vy [a, β ,γ ]v[β ,1]y[γ ]] + ...wm vy [a, β ,γ ]v[ β , mv ] y[γ ]] + v
∑
β ∈Ov [a ] γ ∈O y [ a ]
[w1yv [a, β ,γ ]y[γ ,1]v[ β ] + ... + wm
y yv
]
[a, β , γ ] y[γ , m y ]v[ β ] = 0.
(2.35)
Простейшая билинейная окрестностная система для преобразований x, v , содержащая только линейные члены и билинейный член типа xv , имеет вид: ∑ w x [a,α ]x[α ] + ∑ wv [a, β ]v[ β ] + α∈Ox [a ] β ∈Ov [a ]
]
∑ [w1vx [a,α , β ]v[ β ,1]x[α ] + ... + wmv vx [a,α , β ]v[ β , mv ]x[α ] +
α∈O x [ a ] β ∈Ov [ a ]
+
∑
α∈O x [ a ] β ∈Ov [a ]
[w1xv [a,α , β ]x[α ,1]v[ β ] + ... + wm xv [a,α , β ]x[α , mx ]v[β ]]= 0 , x
(2.36)
где mui - размерность ui , например, mv - размерность входа, deg ua - степень i узла (число соседей по ui ). Поставим вопрос о количестве неизвестных элементов в общей билинейной модели (2.35), связывающей состояние, управление и выход. Количество неизвестных элементов N
N
N
N
k = cmv ∑ deg v ai + cm x ∑ deg x ai + cm y ∑ deg y ai + cm x2 ∑ deg x ai +
i =1N i =1 N Ni =1 Ni=1 2 2 + cmv ∑ deg v ai + cm y ∑ deg y ai + cm x mv ∑ deg x ai + cmv m x ∑ deg v ai + i =1 N i=1 i =1 i =1 N + cm x m y ∑ deg v ai + cm y m x ∑ deg y ai + i=1 i =1 N N + cmv m y ∑ degv ai + cm y mv ∑ deg y ai . (2.37) i =1 i =1
В модели (2.36) количество неизвестных элементов N
N
N
N
i =1
i =1
i =1
i =1
k = cmv ∑ deg v ai + cm x ∑ deg x ai + cm x mv ∑ deg x ai + cmv m x ∑ deg v ai .
(2.38)
43
В общей модели N
N
N
k = rcmui ∑ degui ai + rcmu2 ∑ degui ai + rcmui mγ i ∑ degui ai + i =1
i x i=1
i =1
N
N
N
i =1
i=1
i=1
+ rcmγ mui ∑ degγ i ai = rc mu ∑ deg u i ai + mu2 ∑ deg ui ai + i i i N
)
N
+ mu mγ i ∑ degui ai +mγ mui ∑ degui ai . i =1
i
i=1
i
(2.39)
Распишем уравнения системы для всех узлов, что дает N матричных уравнений вида r
[ [
] [
]
[
] [
]]
∑ wu i a s ,α a s ,1 u i α a s ,1 + ...wu i a s ,α a s , deg u i a s u i α a s , deg u i a s +
i =1
r mi
+ ∑ ∑ wlu iγ i [a s ,α a s ,1, β a s ,1 ]γ i [α a s ,1 , l ]ui [ β a s ,1 ] + ... i=1 l =1
[
][
] [ ]
mi + ∑ wlu iγ i a s ,α a s ,deg u a s , β a s ,1 γ α a s ,deg u a s , l ui β a s ,1 + i i l =1
[
][ ] [
]
mi ... + ∑ wlu iγ i a s ,α a s ,1 , β a s ,deg u a s γ α a s , l ui β a s ,deg u a s + i i l =1
[
][
] [
mi ... + ∑ wlu iγ i a s ,α a s ,deg u a s , β a s ,deg u a s γ α a s ,deg u a s , l ui β a s ,deg u a s i i i i l =1
] = 0, (2.40)
где номер узла s = 1, N . Запишем уравнения системы в скалярной форме. Уравнение с номером s для узла a s имеет вид r ni
[
]
[
]
∑ ∑ wu i as ,α a s ,1 (s, k )ui α a s ,1 , k + i=1 k =1
[
]
[
]
ni ... + ∑ wu i a s ,α a s ,deg u a s (s, k )ui α a s ,deg u a s , k + i i k =1
44 r mi ni
[
]
[
][
]
+ ∑ ∑ ∑ wluiγ i a s ,α a s ,1, β a s ,1 (s, k )γ i α a s ,1, l ui β a s ,1, k + i=1l =1k =1 mi ni
[
mi ni
[
]
[
][
]
... + ∑ ∑ wluiγ i as ,α a s ,deg u a s β a s ,1 (s, k )γ i α a s ,deg u a s , l ui β a s ,1, k + i i l =1 k =1
]
][
[
]
... + ∑ ∑ wluiγ i a s ,α a s ,1, β a s ,degu a s (s, k )γ i α a s ,1, l ui β a s ,deg u a s + K + i i l =1k =1
[
]
[
][
(2.41)
]
∑ ∑ wluiγ i a s ,α a s ,deg u a s , β a s ,deg u a s (s, k )γ i α a s ,deg u a s , l ui β a s ,deg u a s = 0. i i i i l =1k =1 mi ni
Для узлов s = 1, N . Полагая для случая r = 3, u1[a ] = x[a ], u 2 [a ] = v[a ], u3 [a ] = y[a ] , получим координатную форму билинейной модели для состояния, управления, выхода. Скалярное уравнение (представленное некоторыми слагаемыми) с номером s для узла a s имеет вид:
[
nx
]
[
]
∑ wx as ,α as ,1 (s, k )x α as ,1, k + ...
k =1
nx
[
]
[
]
+ ∑ wx as ,α as ,deg x as (s, k )x α a s ,deg x as , k + k =1 nv
[
]
[
]
+ ∑ wv as , β as ,1 (s, k )v β as ,1, k + k =1
nv
[
]
[
]
+ ... ∑ wv as , β a s ,deg v as (s, k )v β as ,deg v as , k + k =1
ny
[
]
[
]
+ ∑ w y as ,γ a s ,1 (s, k ) y γ as ,1, k + k =1
ny
[
]
[
[
]
[
]
... + ∑ w y as ,γ a s ,deg y as (s, k ) y γ a s ,deg y as , k + k =1
nx
][
]
+ ∑ w1xx a s ,α a s ,1 ,α a s ,1 (s, k )x α a s ,1 ,1 x α a s ,1 , k + k =1
45
[
nx
]
[
][
]
.. + ∑ wm x xx a s ,α a s ,1 ,α a s ,1 (s, k )x α a s ,1 , m x x α a s ,1 , k + k =1
[
nx
]
[
]
... + ∑ w1xx as ,α as ,deg x as ,α as ,deg x a s (s, k )x α as ,deg x as ,1 ⋅ k =1
[
]
[
nx
]
⋅ x α a s ,deg x as , k + ... + ∑ wmx xx as ,α as ,deg x as ,α as ,deg x as (s, k )⋅
[
k =1
][
]
[
nv
]
[
]
⋅ x α a s ,deg x a s , m x x α a s ,deg x a s , k + ∑ w1vv a s , β a s ,1 , β a s ,1 (s, k ) ⋅ v β a s ,1 ,1 k =1
[
nv
]
⋅ v[ β a s ,1, k ] + ... + ∑ wmv vv a s , β a s ,1 , β a s ,1 (s, k )v[ β a s ,1 , mv ]v[ β a s ,1 , k ] + K k =1
[
my
]
][
[
]
+ ∑ w1xy as ,α as ,1,γ as ,deg y as (s, k )x α as ,1,1 y γ as ,deg y as , k + k =1
[
my
]
][
[
]
... + ∑ wm x xy a s ,α a s ,1 , γ a s ,deg y a s (s, k )x α a s ,1, m x y γ a s ,deg y a s , k + k =1
[
my
]
... + ∑ wmv vy a s , β a s ,deg y a s , γ a s ,deg y a s (s, k ) ⋅ k =1
[
]
v[ β as ,deg y as , mv ] y γ a s ,deg y as , k = 0 .
(2.42)
Оставляя в (2.42) члены, связанные только с x, v, x 2 , v 2 , xv, vx , получим билинейную модель, обобщающую симметричную
(
)
Φ x, v, x 2 , v 2 , xv, vx = 0 nx
[
]
[
]
∑ wx a s ,α a s ,1 (s, k )x α a s ,1 , k + ...
k =1
nx
[
]
[
]
+ ∑ wx a s ,α a s ,deg x a s (s, k )x α a s ,deg x a s , k + K k =1 nx
[
]
[
][
]
+ ∑ w1xx a s ,α a s ,1 ,α a s ,1 (s, k )x α a s ,1 ,1 x α a s ,1 , k + K k =1 mv
[
]
+ ∑ wm x xv a s ,α a s ,deg x a s , β a s ,deg v a s (s, k ) ⋅ k =1
[
][
]
x α a s ,deg x a s , m x v β a s ,deg v a s , k = 0 .
(2.43)
46
Отсюда, легко получить простейшую билинейную модель
Φ(x, v, xv ) = 0 в скалярной форме:
[
nx
]
[
]
∑ wx as ,α as ,1 (s, k )x α as ,1, k + ...
k =1
nx
[
]
[
]
+ ∑ wx as ,α as ,deg x as (s, k )x α as ,deg x as , k + k =1 nv
[
]
[
]
+ ∑ wv as , β as ,1 (s, k )v β as ,1, k + k =1
nv
[
]
[
]
+ ... ∑ wv as , β as ,deg v as (s, k )v β as ,deg v as , k + k =1
mx
[
]
[
][
]
+ ∑ w1vx a s ,α a s ,1 , β a s ,1 (s, k )v β a s ,1 ,1 x α a s ,1, k + K k =1 mx
[
]
+ ∑ wmv vx a s ,α a s ,deg x a s , β a s ,deg v a s (s, k )⋅ k =1
[
][
]
v β a s ,deg v a s , mv x α a s ,deg x a s , k = 0 .
(2.44)
2.4. Разработка алгоритмов параметрической идентификации билинейных систем Билинейную окрестностную систему
∑ wx [a,α ]x[α ] + ∑ wv [a, β ]v[ β ] + ∑ ∑ [ w1xv [a,α , β ]v[ β ,1]x[α ] + K α∈O x[ a ] β ∈Ov[ a ] α∈O x [a ] β ∈Ov [ a ] + wmxv [a,α , β ]v[ β , m]x[α ]] = 0 , где m -размерность вектора v , можно рассматривать как систему линейных алгебраических уравнений (СЛАУ) относительно элементов системных матриц wx [a,α ], wx [a,α ], wv [a,α , β ] вида [87, 93]
AW = 0 .
(2.45)
Матрица A имеет вид
A = [ Awx [a s ] Awv [a s ] Awxx [a s ] Awvv [a s ] Awxv [a s ]] , где s = 1, N , или
(2.46)
47
Awx [a1 ] A [a ] A = wx 2 Aw x [a N ]
Awv [a1 ] Awxx [a1 ] Awvv [a1 ] Awxv [a1 ] Awv [a2 ] Awxx [a2 ] Awvv [a2 ] Awxv [a 2 ] M Awv [a N ] Awxx [a N ] Awvv [a N ] Awxv [a N ]
(2.47)
Порядок матрицы A N
N
N
i =1
i =1
i =1
cN × [c (n ∑iN=1 deg x ai + m ∑iN=1deg v ai + n 2 c ∑ deg 2x ai + m 2 c ∑ deg v2 ai + nc ∑ deg x ai deg v ai ] .
Пусть
0 axi ∈ R c×cndeg xai ,
0 vai ∈ R c×cmdegv ai ,
2 2 0 axxi ∈ R c×cn deg x ai ,
c×cm 2 deg v2 ai , 0 vv 0 axvi ∈ R c×cnmdeg x aidegvai ––нулевые матрицы. Тогда блоки ai ∈ R
матрицы A , соответствующие неизвестным элементам матриц wx в узле a s , принимают вид A wx [a s] = [0 ax K0 ax A wx [a s ,α a s,1]K A wx [a s ,α a s,deg xa s] 0 ax K 0 ax ] . 1 s −1 s +1 N
(2.48)
Блоки матрицы A , соответствующие неизвестным элементам матриц wv в узле a s , принимают вид A wv [a s ] = [0 va K 0 va A wv [a s , β a s,1]K A wv [a s , β a s,deg a s ] 0 va K 0 va N ] . 1 s −1 v s +1
(2.49)
Блоки матрицы A , соответствующие неизвестным элементам матриц wxv в узле a1 , принимают вид A wxv [a1] = [ A wxv [a1,α a1,1 , β a1,1]K K A wxv [a1,α a1,deg a1 , β a ,deg a ] 0 axv K 0 axv ]. x 1 2 N v 1
(2.50)
Для произвольного узла a s имеем
A wxv [a s] = [0 axv1 K 0 axvs−1 A wxv [a s ,α a s,1 , β a s,1] K K A wxv [a s ,α a ,deg a , β a ,deg a ] 0 axv K0 axv ] . s x s N s +1 s v s
(2.51)
Аналогично для узла a N : A wxv [a N ] = [0 axv1 K 0 axv
N −1
A wxv [a N ,α a N ,1 , β a N ,1 ]K
K A wxv [a N ,α a ,deg a , β a ,deg a ]] . N x N N v N В свою очередь, указанные блоки матрицы
(2.52) A , соответствующие
48
элементам матриц wx в узле a j , состоят из блоков. Эти блоки являются коэффициентами в уравнении (2.45) при элементах матрицы параметров
wx [ a j , k ] xT [ k ] 0 n 0 n 0 n K 0 n 0 n T 0 n x [k ] 0 n 0 n K 0 n 0 n A wx [a j , k ] = 0 n 0 n xT [ k ] 0 n K 0 n 0 n . M K M 0n 0 n 0 n K xT [k ] 0 n 0 n
(2.53)
Размерность блоков следующая:
A w x [a j , k ]∈ R c×cn , j = 1, N , k = {α a j,1,K,α a j,deg xak}. Следующие блоки являются коэффициентами в уравнении (2.45) при элементах матрицы параметров wv [a j , k ] v T [ k ] 0 m 0 m 0 m K 0 m 0 m T [k ] K v 0 0 0 0 0 m m m m m A wv [a j , k ] = 0 m 0 m vT [k ] 0 m K 0 m 0 m . M K M 0 m 0 m 0 m 0 m K vT [k ] 0 m
(2.54)
Размерность блоков следующая: A wv [a j , k ]∈ R c×cm , j = 1, N , k = {β a j,1,K, β a j,deg ak} . v Следующие блоки являются коэффициентами в уравнении (2.45) при неизвестных
элементах
двумерных
матриц
w pxv [a j , k , β ] ,
являющихся
плоскими срезами трехмерных матриц Wxv [a,α , β ] : v[ β a ,l , p ] xT [k ] K 0n 0n 0 n j T [k ] K v [ β , p ] 0n x 0n 0 n a j ,l A w pxv [a j , k , p ] = , (2.55) M M T K v[ β a j ,l , p ] x [k ] 0 n 0n 0n где размерность блоков Aw pxv ∈ R c×cnm , j = 1, N , k = {α a j,1,K,α a j,deg a }, l = {β a ,1,K, β a ,deg }, x k j j va k
49
p = 1, m . Далее Awsxx ∈ R c×cn 2 , Awsvv ∈ R c×cm 2 . Вектор
неизвестных,
составленный
из
элементов
матриц
wx , wv , wxv [a,α , β ] , имеет вид w x [a1 ,α a1,1 ] M w [a ,α ] x 1 a1,deg x a1 M wv [a N ,α a N ,1 ] M wv [a N ,α a ,deg a ] N v N w1xx [a1 ,α a1,1 ,α a1,1 ] M W = wnxx [a N ,α a N ,deg x a N ,α a N ,deg x a N ] M w [a , β , ] β 1vv 1 a1,1 a1,1 M [ , w a β mvv N a N ,deg v a N , β a N ,deg v a N ] M w [a ,α , β 1xv 1 a1,1 a1,1 ] M [ , w a α mxv N aN ,deg x a N , β a N ,deg v a N ]
(2.56)
Размер матрицы W c[n ∑ iN=1deg x ai + m ∑ iN=1deg v a i + n 2 ∑ iN=1deg 2 x ai +m 2 ∑ iN=1 deg 2 v ai + + nm∑ iN=1 ∑ Nj=1deg x ai deg v a j ] . Блоки вектора W имеют приведенную ниже структуру. Блок, связанный с неизвестными элементами матриц wx [a,α ] , имеет вид w x [a i ,α ai, j ](1,1) M w [a ,α ](1, n) x i a i, j cn w x [ ai , α a i , j ] = M ∈ R , i = 1, N , j = 1, deg x a i . wx [a i ,α ai, j ](c,1) M wx [a i ,α ai, j ](c, n) Блок,
связанный
с
неизвестными
элементами
матриц
(2.57)
wv [a, β ] ,
50
следующий: wv [a i , β ai, j ](1,1) M w [ , β ](1, m) v a i ai , j cm i = 1, N , j = 1, deg v a i . wv [a i , β ai, j ] = M ∈R , wv [a i , β ai, j ](c,1) M w [ , β ](c, m) v a i ai , j
(2.58)
Блок, связанный с неизвестными элементами матриц w pxx [a,α , β ] , следующий: wxx [ai ,α ai , j ,α ai , p ](1,1) M w [ a ,α ,α ai , p ](1, n) , xx i a j i cn w pxx [ai ,α ai , j ,α ai , p ] = M ∈R , wxx [ai ,α ai , j ,α ai , p ](c,1) M wxx [ai ,α a , j ,α a , p ](c, n) i i
(2.59)
i = 1, N , j = 1, deg x a i , p = 1, n . Блок, связанный с неизвестными элементами матриц w pvv [a,α , β ] , следующий: wvv [ai , β ai , j , β ai , p ](1,1) M w [a , β , β ai , p ](1, m) vv i a , j i cm w pvv [ai , β ai , j , β ai , p ] = M ∈R , wvv [ai , β ai , j , β ai , p ](c,1) M wvv [ai , β a , j , β a , p ](c, m) i i
(2.60)
i = 1, N , j = 1, deg v a i , p = 1, m . Блок, связанный с неизвестными элементами матриц w pxv [a,α , β ] , следующий:
51
w xv [a i ,α ai , j , β ai , p ](1,1) M w [a ,α ,β ](1, n ) xv i ai , j ai , p cm w pxv [a i ,α ai , j , β ai , p ] = M ∈R , w xv [a i ,α ai , j , β ai , p ](c,1) M w xv [a i ,α a , j , β a , p ](c, n) i i
(2.61)
i = 1, N , j = 1, deg x ai , p = 1, m . Для получения нетривиального решения системы (2.45) экспертам следует задать часть элементов матриц (2.45), т.е. решить задачу смешанной идентификации билинейной системы.
{
[
]
w w Пусть заданы N wx элементов матриц wx ad i , a f i rowi x , coli x , где
} {
}
d i = d1 ,..., d N w , f i = f1 ,..., f N w - множества номеров узлов с заданными x x элементами матриц wx
wx , rowi
w w w w w = row1 x ,..., rowN x , coli x = col1 x ,..., col N x - множества wx wx
номеров строк и столбцов заданных элементов в матрицах wx .
{
[
]
w w Пусть заданы N wv элементов матриц wv aei , a g i rowi v , coli v
} {
ei = e1 ,..., e N w , g i = g1 ,..., g N w v v wv
элементами матриц wv , rowi
}-
, где
множества номеров узлов с заданными
= row1 v ,..., rowNv wv w
w
, col wv = col wv ,..., col wv 1 i N wv
- множества номеров строк и столбцов заданных элементов в матрицах wv . Заданы
[
N wxx
]
w pxx
w pxx ak i , ali , ahi (rowi
матриц w xx [a,α , β ] , где
{
неизвестных w pxx
, coli
} {
элементов
двумерных
матриц
), являющихся плоскими срезами трехмерных
} {
}
ki = k1 ,..., k N w , li = l1 ,..., l N w , hi = h1,..., hN w - множества номеров xx xx xx узлов с заданными элементами матриц w pxx ,
52 w pxx
rowi
w w w w w = row1 pxx ,..., rowN pxx , coli pxx = col1 pxx ,..., col N pxx - множества wxx wxx
номеров строк и столбцов заданных элементов в матрицах w pxx . Заданы
неизвестных
N wvv
[
]
w pvv
w pvv ari , a ni , at i (rowi
w pvv
{
vv
}, n = {n ,...,n i
1
двумерных
матриц
), являющихся плоскими срезами трехмерных
, coli
матриц wvv [a,α , β ] , где ri = r1 ,..., rN w
элементов
} {
N wvv , ti = t1 ,..., t N wvv
} - множества номеров
узлов с заданными элементами матриц w pvv , w pvv
rowi
w w w w w = row1 pvv ,..., row N pvv , coli pvv = col1 pvv ,..., col N pvv - множества wvv wvv
номеров строк и столбцов заданных элементов в матрицах wvv . Заданы
неизвестных
N wxv
[
]
w pvv
w pxv a zi , aui , ali (rowi
w pvv
, coli
матриц wvv [a,α , β ] , где
{
zi = z1 ,..., z N w
xv
1
двумерных
матриц
), являющихся плоскими срезами трехмерных
}, u = {u ,...,u i
элементов
} {
N w xv , li = l1,..., l N w xv
} - множества номеров
узлов с заданными элементами матриц w pxv , w pxv
rowi
= row1
w pxv
w w w w ,..., rowN pxv , coli pxv = col1 pxv ,..., col N pxv - множества wxv wxv
номеров строк и столбцов заданных элементов в матрицах w pxv . Необходимое
число
задаваемых
N wx + N wv + N wxx + N wvv + N wxv = c ⋅ N .
ненулевых
элементов
матриц (2.62)
При этом желательно, чтобы произведения задаваемых элементов матриц на соответствующие компоненты сигналов были ненулевыми. Это гарантирует, что в правой части преобразованного уравнения (2.45) не будет нулевых элементов и уравнение (2.45) примет вид
AW = B .
(2.63)
Тогда число неизвестных уменьшится и составит следующую величину:
53
c[n ∑ iN=1deg x ai + m ∑ iN=1deg v a i + n 2 ∑ iN=1deg 2 x ai +m 2 ∑ iN=1 deg 2 v ai + + nm∑ iN=1 ∑ Nj=1 deg x ai deg v a j ] − ( N wx + N wv + N wxx + N wvv + N wxv ) .
(2.64)
В формулах (2.46)–(2.55) произойдут следующие изменения: в блоках A wx [a j , k ] , вычисляемых по формуле (2.53), вырезаются wx [ , столбцы с индексами rowiwx ⋅ n + col iwx ; пусть их всего N cut a d i α d i, j ] ;
в блоках A wv [a j , k ] , вычисляемых по формуле (2.54), вырезаются wv Ω столбцы с индексами rowΩ i ⋅ m + col i ; пусть их всего N cut [ a ei , β ei, j ] ;
в блоках A w pxx [a j , k , p ] , вычисляемых по формуле (2.55), вырезаются w pxx [ , β столбцы с индексами rowiw pxx ⋅ n + col iw pxx ; пусть их всего N cut a k i k i, j ] ;
в блоках A w pvv [a j , k , p ] , вычисляемых по формуле (2.55), вырезаются w pvv [ , β столбцы с индексами rowiw pvv ⋅ n + col iw pvv ; пусть их всего N cut a r i r i, j ] ;
в блоках A w pxv [a j , k , p ] , вычисляемых по формуле (2.55), вырезаются w pxv [ , β столбцы с индексами rowiw pxv ⋅ n + col iw pxv ; пусть их всего N cut a z i z i, j ] ; xv изменится число столбцов у нулевых матриц 0axd , 0vae , 0 axxk , 0 vv ar i , 0 a zi i i i
на
(уменьшится
wx x ai ∑ deg j =1 N cut[ a d i ,α d i, j ] ,
w pxx xai ∑ deg j =1 mN cut [ a k i , β k i, j ] ,
w pvv vai ∑ deg j =1 mN cut [ a r i , β r i, j ] ,
2
xai ∑ deg j =1
deg ai v mN w pxv [ a
cut
z i , β z i, j ]
wv vai ∑ deg j =1 N cut[ a ei , β ei, j ] , 2
соответственно).
В векторе свободных членов СЛАУ B ∈ R cN ×1 ненулевой элемент, равный
wx [a d , a f ](row, col ) ⋅ x[a f , col] , появится в строке с номером c ⋅ (a d − 1) + row . Элемент
этого
вектора,
соответствующий
wx [a d i , a f i ](rowiwx , col iwx ) матрицы wx , примет вид b[c ⋅ ( a d i −1) + rowiw x ] =
заданному
элементу
54
= b[c ⋅ (a d i − 1) + rowiwx ] − wx [a d i , a f i](rowiwx , col iw x ) ⋅ x[a f i , col iwx ] . Элемент
вектора
B,
соответствующий
заданному
элементу
wv [a ei , a g i ](rowiwv , col iwv ) матрицы wv , примет вид b[c ⋅ ( a ei −1) + rowiwv ] =
= b[c ⋅ (a ei − 1) + rowiwv ] − wv [a ei , a g i]( rowiwv , col iwv ) ⋅ v[a ei , col iwv ] . Элемент
вектора
B,
соответствующий
заданному
элементу
w pxx [a k i , a li , a hi ](rowiw pxx , col iw pxx ) матрицы w pxx , примет вид b[c ⋅ ( a k i −1) + rowiw pxx ] = b[c ⋅ ( a k i −1) + rowiw pxx ] −
− w pxx [a k i , a li , a hi ](rowiw pxx , col iw pxx ) ⋅ x[a k i , col iw pxx ] ⋅ v[a a k ,ah , p ] . i
Элемент
вектора
B,
соответствующий
i
заданному
элементу
w pvv [a ri , a ni , a ti ](rowiw pvv , col iw pvv ) матрицы w pvv , примет вид b[c ⋅ ( a r i −1) + rowiw pvv ] = b[c ⋅ ( a r i −1) + rowiw pvv ] −
− w pvv [a r i , a ni , a ti ](rowiw pvv , col iw pnn ) ⋅ v[a ri , col iw pvv ] ⋅ x[a ar ,a n , p ] . i
Элемент
вектора
B,
соответствующий
i
заданному
элементу
w pxv [a zi , a ui , a pi ](rowiw pxv , col iw pxv ) матрицы w pxv , примет вид b[c ⋅ ( a z i − 1) + rowiw pxv ] = b[c ⋅ ( a z i −1) + rowiw pxv ] −
− w pxv [a z i , a u i , a p i ](rowiw pxv , col iw pxv ) ⋅ v[a z i , col iw pxv ] ⋅ x[aa ,a u , p] . zi i СЛАУ может быть решена с использованием псевдообращения. Если A + псевдообратная к A , то
W = A+ B + ( I − A+ A) y ,
(2.65)
где I - единичная матрица, y - вектор с произвольными элементами соответствующей размерности. Проверку выполнения свойства параметрической идентифицируемости можно осуществить в терминах псевдообратных матриц. Очевидно, что билинейная окрестностная система строго идентифицируема тогда и только
55 Начало Ввод исходных данных: v, x, известных элементов матриц k=0
k