ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ ИНДУСТРИАЛЬНЫЙ УНИВЕРСИТЕТ
Н.Н. Карабутов
СТРУКТУРНАЯ ИДЕНТИФИКАЦИЯ СИСТЕМ Анализ динамических структур
МГИУ 2008
УДК 517.05:005 ББК 22.161 К21 Рецензенты: Ю.Г. Ионов, профессор кафедры проблемы управления МИРЭА, доктор технических наук
Карабутов Н.Н. К21 Структурная идентификация систем: Анализ динамических структур. — М.: МГИУ, 2008. – 160 с. ISBN 978-5-2760-1752-5
Рассмотрены вопросы структурной идентификации динамических систем на основе анализа наблюдаемых информационных портретов в условиях неопределенности. Предложены методы оценки состояния равновесия динамической системы. Описаны процедуры нахождения собственных чисел динамической системы. На основе информационного синтеза разработан метод оценки нелинейной структуры системы без применения методов параметрического оценивания. Предложены методы структурной идентификации статических объектов. Изложены процедуры оценки области параметрических ограничений в условиях априорной неопределенности. Будет полезна всем, кто занимается вопросами синтеза систем автоматического управления, а также студентам и специалистам, изучающим проблемы экономического анализа на основе применения информационных технологий, эконометрический и технический анализ и его применение в экономических информационных системах. УДК 517.05:005 ББК 22.161
ISBN 978-5-2760-1752-5
© Карабутов Н.Н., 2008 © МИРЭА, 2008
Оглавление Предисловие.............................................................................................................................. 5 Введение.................................................................................................................................... 7
Глава 1. ПРОБЛЕМА ИДЕНТИФИКАЦИИ СИСТЕМ.................................... 10 1.1. Подходы и методы идентификации ........................................................................ 10 1.2. Параметрические модели динамических систем ................................................... 13 1.2.1. Безынерционные динамические модели..................................................................16 1.2.2. Инерционные динамические модели .......................................................................17 1.2.3. Окрестностные системы............................................................................................20
1.3. Критерии идентификации ........................................................................................ 21 1.4. Методы выбора структуры модели ......................................................................... 22
Глава 2. НАБЛЮДАЕМЫЕ ИНФОРМАЦИОННЫЕ ПОРТРЕТЫ .............. 27 2.1. Основные понятия и определения ........................................................................... 27 2.2. Примеры наблюдаемых информационных портретов .......................................... 30 2.3. Применение индексов для определения структуры динамической системы...... 36 2.3.1. Индекс особой точки и его свойства........................................................................37 2.3.2. Применение индекса в задачах структурной идентификации с помощью НИП .......................................................................................................39
2.4. Определение особой точки по наблюдаемому информационному портрету ..... 41
Глава 3. СТРУКТУРНАЯ ИДЕНТИФИКАЦИЯ ДИНАМИЧЕСКИХ СИСТЕМ..................................................................................................... 44 3.1. Коэффициент структурности динамической системы .......................................... 45 3.2. Определение порядка линейной динамической системы на основе анализа коэффициента структурности.................................................................................. 47 3.3. Определение типа особой точки динамической системы .................................... 51 3.3.1. Постановка задачи .....................................................................................................52 3.3.2. Модели и подходы к решению задачи .....................................................................52 3.3.3. Критерии оценки типа точки состояния равновесия..............................................55 3.3.4. Примеры идентификации состояния равновесия ...................................................57 3.3.5. Применение характеристических показателей Ляпунова для оценки состояния равновесия...........................................................................61 3.3.6. О связи характеристического показателя Ляпунова и коэффициента структурности. Оценка собственных чисел системы............................................62
3.4. Оценка структуры нелинейной динамической системы ....................................... 69 3.4.1. Постановка задачи .....................................................................................................70 3.4.2. Подход к идентификации класса нелинейностей ...................................................70 3.4.3. Выбор информационного подмножества в I N для идентификации функции χ = ϕ ( y ) ....................................................................................................73 3.4.4. Структурная идентификация функции χ ...............................................................74 3.4.5. Примеры .....................................................................................................................76
3.5. Получение параметрических ограничений в условиях неопределенности......... 81 3.5.1. Постановка задачи .....................................................................................................82 3.5.2. Подход и модели для получения параметрических ограничений .........................83 3.5.3. Выбор порога в алгоритме классификации (3.53) ..................................................85 3.5.4. Адаптивные алгоритмы оценивания параметров T- и B-систем ...........................87 3.5.5. Свойства адаптивной системы..................................................................................88
3.6. Заключение .................................................................................................................. 9
Глава 4. СТРУКТУРНАЯ ИДЕНТИФИКАЦИЯ СТАТИЧЕСКИХ СИСТЕМ.................................................................................................................... 96 4.1. Плоскость, секущая наблюдаемый информационный портрет............................ 96 4.2. Выбор информативных переменных системы с помощью секущих ................. 102 4.3. Нахождение коэффициента структурности статических объектов.................... 106 4.3.1. Оценка коэффициента структурности ...................................................................106 4.3.2. Об информационном аспекте оценки коэффициента структурности.................111
4.4. Оценка нелинейных параметров модели на основе анализа НИП..................... 113 4.5. Поле структур для статической системы на множестве секущих...................... 123 4.6. Оценка области параметрических ограничений в условиях неопределенности ............................................................................... 128 4.6.1. Оценка области параметрических ограничений, заданной в виде интервала изменения параметров .........................................................................128 4.6.2. Адаптивный алгоритм определения параметров области Ω A ............................138 4.6.3. Оценка области параметрических ограничений, заданной в виде ограничения на норму изменения параметров ....................................................139 4.6.4. Получение параметрических ограничений на основе анализа НИП ..................149
4.7. Заключение .............................................................................................................. 151 Библиографический список.......................................................................................................
4
Предисловие Вопросы идентификации процессов и явлений занимают одно из центральных мест в современной теории управления и принятия решений. Основу теории построения математических моделей (идентификации) составляет информационно-алгоритмический подход. В условиях априорной неопределенности информационная составляющая начинает играть доминирующую роль, так как от ее анализа во многом зависит применение тех или иных алгоритмических процедур, а также методов формализации, позволяющих синтезировать математическое описание для исследуемого объекта. Прежде чем применять методы параметрической идентификации, необходимо определить структуру модели. Это одна из основных проблем теории идентификации. Как правило, в большинстве работ по синтезу математических моделей структура постулируется априори с точностью до некоторого множества неизвестных параметров. В дальнейшем это множество является основным объектом исследования. Это не означает, что методам идентификации структурной идентификации не уделялось внимания. Доминирующим подходом при выборе структуры является статистический подход и решение принимается на заданном классе моделей-претендентов. Но какие-либо формализованные подходы и методы, позволяющие выбрать структуру модели на основе доступного для наблюдения информационного множества объекта, отсутствуют. Это объясняется тем, что некоторые элементы структуры модели не поддаются адекватной математической трактовке. Поэтому структурное множество часто сужают до таких математических категорий и объектов, которые можно описать на существующем математическом языке и, следовательно, задать на классе функций из заданного множества. Наиболее сложной и наименее изученной является проблема оценки структуры нелинейных систем. Если для класса регрессионных моделей предложен ряд методов, основанных на статистическом подходе, то для динамических систем какие-либо форма5
лизованные процедуры отсутствуют. В данной книге разрабатывается подход к структурной идентификации статических и динамических систем в условиях неопределенности, основанный на методологии информационного синтеза системы "объект + среда". Для этого строится динамическая структура — наблюдаемый информационный портрет — и по ней принимается решение как о классе моделей, так и применении соответствующих методов анализа информации и принятия решений. Выбор структуры модели — задача многокритериального принятия решения. Производной от наблюдаемого информационного портрета является коэффициент структурности, получение и анализ которого обеспечивает принятие решения о структурных свойствах системы. С помощью метода секущих наблюдаемого информационного портрета строится поле структур статического объекта. Некоторые из изложенных подходов легли в основу лекций, которые автор читал студентам Московского государственного института радиотехники, электроники и автоматики (технического университета). Ряд алгоритмов применялся при чтении дисциплин “Информационные технологии в экономике” и “Информационные технологии управления”в Московском государственном индустриальном университете.
6
Введение При решении задач управления, изучении новых процессов, анализе экономических систем широко применяются математические модели. Выбор структуры модели диктуется как условиями реализации, так и требованием адекватности. Построения модели — это чисто интуитивный процесс, сводящийся к формированию структуры модели с последующей настройкой ее параметров. Настройка или определение параметров реализуется на основе применения регулярных математических методов. В условиях априорной неопределенности интуиция является одной из составляющих процесса принятия решения о структуре модели. На первый план выходит анализ данных с целью получения дополнительных структурных свойств данных, отражающих те или иные характерные черты системы. Одно из направлений, позволяющих получить дополнительную информацию о структуре объекта, основано на анализе наблюдаемых информационных портретов — динамических структур, заданных в пространстве "вход-выход". Целью данной книги является разработка методов и алгоритмов структурной идентификации в условиях неопределенности на основе информационного синтеза и анализа динамических структур — наблюдаемых информационных портретов, отражающих свойства объекта в пространстве "вход-выход". Книга состоит из четырех глав. В первой главе дается обзор методов и подходов к проблеме идентификации в условиях неопределенности. Вторая глава посвящена построению и анализу динамических структур в системах идентификации. Эти структуры получили название наблюдаемого информационного портрета (НИП). Частным случаем НИП является фазовый портрет, который применяется для анализа систем не выше второго порядка при полной наблюдаемости переменных состояния и известной модели. Введено понятие коэффициента структурности. Для анализа структурных свойств системы на основе НИП использовано понятие индекса. 7
Третья глава посвящена структурной идентификации динамических систем на основе анализа информационных портретов, которые могут быть как наблюдаемыми, так и виртуальными, отражающими состояние системы идентификация на данном этапе информационного синтеза. Для принятия предварительного решения о структурных свойствах системы используется коэффициент структурности. Описан метод нахождения порядка модели, основанный на минимизации ширины интервала изменения коэффициента структурности. Предложен метод идентификации типа точки равновесия динамический системы на основе анализа НИП. Он не требует построения математической модели динамической системы. Показано, что для реализации предлагаемого подхода можно использовать класс статических моделей. Причем эти модели должны иметь динамическую спецификацию по входу и служат для оценки вынужденного движения системы. Предложены способы выделения свободного движения системы и критерии оценки типа точки состояния равновесия на его основе. Приводится метод определения структуры модели, описывающей нелинейную часть системы. Показана связь между характеристическими числами Ляпунова и коэффициентом структурности системы. Предложен адаптивный алгоритм оценки спектра собственных чисел линейной части динамической системы на основе специальным образом сформированного информационного множества. В заключение изложен подход к определению параметрических ограничений в условиях неопределенности. В четвертой главе дается развитие идей, изложенных в третьей главе, на статические системы. Предложен способ выбора информативных переменных на основе применения секущих наблюдаемого информационного портрета. В отличие от динамических систем проблема нахождения коэффициента структурности для статических систем является более сложной. Локальный коэффициент структурности является текущей оценкой параметра модели при соответствующем элементе вектора входа системы. Введено понятие информационной мощности сигнала. Показано, что применение многошаговой процедуры нахождения коэффициента структурности приводит к расходованию информацион8
ной мощности объекта. Предложен метод информационного синтеза структуры нелинейных статических систем в условиях неопределенности на основе анализа наблюдаемого информационного портрета. Информационный синтез позволяет выделить некоторое подмножество данных, которое содержит информацию о нелинейных свойствах системы. Предложены критерии и алгоритмы принятия решений о структуре модели. Для случая нелинейностей, относящихся к классу степенных функций, разработан метод выпрямления информационного портрета, который позволяет подобрать показатель степени. Данный метод применим только к "управляемым" моделям, то есть моделям, которые содержат параметр, который можно изменять таким образом, чтобы выполнялось заданное целевое условие. Для статических систем, описываемых более общим классов нелинейных функций, предложен подход, основанный на построении поля структур на множестве секущих. Показано, что нелинейной системе соответствует линейное поле структур. Для принятия решения о структуре исследуемой модели введено секторное условие. Заключительная часть главы содержит результаты по оценке области параметрических ограничений в условиях неопределенности. Показано, что для идентификации области параметрических ограничений пригодны не все векторные нормы. Изложен способ получения параметрических ограничений на основе анализа наблюдаемого информационного портрета. Работоспособность практически всех изложенных процедур и методов подтверждается результатами моделирования. В заключение хотелось бы отметить, что в силу многообразия существующих подходов и методов к проблеме идентификации в условиях неопределенности новые задачи могут возникать во многом благодаря анализу информационного множества системы. Это направление еще не получило должного развития, но учитывая прогресс в информационных и математических технологиях, позволяющих автоматизировать процесс предварительного анализа данных, может появиться возможность расширения рамок оценивания структурных параметров и характеристик данных, а, следовательно, и самой изучаемой системы. 9
Глава 1. ПРОБЛЕМА ИДЕНТИФИКАЦИИ СИСТЕМ Решение задачи построения математических моделей динамических систем по данным наблюдения за их поведением составляет предмет теории идентификации, которая тем самым становится элементом общей научной методологии. Льюнг Л. Идентификация систем.
1.1. Подходы и методы идентификации Идентификация системы сводится к определению структуры и параметров модели по наблюдаемым данным (входу и выходу объекта) и имеющейся априорной информации. Все существующие подходы к идентификации можно разбить на две группы — статистические и множественно-функциональные (детерминированные). Указанные классы различаются учетом природы возмущений (помех), действующих на систему, и получаемыми оценками. На этапе создания теории идентификации преобладал статистический подход к задаче оценивания параметров. В рамках этого подхода постулировалась структура модели объекта, а относительно всех неопределенных факторов и помех предполагалось, что они носят случайный характер [6, 12, 13, 35, 51, 56, 69]. Модели действующих возмущений и помех задавались в виде закона распределения, а большинство применяемых алгоритмов основывалось на методе наименьших квадратов. Реализация этих подходов и процедур в системах управления требовала привлечения мощных вычислительных средств, разработки стабильных методов оценки вероятностных характеристик возмущений. Но несмотря на это стохастический подход к проблеме идентификации применялся и в дальнейшем в связи с развитием и применением адаптивных методов идентификации. В рамках рассматриваемого подхода структура модели постулировалась априори. Такое же состояние проблемы структурной идентификацией сохранилось до настоящего времени. Несмотря на большое разнообразие алгоритмов и методов идентификации, так и не удалось пред10
ложить какие-либо процедуры регулярного синтеза структуры модели [50]. Основные подходы к выбору структуры попрежнему основываются на интуиции исследователя и методе перебора претендентов из заданного класса моделей. Объясняется такая ситуация сложностью и разнообразием объектов управления, плохой изученностью процессов, протекающих в объекте. Для оценки параметров модели на основе данных, полученных в процессе нормальной эксплуатации, использовались методы ретроспективной идентификации [6, 12, 13, 35, 51, 56, 59, 69], а немного позже в связи с повышением требований к качеству управления и развитием средств вычислительной техники и автоматизации стали применяться настраиваемые модели [12, 56, 71, 77]. В условиях априорной неопределенности для управления объектами широко применяются системы с непрямым адаптивным управлением, так как позволяют обеспечить высокое качество функционирования. Основным звеном таких систем является блок идентификации. В зависимости от свойств объекта и требований, предъявляемых к системе, могут применяться как методы ретроспективной, стратегической идентификации (модель определяется вне контура управления), так и подходы, основанные на текущей или оперативной идентификации [24, 50, 56, 59, 66]. Несмотря на обилие публикаций можно выделить лишь несколько подходов к адаптивному параметрическому оцениванию. В основном это методы наименьших квадратов, стохастической аппроксимации и их модификации, а так же различные градиентные алгоритмы. При решении практических задач теории управления теоретические предпосылки, лежащие в основе указанных методов, как правило, не выполнялись и поэтому эффективность многих процедур идентификации была невысокой. Неучет реальных свойств приводил, в частности, к потере свойств оптимальности, замедлению или ухудшению скорости сходимости [66]. Поэтому в теории идентификации остро встала проблема обеспечения грубости применяемых алгоритмов и методов, непосредственно связанная с учетом ограничений и условий функционирования системы «объект + среда». Это был следующий этап развития статистического направления развития методов параметрического оценивания. 11
Для решения проблемы робастности (грубости) адаптивных алгоритмов было предложено ряд подходов [14, 53, 65, 66], которые в последующем составили основу нового научного направления — информационной теории идентификации. Указанное направление базировалось на учете априорной информации о среде в виде задания класса наименее благоприятных распределений помехи. Такой подход не позволяет полностью учесть реальные условия функционирования объекта. Кроме того, в этом случае возникают трудности, связанные с оценкой качества работы алгоритмов идентификации по конечным выборкам. Полученные алгоритмы являются нелинейными относительно ошибки оценивания. Если же ограничения на помеху носят нестатистический характер, или известна дополнительная информация о входе, выходе или параметрах объекта, то предлагаемая методология является неработоспособной. Существует целый класс объектов управления, для которых априори задавать класс наименее благоприятных распределений возмущений и помех не представляется возможным, а сама задача оценивания не вкладывается в схему стохастической аппроксимации. Это замечание справедливо и для ряда стохастических задач управления [7]. В этом случае для возмущения или помехи задают гарантированные оценки [39, 40, 61, 67, 81]
ξ (t ) ∈ Gξ ,
(1.1)
где ξ (t ) ∈ R q — помеха, G ξ — некоторое замкнутое множество с известным уравнением границ. Такой подход к заданию класса возмущений применим к процессам, имеющим как статистическую, так и нестатистическую природу, а оценка (1.1) является более реалистичной, чем задание вероятностных характеристик в условиях априорной неопределенности. Для решения задач параметрической идентификации при нестатистической трактовке возмущений и помех ξ (t ) может применяться несколько подходов. Они различаются классом получаемых оценок для параметров объекта и условно могут быть разделены на две группы. Первая группа ориентирована на получение точечных оценок параметров с помощью адаптивных методов [27, 36, 37, 70]. Наиболее общие результаты в рамках дан12
ного подхода получены А.А. Крассовским [36, 37]. Им предложена схема синтеза системы адаптивной идентификации непрерывного объекта исходя из условия оптимизации критерия обобщенной работы и получен общий вид алгоритма параметрического оценивания. Этот алгоритм описывается функциональным рядом и в таком виден нереализуем. Если взять к нему первое приближение, то получим класс градиентных алгоритмов, использующих функцию чувствительности. Другая группа методов использует функционально-множественные подходы (минимаксный, игровой, теоретико-множественный, многозначный, интервальный) [39, 40, 41, 62, 68] и направлена на получение множественных оценок параметров объекта вида Aˆ (t ) ∈ G , A
содержащих истинные значения искомого вектора параметров. G A представляет собой некоторое априори неизвестное ограниченное множество, которое может определяться в процессе идентификации. Получаемые в этом случае оценки принято называть эллипсоидальными или гарантированными. Чаще всего множество G A является замкнутым и для него определяются или задаются априори уравнения границ.
1.2. Параметрические модели динамических систем Параметрический подход является доминирующим в теории идентификации [6, 12, 13, 27, 35, 51, 56, 69, 71]. Естественно, что параметрические модели применяются в адаптивных системах идентификации и управления. Широкое распространение параметрического подхода объясняется, во-первых, самим развитием теории автоматического управления, во-вторых, попыткой описать в виде моделей физические процессы, протекающие в объекте, в-третьих, алгоритмизацией исследуемых процессов. Введение параметров в модель позволяет отразить структуру, организацию элементов в объекте, их взаимосвязь. О работоспособности объекта прежде всего судят по пределам изменения его 13
параметров. И, наконец, только благодаря параметрическому представлению удалось решить задачу управления в условиях неопределенности. Параметрический подход неразрывно связан с методами построения и реализации моделей, зависящих от параметров. Как правило, математическая модель строится для описания какихлибо процессов, протекающих в объекте, или изучения явлений различной природы. В теории автоматического управления математические модели отражают причинно-следственные связи между наблюдаемыми переменными в пространстве «вход-выход». ξ(t ) U (t )
Y (t ) ~ Y (t )
Объект управления
Y1 (t )
Рис. 1.1. Блок-схема объекта управления
Объект, рассматриваемый с точки зрения вход-выходных соотношний, обычно представляется в виде, показанном на рис. 1.1. ~ Здесь Y (t ) вектор наблюдаемых переменных, который для большинства объектов управления можно записать в виде [58] ~ Y (t ) = Y (t ) U Y1 (t ) , где Y (t ) ∈ R n — непосредственный выход объекта, Y1 (t ) ∈ R l — вектор косвенных переменных, по которым можно судить о состоянии объекта, Y1 (t ) = Y1 (Y , t ) .
Пространство входных переменных также можно разбить на два подмножества: управляющих переменных U (t ) ∈ R k и переменных ξ (t ) ∈ R q (возмущений), изменяющихся по независимым от нас и в общем случае априори неизвестным причинам. ξ (t ) отражает влияние внешней среды на объект и может носить случайный характер. Некоторые переменные из ξ (t ) поддаются контролю (контролируемые возмущения) и используются для решения задач управления, другие являются вредными и по отноше14
нию к объекту могут рассматриваться как шум. В задачах идентификации предполагается, что влияние среды на объект проявляется в виде некоторого шума (помехи). Причинно-следственные связи в объекте на множестве экспериментальных данных I э = { Y (t ), U (t ) t ∈ J } можно описать с помощью математической модели X& (t ) = F1 ( X , A1 ,U , t ,τ ), (1.2) Y (t ) = F ( X , A,U , ξ , t ),
где X (t ) ∈ R m — вектор состояния, τ ∈ J — некоторый интервал времени (временная задержка), F , F1 — нелинейные операторы, структура которых известна с точностью до векторов неизвестных параметров A1 (t ) , A(t ) , принадлежащих ограниченной, но априори неизвестной области G A ⊆ Rυ . Векторы A1 (t ) , A(t ) могут быть постоянными или изменяться с течением времен t ∈ J неизвестным образом. Вектор X (t ) в данной записи характеризует внутренней состояние объекта, а Y (t ) является выходом. Уравнение (1.2) представляет общую запись процессов, протекающих в объекте, в параметрической форме. Из (1.2) можно получить различные виды параметрических представлений за счет изменения или преобразования аргументов или вида операторов F , F1 . Данное представление справедливо как для динамических, так и статических объектов. Для динамических объектов из (1.2) можно получить модель в пространстве состояний. При этом первое уравнение описывает эволюцию внутреннего состояния объекта (модель состояния), а второе — процесс измерения (модель наблюдения). Рассмотрим некоторые частные случаи уравнения (1.2), которые соответствуют часто применяемым параметрическим моделям в системах управления. Наиболее общим классом параметрических моделей являются динамические, которые можно разделить [10] на безынерционные и инерционные. Предлагаемая классификация основана на анализе и использовании информации I э , наблюдаемой на некотором интервале J = [t0 , t к ] и наиболее полно соответствует проблеме идентификации. Обычно к динамическим относят модели, описывающие процессы, обладающие свойством инерционности. 15
Под инерционностью понимают реакцию объекта на входное воздействие. В такой трактовке понятие инерционности (динамизма) ассоциируется с парой (U , Y ) объекта. Безынерционные динамические модели включают в себя еще одну переменную — время, которое в некоторых случаях может выступать и как входная переменная, и как переменная, отражающая предысторию объекта. Учитывая приведенные рассуждения, динамическую модель можно представить следующим образом. Введем переменную τ ∈ J = [t0 , t к ] и будем полагать, что t0 ≤ τ ≤ t . Тогда из уравнения (1.2) можно получить динамическое представление в пространстве {U , Y } Y (t ) = F ( A, Y (τ 1 ), U (τ 2 ), ξ (τ 3 ),τ i ∈ [tτ i , t ], i = 1,3 ) ,
(1.3)
где tτ i ≥ t0 . Из (1.3) видно, что динамические свойства объекта могут определяться как собственно его внутренней структурой, так и динамическими свойствами входа U (t ) и помехи ξ (t ) . Рассмотрим некоторые частные случаи (1.3). 1.2.1. Безынерционные динамические модели 1.2.1.1. Модель тренда. Широко применяется в задачах прогнозирования и сглаживания временных рядов [6, 45]. Для случая Y (t ) = y (t ) , y ∈ R модель записывается в виде y (t ) = F ( A, t ) + ξ (t ) ,
(1.4)
где ξ (t ) ∈ R — случайный процесс, F ( A, t ) — известная с точностью до вектора параметров A функция времени. Модель (1.4) может быть как линейной, так и нелинейной по A , а время t непрерывным или дискретным. 1.2.1.2. Регрессионная модель. Имеет вид y (t ) = F ( A,U , t ) + ξ (t ) ,
(1.5)
y (t ) = F ( A1 ,U (τ 2 ,τ 2 ∈ [tτ 2 , t ]) + ξ (τ 3 ,τ 3 ∈ [tτ 3 , t ]) ,
(1.6)
16
где A, A1 — векторы параметров, U (t ) — вектор входа (управления), ξ (t ) — случайное возмущение. Модель (1.6) является обобщением статической регрессионной модели (1.5). Уравнение (1.6) при ξ (t ) = 0 и дискретном t получило название модели скользящего среднего [10], а при ξ (t ) ≠ 0 представляет собой модель скользящего среднего с динамической спецификацией для стохастической части [49]. Как и в (1.4), так и (1.6) предполагается, что структура оператора F (⋅) задана с точностью до вектора неизвестных параметров A1 . Поэтому все выше сказанное в пункте 1.2.1.1 относительно свойств F (⋅) справедливо и в этом случае. Таким образом, безынерционные динамические модели (1.6) характеризуются временным распределением (лагом) переменных U (t ), ξ (t ) . Уравнение (1.5) используется в системах управления статическими объектами [51, 56]. 1.2.2. Инерционные динамические модели
Из всего разнообразия динамических моделей с «памятью» [12, 35, 56] рассмотрим только те, которые имеют параметрическое представление. Основным представителем этого класса уравнений являются модели, описываемые обыкновенными дифференциальными уравнениями. Последние могут быть линейными или нелинейными как по параметрам, так и переменным; стационарными и нестационарными по A , одномерными и многомерными; стохастическими, если вектор A(t ) или ξ (t ) носят случайный характер, и детерминированными. Множество динамических процессов в объектах управления можно описать с помощью дифференциального уравнения с одним входом и выходом a0 y ( m ) + a1 y ( m−1) + K + a m y = b0 u ( k ) + b1u ( k −1) + K + bk u + ξ .
(1.7)
Из (1.7) можно получить операторное представление объекта через передаточную функцию. От уравнения (1.7) нетрудно перейти к конечно-разностному 17
представлению. Полагая t = nτ , где n = 0,1,K , τ — интервал съема данных, и вводя оператор z сдвига назад zy( n ) = y ( n − 1) ,
получим D y ( z ) y ( n ) = Du ( z )u( n ) + ξ ( n ) ,
(1.8)
где D y ( z ) = a0 z m + a1 z m−1 + K + a m , Du ( z ) = b0 z k + b1 z k −1 + K + b1 . Если ξ (n ) случайная последовательность, то (1.8) представляет собой уравнение авторегрессии-скользящего среднего, а при Du ( z ) = 1 — модель скользящего среднего. В общем случае уравнение авторегрессии-скользящего среднего с динамической спецификацией для ξ (n ) имеет вид (1.3). Уравнения (1.7) - (1.8) можно записать в матричной форме (в форме Коши или в пространстве состояний). Такое представление в связи с применением в системах управления средств вычислительной техники в настоящее время является общепринятым. Для линейного стационарного объекта уравнение в пространстве состояний имеет вид X& = AX + BU + ξ , (1.9) Y = CX + DU + ζ , где X ∈ R m — вектор состояния, A ∈ R m × m — матрица состояния, U ∈ R k — вектор входа, Y ∈ R n — вектор выхода, B ∈ R m × k , C ∈ R n × m , D ∈ R n × k , ζ ∈ R n — ненаблюдаемый вектор ошибок измерения, ξ ∈ R m — вектор помех. Матрицы A, B, C , D параметризованы с точностью до некоторых векторов AA , AB , AC , AD . Первое уравнение в (1.9) называют уравнением состояния, а второе — уравнением измерения (наблюдения). В задачах идентификации матрица D обычно является нулевой. Аналогичные модели состояния могут быть получены для нестационарных, нелинейных и дискретных объектов. Если ξ (t ) является белым шумом, то первое уравнение в (1.9) можно рассматривать как стохастическое дифференциальное уравнение в форме Ито [64]. 18
Реализация моделей в пространстве состояний связана с необходимостью оценки ненаблюдаемых компонентов вектора X (t ) на множестве I э . Часто это сказывается на процессе синтеза и свойствах алгоритмов адаптации и управления. Для преодоления указанных трудностей применяются модели с обобщенным входом (наблюдатели). В этом случае уравнение (1.9) приводится к так называемой идентификационной форме [78], позволяющей использовать информацию о входе и выходе объекта. Для объекта с одним входом u(t ) и выходом y (t ) модель с обобщенным входом записывается в виде [27, 78, 79] y& = AT [ P1T y u ]T , P&1 = [ Λ +& Λ ] P1 + [ M 1T y M 2T u ]T ,
(1.10)
где P = [ y P1T u ]T — вектор обобщенного входа, P1 (t ) = P1 ( y , u , t ) , Λ ∈ R ( m −1) ×( m −1) — диагональная устойчивая матрица, M i ∈ R m−1 ( i = 1, 2 ) — вектор с постоянными параметрами, выбираемый так, чтобы пара ( Λ , M i ) была наблюдаемой, +& — знак прямой суммы матриц, A ∈ R 2 m — вектор параметров. Уравнению (1.10) соответствует одно из представлений объекта в пространстве состояний, получившее название неявной идентификационной формы. В общем виде уравнение (1.10) может содержать вектор обратной связи, зависящий от P(t ) . В этом случае можно получить каноническое (явное) идентификационное представление в пространстве состояний [78]. В дискретном случае (1.10) соответствует разностное уравнение с обобщенным входом. В общем случае дискретные модели с обобщенным входом можно привести к (1.5). Рассмотренные уравнения являются основой настраиваемых моделей, применяемых в системах идентификации и управления. Настраиваемая модель должна в каждый момент времени t вырабатывать прогноз выходной величины объекта на основе текущего множества экспериментальных данных. Поэтому настраиваемую (адаптивную) модель часто называют прогнозирующей. Близость параметров модели к параметрам объекта служит признаком правильной (адекватной) работы модели. 19
1.2.3. Окрестностные системы
Для описания сложных процессов и явлений могут применяются окрестностные системы [5, 34]. Общее представление окрестностных систем имеет вид
X [ a ] = Φ( X [O X [ a ]], U [OU [ a ]]), Y [ a ] = Ψ (OY [ a ]),
(1.11)
где U [ a ] ∈ R m , X [ a ] ∈ R n , Y [ a ] ∈ R q — вход, состояние и выход системы в узле a , O X [ a ], Ou [ a ], OY [ a ] — окрестности по входу, состоянию и выходу системы в узле a . Система (1.11) может иметь следующие разновидности. Уравнение Φ X ( X [O x [ a ]) = ΦU (U [Ou [ a ]]),
описывает класс симметричных систем, а F (Φ X ( X [O x [ a ]]), ΦU (U [Ou [ a ]]) = 0 класс смешанных систем. В развернутом виде линейная симметричная и смешанная системы имеет вид Ω[ a ,α ] X [α ] = ∑ Ξ[ a , β ]U [ β ] , ∑ α β ∈O X [ a ]
∈OU [ a ]
Ω[ a ,α ] X [α ] + ∑ Ξ[ a , β ]U [ β ] = 0 , ∑ α β ∈O X [ a ]
∈OU [ a ]
где Ω[ a ,α ] ∈ R c×n , Ξ[ a , β ] ∈ R c×m — постоянные матрицы, (α , β ) ∈ A — множество значений аргумента, # A = N , # — мощность множества. В общем случае предполагается, что O X [ a ] ≠ OU [ a ] ≠ OY [ a ] .
20
1.3. Критерии идентификации Выбор критерия идентификации — один из важнейших этапов решения задачи оптимизации. В системах идентификации применяется множество критериев, причем в зависимости от подхода к задаче идентификации они могут структурно отличаться [12, 13, 51, 56, 69]. При статистическом подходе наиболее часто применяется квадратичный критерий средних потерь от ошибки прогнозирования, так как он позволяет получить в аналитическом виде алгоритм адаптации. Такие критерии является особенно важным при решении задач идентификации, сводящихся к получению беспоисковых алгоритмов параметрического оценивания. Выбор критерия идентификации основывается на предпочтениях исследователя и отражает область его математических вкусов. Основное при выборе критерия — это возможность оценки качества аппроксимации (адекватности) модели процессов, протекающих в объекте. Кроме квадратичного функционала могут применяться также и другие виды нелинейных функционалов от ошибки прогнозирования (модульный, показательный, минимаксный и пр.). В информационной теории идентификации учет дополнительной априорной информации приводит к формированию критерия — функции потерь — в виде функционала, зависящего от наименее благоприятного распределения помехи. В [66] показано, что оптимальная функция потерь в данном случае равна логарифмической функции правдоподобия с обратным знаком. При таком выборе оценки параметров объекта обладают максимальной асимптотической скоростью сходимости. При функционально-множественном подходе также может применяться большое разнообразие критериев, отмеченных выше. Здесь доминирующим является квадратичный критерий или квадратичная форма от ошибки прогнозирования [27, 39, 62, 81]. Для уменьшения влияния внешних возмущений в функционал могут вводиться различные взвешивающие функции. Задача выбора критерия идентификации, наиболее полно 21
учитывающего реальные условия функционирования объекта, практически не ставилась. В [66] при формировании функции потерь учитывалось влияние среды за счет задания статистических характеристик помехи. В работе [27] предложен функционал, который позволяет учесть ограничения, накладываемые на объект. Для этого в критерий вводится функция, в обобщенном виде (функциональное ограничение) отражающая априорные и апостериорные сведения о системе «объект + среда». Тем самым на этапе формирования критерия в него закладывается структура синтезируемого алгоритма. Другой подход к синтезу алгоритмов параметрического оценивания основан на применении стандартного квадратичного критерия (локального) [25], а структура процедуры идентификации формируется на этапе учета имеющейся информации (априорной или предварительно обработанной), исходя из условия устойчивости системы. Итак, несмотря на разнообразие критериев, применяемых в системах идентификации, отсутствуют какие-либо рекомендации по их выбору.
1.4. Методы выбора структуры модели Структурная идентификация сводится к выбору математической модели, описывающей процессы в исследуемом объекте. Каких-либо формализованных процедур априорного выбора структуры модели до настоящего времени не существует. Объясняется это тем, что [27]: 1) в системах управления используются математические модели, отражающие наиболее существенные стороны протекающих процессов. Поэтому в системах идентификации доминирует концепция черного ящика; 2) попытка использовать физические законы для описания природы процессов может существенно усложнить процедуру получения математического описания. Поэтому выбор структуры математической модели может превратиться в нереализуемую мечту, так как потребуется описывать процессы, которые не нашли отражения в физических законах или имеют очень сложное математиче22
ское представление; 3) идентификация новых (недостаточно изученных) объектов базируется только на концепции черного ящика, а это, в свою очередь, приводит к появлению априорной неопределенности, которую необходимо каким-то образом преодолевать; 4) любой реальный объект всегда связан с внешней средой и поэтому на этапе выбора структуры модели необходимо учитывать реальные ограничения. Это существенно влияет на сам подход к получению математического описания. Математическая модель должна быть конкретизирована только до того уровня, какой допускает имеющееся информационное множество системы. Так, в [54] отмечается, что «в настоящее время отсутствует общепризнанная методология структурной идентификации. Причина, по-видимому, заключается в том, что в среде специалистов существует два различных дисциплинарных образа структурной идентификации. На концептуальном уровне все специалисты согласны, что интуиция и жизненный опыт… играют существенную роль. На уровне же конкретного теоретического исследования основные… усилия направлены на структуризацию и абсолютную формализацию данного процесса». Следует заметить, что в силу исторических обстоятельств доминирующую роль в теории идентификации занимают статистические методы. С помощью этих методов [56, 69, 77] удалось решить такие задачи структурной идентификации как выбор наиболее существенных переменных, оценка степени нелинейности объекта, выбор шага дискретизации съема экспериментальных данных и другие, т. е. таких проблем, которые позволяют более обоснованно подходить к выбору структуры модели. В [6] предлагается теоретико-эмпирический подход к выбору структуры модели. Сначала на основе априорной информации об изучаемом процессе или объекте формируется предполагаемая структура модели. Затем на основе экспериментальных данных выполняется проверка модели на адекватность и в случае неудовлетворительных результатов в нее вносятся структурные изменения или выполняется адаптация ее параметров. Это общепринятый подход к выбору структуры. 23
В [77] приводится процедура, которая детализирует подход, предложенный в [6], с учетом дополнительной априорной информации о системе "объект + среда". Процедура включает в себя выбор типа модели (нелинейная, линейная и т. п.), определение порядка модели. Далее следует произвести параметризацию модели, которая для класса линейных моделей сводится к заданию множества передаточных функций и модели описания шума. Так как какие-либо формализованные процедуры предложить очень сложно в силу отмеченных выше причин, то для получения структуры модели обычно применяются переборные методы на заданном априори классе моделей. Такой подход является доминирующим. Он так же составляет основу метода группового учета аргументов [15]. Применение переборных процедур требует принятия решения об останове процедуры структурной идентификации. Сейчас наиболее разработаны методы структурной идентификации для линейных по параметрам моделей. Выбор критерия зависит от типа возмущений, действующих на объект, и целей, которые преследуются при идентификации. Наиболее часто применяют следующие функционалы, учитывающие адекватность модели и ее порядок. 1. Информационный критерий Акаике (AIC) [77] k 1 LN ( e, X , Aˆ ) + , (1.12) N N где k — порядок модели; LN ( e, X , Aˆ ) — логарифмическая функция правдоподобия, зависящая от ошибки предсказания выхода системы с помощью модели e , X ∈ R m — вектор обобщенного входа, Aˆ ∈ R k — вектора параметров модели. Этот критерий существенно ограничивает рост сложности модели за счет наличия аддитивного члена k / N . Проблема применения критерия AIC состоит в том, что в практических задачах функция распределения помехи неизвестна. Если помеха имеет нормальное распределение, то из (1.12) получаем критерий Маллоуза [77] AIC ( k ) = −
24
1 1 1 ⎛1 AIC ( k ) = + ln 2π + ln⎜ 2 2 2 ⎜⎝ N
⎞ k en2 ( Aˆ ) ⎟ + , ⎟ N ⎠ n =1 N
∑
где en ∈ R — ошибка прогнозирования выхода системы, n — номер измерения, N — длина выборки экспериментальных данных. 2. Критерий Байеса-Шварца (BSC) [9]
ln N 1 + ln e 2 ( Aˆ ) . 2 2 Он применяется при больших выборках экспериментальных данных. 3. Критерий энтропии модели [72] BSC = k + ln e 2 ( Aˆ ) . BSC = k
4. Критерий остаточной суммы квадратов ошибок модели (RSS) [77]. Он имеет вид N
RSS =
∑
en2
N
=
n =1
∑( y
n
− yˆ n )2 ,
n =1
где yˆ n — выход модели. Величина RSS не может служить критерием для выбора структуры, поскольку при увеличении сложности модели происходит все более точное приближение к выходным данным, что допустимо только при отсутствии возмущений. Однако при заданных характеристиках шума могут применяться производные этого критерия. В частности, если помеха имеет нормальное распределение, то могут приняться скорректированный RSS критерий и статистика Фишера. На критерии остаточной суммы квадратов ошибок модели основан функционал финальной ошибка прогнозирования [77] N +k RSS ( k ) , N −k который в отличие от приведенных выше критериев не требует дополнительной информации о свойствах помехи. Для идентификации порядка динамической системы кроме FRE ( k ) =
25
описанных выше подходов и критериев могут применяться методы, основанные на анализе автокорреляционной функции [6, 56], информационной матрицы [73], на статистических методах и процедурах параметрического оценивания [49, 77]. Это так называемые неявные методы определения порядка. В [19] предложен явный метод нахождения порядка динамической системы на основе решения некоторого неравенства, полученного на основе соотношения для ранга матрицы состояния системы. Из приведенного краткого обзора методов структурной идентификации следует, что наиболее полно эта проблема разработана для класса регрессионных моделей. В основном все процедуры и методы выбора структуры базируются на проверке статистических гипотез и применении различных статистических критериев. Каких-либо более менее формальных процедур до настоящего времени так предложено и не было. С чем это связано, было отмечено в начале этого параграфа. Пожалуй, разработка более менее формализованных методов и процедур все-таки требует привлечения априорной информации. В случае принятия решений в условиях неопределенности необходимую дополнительную информации о структурных свойствах системы можно получить только на основе анализа имеющегося множества экспериментальных данных. Следует заметить, что были также предприняты попытки ввести критерии для оценки степени нелинейности объекта, процессы в котором описываются регрессионными уравнениями. Для формирования критерия предлагается использоваться аналоги F статистики. Такой подход, в частности применял Б. Закс. Правда применение статистических критериев требует предварительной группировки данных, а, следовательно, и задания структуры модели.
26
Глава 2. НАБЛЮДАЕМЫЕ ИНФОРМАЦИОННЫЕ ПОРТРЕТЫ Структура разбиения пространства на фазовые траектории называется фазовым портретом рассматриваемой динамической системы. С геометрической точки зрения под структурой разбиения фазового пространства на траектории понимается геометрическая картина взаиморасположения фазовых траекторий в пространстве Ф. Следует отметить, что полное описание фазового портрета для произвольной динамической системы представляет собою очень сложную и до сих пор нерешенную проблему. Бутенин Н.В., Неймарк Ю.И., Фуфаев Н.Л. Введение в теорию нелинейных колебаний.
Дается определение динамической структуры в системах идентификации — наблюдаемого информационного портрета. Приводятся примеры наблюдаемого информационного портрета в пространстве "вход-выход". Показана связь рассматриваемых информационных отображений с задачами структурной идентификации. В качестве одного из подходов к предварительной оценке структуры динамической системы рассматривается применение теории индексов.
2.1. Основные понятия и определения Рассмотрим систему X& = F ( X ,U , A, t ), Y = FY ( X ,U , A1, t ),
(2.1)
где U ∈ ΩU ⊂ U ⊆ R m — вход, Y ∈ Y ⊂ R n — выход системы, X ∈ X ⊆ Rq
—
вектор
состояния, 27
Y ⊆ X ⊆ Rn ,
A ∈ R q× p ,
A1 ∈ R n×q — матрица параметров, F : R q × R m × J → R q — гладкая непрерывно дифференцируемая по X и A вектор-функция, t ∈ J , FY : R q × R m × J → R n — функция, задающая способ формирования выхода системы. К множеству I э будем относить не сами векторы U (t ) и Y (t ) , ~ ~ а их наблюдаемые (измеряемые) аналоги U (t ) , Y (t ) , которые получаются в результате применения операторов fU , f Y : fU : U × J → R m ,
fY : Y × J → R n ,
(2.2)
отражающих ошибки измерения. Операторы fU ∈ NU , fY ∈ N Y определены на множествах NU , N Y , характеризующих неопределенность процесса измерения. В зависимости от доступности процесса наблюдения множества NU и N Y могут иметь как нечеткую (гиперобъемную — гиперкуб, гиперцилиндр) природу, так и статистическую. Все определяется подходом к решению задачи идентификации. Обозначим через Ξ ( t ′; t ′ ≥ t0 ; X (t0 ); U (⋅) ∈ ΩU ) множество достижимости системы (2.1), то есть совокупность траекторий, реализованных к моменту времени t ′ ∈ J из начального состояния X (t0 ) под воздействием входа U (⋅) ∈ ΩU . Множеству Ξ в пространстве выхода (наблюдаемости) Y ⊆ R n соответствует некоторое подмножество достижимости Ξ Y ⊆ Ξ , структура которого в силу наложения множеств NU , N Y и включения Y ⊆ X может значительно отличаться от Ξ: Ξ Y = FY (Ξ ) × N Y ⊆ Ξ .
В [41] под информационным множеством системы понимается множество ~ IΞ = Ξ(t ′; t ′ ≥ t0 ; X (t0 ); U (⋅) ∈ ΩU ) , (2.3) то есть совокупность всех траекторий системы (2.1) на множестве ~ доступных для измерения входов U (⋅) ∈ ΩU . Таким образом IΞ ⊆ X ⊂ X . 28
В системах идентификации обычно используется множество I э . В силу применения операторов (2.2) получим множество наблюдения (измерений) ~ ~ ~ ~ ~ I э = I(U ,Y ) = {U ∈ R m ,Y ∈ R n | U (t ) = fU (U , t ) , , (2.4) ~ Y (t ) = fY (Y , t ) ∀(t ∈ J ) } В дальнейшем в отличие от [41] (2.4) будем называть наблюдаемым информационным множеством системы (2.1) [31, 32]. Следует заметить, что множества I э и I(U ,Y ) = {U ∈ R m ,Y ∈ R n
U (t ) , Y (t ) ∀(t ∈ J ) }
имеют одинаковую мощность и определены в одном и том же пространстве U × Y , но в силу наличия множеств неопределенности NU , N Y , которые преобразуют множество I(U ,Y ) в I э , имеют разную структуру [27] ~ ~ I э = I(U ,Y ) = I(U ,Y ) × N U × N Y . (2.5) Соотношение (2.5) показывает, что, несмотря на то, что мно~ ~ жества I (U ,Y ) и I (U ,Y ) имеют одну и туже область определения J , их области значений не совпадают: rng( I э ) ≠ rng( I(U ,Y )) .
Представим множество (2.4) в виде ~ ~ ~ ~ I э = I(U ,Y ) = I(U ) U I(Y )
∀t ∈ J .
Определим бинарное отношение Γ между множествами U и Y системы (2.1): Γ ⊂ U × Y . Назовем это множество портретом системы (2.1) в пространстве U × Y . Множество Γ является дополнением множества Ξ при проектировании его на U × Y . Соответствующий фазовый портрет системы (2.1) представим в виде ΓP ⊂ X \ Y × Y
∀U (⋅) ∈ ΩU .
(2.6)
Расширенным фазовым портретом системы будем называть отображение ΓP ⊂ X × U
(∀U (⋅) ∈ ΩU ) & (∀t ∈ J ) . 29
Определение 2.1 [27, 30]. Рассмотрим наблюдаемое инфор~ ~ мационное множество I(U ,Y ) (2.4) системы (2.1), определенное в пространстве U × Y . Тогда наблюдаемым информационным портретом системы (2.1) назовем бинарное отношение ~ ~ Γo = Γo ( I э ) ⊂ I(U ) × I( Y ) . (2.7)
Из (2.7) следует, что Γ ⊆ Γo и dom( ΓP ) = rng( Γ ) , то есть между ними существует структурное соответствие. Наблюдаемый информационный портрет в отличие от фазового выходного портрета позволяет выявить новые свойства системы (2.1), которые дополняют динамическое множество Ξ и позволяют определить ряд новых характеристик, полезных в процессе решения задачи структурной идентификации.
2.2. Примеры наблюдаемых информационных портретов Рассмотрим систему ⎡ x&1 ⎤ ⎡ a1 (t ) 1 ⎤ ⎡ x1 ⎤ ⎡b1 ⎤ ⎢ x& ⎥ = ⎢a (t ) − α ⎥ ⎢ x ⎥ + ⎢b ⎥ u, ⎦⎣ 2⎦ ⎣ 2⎦ ⎣ 2⎦ ⎣ 2 y = x1 ,
(2.8)
где u(t ) = 2,5 + 0,25 sin(2πωu t) , a1 (t ) = −1,97 + 0,2 sin(2πω1 t) , b2 = 1,2 , b1 = 1,5 , a 2 (t ) = −0,9 + 0,18 sin(2πω2 t) .
Портреты ΓP и Γo системы (2.8) показаны на рис. 2.1. Как и следовало ожидать, множества ΓP и Γo имеют различные структуры, что объясняется, прежде всего, внутренними свойствами системы (2.8). Поэтому на фазовой плоскости (рис. 2.1а) траектория имеет более сложный вид. Видно, что процессы в системе носят колебательный характер. Для стационарной линейной системы (2.8) ( ω1 = 0, ω2 = 0 ) множества ΓP и Γo структурно изоморфны (рис. 2.2). 30
1,2
x2 1,0
0,8
0,6
0,4
0,2 1,8
x1 2,0
2,2
2,4
2,6
2,8
а)
2,8 u 2,7 2,6 2,5 2,4 2,3 2,2 1,8
x1 2,0
2,2
2,4
2,6
2,8
б)
Рис. 2.1. Фазовый и наблюдаемый информационный портреты для нестационарной системы (2.8): а) — фазовый портрет, б) — наблюдаемый информационный портрет
31
1,0
x2 0,9 0,8 0,7 0,6 2,0
x1 2,2
2,4
2,6 а)
u
2,8
2,6
t
2,4
2,2 2,0
x1 2,2
2,4
2,6 б)
Рис. 2.2. Множества ΓP и Γo для стационарной системы: а) — фазовый портрет, б) — наблюдаемый информационный портрет
Сравнивая рис. 2.1, 2.2, можно отметить, что изменение параметров системы (2.8) приводят к эффекту "умножения частоты". 32
с
1,8 1,1
2,0
2,2
x1
2,4
2,6 1,2 с
нс
x2
x2 1,0 нестационарная система
0,9
0,9
ωi → 0
0,8 0,6
стационарная система
0,7 0,6 1,8
2,0
2,2
0,3 2,6
2,4
нс
x1
а)
2,525
u
2,500
2,475 1,8
x1 2,0
2,2
2,4
б)
Рис. 2.3. Множества ΓP и Γo для стационарной и нестационарной системы с постоянным входом: а) — фазовый портрет, б) — наблюдаемый информационный портрет
Естественно, что выходной информационный портрет позволяет не всегда раскрыть новые структурные свойства системы. Так, если на систему (2.8) действует постоянное возмущение u , то множество Γo является неинформативным (рис. 2.3б), несмотря на то, что кривая ΓP может иметь сложный вид (рис. 2.3а) в зависимости от того, являются ли параметры стационарными или зависят от времени (см. (2.8)). Важно отметить, что при u = const система (2.8) неидентифицируема на основе множества I э , что и 33
отражает рис. 2.3б (связь с частотным богатством входа [27]). Информационный портрет системы в трехмерном пространстве при u = const показан на рис. 2.4. Диаграмма на рис. 2.3б отражает только диапазон изменения выхода системы, скрывая при этом внутреннюю структуру процессов. На рис. 2.3а показаны выходные фазовые портреты системы (2.8) для двух предельных случаев, когда параметры являются нестационарными (множества ΓPнс ) и стационарными (множества ΓPс ). Видно, что переход aiнс (t ) → aiс (i = 1, 2) ωi → 0
приводит к деформации границ множества ΓPнс и трансформации его в ΓPс . В структурном плане деформация приводит к превращению матриц состояния A нс (t ) → Ac при ωi → 0 .
2,5
y
Γo
2,4 2,3 2,2 2,1
1,0 0,8 x2 0,6
2,0 2,3
2,4
u
2,5
2,6
0,4 2,7
Рис. 2.4. Информационный портрет системы (2.8) с u = const
Рассмотрим теперь нелинейный вариант системы (2.8) ⎡ x&1 ⎤ ⎡ a1 (t ) 1 ⎤ ⎡ x1 ⎤ ⎡b1 ⎤ ⎡κ ⋅ sign( x2 )⎤ + u + = ⎢ x& ⎥ ⎢a (t ) − α ⎥ ⎢ x ⎥ ⎢b ⎥ ⎥, ⎢ 0 ⎦ ⎣ ⎦⎣ 2⎦ ⎣ 2⎦ ⎣ 2⎦ ⎣ 2 y = x1 ,
где κ > 0. 34
(2.9)
Соответствующие портреты ΓP и Γo системы (2.9) показаны на рис. 2.5, а наблюдаемый информационный портрет в пространстве { t , u, x1 } — на рис. 2.6. 1,4
x2 1,2 1,0 0,8 0,6 0,4 0,2 0,0 -0,2 1,8
2,0
2,2
2,4
2,6
x1
2,8
а)
2,8
u
2,7 2,6 2,5 2,4 2,3 2,2 1,8
2,0
2,2
2,4
2,6
2,8
x1
б)
Рис. 2.5. Множества ΓP и Γo нестационарной нелинейной системы (2.9): а) — фазовый портрет, б) — наблюдаемый информационный портрет
35
Из рис. 2.1, 2.5 видно, что нелинейная структура системы приводит к изменению как множества ΓP (ср. рис. 2.5а и 2.1а), так и Γo (ср. рис. 2.5б и 2.1б). В данном случае эти изменения проявляются при переходе фазовой траектории из одного состояния в другое, когда начинает сказываться нелинейности в системе. Итак, из приведенных примеров видно, что наблюдаемый информационный портрет отражает структуру системы в пространстве U × Y и, в принципе, может использоваться в процессе решения задачи структурной идентификации.
2,7
x1 2,4
2,1 2,8
0 50
t
2,4
100
u
150
Рис. 2.6. Наблюдаемая траектория системы (2.9) в пространстве
{U ,Y , J }
2.3. Применение индексов для определения структуры динамической системы Из приведенных выше примеров видно, что наблюдаемый информационный портрет можно использовать для принятия предварительного решения о некоторых структурных свойствах динамической системы. В последующих главах будет показано, как на основе анализа НИП можно оценить такие параметры модели как порядок, линейность и нелинейность системы, а также 36
выбрать информативные параметры. К структурным характеристикам системы, отражающим качество ее работы, можно отнести также особые точки в фазовом пространстве. До настоящего времени на идентификационном уровне задача оценки типа особой точки в условиях неопределенности не ставилась. Первые попытки ее решения предприняты в [28, 32]. В [28] для решения указанной задачи применялся информационный синтез, основанный на анализе информационных портретов. Методы, реализующие данный подход, будут изложены в следующей главе. В [27, 32] дается применение индексов для предварительной оценки структуры динамической системы. Кроме этого с помощью индекса можно легко решить проблему идентифицируемости системы на основе НИП. Возникает естественный вопрос: можно ли по наблюдаемому информационному портрету судить об особых точках (корнях) динамической системы. Как было показано в параграфе 2.2, НИП является трансформацией фазового портрета системы, и, естественно, по нему можно делать некоторые заключения о свойствах системы. 2.3.1. Индекс особой точки и его свойства
Рассмотрим векторное поле V, заданное на ориентированной евклидовой плоскости П и порождаемое динамической системой X& = F ( X , t ) , где X ∈ R m , t ∈ J ⊆ R , F : R m × J → R m — гладкая вектор-функция. Полю V на евклидовой плоскости Γ Π соответствует некоторая замкнутая Π кривая Γ (фазовый портрет). Тогда индекс ind ( Γ, V ) [44] — это деленная на 2π вариация поля V вдоль кривой Γ. Другими словами, индекс — это количество оборотов векторного поля V при обходе кривой Γ (рис. 2.7) в по- Рис. 2.7. Кривая индекса ложительном направлении. Число обо37
ротов берется со знаком плюс, если вектор вращается в направлении ориентации плоскости, и со знаком минус, если в противоположном направлении. Приведем некоторые определения и свойства индекса, следуя [1]. Обозначим через D ⊆ Π область плоскости Π с координатами ( x1 , x2 ) , S 1 окружность на П. Зададим отображение области D ′ = D \ D0 на окружность S 1 Γ : D ' → S 1 , Γ( X ) =
F( X ) , X ∈ R2 , || F ( X ) ||
где D0 — области с особыми точками поля, || ⋅ || — евклидова норма. Это отображение является гладким. Тогда справедливо следующее [1] Определение 2.2. Индексом ориентированной замкнутой кривой Γ : D' → S 1 называется интеграл dϕ = d arctg
f1 f 2 df1 − f1df 2 = f2 f12 + f 22
( fi ( X ) ∈ F ( X ) )
по кривой Γ, деленный на 2π , ind ( Γ ) =
1 2π
∫ dϕ .
Γ
Итак, индекс связан только с замкнутыми кривыми (фазовыми портретами). Индекс обладает следующими свойствами [1]. 1°. При непрерывной деформации замкнутой кривой ее индекс не меняется, пока кривая не проходит через особые точки. 2°. Индекс кривой не меняется при непрерывной деформации векторного поля, если только при этом на кривой во все время деформации нет особых точек. Определение 2.3. Индекс какой-нибудь достаточно малой положительно ориентированной окружности с центром в изолированной особой точке векторного поля называется индексом особой точки. 38
Определение 2.4. Особая точка векторного поля называется простой, если оператор линейной части поля в этой точке не вырожден. К простым точкам на плоскости относят узлы, седла, фокусы, центры. Индексы простых особых точек равны ± 1 . Если кривая Γ состоит из нескольких кривых γ 1 , γ 2 , …, то ind Γ = ind
∑γ
i
.
i
Пусть на плоскости Π задано векторное поле, не имеющее особых точек на кривой S , которая ограничивает компактную область D . В области D имеется конечное число особых точек. Тогда справедливы следующие теоремы 1, 2 [1]. Теорема 2.1. Индекс кривой S равен сумме индексов особых точек поля, лежащих внутри D . Теорема 2.2. Если индекс кривой S отличен от нуля, то внутри ограниченной ею области D есть хотя бы одна особая точка. 2.3.2. Применение индекса в задачах структурной идентификации с помощью НИП
Условимся считать поворот векторного поля положительным, если вектор поля совпадает с направлением изменения времени. Следует отметить, что индекс применяется в фазовом пространстве, а наблюдаемый информационный портрет строится в выходном пространстве системы. Поэтому напрямую перенести результаты анализа на основе использования индекса не всегда корректно. Покажем на примере линейной динамической системы с одним входом и одним выходом, что такой перенос возможен [27]. Рассмотрим линейную динамическую систему X& = AX + Bu, (2.10) y = CT X , где u ∈ R , y ∈ R — вход и выход системы, X ∈ R q — вектор состояния, A ∈ R q×q , B ∈ R q , C ∈ R q . 39
Для выхода системы (2.10) получаем t
∫
y (t ) = C T e A( t −t0 ) X (t0 ) + C T e A( t −τ ) Bu(τ )dτ .
(2.11)
t0
~ Представим вектор X в виде X = [ y X T ]T . Тогда для ~ X ∈ R q −1 получим t
~ ~ ~ A ( t −t0 ) A ( t −τ ) X (t ) = e X (t0 ) + e Bu(τ )dτ ,
∫
(2.12)
t0
~
где e A ( t −t0 ) — матрица размерности ( q − 1) × q . Так как уравнение (2.12) является линейным относительно ~ u(t ) , то u(t ) можно выразить через X (t ) . Поэтому u можно использовать в качестве новой (виртуальной) фазовой переменной. ~ В силу того, что dim u < dim X , переход от пространства R q к пространству R 2 (в рассматриваемом случае) в общем случае может привести к потере некоторых фазовых свойств системы. Так как отношение Ψ : R q → R 2 переводит одно фазовое пространство в другое, то в полученном виртуальном фазовом (выходном) пространстве также можно применять понятие индекса. Рассмотрим линейную динамическую систему S ( A,B,C ) (2.10). Так как y ∈ R и u ∈ R , то можно ограничиться рассмотрением наблюдаемого информационного портрета на евклидовой плоскости Ε. Пусть P — множество кусочно-непрерывных функций. Утверждение 2.1. Если кривая Γo наблюдаемого информационного портрета является замкнутой и ее индекс отличен от нуля, то она содержит хотя бы одну особую точку системы (2.10). Доказательство утверждения 2.1 немедленно следует из отображения Ψ : R q → R 2 , понятия индекса и теоремы 2.2. Теорема 2.3. Если u ∉ P и является постоянным, а матрица A ∈ R q ×q гурвицевой, то система S структурно и параметрически неидентифицируема на множестве I э . 40
Доказательство теоремы 2.3. Предположим, что Γo содержит особые точки системы S . Так как u = const , то все особые точки расположены на прямой (в случае R 2 ) или плоскости, которая проецируется на евклидовую плоскость Ε в виде прямой в случае q > 2 . Γo является незамкнутой кривой (прямой линией) и, следовательно, в процессе преобразования она стягивается в точку, индекс которой равен нулю. Теорема 2.3 содержит доказательство того факта, что для получения параметров (а, значит, и структуры) системы на заданном классе моделей необходимо, чтобы вход u ∈ P , то есть обладал свойством частотного богатства. Если же u ∉ P , то структура системы является «скрытой» для наблюдателя (стянута в прямую) (см. рис. 2.3). Теорема 2.4. Если кривая Γo на плоскости Ε является замкнутой и ее индекс отличен от нуля, то для порядка системы S справедливо неравенство q ≥ ind Γo . Доказательство теоремы 2.4 непосредственно следует из утверждения 2.1 и того факта, что особые точки системы определяются корнями матрицы A системы (2.10).
2.4. Определение особой точки по наблюдаемому информационному портрету Рассмотрим способы определения положения особой точки. Большинство аналитических методов основано на дифференцировании отображения Γo и анализе свойств получаемых производных [52]. Так, если кривая, заданная на плоскости ( x, y ) , описывается уравнением F ( x, y ) = 0 ,
где x ∈ R , y ∈ R , то особая точка N 0 определяется из следующей системы уравнений ∂ ∂ F ( x, y ) = 0 , F ( x, y ) = 0 . дy дx 41
(2.13)
Так как (2.13) имеет место не тождественно, а лишь в рассматриваемой точке N 0 , то вторые частные производные могут в этой точке не обращаться в нуль. Если же в N 0 имеет место одно из равенств Fxx = Fxy = Fyy = 0 ,
а также справедливо (2.13), то N 0 принято называть двойной особой точкой. Аналогичным образом вводится понятие тройной особой точки. Возможен случай, когда в малой окрестности точки N 0 ( x0 , y0 ) отсутствуют другие какие-либо точки, принадлежащие кривой Γo . В этом случае точка N 0 называется изолированной. Пример такой точки показаны на рис. 2.8. Для фазового портрета такая точка соответствует комплексному спектру σ ( λ ) собственных чисел системы и классифицируется как центр.
y
-0,4 1,6
u'
-0,2
0,0
0,2
0,4 60 40
ks(u',y')
1,2
ks(u',y')
t 20
0
S(N0 )
0 0
N0
0,8
-20
y N0
γy 0,4 1,0
1,5
u
-40 -60 2,0
Рис. 2.8. Особая точка наблюдаемого информационного портрета
Так как отображение Γo строится на основе множества I э , то неизвестно его аналитическое описание и изложенным подходом воспользоваться нельзя. Но можно применить численное диффе42
ренцирование для определения наличия особой точки. Так, на рис. 2.8 приведен пример определения особой точки для НИП, показанного на рис. 16. На рис. 2.8 использованы следующие обозначения: u ′ = du / dt , k s' = k s (u ′, y' ) = y ′ / u ′ — коэффициент структурности системы (2.8) на множестве {u ′, y' } . Так как k s' зависит от y ′ и u ′ , то его обращение в нуль может свидетельствовать о наличии особой точки в системе. Из рис. 2.8 видно, что точка N 00 (0; 0) на плоскости (u ′, k s' ) является центром (узлом) некоторого подмножества S ( N 00 ) , в котором происходит изменение направления движения в системе. На плоскости (u, y ) N 00 (0; 0) соответствует точка N 0 (1,5; 0,768) , координаты которой равны медиане переменных u, y . Так как отображение h : M f → M o в общем случае не является гомеоморфизмом, то в отображении Γo не удается сохранить все свойства, присущие фазовому многообразию M f . Это связано с тем, что для наблюдаемого многообразия M o справедливо условие: deg M f ≤ deg M o . Поэтому перенос классификации особых точек системы из фазового пространства на наблюдаемое пространство является некорректным.
43
Глава 3. СТРУКТУРНАЯ ИДЕНТИФИКАЦИЯ ДИНАМИЧЕСКИХ СИСТЕМ Математическое понятие структуры неотделимо от понятий «множество», «элемент», «отношение», «операция» и т. д. Эбелинг В. Образование структур при необратимых процессах. Нелинейность всепроникающа и вездесуща, многолика и неисчерпаемо многообразна. Она повсюду: в большом и малом, в явлениях быстротечных и длящихся эпохи… Нелинейность — понятие емкое, с множеством оттенков и градаций. Нелинейность эффекта или явления означает одно, нелинейность теории — другое. Данилов Ю.А. Нелинейность.
Излагаются методы структурной идентификации динамических систем на основе анализа информационных портретов, которые могут быть как наблюдаемыми, так и виртуальными, отражающими состояние системы идентификация на данном этапе информационного синтеза. Вводится понятие коэффициента структурности системы. Описывается процедура нахождения порядка модели, основанная на оценке ширины интервала изменения коэффициента структурности. Предложен алгоритм идентификации типа точки равновесия динамический системы на основе наблюдаемого информационного множества. Приводится процедура оценки структуры модели, описывающей нелинейную часть системы. Показана связь между характеристическими числами Ляпунова и коэффициентом структурности системы. Предложен адаптивный алгоритм оценки спектра собственных чисел линейной части динамической системы на основе специальным образом сформированного информационного множества. В заключение изложен подход к определению параметрических ограничений в условиях неопределенности.
44
3.1. Коэффициент структурности динамической системы Так как предметом теории идентификации является исследованием связей «вход-выход» системы, то на множестве I э введем коэффициент структурности, который является оценкой структурных свойств системы. Для динамической системы (2.1) с одним входом u ∈ R и выходом y ∈ R он имеет вид k s (t ) =
y (t ) . u (t )
(3.1)
Из (3.1) следует, что k s (t ) является текущей оценкой коэффициента при переменной u для каждого момента времени. Следовательно, коэффициент структурности можно использовать в качестве критерия стационарности системы, а при некоторой модификации и в качестве критерия оценивания порядка математической модели. 2,8
y 2,6 u, ks 2,4
u
2,2
y
2,0 1,8 нс
ks
1,0
с
ks
0,9 0,8
t 0
25
50
75
100
125
150
Рис. 3.1. Временные диаграммы изменения наблюдаемого информационного множества и k s системы (2.8)
На рис. 3.1 приведен пример изменения коэффициента структурности k s (t ) для системы (2.8) с нестационарными и постоянными параметрами. k s в каждый момент времени можно рассматривать как статический коэффициент передачи системы. Для 45
нестационарной системы он лежит в диапазоне [0.8; 1.02]. Рис. 3.1 (в верхней части) отражает также изменение элементов наблюдаемого информационного множества во времени. На рис. 3.2 показано изменение элементов множества I э и коэффициента k s для нелинейной системы (2.9). Из рисунка видно, что система является нестационарной и нелинейной, причем нелинейность проявляется только при смене знака производной y ∈ R . Это наводит на мысль о наличии в системе нелинейности (релейного типа). Если y ∈ R n , u ∈ R m , то можно вычислять коэффициенты структурности для каждого канала "вход-выход" k sij (t ) =
yi ( t ) , u j (t )
i = 1, n ,
j = 1, m .
2,8
y, u 2,6 ks 2,4
u y
2,2 2,0 1,8 1,2 1,1 1,0
ks
0,9 0,8
t 50
60
70
80
90
100
Рис. 3.2. Временные диаграммы изменения наблюдаемого информационного множества и k s системы (2.9)
В некоторых случаях, например, при получении параметрических ограничений, можно ввести интегрированный коэффициент структурности k sI (t ) =
|| y (t ) || || u(t ) ||
где || ⋅ || — евклидова норма. 46
∀t ∈ J ,
Изложенный подход можно распространить на статические объекты. Более подробно об этом речь пойдет в главе 4. Для статических объектов коэффициент структурности можно использовать в качестве предварительной оценки параметров модели. Изложим метод оценки порядка модели динамической системы на основе анализа изменения коэффициента структурности.
3.2. Определение порядка линейной динамической системы на основе анализа коэффициента структурности Известно, что порядок динамической системы определяется его линейной частью, поэтому коэффициент структурности k s можно использовать в качестве критерия структурной идентификации. Так как анализ наблюдаемого информационного портрета выполняется в пространстве наблюдаемых переменных, то коэффициент структурности k s носит обобщенный характер и в общем случае не позволяет судить о структурных свойствах динамической системы. Это, в свою очередь, требует привлечения новых подходов к анализу имеющейся информации. Ниже излагается метод оценки порядка модели [30], основанный на расширении входного пространства системы путем введения вспомогательных переменных, которые позволяют учитывать динамические свойства системы. Рассмотрим систему [78] ~ X& = A X + Bu, (3.2) T y =C X, где u ∈ R , y ∈ R — вход и выход системы, X ∈ R m , B ∈ R m , C ∈ Rm , HT ⎤ ~ ⎡ m×m , A = ⎢ A1 ⎥∈R Λ ⎣ ⎦ A1 ∈ R m — вектор параметров, H ∈ R m−1 , Λ ∈ R ( m−1)×( m−1) , пара ( H , Λ ) является управляемой, спектр σ ( λ ) собственных чисел матрицы Λ лежит в левой полуплоскости. 47
Систему (3.2) можно привести к следующей выходной форме с обобщенным входом [27, 78] y& = AT P ,
(3.3)
где A ∈ R 2 m — вектор параметров, A = A( A1 , B ) , P ∈ R 2 m — обобщенный вход, P = [ y PyT u PuT ]T , Py ( u ) ∈ R m−1 — вектор, полученный путем пропускания переменных y, u через вспомогательную устойчивую систему. Для системы (3.3) известно множество экспериментальных данных I э = { y ( t ), u (t ) t ∈ J } .
(3.4)
На основе (3.4) и НИП определяется коэффициент структурности k s (t ) =
y (t ) . u(t )
(3.5)
Назовем D k s = max ks (t ) − min ks (t ) t∈I э
t∈I э
(3.6)
шириной интервала изменения коэффициента k s . Ставится задача: на основе анализа множества I э необходимо найти порядок m системы (3.2) таким образом, чтобы минимизировать ширину интервала изменения коэффициента k s min D ks → m* . m
(3.7)
Для системы (3.3) порядок системы понимается как число m , соответствующее размерности вектора W = [ y PyT ]T . При решении практических задач вместо (3.7) можно потребовать выполнения более слабого условия D ks ≤ Δ D ,
где Δ D < ∞ — некоторая величина, которая обычно задается исходя из конструктивных соображений. 48
Так как dim u < dim P , то вычисление k s на основе (3.4) может привести к неполноте учета структурных (динамических) свойств системы. Учитывая это, предлагается следующий алгоритм определения m [30]. 1. Для ∀t ∈ J на основе (3.4) вычислить величину коэффициента структурности k s и по нему найти ширину D ks согласно (3.6). Обозначить i = 0 , d i =| D ks | , m = 1 , pi (t ) = u(t ) . 2. Положить i = i + 1 и сгенерировать вспомогательные переменные pui и p yi путем решения системы с нулевыми начальными условиями ⎧⎪ p& ui (t ) = −α i pui (t ) + u(t ), ⎨ ⎪⎩ p& yi (t ) = −α i p yi (t ) + y (t ),
(3.8)
где α i > 0 . 3. Сформировать сигнал pi (t ) = pi −1 (t ) + pui (t ) + p yi (t )
(3.9)
и для него определить коэффициент структурности k si k si (t ) =
y (t ) pi (t )
(3.10)
и ширину d i . 4. Сравнить d i −1 и d i . Если ( d i < d i −1 ) & ( d i ≤ Δ D ) , то положить m = m + 1 и закончить процедуру. В противном случае перейти к шагу 2. Пример определения порядка модели для стационарной системы (3.4) показан на рис. 3.3. Здесь использованы следующие обозначения: k s1 вычисляется согласно (3.5), k s2 (t ) =
y (t ) y (t ) , k s2* (t ) = . u (t ) + pu (t ) + p y (t ) pu ( t ) + p y ( t )
Ширины интервалов изменения коэффициентов структурности, соответственно, равны d1 = 0.183 ; d 2 = 0.05 ; d 2* = 0.026 . На основе полученных результатов можно сделать вывод о том, что для идентификации системы (3.4) можно применить ли49
нейную динамическую модель второго порядка со структурой вектора P(t ) , соответствующей коэффициенту k s2* . 1,0
ks 0,8
1
d1=0,183
2
ks
ks
0,6
0,4
0,2
2*
ks
d2=0,05 0,0
0
5
10
15
20
d2=0,026 25
t
30
Рис. 3.3. Интервал изменения коэффициента структурности
Если система является нелинейной, то следует выполнить процедуру кластеризации множества I э ∀t ∈ J I э = I lэ U I nэ
с тем, чтобы выделить подмножество данных I lэ , позволяющее идентифицировать линейную часть системы. На множестве I lэ можно реализовать описанный выше алгоритм. Замечание. Так как коэффициент структурности k s содержит динамическую составляющую и переменная pi (t ) , используемая в (3.10), в реальных системах представляет собой взвешенную комбинацию сигналов pui (t ), p yi (t ) , то вместо min D ks → 0 m
в алгоритме используется более слабое условие D ks ≤ Δ D ,
которое учитывает специфику системы. Итак, справедлива следующая 50
Теорема 3.1. Рассмотрим систему (3.3) с обобщенным входом. Для нее известно информационное множество I э (3.4). Если существует такое значение m* ∈ Z , которое обеспечивает выполнение условия ⎛⎜ min D → 0 ⎞⎟ ∨ (D ≤ Δ ) , ks D ⎝ m ks ⎠
где D ks ( k si , m) определяется согласно (3.6), k si — коэффициент структурности, определяемый согласно (3.9), (3.10), Z — множество целых чисел, то m* = m можно использовать в качестве оценки порядка системы (3.3).
3.3. Определение типа особой точки динамической системы При анализе качества динамических систем большое внимание уделяется вопросам устойчивости. Для этого часто применяют метод фазовой плоскости, позволяющий исследовать поведение системы вблизи особой точки (состояния равновесия). Эта задача хорошо исследована для систем второго порядка в случае, когда известна математическая модель [3]. Обычно определяются корни характеристического уравнения, по которым делается заключение о типе особой точки. Вопрос существенно усложняется при учете нелинейных членов. Для принятия решения в этом случае применяют различные косвенные методы, основанные на оценке индекса особой точки, теореме Пуанкаре-Бендиксона и другие. В условиях неопределенности, когда отсутствует математическое описание, применение указанных методов требует проведения предварительной идентификации системы. Такой подход связан с решением ряда проблем. Ниже предлагается приближенный метод оценки типа состояния равновесия динамической системы [18] на основе анализа информационного множества I э , который сводится к идентификации частного решения системы с целью выделения общего решения при некотором начальном состоянии. При этом собственные числа динамической системы не оцениваются. Задача решается на классе статических моделей. 51
3.3.1. Постановка задачи
Рассматривается линейная динамическая система X& = AX + BU , Y = CX + DU ,
(3.11)
где X ∈ R m — вектор состояния, U ∈ R k , Y ∈ R n — вход и выход системы, A ∈ R m×m , B ∈ R m×k , C ∈ R n×m , D ∈ R n × k . Для (3.11) имеется экспериментальная информация I э = {Y (t ), U (t ), t ∈ J = [t0 , t1 ] } .
(3.12)
Решение системы (3.11) имеет вид X (t ) = X (t0 ,U , t )
(3.13)
где X — оператор, однозначно определяемый матрицами A, B . Учитывая (3.12), из (3.13) получаем решение системы (3.11) при X 0 = X (t0 ) X (t ) = X g (t ) + X q (t ) ,
(3.14)
где X q (t ) — частное решение с U ∈ I э , X g (t ) — общее решение с U (t ) = 0 при неизвестном X 0 ∈ I э . Обозначим через X g ( X 0 , t ) общее решение (3.11) с X 0 = X 0 (Y0 ) ∈ I э . Задача состоит в нахождении оценки общего решения X g (t ) = X g ( X q , X 0 , t ) на множестве I э и принятии решения о состоянии равновесия. 3.3.2. Модели и подходы к решению задачи
Процедура решения задачи основана на реализации двух этапов: идентификации решения X q (t ) и последующем определении X g (t ) как функции от X q (t ) . На классе динамических систем (3.11) выделение частного решения в условиях неопределенности является непростой задачей. Для разделения решений в (3.14) проще всего X q (t ) идентифицировать на классе статических моделей, то есть искать зависимость X q (t ) = X q (U , t ) . Структура 52
модели для оценивания X q (t ) во многом зависит от частотного спектра выхода Y (t ) . Кроме этого, модель должна компенсировать динамическое запаздывание, присущее системе (3.11). Изложим метод решения задачи на примере системы (3.11) второго порядка с одним входом и выходом. Обозначим y = Y ; u = U , D y (ω ) , Du (ω ) — частотные спектры сигналов u, y . Пусть || y (t ) || < ∞ , || u(t ) || < ∞ . Предположим, что D y (ω ) = Du (ω ) , то есть система (3.11) является линейной и стационарной. Действительные части корней характеристического уравнения системы (3.11) λi в силу сделанных предположений будут отрицательными: Re λi ≤ 0 i = 1, 2 . Предположим, что I э можно представить в виде I э = I эq ( J q ) U I эg ( J g ) ,
(3.15)
где J q U J g = J ⊆ R , I qэ , I эg — множества, содержащие информацию о X q и X g . На множестве I qэ ( J q ) будем оценивать частное решение системы (3.11). Так как x1 = y ∈ R , то для получения компоненты x2 = x&1 вектора X ∈ R 2 воспользуемся операцией дифференцирования переменной y . Обозначим x2 = y& . Утверждение 3.1. Для идентификации X q (t ) на множестве I qэ можно применить модель
Xˆ q (t ) = Aˆ qW (t ) ∀t ∈ J q ,
(3.16)
где Aˆ q ∈ R 2 ×2 — матрица параметров модели, W = [u u ′]T . Доказательство утверждения непосредственно следует из того, что сигнал u ′(t ) относительно u(t ) имеет фазовый сдвиг и за счет подбора элементов матрицы Aˆ можно обеспечить компенq
сацию временного запаздывания, присущего (3.11). Модель (3.16) можно рассматривать как секущую наблюдаемого информационного портрета. Более подробно этот вопрос освещается в следующей главе. 53
На основе модели (3.16) на множестве I эg определяем оценку частного решения Xˆ q (t ) системы. Затем, зная Xˆ q (t ) , находим оценку общего решения Xˆ g (t ) = X (t ) − Xˆ q (t ) ∀t ∈ J g , где Xˆ g (t ) = [ yˆ g (t ) yˆ& g (t )]T . После получения вектора Xˆ g строим отображение (информационный портрет) Γg ⊂ { yˆ g }×{ yˆ& g } на фазовой плоскости и определяем тип точки состояния равновесия. Если множество I э не удается представить в виде (3.15), то предварительную оценку типа особой точки системы (3.11) можно получить следующим образом. Найдем частую производную T
∂X ⎡ ∂y ∂xˆ 2 ⎤ T Fg = =⎢ = [ f f ] . 1 2 ∂u ⎣ ∂u ∂u ⎥⎦
Построим отображение ΓgF ⊂ { f1}×{ f 2 } , которое назовем Fхарактеристикой системы (3.11). Для линейной системы (3.11) вектор Fg равен t
∫
Fg = e A( t −τ ) Bdτ .
(3.17)
t0
и в зависимости от спектра σ = {λ1 , λ2 } может содержать как экспоненты, так и вековые члены и синусоиды. Для удобства (3.17) будем называть F-системой. Определение. Будем говорить, что поведение двух динамических систем качественно совпадает на фазовой плоскости, если они имеют один и тот же тип состояния равновесия. Теорема 3.2. Для системы (3.11) отображение ΓgF качественно совпадает с Γg . Доказательство 3.2. Fg является вектором состояния системы (3.17) с входом u(t ) = 1 и нулевыми начальными условиями. Системы (3.11) и (3.17) имеют одинаковый спектр собственных 54
чисел. Отсюда следует утверждение теоремы. Различие между системами (3.11) и (3.17) состоит в следующем. 1. Для (3.11) неизвестны начальные условия, а для (3.17) они являются нулевыми. Это отличие отражается на начальном этапе изменения отображений ΓgF , Γg . 2. Так как для системы (3.11) получена оценка общего решения, то для определения соответствующих результатов для Fсистемы необходимо применить описанный выше подход. 3. Следует правильно выбрать интервал для представления отображения ΓgF . Итак, предложено два подхода к оценке типа состояния равновесия динамической системы. Один из них основан на идентификации частного решения системы на классе статических моделей, а второй — на определении F-характеристики системы. 3.3.3. Критерии оценки типа точки состояния равновесия
Выше был изложен подход к оценке типа точки состояния покоя на основе выделения свободной составляющей решения и анализа ее поведения для системы второго порядка. Приведем приближенные критерии оценки точки состояния равновесия на основе анализа результатов идентификации, так как они не требует знания отображения Γg . Пусть в результате идентификации получено информационное множество I ˆ = { Xˆ g (t ) t ∈ J g } . Xg
Необходимо на основе анализа I Xˆ принять решение о типе g
состояния равновесия. Известно [57], что для кривой, описываемой уравнением f ( v, z ) = 0 , условие существования особой точки M 0 ( v0 , z0 ) имеет вид 55
f ( v0 , z0 ) = 0,
(3.18) ∂ ∂ f ( v, z ) = 0, f ( v, z ) = 0. ∂z ∂v Эти условия не является необходимым. Оно позволяет определять только состояние равновесия для простейших динамических систем. К ним, в частности, можно отнести узел. Для систем второго порядка кривая на фазовой плоскости (отображение Γg ) описывается в параметрической форме, то есть Xˆ g = Ψ (t ) . Тогда условие существования особой точки M 0 ( yˆ g0 , yˆ& g0 ) записывается следующим образом Ψ (t 0 ) = 0, Ψ ′(t 0 ) = 0 ,
(3.19)
где yˆ g0 = yˆ g (t∗ ) , yˆ& g0 = yˆ& g (t∗ ) , t∗ > t0 — момент времени, для которого выполняется (3.18). 1. Критерий определения устойчивого узла (КУ). Если вектор Xˆ g (t ) является гладкой функцией для почти всех ∀t ∈ J g , а его производная Xˆ g′ (t ) непрерывно убывает и для некоторого t∗ ∈ J g Xˆ g′ (t∗ ) = 0 , Xˆ g (t∗ ) = 0 ,
(3.20)
то система (3.11) с m = 2 имеет устойчивый узел. Первое условие (3.20) несколько ослабляет (3.19), так как операция численного дифференцирования очень чувствительна к ошибкам. Второе условие (3.20) непосредственно следует из определения особой точки. Примечание. Так как задача решается на множестве I Xˆ , то g
в качестве точки M 0 можно взять начало координат на фазовой плоскости. 2. Критерий определения устойчивого фокуса (КФ). Если вектор Xˆ g (t ) является гладкой функцией для почти всех t ∈ J g , а его производная Xˆ g′ (t ) непрерывно убывает и при достаточно больших (t∗ > t0 ) ∈ J g 56
Xˆ g′ (t∗ ) → 0 , Xˆ g (t∗ ) ∈ OM 0 ,
(3.21)
где OM 0 — окрестность точки M 0 , то система (3.11) имеет состояние равновесия устойчивый фокус. В данном случае условия (3.20) не выполняется. В силу предположения об убывании вектор Xˆ g′ (t ) может достичь точки O только при достаточно больших значениях, то есть при t → ∞ . Если при этом выполняется включение Xˆ g (t∗ ) ∈ OM 0 , то получаем все признаки наличия особой точки, которая в отличие от (3.20) является устойчивым фокусом. 3. Критерий определения центра (КЦ). Если векторы Xˆ g (t ) , Xˆ g′ (t ) являются гладкими функциями для почти всех t ∈ Jg и || Xˆ g (t ) || ≥ α g , || Xˆ g′ (t ) || ≥ β g ∀t ∈ J g ,
(3.22)
где α g > 0 , β g > 0 , || ⋅ || — норма вектора, то система (3.11) имеет состояние равновесия центр. 3.3.4. Примеры идентификации состояния равновесия
Рассмотрим линейную систему (3.11) второго порядка с синусоидальным входом. Применим разработанный выше подход к идентификации состояния равновесия. Рис. 3.4 отражает результаты идентификации типа особой точки системы, когда собственные числа λ1 = −1, λ 2 = −3 . На рис. 3.4а показана реакция системы (3.11) на начальные условия при u(t ) = 0 , а на рис. 3.4б приведен фазовый портрет (3.11). На фазовой плоскости ( yˆ g , y&ˆ g ) (рис. 3.4в) представлена оценка свободного движения системы (3.11) с помощью предложенной выше процедуры идентификации общего решения. Из рисунка следует, что системе соответствует устойчивый узел.
57
1
y′
1,0
б)
0,8
0,5
y′g
yˆ ′g -1
0 0 -0,5 -1
-0,6
1
2
3
y 0,6
-0,4
0,2 -0,2
эталон
0 0
1
2
3
yg
-1
0,4
фазовый портрет
1
а)
-2
0,0 0,0 -0,2
0,2
0,4
0,6
Γg
yˆ g
0,8
t↑
-0,4
оценка свободного движение
-0,6 -0,8
в)
Рис. 3.4. Результаты идентификации типа состояния равновесия для линейной стационарной динамической системы второго порядка
2
2
f2
f1, f2
f1
1 0
1
0
4
8
12
-1,5
t
20
f2
-1
-3,0
16
-2
0 0,0
1,5
3,0
4,5
f1
ΓgF
-1
-2
Рис. 3.5. F-характеристика линейной динамической системы второго порядка с λi < 0
58
На рис. 3.5 показана F-характеристика системы (3.17), которая также подтверждает сделанный вывод о типе особой точки. y'
5
г)
2,5
yˆ g′
y
-3 -2 -1 00
1
2
3
1,5
2
-1
-2,5
эталон
-5
фазовый портрет
y′g 3
3
0 0 -1,5
2
3
yg
а)
Γg
1
1
-3
yˆ g
0 -1,5 3 2
-1,0
-0,5
0,0
1,0 30
f1
-2 -30
в)
-1 2
4
б)
15
1 0
1,5
f2
-1
НИП
y
0,5
u 6
-15
0
0
-15
-3
ΓgF
15
30
8 -30
Рис. 3.6. Результаты идентификации состояния равновесия для линейной стационарной динамической системы второго порядка с мнимыми корнями
y'1,5 0
0
-1,5
1
2
2
г)
-3
yˆ g′ y′g
0,50
фазовый портрет
3
y
а)-1
0,25
реакция на начальные условия
0 0 -2
1
2
3
yg
эталон
-4
yˆ g
0,00 -0,2
y
-0,1
0,0
0,1
0,2
2 1,5
в)
-0,25
1
5
Γg
0,5 0 2,5
5
f2
10
НИП
7,5
-0,50
u
-4
-2
ΓgF б)
0 -5 -10
0
2
f1
-15
Рис. 3.7. Идентификация состояния равновесия для линейной стационарной динамической системы второго порядка с комплексными корнями
59
На рис. 3.6 приведены результаты идентификации системы второго порядка с мнимыми корнями. Рис. 3.6а отражает фазовый портрет системы, полученный на основе анализа наблюдаемого множества I э ; рис. 3.6в — наблюдаемый информационный портрет (НИП) для рассматриваемой системы, а рис. 3.6б — F-характеристику системы. Из рисунка видно, что оба способа дают одну и ту же оценку состояния равновесия — это центр.
d yˆ g′ dt
8
2 КФ
4
1 0
0 -4
-3
-2
-1
0
d yˆ g dt
1
2
0,2
0,4
-4
-1
-8
-2
КУ
-12
-3 -4
КЦ
M0
-0,8
-0,6
-0,4
-0,2
-16 0,0
Рис. 3.8. Результаты применения критериев (3.20) - (3.22)
Рис. 3.7 отражает результаты оценивания точки состояния равновесия для системы второго порядка с комплексными корнями с действительными отрицательными частями. Система имеет устойчивый фокус. Рис. 3.8 отражает применение критериев (3.20) - (3.22) для случая данных, представленных на рис. 3.4. Результаты моделирования подтверждают, что показатели Ляпунова можно применять для принятия решения о типе точки состояния покоя. Итак, результаты моделирования подтверждают работоспособность предложенных подходов к оценке качественного поведения линейной динамической системы. Данный подход справедлив для системы m -го порядка. Естественно, что здесь существует ряд проблем, требующих своего дальнейшего развития и решения. В первую очередь это относится к первому подходу. 60
Так как производные приходится находить численными методами, то точность этих методов может сказаться на результатах идентификации. 3.3.5. Применение характеристических показателей Ляпунова для оценки состояния равновесия
Характеристические показатели Ляпунова [47] являются критерием устойчивости системы и для действительной функции h(t ) определяются следующим образом ln | h(t ) | , t →∞ t
χ [ h] = lim
(3.23)
где lim — верхний предел. t→∞
Известно [47], что характеристические показатели χi (i = 1, m) ненулевого решения системы (3.11) совпадают с действительными частями собственных чисел λi матрицы A . Воспользуемся характеристическими показателями для определения типа точки равновесия системы (3.11). Пусть известна оценка общего решения X g (t ) ∀t ∈ J g системы (3.11). Как и выше предполагаем, что система является устойчивой. Применяя (3.23) к yˆ g (t ) , получим
χ [ yˆ g ] = lim
ln | yˆ g (t ) |
, (3.24) t где t ∈ J g — максимальное значение (верхняя грань) на интервале J g . Если предел (3.24) существует, то χ [ yˆ g ] можно считать оценкой максимального собственного числа матрицы A . Таким образом, число χ [ yˆ g ] является оценкой степени устойчивости системы (3.11). Если m = 2 , то для y&ˆ получаем t →t
g
χ [ y&ˆ g ] = lim t →t
61
ln | yˆ& g | t
.
На основе чисел χ [ yˆ g ] , χ [ yˆ& g ] делается заключение о типе точки равновесия системы. Для повышения точности вычисления показателей можно воспользоваться методами идентификации. 3.3.6. О связи характеристического показателя Ляпунова и коэффициента структурности. Оценка собственных чисел системы
Вычислим для системы (3.11) показатель
μ [ yˆ g ] = ln | yˆ g (t ) | ∀t ∈ J g ⊂ J g , где J g = [t0 , t ] определяется в соответствии с (3.24). Рассмотрим теперь систему с входом t и выходом μ [ yˆ g ] . Для оценки структурных свойств этой системы можно ввести коэффициент структурности μ [ yˆ g ] , (3.25) k s (t , yˆ g ) = t который в силу выбора интервала J g совпадает с показателем χ [ yˆ g ] (3.24). Итак, установлена связь между характеристическим показателем Ляпунова χ [ yˆ g ] и коэффициентом структурности k s (t , yˆ g ) на информационном множестве I μ = {t ∈ J g , μ[ yˆ g (t )]} .
Рассмотрим множество I g ( yˆ g , t ) = { yˆ g (t ) t ∈ J g } = I Xˆ \ { y&ˆ g (t ) t ∈ J g } , g
содержащее данные об изменении переменной yˆ g на интервале J g . Будем считать, что спектр системы (3.11) σ ( λ ) содержит вещественные отрицательные числа. Ставится задача: на основе анализа множеств I μ , I g оценить спектр σ ( λ ) собственных чисел матрицы A системы (3.11). Решение задачи распадается на следующие подзадачи: 62
1) оценка размерности спектр σ ( λ ) ; 2) определение интервала изменения собственных чисел матрицы A ; 3) оценка λi ∈ σ (λ ) . Основная трудность, не позволяющая применить в данном случае метод наименьших квадратов, связана с аппроксимацией yˆ g (t ) на классе функций {eλi t , i = 1, n} , которые нелинейным образом зависят от λi . Рассмотрим каждую из подзадач. Решение задачи 1 может быть получено с помощью теоремы 3.1 на основе анализа множества I э системы (3.11). Для нахождения интервала изменения собственных чисел матрицы A (задача 2) воспользуемся следующим подходом. Найдем максимальное и минимальное значения коэффициента структурности k s (t , yˆ g ) (3.25) на интервале J g
κ min = min k s (t , yˆ g ) , κ max = max k s (t , yˆ g ) . t∈J g
t∈J g
Пусть собственные числа матрицы A расположены в порядке убывания, т. е.
λ1 > λ2 > K > λm . Положим λˆ1,0 = κ max , λˆn,0 = κ min (смысл второго индекса будет ясен из дальнейшего изложения). Оставшимся m − 2 числам λ j ( j = 2, m − 1) присвоим значения из внутреннего интервала J g . Для оценки правильности сделанного распределения частот для каждого λˆi ,0 (i = 1, m) ∀t ∈ J g сформируем множество λˆ t I i ( λˆi ,0 ) = {e i ,0 , t ∈ J g } .
Найдем степень взаимосвязи между ϑi (t ) = e
λˆi ,0t
и yˆ g (t ) на
интервале J g . Для этого воспользуемся коэффициентом взаимной корреляции rϑ2i , yˆ g . Если окажется, что rϑ2j , yˆ g ≥ δ i , 63
(3.26)
где δ i > 0 — заданная величина, то сделанное распределение для λˆi ,0 принимается. В противном случае значение λˆi ,0 корректируется. Для этого можно воспользоваться алгоритмом, описанным в [23, 27]. В результате получаем начальную оценку для спектра σ 0 ( λ ) частот матрицы A . Для оценки общего эффекта от получено спектра σ 0 (λ ) поступим следующим образом. Разобьем временной интервал [t0 , t ] = J g на n подинтервалов tn = nτ с шагом τ . На каждом шаге сформируем вектор Fn0 = [ e
λˆ1,0 t n
e
λˆ2 ,0 t n
Ke
λˆm ,0 t n T
] , Fn0 ∈ R m . За-
метим, что вектор Fn0 зависит от начального распределения σ 0 (λ ) . Обозначим вектор собственных чисел матрицы A через Λ 0 . Введем модель
ηn = H 0T Fn0 = H 0T Fn0 ( Λˆ 0 ) и найдем вектор параметров модели H 0 ∈ R m из условия H 0 = arg min Q( ηn , yˆ g ,n ) , H 0 , tn∈J g
(3.27)
где Q(η n , yˆ g ,n ) = 0,5(η n − yˆ g ,n ) 2 . Итак, в результате решения задачи 2 получено начальное приближение {H 0 , Λ 0 } для параметрического множества H n = {Hˆ n , Λˆ n } . Для определения оценки спектра σ ( λ ) системы (3.11) применим адаптивную модель (3.28) ηˆn = Hˆ nT−1 Fn ( Λˆ n−1 ) = Hˆ nT−1 Fn , ( Hˆ 0 , Λˆ 0 ) ∈ H 0 . Теперь решение задачи 3 сводится к нахождению такого алгоритма адаптации множества H n модели (3.28) на основе анализа информационного множества { yˆ g ,n , tn ∈ J g } , чтобы минимизировать критерий V (ηˆn , yˆ g ,n ) = 0,5(ηˆn − yˆ g ,n ) 2 при заданном начальном приближении для H n , определяемом из условия (3.27). Для синтеза алгоритма адаптации воспользуемся прямым методом Ляпунова с функцией Vn = 0,5en2 = 0,5(ηˆn − yˆ g , n )2 . Пользу64
ясь методом ϕ -алгоритмов [27], получим ⎡ Hˆ n ⎤ ⎡ Hˆ n−1 ⎤ ⎡I m ⎢ ⎥=⎢ ⎥ − Γen ⎢ ⎣0 ⎣⎢Λˆ n ⎦⎥ ⎣⎢Λˆ n−1 ⎦⎥
0 ⎤ ⎡ Fn ⎤ , t n D( Hˆ n−1 )⎥⎦ ⎢⎣ Fn ⎥⎦
(3.29)
где Γ ∈ R 2 m×2 m — диагональная матрица с γ ii > 0 , D( Hˆ n ) ∈ R m×m — диагональная матрица от вектора Hˆ n , I m ∈ R m×m — единичная матрица, λˆ λˆ λˆ t t t Fn = Fn ( Λˆ n −1 ) = [ e 1, n −1 n e 2, n −1 n K e m, n −1 n ]T .
Лемма 3.1. Уравнение для ошибки прогнозирования en имеет
вид en = ΔH nT−1 Fn + ε n ,
(3.30)
где ε n = yˆ g , n I T ( FnΔ − I ) , I ∈ R m — единичный вектор, FnΔ = [ e
Δλ1, n −1t n
e
Δλ2 , n −1t n
Ke
Δλm , n −1t n T
] .
Доказательство леммы 3.1. Запишем уравнение для ошибки
en en = Hˆ nT−1 Fn ( Λˆ n −1 ) − yˆ g , n = ΔH nT−1Fn H T + δFn ,
где
δFn = Fn ( Λˆ n −1 ) − Fn ( Λ ) , Fn ( Λ ) = [ eλ1t n eλ2tn Keλmt n ]T , ΔH n −1 = Hˆ n −1 − H .
После несложных преобразований приходим к (3.30). Как и следовало ожидать, ошибка en зависит от вектора параметрической невязки [ ΔH nT ΔΛTn ]T . Запишем уравнение для параметрической невязки векторов Hˆ n , Λˆ n . Для упрощения анализа второго уравнения в (3.29) разложим вектор Fn в ряд, ограничиваясь линейными членами. Тогда после несложных преобразований получим 65
0 ⎤ ⎡ΔH n −1 ⎤ ⎡ ΔH n ⎤ ⎡ I m = ⎢ΔΛ ⎥ ⎢ 0 A ⎥ ⎢ΔΛ ⎥ − Λ,n ⎦ ⎣ ⎣ n⎦ ⎣ n −1 ⎦ , 0 ⎡Im ⎤ ⎡ Fn ⎤ ( ΓH +& ΓΛ )en ⎢ ⎥⎢ ⎥ ⎣ 0 t n D( Hˆ n −1 )⎦ ⎣ Fn ⎦
(3.31)
где ΓH ∈ R m × m , ΓΛ ∈ R m×m — диагональные матрицы, +& — знак прямой суммы матриц, AΛ ,n = I m − ΓΛ en D( Hˆ n−1 )t n , AΛ ,n ∈ R m×m . Свойства алгоритма (3.29), (3.31) следуют из следующего утверждения. Теорема 3.3. Алгоритм (3.31) сходится, если: а) || AΛ ,n || ≤ d Λ ≤ 1 ∀n > 0 ; б) существует такое cΛ ≥ 0 , что en ΔΛTn−1 AΛT ,n D ( Fn ( Λ ))ΓΛ Hˆ n−1 ≥ cΛ en2 ; в) cΛ ≥ 0,5γ~Λ2 || Fn ( Λ ) ||2 d H2 t n ∀n > 0 , где 0 < d < ∞ , γ~ — максимальное собственное число H
Λ 2 cε en ,
матриц ΓΛ ; г) en ε n ≥ 1 ≥ cε ≥ 0 ; д) матрица ΓH выбирается так, чтобы γ~H2 max || Fn ||2 ≤ 2γ H (1 − cε ) , (3.32) n
где γ~H — максимальное собственное число матриц ΓH . Доказательство теоремы 3.3. Рассмотрим первое уравнение в (3.31). На его движениях введем функцию Ляпунова VnH = ΔH nT ΔH n . Тогда VnH = VnH−1 − 2en ΔH nT ΓH Fn + en FnT ΓH2 Fn .
(3.33)
Так как ΔH nT−1ΓH Fn ≥ γ H ΔH nT−1Fn , где γ H — минимальное собственное число матрицы ΓH , и существует такое cε ≥ 0 , что выполняется условие г) теоремы 3.3, то правую часть (3.33) можно привести к виду VnH ≤ VnH−1 − 2γ en2 + 2γ H cε en2 + en2γ~H2 || Fn ||2 .
(3.34)
Тогда алгоритм для оценки вектора H будет сходиться, если выполняется (3.32). Рассмотрим второе уравнение (3.31). Вводя функцию Ляпу66
нова VnΛ = ΔΛTn ΔLn , получаем VnΛ = ΔΛTn −1 AΛ , n ΔΛ n −1 − 2en tn ΔΛTn −1 AΛ , n D( Hˆ n −1 )ΓΛ Fn + + en2 FnT ( Λ )ΓΛ2 D 2 ( Hˆ n −1 ) Fn tn2 .
(3.35)
Пусть || AΛ ,n || ≤ d Λ ≤ 1 . Тогда ΔΛTn−1 AΛ ,n ΔΛ n−1 ≤ d ΛVnΛ−1 .
Вектор Fn (Λ ) в силу устойчивости системы (3.11) является исчезающим при n → ∞ . Как следует из первой части доказательства теоремы 3.3, алгоритм оценки вектора H является сходящимся в силу выполнения (3.32) и, следовательно, || Hˆ n −1 ||≤ d H , ( d H < ∞ ) . Тогда можно указать такое cΛ ≥ 0 , что выполняется условие б) теоремы 3.3. (3.35) можно привести в виду V Λ ≤ d V Λ − 2c e2t + e2γ~ 2 || F ( Λ ) ||2 d 2 t 2 . n
Λ n −1
Λ n n
n Λ
n
H n
Для сходимости алгоритм оценки вектора Λ необходимо, чтобы выполнялось условие в) теоремы 3.3 γ~ 2 || F ( Λ ) ||2 d 2 t ≤ 2c . Λ
n
Λ
H n
-0,6
k s ( t , yˆ g ) -0,9 -1,2 -1,5 -1,8 -2,1
t 0
1
2
3
4
5
6
7
Рис. 3.9. Изменение коэффициента структурности k s (t,yˆ g ) Пример. Рассмотрим систему из §3.3.4. Для нее получено
множество I g , на основе которого определен коэффициент структурности k s (t , yˆ g ) (рис. 3.9). Необходимо оценить спектр систе67
мы.
Для k s (t , yˆ g ) получены оценки κ min = −2,7 , κ max = −0,82 . Положим λˆ1,0 = κ max , λˆ2,0 = κ min . Коэффициенты взаимосвязи rϑ2 , yˆ i
для
ϑi (t ) = e
переменных
− λˆi ,0t
,
i = 1, 2
g
rϑ21 , yˆ g = 0,95 ,
равны:
rϑ22 , yˆ g = 0,93 . Параметр δ i в (3.26) равнялся 0,85. Для вектора H 0
путем решения задачи (3.27) была получена следующая оценка: H 0 = [ −0,43 1,06]T . Множество H 0 служило ориентиром для выбора начальных приближений для Hˆ n , Λˆ n . -0,7
hˆ1,n
0,6
-1,00
λˆ2,n
-0,8
-1,05
n
hˆ2,n
N Δ2 H
N Δ2 H
λˆ
2,n
0,4 -0,9 -1,10 -1,0 -1,1
0,2 -1,15 opt
-1,2
0,0
-1,20 0,75
0,90
1,05
hˆ2,n
1,20
n
Рис. 3.10. Результаты настройки вектора ηˆ n
yˆ g ,n
100
0,6
eff n ,% 0,4
ηˆ n
0,2
eff n ,% 98
yˆ g ,n
0,2
0,0 0,0
Λˆ n
96
0,4
94 0,6
yˆ g ,n
Рис. 3.11. Результаты оценки адекватности модели
Результаты работы адаптивного алгоритма (3.29) показаны на рис. 3.10. 3.11. Рис. 3.10 в обобщенном виде отражает результаты работы адаптивного алгоритма в пространстве настраиваемых 68
параметров. В частности, на нем приведены линии уровня для функции нормы параметрической невязки N Δ2 H =|| [ ΔH nT ΔΛTn ] ||2 на плоскости ( hˆ2,n , λˆ2, n ) и показано изменение самой функции N Δ2 H . Здесь же представлены портреты, отражающие зависимости λˆ2,n = λˆ2,n ( hˆ2,n ) и hˆ1, n = hˆ1, n ( hˆ2,n ) . Истинные значения векторов H , Λ равнялись T
H = [1,29 − 0,7]T , Λ = [ −1 − 3] .
Рис. 3.11 отражает адекватность полученной модели. Он содержит информационные портреты на плоскости ( yˆ g , n ,ηˆn ) и ( yˆ g ,n , eff n ) , где переменная eff n отражает отношение выходов модели и объекта. Из рисунка видно, что выходы практически неотличимы, а коэффициент детерминированности модели равен 0,99.
3.4. Оценка структуры нелинейной динамической системы В настоящее время при выборе структуры модели нелинейной динамической системы обычно используются переборные методы [46, 50] на заданном классе функций-претендентов, постулируемых априори. Эта процедура очень трудоемка и требует определенной квалификации от специалиста, выполняющего подбор модели. Все известные методы структурной идентификации [60] развиваются в рамках данной концепции. В [56] для определения степени нелинейности объекта применялись корреляционный и дисперсионный анализ. Ниже излагается метод структурной идентификации динамических объектов, основанный на подходе, получившем название информационного синтеза [20,27] и позволяющем выделить вспомогательное подмножество из информации I э , на основе которого принимается решение о классе нелинейностей и ее структуре.
69
3.4.1. Постановка задачи
Рассматривается динамическая система X& = F ( X ,U , A, t ), Y = FY ( X ,U , A, t ),
(3.36)
где U ∈ ΩU ⊂ U ⊆ R m , Y ∈ Y ⊂ R n — измеряемые вход и выход системы, X ∈ X ⊆ R q — вектор состояния, Y ⊆ X ⊆ R n , F : R q × R m × J → R q — гладкая непрерывно дифференцируемая по X и A вектор-функция, A ∈ R q × q — матрица параметров, t ∈ J , FY : R q × R m × J → R n — функция, задающая способ формирования выхода системы. Для (3.36) известно множество измеряемых данных, наблюдаемых на временном интервале J , ~ ~ ~ ~ ~ I э = I(U ,Y ) = {U ∈ R m ,Y ∈ R n | U (t ) = sU (U , t ) , , (3.37) ~ Y (t ) =sY (Y , t ) t ∈ J } где операторы sU ∈ NU , sY ∈ N Y определены на множествах NU , N Y , характеризующих неопределенность процесса измерения, sU : U × J → R m , sY : Y × J → R n .
В зависимости от доступности процесса измерения множества NU и N Y могут иметь как нечеткую (гиперобъемную — гиперкуб, гиперцилиндр) природу, так и статистическую. Все определяется подходом к решению задачи идентификации. Необходимо на основе анализа и обработки множества I э принять решение о структуре оператора F в (3.36). 3.4.2. Подход к идентификации класса нелинейностей
Изложим подход к структурной идентификации для частного случая системы (3.36) с выделенной линейной частью X& = AX + ϕ ( y ) I + Bu, (3.38) y = CT X , 70
где u ∈ R , y ∈ R — вход и выход системы, A ∈ R q × q , B ∈ R q , I ∈ R q , C ∈ R q — постоянные матрицы соответствующих размерностей, ϕ ( y ) — некоторая скалярная нелинейная функция. Относительно структуры функции χ = ϕ ( y ) могут делаться различные предположения. Все они определяются уровнем неопределенности априорной информации. В частности, в условиях полной априорной определенности могут применяться методы, основанные на тех или иных разновидностях линеаризации [38, 55, 17]. При исследовании абсолютной устойчивости нелинейных систем относительно нелинейности делается следующее предположение [63]
χ ∈ Fϕ = {ϕ (ξ )ξ ≥ ξ 2 , ξ ≠ 0, ϕ (0) = 0} , где ξ ∈ R — вход нелинейного элемента. Обычно предполагают, что ζ является линейной комбинацией переменных состояния, то есть вектора X . Часто для аппроксимации функции χ используется так называемое секторное условие, то есть определяется сектор, ограниченный двумя прямыми, между которыми может лежать искомая нелинейная функция
χ ∈ Fϕ = {γ 1ξ 2 ≤ ϕ (ξ )ξ ≤ γ 2ξ 2 , ξ ≠ 0, ϕ (0) = 0, γ 1 ≥ 0,γ 2 < ∞}
,
(3.39)
Из (3.38) и (3.39) следует, что чаще всего в системах управления применяются статические нелинейности. Отсюда можно сделать вывод, что для оценки функции ϕ следует применять модели, описываемые статическими (алгебраическими) уравнениями. Для идентификации данного класса моделей необходимо получить соответствующее подмножество информационного множества I э или его преобразованный аналог. Предположим, что множество I э для (3.38) имеет вид I э = {u ( t ), y ( t ) t ∈ J = [ t0 , tk ]} ,
(3.40)
то есть переменные u, y измеряются без помех. В случае наличия неопределенности в процессе измерения множества I э . Необходимо выполнить процедуру предварительной обработки его элементов [27]. 71
Ставится задача: необходимо на основе обработки множества (3.40) оценить функцию ϕ ( y ) , принадлежащую классу Fϕ (3.39). Для решения задачи предлагается использовать процедуру информационного синтеза, основанную на реализации следующих шагов. 1. Выделение линейной составляющей в (3.38). 2. Формирование вспомогательного множества данных I N , содержащего информацию о нелинейной составляющей в (3.38). 3. Разработка алгоритма идентификации функции ϕ на множестве I N . Так как информация о функции ϕ ( y ) содержится в ненаблюдаемых переменных системы (3.38), то необходимо получить оценку этих компонент вектора X . В частности, применим к выходу y (t ) операцию дифференцирования и обозначим полученную переменную через x1 . Учет x1 приводит к расширению информационного множества I э : I enl = {I э , x1} . Для реализации первого шага предлагаемой процедуры необходимо выделить подмножество данных I g ⊂ I enl , соответствующее частному решению системы (3.38) (установившемуся состоянию). Это множество формируется путем исключения данных Itr , содержащих информацию о переходном процессе в системе, то есть I g = Ient \ Itr . Для выделения линейной составляющей из x1 применим математическую модель xˆ1l (t ) = H T [1 u(t ) y (t )]T , (3.41) где H ∈ R 3 — вектор параметров модели. Вектор H ищется так, чтобы минимизировать квадратичный критерий Q( e) = 0,5e2 min Q( e) e = xˆ1 − x1 → H opt . H
На основе полученной модели (3.41) ∀t ∈ I g находим прогноз для переменной x1 и формируем ошибку eN (t ) = xˆ1 (t ) − x1 (t ) , которая зависит от нелинейности в системе (3.38). В результате получаем множество I N = { y (t ), eN (t ) t ∈ J g }, которое будет использоваться на втором этапе информационного синтеза. 72
3.4.3. Выбор информационного подмножества в I N для идентификации функции χ = ϕ ( y )
Задача выделения подмножества Iϕ ⊆ I N , позволяющего однозначно идентифицировать функцию χ = ϕ ( y ) , является нетривиальной и во многом зависит от имеющейся априорной информации. В условиях неопределенности она сводится к выделению такого интервала изменения переменной y ∈ I y ⊂ Iϕ ⊆ I N , на котором четко проявляются характерные особенности изменения функции χ . Изложим процедуру решения рассматриваемой задачи, основанную на анализе особенностей изменения траектории переменной eN . В качестве первичных характеристик, позволяющих принимать решение, используется информационный портрет (отображение) Γϕ ⊆ { y} ×{eN } на плоскости ( y , eN ) , являющийся в данном случае разновидностью наблюдаемого информационного портрета, или коэффициент структурности для рассматриваемой на данном уровне системы e (t ) t ∈ JN . k s (t ) = N y (t ) На основе анализа указанных траекторий выделяется совокупность подмножеств (кандидатов) I yj ( j = 1, s ) , среди которых могут содержаться подмножества, не связанные с особенностями нелинейной функции. Под особенностями функции будем понимать потерю непрерывности на некотором интервале I yj , а также появления точек перегибы, экстремумов и прочее. Все эти признаки (особенности) являются свидетельством нелинейности исследуемой функции. В этом смысле будет использоваться понятие информативности множества I yj . Чтобы отличить это понятие от общепринятого понятия информативности, будем называть его ϕ -информативностью. Утверждение 3.2. Если на некотором интервале I yj функции
de (t ) ⎞ ⎛ dk (t ) ⎞ ⎛ j ⎜ μe (t ) = N ⎟ ∨ ⎜ μ kjs (t ) = s ⎟ ∀j = 1, s . dy ⎠ ⎝ dy ⎠ ⎝ 73
(3.42)
теряют свойство непрерывности и в их поведении появляются особенности, то этот интервал можно рассматривать как ϕ информативный. Доказательство утверждения непосредственно следует из анализа поведения функции, а заключение о наличии у нее тех или иных особенностях делается на основе анализа производных. Это утверждение не охватывает некоторые классы нелинейных функций. Но в условиях априорной неопределенности такой подход является единственно разумным. На основе анализа изменения показателей (3.42) на каждом из временных интервалов J yj из рассмотрения исключаются неинформативные подмножества I yj , а оставшиеся включаются в состав Iϕ v
Iϕ = U Iϕl ( Ily ) , l
v ≤ s.
Итак, сформировано информационное множество Iϕ ⊆ I N , позволяющее перейти к структурной идентификации функции χ = ϕ ( y) . Замечание. При анализе изменения Γϕ или k s могут появиться "ложные" (неинформативные) множества I yj , которые должны проверяться с помощью параметров (3.42) (см. §3.4.5). 3.4.4. Структурная идентификация функции χ
Построим сужение информационного портрета Γϕ на множестве Iϕ и на основе его анализа сделаем предварительное заключение о классе Fϕ . Для этого рассмотрим сектор S = (γ 1 y ,γ 2 y ) и зададимся подмножеством функций {ϕ apo,i , i = 1, n} ∈ S ⊂ Fϕ в (3.38). Очень часто выбор элементов ϕ apo,i удается сделать довольно точно даже в условиях неопределенности. Учитывая условия, в которых проводятся измерения и формируется множество I э , для проверки сделанного предположения относительно класса Fϕ применим модель 74
eˆ N ,i (t ) = α iϕˆ i ( y , t ) + β i , ( y , t ) ∈ Iϕ , i = 1, m ,
(3.43)
где eˆ N ,i ∈ R — выход модели, α i , β i — параметры модели, ϕˆi = ϕ apo,i ∈ Fϕ . В результате получим множество моделей M (Fϕ ) . Подберем параметры каждой mi (ϕˆ i ) ∈ M (Fϕ ) модели (3.43) таким образом, чтобы минимизировать квадратичный критерий Q(ε i ) = 0,5ε i2 = 0,5( eˆ N ,i − eN ) 2 min Q(ε i ) → (α iopt , β iopt ) .
α i , βi
(3.44)
Для каждой из mi (ϕˆi ) моделей найдем величину критерия Q(ε i ) и коэффициент взаимной корреляции ri (коэффициент детерминации). Оставим только те из моделей (3.43), для которых справедливо условие ( ri ≥ δ r ) & (Q(ε i ) ≤ δ Q ) ,
где 0 < δ r ≤ 1 — заданное число (порог), δ Q ≥ 0 . В итоге получим уточнение класса Fϕ∗ ⊆ Fϕ и множество моделей M (Fϕ∗ ) ⊆ M (Fϕ ) (3.43). Для принятия окончательного решения относительно оптимальной структуры функции ϕˆ opt ∈ Fϕ∗ с помощью каждой из mk (ϕˆ k* ) ∈ M (Fϕ∗ ) ( k = 1, k * , k * = # M (Fϕ∗ ) — мощность множества M (Fϕ∗ ) ) моделей находим прогноз для вспомогательной пере-
менной eN на множестве I N или для ∀x1 ∈ I g и оставляем только ту из моделей m(ϕˆ opt ) ∈ M (Fϕ∗ ) , которая дает минимальное значение ошибки прогнозирования min
mk (ϕˆk* )∈M (Fϕ∗ )
Q(ε i ) → m(ϕˆ opt ) .
На этом заканчивается решение задачи структурной идентификации. Возможны также некоторые модификации изложенного метода принятия решений. 75
3.4.5. Примеры
Рассмотрим динамическую систему второго порядка &x& + a1 x& + a2 x + ϕ ( x ) = u , y = x ,
(3.45)
где a1 = 4 , a 2 = 3 , ϕ ( x ) = | x | , u(t ) = 2 sin(0,1πt ) . На рис. 3.12 показаны фазовые портреты системы (3.45) для линейного и нелинейного случаев. Здесь же приведен наблюдаемый информационный портрет Γo нелинейной системы. Из рисунка видно, что влияние нелинейности начинает проявляться при пересечении y оси ординат, т. е. при смене знака переменной y. y'
1,0
2,50
u 0,5
-1,25
Γο
1,25
y
0,0 0,00
1,25
-0,5
yl′
2,50
y N′
0,00
-1,0
-1,25
-1,5
-2,50
Рис. 3.12. Информационные портреты системы (3.45)
Система (3.45) интегрировалась с шагом 0,2 сек и было сформировано множество I ent , включающее в себя данные I э (3.40) и значения x1 = x& , Множество I ent содержало массив из 200 точек. Для выделения линейной составляющей из I ent было исключено подмножество Itr со значениями, лежащими на временном интервале [0; 7,8 ] c. На множестве I g с помощью метода наименьших квадратов была получена модель (3.41) с вектором параметров H = [0,085 0,226 - 0,577]T . Коэффициент детерминированности равнялся 0,92. Из полученных результатов можно сделать вывод о том, что процессы в системе носят нелинейный характер. 76
После исключения линейной составляющей из x1 было сформировано множество I N , на основе которого был построен информационный портрет на плоскости ( y , eN ) (рис. 3.13а). 0,12
eN eN
0,06
S -0,6
-0,3
0,00 0,0
0,3
0,6
0,9
y
-0,06
Iϕ2
а)
Iϕ1
-0,12
0,50
μe 0,25
Iϕ3 0,00 -0,5
Iϕ4
Iϕ1
0,0
2
Iϕ
y 0,5
1,0
-0,25
б) -0,50
Рис. 3.13. Результаты информационного анализа множества I N : а — информационный портрет системы (3.45) в пространстве ( y,eN ) , б — изменение параметра μe (t )
Целью анализа портрета являлось выделение подмножества Iϕ . На рис. 3.13а показан сектор S , определяющий класс нелинейных функций Fϕ , и четыре участка траектории Iϕ1 , Iϕ2 , которым соответствуют подмножества (I1ϕ , Iϕ2 ) ⊂ I N . Из рисунка следует, что для описания нелинейности можно использовать функцию нахождения модуля от y (t ) . На рисунке показаны также два 77
участка Iϕ3 , Iϕ4 , которые также следует исключить, так как на этих участках траектория достигает локальных экстремумов (рис. 3.13а) и при дифференцировании это может приводить к большим скачкам, но они не отражают особенности функции ϕ ( y ) . Для принятия решения об ϕ -информативности множеств I1ϕ , Iϕ2
вычислялся показатель μ e (t ) (3.42) (рис. 3.13б). Из
рис. 3.13б видно, что множество Iϕ2 можно исключить из анализа. eN
eˆN
0,08 0,04 0,00 -0,6
-0,4
-0,2
0,0
0,2
0,4
0,6
0,8
1,0
y
-0,04 -0,08
eˆ No (ϕˆ 2 )
eN
eN -0,08
б)
eˆNo (ϕˆ1 )
-0,12 -0,16
eˆN ,1 , eˆN ,2
eN
-0,09
eˆN ,1 -0,10
eˆN ,2
а)
-0,11
-0,12
-0,11
-0,10
-0,09
-0,08 y
Рис. 3.14. Информационные портреты системы структурной идентификации с моделью (3.43) в пространстве { y,eN ,eˆN,i }: а) — результаты идентификации на множестве I1ϕ , б) — адекватность выходов модели на множестве I N
На множестве I1ϕ , заданном на временном интервале [11,2; 12,4] с, строилась модель (3.43) с ϕˆ1 ( y , t ) = | y (t ) | . Коэффи78
циент детерминированности R 2 равнялся 0,92. Адекватность полученной модели (3.43) показана на рис. 3.14. Здесь приведен также выход модели (3.43) с ϕˆ 2 ( y , t ) = y 2 (t ) . Коэффициент R 2 для статической модели (3.43) с нелинейностью ϕˆ1 на множестве I N равнялся 0,92, а с нелинейностью ϕˆ 2 — 0,87. В среднем точность первой модели в 3 раза выше, чем второй, что подтверждает рис. 3.14б. На рис. 3.15 приведены результаты структурной идентификации системы (3.45) с ϕ ( x ) = ϕ s ( x ) = sign( x ) , где sign(x ) — знаковая функция. Из рис. 3.15 видно, что в начале траекторий I1ϕ , Iϕ2 переменная eN (пунктирная линия) претерпевает резкий скачек, что является характерным для идеальных релейных нелинейностей типа sign(x ) . Поэтому в (3.43) ϕˆ1 ( x ) = sign( x ) . Коэффициент детерминированности R 2 = 0,92 . Здесь же показан выход модели (3.43) eˆ N ,1 . 0,3
eˆN ,1
eN
0,2 0,1
-1,0
-0,5
eN
Iϕ1
0,0 0,0
eˆN ,1
Iϕ2
y 0,5
1,0
-0,1 -0,2 -0,3
Рис. 3.15. Результаты идентификации нелинейности в системе (3.45) с ϕ ( x ) = sign( x )
Гипотезу о наличии в системе двух множеств ϕ -информативности I1ϕ , Iϕ2 подтверждает также изменение коэффициента структурности k s (eN , y ) (рис. 3.16). 79
В качестве кандидата была опробована также функция ϕˆ 2 ( x ) = 3 x , для которой коэффициент R 2 равнялся 0,97, то есть на множестве I1ϕ модель (3.43) с ϕˆ 2 ( x ) лучше аппроксимирует данные, чем модель с ϕˆ1 ( x ) . Для принятия решения об оптимальной структуре функции ϕ ( x ) проводилось прогнозирование переменной x1 на множестве I g , где модель с ϕˆ1 ( x ) на участках с неявно выраженными нелинейностями показала практически идеальное прогнозирование значений x1 (рис. 3.17). 4
k s ( eN , y ) -0,2
-0,1
0,0 0
0,1
-4
0,2
ks -1
-8
0 0
y
y 1
-8
-12
Iϕ2
Iϕ1
-16
-16
Рис. 3.16. Изменение коэффициента структурности k s ( eN ,y ) в системе (3.45) с ϕ ( x ) = sign( x )
Итак, предложен подход к структурной идентификации нелинейных динамических систем с одним входом и выходом на основе обработки доступного информационного множества I э . На основе методологии информационного синтеза разработана процедура выделения вспомогательного множества данных, содержащих информацию о нелинейных свойствах системы. Предложен способ классификации полученного множества с целью формирования информативных подмножеств, позволяющих принять решение о структуре неизвестной нелинейной функции и провести оценивание ее параметров. Описана процедура выбора 80
оптимальной структуры нелинейной функции. Результаты моделирования подтверждают эффективность изложенного подхода. Следует иметь виду, что информационный синтез предъявляет определенные требования к владению методами анализа, выделения и классификации информации. Именно формирование необходимого информационного множество на данном этапе анализа позволяет, в конечном счете, свести задачу к некоторой стандартной процедуре оценивания. В этом проявляется действие принципа информационной полноты [27] на заданном информационном множестве I э , которое доступно на априорном уровне постановки задачи идентификации. -0,150
xˆ1
x1
xˆ1 (ϕˆ1 )
x1
xˆ1 (ϕˆ 2 )
-0,175
-0,200
x1
-0,225 -0,20
-0,16
-0,12
Рис. 3.17. Прогнозирование переменной x1 с помощью модели (3.43) с различными нелинейностями
3.5. Получение параметрических ограничений в условиях неопределенности Учет параметрических ограничений в задачах идентификации неразрывно связан с проблемой робастности. Обычно при синтезе адаптивных систем используются параметрические ограничения, полученные на основе анализа априорной информации [74-76, 82]. Такой же подход применяется при задании ограничений на структурные возмущения в системе. В условиях априор81
ной неопределенности такая информация, как правило, отсутствует. Проблеме получения апостериорных параметрических ограничений в условиях неопределенности уделялось большое внимание в работах по гарантированному оцениванию [40], исходя из информации о возмущениях. В [21, 26, 27] предложен метод синтеза моделей для оценки параметрических ограничений в условиях неопределенности на основе нахождения мажорирующих решений для динамической системы [48], который в отличие от [40] не требует данных о неконтролируемых возмущениях. Ниже рассматривается задача формирования параметрических ограничений и ограничений на неопределенность для непрерывной нестационарной динамической системы с обобщенным входом на основе адаптивного подхода и развития результатов, полученных в [22, 27]. 3.5.1. Постановка задачи
Рассматривается непрерывная динамическая система, описываемая в пространстве “вход-выход” системой уравнений y& (t ) = AT (t ) P(t ) - f (t , y , r , A),
(3.46)
P&v (t ) = K v Pv (t ) + Hv(t ), v = y , r ,
(3.47)
где r ∈ R , y ∈ R — вход и выход системы; P ∈ R 2 m — обобщенный вход, P(t ) = [ y (t ) PyT (t ) r (t ) PrT (t )]T , Py ∈ R m −1 , Pr ∈ R m −1 ; A ∈ G A ⊆ R 2 m — вектор параметров, принадлежащий ограничен-
ной, но априори неизвестная области G A ; H ∈ R ( m−1) — известный вектор; K v ∈ R 2( m −1)×2( m −1) — гурвицева матрица; f (t , y , r , A) — неопределенность. Пара ( K v , H ) является управляемой. Предполагается, что при | r (t ) | ≤ ∞ | f (⋅) | ≤ β ∀t ≥ t0 , где β ≥ 0 . Передаточная функция системы (3.46), (3.47) является положительной действительной. Введение обобщенного входа P(t ) (его еще называют регрессионным) связано с приведением динамической системы m -го порядка к идентификационной форме (неминимальная реализация) относительно выхода y ∈ R . P(t ) включает в себя как сам 82
вход r (t ) , так и выход системы y (t ) и их преобразования Py (t ), Pr (t ) , полученные в результате пропускания y (t ) и r (t ) через систему (3.47). Отсюда название вектора P(t ) . Для системы (3.46), (3.47) известна информация I э = { y (t ), r (t ) t ∈ J } ,
где J — интервал наблюдения. Ставится задача: на основе анализа информации I э о функционировании системы (3.46), (3.47) найти оценки для области G A и верхнюю границу для числа β . 3.5.2. Подход и модели для получения параметрических ограничений
Известно, что решение уравнения (3.46) имеет вид [48] t
∫
y (t ) = ϕ (t , t0 ) y (t0 ) + ϕ (t , s )( AT ( s ) P( s ) − f ( s ))ds,
(3.48)
t0
где ϕ (t , t0 ) — переходная функция. Дискретный аналог уравнения (3.48): ( n +1)τ
y n+1 = ϕ (( n + 1)τ , nτ ) y n +
∫
ϕ ( nΔt , s )( AT ( s ) P( s ) − f ( s ))ds, (3.49)
nτ
где τ ≥ 0 — интервал дискретизации, y n = y ( nτ ) . Из (3.49) получаем оценку | yn +1 | ≤ ϕ (( n + 1)τ , nτ ) | yn | + ( n +1)τ
∫
ϕ ( nτ , s ) ( || A( s ) |||| P( s ) || + | f ( s ) | )ds,
(3.50)
nτ
где || P(t ) || — норма вектора P(t ) в соответствующем пространстве. Неравенство (3.50) давно известно [48] и широко применяется в теоретических исследованиях. Одним из достоинств оценки (3.50) является то, что она связывает между собой элементы 83
множества I э , вектор A(t ) и неопределенность f (t ) . Поэтому в дальнейшем область G A будем представлять в виде G A = { A ∈ R 2 m | α b ≤ || A(t ) || ≤ α t ∀t ≥ t0 } ,
(3.51)
где α b = inf || A(t ) ||, α t = sup || A(t ) || являются границами области t
t
G A . Из допущений, сделанных в разделе 3.5.1 относительно системы (3.46), (3.47), следует, что α t < ∞ . Неравенство (3.50) затруднительно применять для идентификации границ области G A . Поставим в соответствие (3.50) некоторое уравнение, которое позволяло бы использовать элементы множества I э или их преобразования. Воспользуемся идеей мажорирующих уравнений (верхних и нижних), которые применяются в теории устойчивости для построения систем сравнения [48]. Впервые эта идея для рассматриваемой задачи была предложена в [40]. Прежде чем приводить мажорирующие уравнения, получим множество I s на основе преобразования элементов множества I э . Для каждого t ≥ t∗ > t0 будем определять функции
ϑ (t ) = | y (t ) |, ρ (t ) = || P(t ) || . В результате получим множество I s = {ϑ (t ), ρ (t ) t ∈ J }. Выделим в I s два подмножества It U Ib ⊆ I s ,
(3.52)
где I t содержит “верхнее” значение функции ϑ (t ) и соответствующие им ρ (t ) для заданного t , I b — “нижние” значения, It I Ib = ∅ . Для классификации множества I s на два подмножества It и I b введем некоторое число (порог) ε > 0 , которое можно выбирать как на основе анализа априорной информации I а , так и определять в результате обработки множества I s (в условиях неопределенности). Тогда алгоритм формирования множеств I t , I b примет вид 84
{ ϑt (i ) := ϑ (t ), ρt (i ) := ρ (t ) }∈ It , если ϑ (t ) ≥ ε , {ϑb ( j ) := ϑ (t ), ρb ( j ) := ρ (t ) }∈ Ib, если ϑ (t ) < ε ,
∀t ≥ t∗ ,
(3.53)
где i = 1, mt , j = 1, mb ; mt , mb — соответственно мощность множеств I t , I b ; t∗ — момент начала классификации функций ϑ (t ) , ρ (t ) ; := — знак присвоения. Из процедуры (3.53) следует, что mt + mb <# I s , где # I s — мощность множества I s , что и отражает (3.53). Предположим, что τ является достаточно малым и ϕ (⋅) = κ , κ = const . Тогда верхнее решение (T-решение) неравенства (3.50) с учетом (3.51) и (3.53) запишем в виде
ϑt , n +1 = κ tϑt , n + bt (α t ρ t , n + β t ),
(3.54)
( n +1)τ
где
∫τϕ (nτ , s)ds = b . Аналогично получаем нижнее решение: t
n
ϑb,n+1 = κ bϑb,n + bb (α b ρ b,n + β b ).
(3.55)
В дальнейшем для удобства ссылки (3.54) и (3.55) будем соответственно называть T- и B-системой. Итак, задача получения параметрических ограничений G A для (3.46), (3.47) сведена к оценке параметров T- и B-системы. Прежде, чем переходить к синтезу адаптивных алгоритмов, опишем процедуру получения порога. Изложенная процедура реализует алгоритмы адаптивного интервального оценивания. 3.5.3. Выбор порога в алгоритме классификации (3.53)
Выражение (3.53) представляет собой детерминированный аналог стохастического алгоритма классификации [43], где ε рассматривается как выборочное среднее стационарного случайного процесса. В изложенной выше постановке ε можно трактовать как сглаженное значение процесса ϑ (t ) , поэтому ε = ε (t ) . Так как система (3.46), (3.47) является детерминированной, то подход, предложенный в [43], не применим. 85
Предлагаемая ниже процедура определения функции ε (t ) основана на многократном сглаживании сигналов [22, 27]. Сначала находится предварительная оценка ε 1 (t ) порога ε (t ) путем пропускания сигнала ϑ (t ) через сглаживающий фильтр
ε 1 (t ) = Fε (t ,ϑ ) , где Fε — оператор сглаживания. Для принятия решения о применении ε 1 (t ) в качестве пороговой функции в алгоритме (3.53) необходимо ввести некоторый критерий. Для этого сформируем функцию ξ (t ) = ϑ (t ) − ε 1 (t ) , которую пропустим через сглаживающий фильтр с оператором Fς . В результате получим сигнал ζ (t ) = Fς (t ,ξ ) , который представляет собой ошибку работы фильтра Fε (t,ϑ ) (в статистической теории в качестве критерия применяют вероятность ложных тревог). Далее определяем величину χ = max | ζ (t ) | и проверяем условие t
(критерий):
χ ≤ δε ,
(3.56)
где δ ε ≥ 0 — некоторое число. Если условие (3.56) выполняется, то полагаем ε (t ) = ε 1 (t ) , в противном случае производим коррекцию функции ε 1 (t ) . Введем переменную ⎧0, χ ≤ δ ε , ⎩1, χ > δ ε .
ω=⎨ Тогда для ε (t ) получим
ε (t ) = ε 1 (t ) + ωζ (t ). Заметим, что при неудачном выборе фильтра Fε (t,ϑ ) или Fς (t ,ξ ) описанная процедура может повторяться до тех пор, пока не будет выполняться (3.56). Замечание. Описанная процедура определения порога может применяться для оценки математического ожидания нестационарных стохастических процессов. 86
Рис. 3.18. Схема системы идентификации параметрических ограничений
Схема системы идентификации параметрических ограничений показана на рис. 3.18. 3.5.4. Адаптивные алгоритмы оценивания параметров T- и B-систем
Для идентификации параметров T-системы применим модель
ϑˆt , n +1 = κˆt , nϑˆt , n + bt (αˆ t , n ρ t , n + βˆt , n ),
(3.57)
где ϑˆt , n +1 ∈ R — прогноз выхода T-системы; bt = τ ; αˆ t , n , βˆt , n — оценки параметров T-системы. Заметим, что это одна из возможных моделей для оценки ограничений. Выбор ее структуры обусловлен упрощением реализации и необходимостью обеспечения мажорирующих свойств. Так как априори число κ t в (3.54) неизвестно, то предлагается получать его значение в процессе адаптации. Запишем уравнение для ошибки прогнозирования выхода T системы: et , n +1 = ϑˆt ,n +1 − ϑt ,n +1 = κˆt , n et , n + δκ t ,nϑt ,n + , (3.58) bt (δα t , n ρ t , n + δβt , n ) 87
где δα t , n = αˆ t , n − α t . Обозначим Cˆ t , n = [ κˆt , n αˆ t , n βˆt , n ]T . Тогда для настройки вектора параметров модели (3.57) применим алгоритм Cˆ t , n +1 = Cˆ t , n − Γt et , n +1 Dt , n , (3.59) где Dt , n = [ϑˆt , n ρ t , n 1]T , Γt ∈ R 3 — диагональная матрица с γ ii > 0 . Оценивать параметры B-системы будем с помощью модели
ϑˆb,n+1 = κˆb,nϑˆb,n + bb (αˆ b,n ρ b,n + βˆb,n ) .
(3.60)
Алгоритм адаптации вектора Cˆ b, n имеет вид Cˆ b, n +1 = Cˆ b, n − Γb eb, n +1Db, n ,
(3.61)
где Cˆ b, n , Db, n и Γb имеют тот же смысл, что и соответствующие векторы в (3.59). Правило останова адаптивных алгоритмов имеет вид | eq , n +1 | ≤ ε q ,
где q = t , b , ε q ≥ 0 . 3.5.5. Свойства адаптивной системы
Так как T- и B-системы описываются уравнениями, имеющими одинаковую структуру, то в дальнейшем будем рассматривать систему en +1 = κˆen + δCnT Fn ,
(3.62)
δCn +1 = δCn − Γn en +1Fn ,
(3.63)
где Fn = WDn , W = diag(1 b b ) . Сначала приведем общий результат для системы (3.62), (3.63). Предположим, что вектор Fn ∈ R 3 принадлежит множеству P3 ( Fn ,ψ 0 ,ψ 1 ) , т.е. удовлетворяет условиям леммы идентифицируемости [21] с числами 0 < ψ 0 < ψ 1 < ∞ : 88
Fn ∈ P3 ( Fn ,ψ 0 ,ψ 1 ) = { Fn ∈ R 3 |
ψ0 < 3
3
det( Ln ) ≤ Sp ( Ln ) ≤ 3λ3 ( Ln ) < ψ 1 ∀n ∈ 0 }
,
где Ln = Fn FnT ; det( Ln ) , λ3 ( Ln ) — соответственно определитель и максимальное собственное число матрицы Ln ; Sp( Ln ) — след матрицы Ln . Пусть Vn = en2 , VnΔ =|| δC n ||2 , Γn = γ n I 3 , γ n > 0 , I 3 ∈ R 3 — единичная матрица,
γ opt = arg min(VnΔ+1 − VnΔ ) . n
γn
Тогда для системы (3.62), (3.63) справедлива [21] Теорема 3.4. Пусть выполняются условия: а) 0 < κˆ < 1 ; б) Fn ∈ P3 ( Fn ,ψ 0 ,ψ 1 ) ; в) sgn en +1 = sgn ( δC nT Fn ) ; г) параметр γ n является таким, что 0 ≤ γ n ≤ 2γ 0 , где γ 0 — некоторое число. Тогда все траектории системы (3.62), (3.63) ограничены и справедливы оценки VnΔ+1 ≤ υ n V0Δ , Vn +1
υ n − κˆ 2 n Δ V0 , ≤ κˆ V0 + μψ 1 υ − κˆ 2 2n
(3.64) (3.65)
где υ = 1 − ψ 0 /ψ 1 , μ = 1 + 2κˆ 2 / θ , θ = 1 − κˆ 2 . Для системы (3.62), (3.63) вектор Fn ∉ P3 ( Fn ,ψ 0 ,ψ 1 ) , поэтому условия теоремы не выполняются. Представим вектор Fn в виде: Fn = [ F1T, n b]T . Сделаем следующие допущения относительно системы (3.62), (3.63).
1. Fn = [ F1T, n b]T , F1, n ∈ R 2 и F1, n ∈ P2 ( F1, n ,ψ 01 ,ψ 11 ) . 2. Γn = γ 1 I 2 +& γ 2 , где +& — знак прямой суммы матриц, γ 1 , γ 2 удовлетворяют условию г) теоремы. 3. Свойства системы (3.62), (3.63) исследуются при γ 1opt , γ 2opt , определяемых из условия: 89
(γ 1opt ,γ 2opt ) = arg min(VnΔ+1 − VnΔ ) . γ 1 ,γ 2
(3.66)
Представим VnΔ в виде VnΔ = V1Δ, n + V2Δ, n ,
где V1Δ, n = || δC1, n ||2 = δκ n2 + δα n2 , V2Δ, n = δβ n2 . Следствие из теоремы 4.1. При допущениях 1-3 для системы (3.62), (3.63) справедливы оценки V1Δ, n +1 ≤ υ1n V1Δ,0 ,
(3.67)
V2Δ, n +1 ≤ V2Δ,0 ,
(3.68)
υ1n − κˆ 2 n Δ Vn+1 ≤ κˆ V0 + 2 μ ψ 11 V + 2 μ κˆ 2( n−1) V2Δ,0 , 2 1,0 υ1 − κˆ
(3.69)
2n
где υ1 = 1 − ψ 01 /ψ 11 . Из следствия следует, что в силу невыполнения условия Fn ∈ P3 ( Fn ,ψ 0 ,ψ 1 ) применение алгоритма (3.63) с оптимальной матрицей Γn , удовлетворяющей условию (3.66), приводит к ограниченности решений { en , δCn } системы (3.62), (3.63), но сходимость обеспечивается только по части переменных, а именно по вектору δC1, n ⊂ δC n . Величина ошибки δβ n определяется только выбором начальных условий βˆ . Поэтому в случае сужения мно0
жества P3 ( Fn ,ψ 0 ,ψ 1 ) до P2 ( F1,n ,ψ 01 ,ψ 11 ) необходимо применять алгоритм (3.63) с матрицей Γn , элементы которой отличаются от оптимальных значений, полученных из условия (3.66). Так, при γ 1 = μ1γ 1opt , γ 2 = μ 2γ 2opt для VnΔ справедлива оценка VnΔ ≤ (1 − η ( 2 μ1 − μ12 )) n V1Δ,0 + ( μ 2 − 1) 2 n V2Δ,0 ,
(3.70)
где η = 1 − ψ 01 /ψ 11 . Ограничения на μ1 , μ 2 нетрудно получить из (3.70). Пример. Рассматривается динамическая система (3.46), (3.47) второго порядка с A(t ) = [ a1 (t ) a 2 (t ) a3 a 4 ]T ; a3 = 1.5; a4 = 1.2 , 90
a1 (t ) = −2 + 0.5 sin 0,9t; a2 (t ) = 1 + 0.2 sin t . Вход и неопределенность имеют вид: r (t ) = 2.5 + 0.7 sin(3πt + 0.7) + 0.5 sin(0.5πt − 2.3) , t
t
∫
∫
f (t ) = A& T (τ ) MP(τ )dτ = a& 2 (τ ) p y (τ )dτ . t0
t0
Для настройки параметров моделей применялись алгоритмы (3.59), (3.61) с матрицами Γt =
Γ1 Γ2 , Γ = , b || Dt ||2 || Db ||2
где || Db ||2 — евклидова норма вектора Db , Γ1 = diag(0.35 0.35 0.0094) , Γ2 = diag(0.26 0.26 0.013) .
Порог ε (t ) определялся на основе анализа множества I s . Соответствующие результаты приведены на рис. 3.19, 3.20. ϑ, ε
6,5
ϑ
6,0 5,5
ε
ε
1,reg
5,0 4,5
ε 1,const
ε1
4,0 3,5 3,0 2
4
6
8
10
12
14
t, с
Рис. 3.19. Определение пороговой функции после применения фильтра Fε c различной структурой
Рис. 3.19 отражает работу низкочастотных фильтров Fε с различной структурой по сглаживанию процесса ϑ (t ) : ε 1 — выход фильтра первого порядка с бесконечной импульсной характеристикой (БИХ); ε — результат коррекции ε 1 на основе результатов сглаживания функции ξ (t ) = ϑ (t ) − ε 1 (t ) с помощью фильтра 91
Fς ; применение сглаживающих фильтров с конечной импульсной
характеристикой (КИХ): ε 1, reg — выход фильтра с регрессионной структурой, ε 1, const — выход фильтра, параметры которого выбирались на основе обработки вариационного ряда процесса ϑ (t ) . 2,0 ξ 1 ,ζ1 1,5 ξ 2 ,ζ2
ξ
1
1,0
ζ1
0,5 0,0
ζ2
-0,5 -1,0
ξ2
-1,5 -2,0
2
4
6
8
10
12
14
t, с
Рис. 3.20. Изменение ошибки определения пороговой функции для фильтра с бесконечной импульсной характеристикой
α^ α^
ε (t )
6,00 t
5,75 b
интервал изменения α^
5,50 5,25
интервал изменения α^
α
t
t
^
b
α
3,75
α 3,50
α^
t b
b
3,25 0,00
1,25
2,50
3,75
5,00
6,25
7,50
8,75
t, с
Рис .3.21. Настройка параметров αˆ t ,αˆ b моделей (3.57), (3.60)
На рис. 3.20 приведены результаты определения ошибки работы низкочастотного фильтра c БИХ с помощью фильтра с КИХ 92
Fς , имеющего регрессионную структуру. Величина δ ε в (3.56)
равнялась 0.25. Так как функция ς 1 (t ) = Fς (t , ξ1 ) не удовлетворяла условию (3.56), то была осуществлена коррекция ε 1 (t ) в соответствии с алгоритмом, приведенным в разделе 3.5.3. Результирующая функция порога ε (t ) показана на рис. 3.19. Рис. 3.20 отражает также изменение ошибки ς 2 (t ) = Fς (t , ξ 2 ) определения порога ε (t ) , полученной с помощью регрессионного фильтра. 0,0055 ^
β β
t
0,0050
t
0,0045
^
β β
t
t
0,0040 интервал изменения β
0,001
t
0,000 0
1
2
3
4
5
6
7
8
t, с
Рис. 3.22. Оценка параметра
β t c помощью модели (3.57)
Результаты идентификации параметров T- и B-систем представлены на рис. 3.21-3.24. Для идентификации использовались данные I t , I b , полученные в результате классификации множества I s с применением фильтра с КИХ, параметры которого определялись на основе обработки вариационного ряда ϑ (t ) . Рис. 3.21, 3.22 отражают результаты настройки параметров αˆ t ( b ) , βˆt моделей (3.57), (3.60). Здесь же показаны интервальные области изменения параметров T- и B-моделей. Они определены на основе анализа оценок αˆ t , αˆ b , βˆt , на интервале [tν , tν k ] , где ν = t, b . В некоторой степени эти области являются детерминированным аналогом доверительных интервалов, применяемых в теории вероятности. 93
Итак, предложен подход к оценке параметрических ограничений и ограничений на неопределенность в условиях неопределенности. Получены модели и адаптивные алгоритмы для идентификации верхней и нижней границ области параметрических ограничений. Исследованы свойства адаптивной системы при несоблюдении условия возбуждения для информационной матрицы системы (3.46), (3.47). κ^ t 0,9 κ^b
κ^ t
0,8
κ^
b
0,7
0,6
0,5
0,0
1,5
3,0
4,5
6,0
7,5
t, с
Рис. 3.23. Настройка параметров κˆ t , κˆ b et , %
6
15
eb , %
5
0 et
-15
eb ^
-30
ϑ
b
ϑ
b
^
ϑ
b
ϑ
b
4
3
-45
2
-60
1
-75 0
1
2
3
4
5
6
7
8
0
t, с
Рис. 3.24. Изменение ошибки идентификации T- и B-систем и выходов B-системы и B-модели
94
3.6. Заключение Излажены методы структурной идентификации динамических систем на основе анализа информационных портретов, которые могут быть как наблюдаемыми, так и виртуальными, отражающими состояние системы идентификация на данном этапе информационного синтеза. С помощью коэффициента структурности делается предварительное заключение о структурных свойствах системы. Описан метод нахождения порядка модели, основанный на оценке ширины интервала изменения коэффициента структурности. Предложен метод идентификации типа точки равновесия динамический системы на основе наблюдаемого информационного множества. Он не требует построения математической модели динамической системы. Показано, что для реализации предлагаемого подхода можно использовать класс статических моделей. Причем эти модели должны иметь динамическую спецификацию по входу и служат для оценки вынужденного движения системы. Предложены способы выделения свободного движения системы и критерии оценки типа точки состояния равновесия на его основе. Приводится метод оценки структуры модели, описывающей нелинейную часть системы. Показана связь между характеристическими числами Ляпунова и коэффициентом структурности системы. Предложен адаптивный алгоритм оценки спектра собственных чисел линейной части динамической системы на основе специальным образом сформированного информационного множества. В заключение изложен подход к определению параметрических ограничений в условиях неопределенности.
95
Глава 4. СТРУКТУРНАЯ ИДЕНТИФИКАЦИЯ СТАТИЧЕСКИХ СИСТЕМ Пытайтесь найти закономерности в вещах и событиях. Практически невозможно понять и предсказать все структуры и процессы. Однако чем больше мы знаем, тем лучшие решения можем принять. Маркус А.
Рассматриваются вопросы структурной идентификации систем, описываемых алгебраическими уравнениями (статическими моделями). Изложен подход к определению коэффициента структурности системы. Предложен способ выбора информативных параметров на основе анализа наблюдаемого информационного портрета. Описаны алгоритмы оценки структуры нелинейной статической системы на основе анализа коэффициента структурности. Изложены процедуры определения области параметрических ограничений в условиях неопределенности. В заключение приведены алгоритмы оценки структуры нелинейной статической системы на основе анализа наблюдаемого информационного портрета.
4.1. Плоскость, секущая наблюдаемый информационный портрет При анализе периодических движений динамических систем может применяться секущая поверхность. С помощью секущей поверхности проводятся исследования грубости свойств динамической системы. Понятие секущей поверхности было введено А. Пуанкаре [80]. Г.Д. Биркгоф [4] предложил условия существования секущей поверхности, которые были уточнены и теоретически обоснованы Е.А. Барбашиным [2]. Приведем основные понятия, относящиеся к рассматриваемой тематике, следуя [2]. Секущей поверхностью динамической системы назовем замкнутое множество F фазового пространства, обладающее тем 96
свойством, что всякая траектория проходит через F и все точки F при подходящем выборе времени t возвращаются периодически в F через одинаковый для всех точек промежуток времени. Дадим более строгое определение секущей поверхности. На n -мерном компактном связном и ориентируемом многообразии M класса Cs с локальными координатами x1 ,K, xn рассмотрим систему n дифференциальных уравнений dxi = X i ( x1 ,K, xn ), i = 1, n , (4.1) dt где правые части трактуются как компоненты некоторого контравариантного векторного поля класса Cr . Будем предполагать, что 3 ≤ r ≤ s − 1 . При указанных ограничениях через каждую точку многообразия M проходит одна траектория системы (4.1) и все траектории этой системы продолжаемы на всем протяжении времени − ∞ < t < ∞ , что следует из компактности многообразия M . Рассмотрим линейную дифференциальную форму
ω=
n
∑ P dx , i
i
(4.2)
i =1
где величины Pi трактуются как компоненты некоторого ковариантного векторного поля класса Cm . Предположим, что m = r − 1 . Дифференциальную форму (4.2) назовем замкнутой, если ее внешняя производная равна нулю. Это требование эквивалентно условию ∂pi ∂pk = ∂xk ∂xi всюду на M . Дифференциальная форма (4.2) гомологична нулю, если она является полным дифференциалом некоторой скалярной функции. Выражение ω& =
n
∑PX i
i
называется производной формы ω
i =1
по времени, и очевидно, оно имеет инвариантный характер в том смысле, что не зависит от системы координат. Дифференциальная форма ω допустима, если ее производная по времени является допустимой функцией. Допустимой 97
функцией считается всюду положительная непрерывная скалярная функция, определенная на M . Определение 4.1. Замкнутое множество F ∈ M назовем секущей поверхностью, если после некоторой замены времени t
∫
τ = ϕ ( f ( p, ξ ))dξ , t0
где ϕ ( p ) — допустимая функция, можно указать такое число T , что любая дуга { f ( p, t ), t0 ≤ t < T } будет в точности один раз пересекать F. Динамические системы, обладающие секущей поверхностью, называют гармонизуемыми. Условия существования секущей поверхности приведены в следующих теоремах [2]. Теорема 4.1. Если динамическая система класса Cr обладает замкнутой допустимой формой класса Cr −1 , то она имеет секущую поверхность класса Cr . Заметим, что принадлежность секущей поверхности к классу Cr означает существование функции класса Cr , для которой данная поверхность является поверхностью уровня без критических точек. Теорема 4.2. Если динамическая система класса Cr имеет секущую поверхность (хотя бы и не гладкую), то она обладает замкнутой допустимой дифференциальной формой класса Cr −1 .
Распространение изложенного выше способа нахождения секущей поверхности в системах идентификации затруднительно, так как он основан на задании векторного поля (4.1) и нахождении на основе него формы (4.2). Поэтому ниже предлагается подход к построению секущей плоскости (прямой) наблюдаемого информационного портрета [27], позволяющей делать заключение о структурных свойствах системы. Рассмотрим систему, описываемую уравнением y (t ) = f (t , U ) , 98
(4.3)
где y ∈ R — выход системы, U ∈ R m — вход, f ∈ F f — функция из заданного класса F f . О системе имеется данные, содержащиеся в информационном множестве I э :
I э = { y ∈ R, W ∈ R k | y(t ), W (t ) t ∈ J } ,
(4.4)
где W ∈ R k — вектор доступных измерению входов, U ⊆ W , J — интервал наблюдения за объектом. На основе информации I э получен наблюдаемый информационный портрет Γo = Γo ( I э ) ⇔ Γo ⊂ I( y ) × I(W ) ,
(4.5)
где I( y ) ⊂ I э , I(W ) ⊂ I э . Рассмотрим проекцию Γo на плоскость { y , wi }, т. е. сужение отображения Γo : Γowi ⊂ Γo w ∈W . В результате получим траектоi
рию движения системы, заданную графиком γ wi : I( y ) → I( wi ∈W ) (рис. 4.1). Примечание. В зависимости от целей анализа в Γo может изменяться область определения и область значений. Рассмотрим зависимость wi = wi ( y ) и аппроксимируем ее линейной моделью, т. е. получим оценку изменения переменной wi (t ) в среднем:
γ wi : wi = wi ( y ) = a 0,i + a1,i y ,
(4.6)
где a 0,i , a1,i — некоторые числа. График зависимости (4.6) обозначим через γ wi и отложим его на плоскости { y , wi } (рис. 4.1). Назовем прямую γ wi секущей график γ wi . Обобщая введенное выше определение, плоскостью Γo , секущей наблюдаемый информационный портрет Γo , будем называть зависимость Γo : y = AT [1 W T ]T , 99
где A ∈ R m +1 . wi
γ wi
γy
ϕ
γ wi 0
y
Рис. 4.1. Наблюдаемый информационный портрет
Такой подход к нахождению секущей плоскости основан на информационном множестве I э и не требует для ее построения никакой дополнительной информации. 360 _
_
γw , y
γw
_ i
wi 270
γw
3
3
_
w3
180
γw
_
w2
90
_
2
_
γw
1
y 0 5
_
γw
1
10
15
_
y
20
w1
_
γw
2
25
y 30
y
Рис. 4.2. Секущие проекции наблюдаемого информационного портрета
Рассмотрим сужение Γowi (i = 1, m) НИП Γo на евклидовой плоскости Ε и добавим к нему (рис. 4.2) секущие γ wi . Отложим на полученной диаграмме средние значения переменных wi , y . Теорема 4.3 [29]. Пусть на евклидовой плоскость Ε с координатами ( y , wi ) построено отображение Γo ⊆ y × W или его 100
сужение Γowi ⊂ Γo w ∈W , где wi ∈ W ∈ R k , k > 1 , y ∈ R . Пусть i
также на плоскости Ε построены секущие
γ wi = ai y + bi ,
(4.7)
где − ∞ < ai < ∞ , − ∞ < bi < ∞ , i = 1, m . Тогда прямая y = y пересекает секущие γ wi в точках wi = wi и выполняется следующее условие ~ ~ a~i wi + bi = a~ j w j + b j , i , j = 1, k , i ≠ j , (4.8) ~ где a~i = ai−1 , bi = −bi / ai , y и wi — средние значения соответствующих переменных. Доказательство теоремы 4.3. Секущая γ wi является средним значением wi (t ) , полученным путем усреднения wi (t ) на множестве { y (t ) t ∈ J } . Поэтому она является оценкой wi — величины, полученной путем усреднения wi (t ) на множестве J . Полагая γ wi = wi и решая (4.7) относительно y , получим y = ai wi + bi ,
(4.9)
где ai = ai−1 , bi = −bi / ai . Так как y является постоянной величиной, то из (4.9) немедленно следует (4.8). Теорема 4.3 доказана. Примечание. Рис. 4.2 отражает наблюдаемый информационный портрет процесса очистки сточных вод [27, 29]. Из (4.8) следует, что wi (t ) можно выразить через w j (t ) . При ~ (t ) будет оценкой w (t ) в этом полученная случайная величина w i i среднем. В силу этого соотношение (4.8) будем называть Сw сечением НИП. Нетрудно показать, что для случайной величины ~ (t ) будет справедливо равенство w i ~ }= w , M {w i,n i
где M {} — знак математического ожидания. Итак, одним из возможных направлений использования секущих в системах идентификации является оценка и генерация 101
входов системы, имеющих заданное значение математического ожидания. Второе направление позволяет осуществить выбор информативных переменных.
4.2. Выбор информативных переменных системы с помощью секущих Рассмотрим систему (4.3). Пусть для нее известно информационное множество (4.4) и построено сужение Γowi наблюдаемого информационного портрета (рис. 4.1). На этой же плоскости приведен график тождественного отношения γ y : I( y ) → I( y ) . Ставится задача: исходя из наблюдаемого информационного портрета (4.5) и множества I э (4.4) отобрать кортеж информативных входов U ∈ W , который можно использовать для построения модели для объекта (4.3). В теории идентификации для решения данной задачи используется корреляционный анализ [56]. В качестве критерия отбора применяется коэффициент взаимной корреляции. Найдем среднеквадратичное отклонение для переменной wi :
σ wi
1 = n
σ wi ( y )
n
∑ [w (t ) − M {w }]
2
,
∑ [w (t ) − w ( y )]
2
i
j
i
(4.10)
j =1
1 = n
n
i
j
i
j
,
(4.11)
j =1
где t j ∈ J — дискретный момент съема данных ( j = 1, n ) ; M {wi } — математическое ожидание, получаемое стандартным путем, принятым в математической статистике [8]; wi ( y j ) — оценка математического ожидания, полученная с помощью модели (4.6). Введем величины
μ=
a 1,i − 1 1 + a1,i
,
υγ w = i
102
σ wi ( y ) σ wi
,
(4.12)
где μ = tgϕ — тангенс угол между прямыми γ y и γ wi [16] (рис. 4.1). Тогда степень взаимосвязи между переменными y и wi можно оценить с помощью следующего показателя (коэффициент взаимосвязи)
π y , wi = sgn( μ )υγ w ,
(4.13)
i
где sgn( μ ) — знаковая функция ⎧ 1, μ > 0, sgn( μ ) = ⎨ ⎩− 1, μ < 0.
Параметр μ отражает влияние wi на переменную y в (3.11): если μ > 0 , то увеличение wi приводит к росту y ; если μ < 0 , то увеличение wi приводит к уменьшению y . Величина υγ w харакi
теризует степень взаимосвязи. Для π y, wi справедлива следующая [27] Лемма 4.1.
π y , wi = ry , wi ,
(4.14)
где ry , wi — коэффициент взаимной корреляции между y и wi . Доказательство леммы 4.1. Рассмотрим квадрат коэффициента взаимной корреляции ry , wi [56] ry2, wi =
1 n 2σ 2yσ w2 i
⎛ ⎜ ⎜ ⎝
2
⎞ [ y (t j ) − M { y}][ w(t j ) − M {w}] ⎟ . ⎟ j =1 ⎠ n
∑
Воспользуемся неравенством ( zl ) 2 ≤ z 2l 2 и формулой
σ 2y
1 = n
n
∑[ y(t ) − M { y}] . j
j =1
Тогда для ry2, wi получим
103
2
ry2, wi
≤
n
1
∑
n 2σ 2yσ w2 i
[ y (t j ) − M { y}]
j =1
=
2
т
∑
[ w(t j ) − M {w}]2 =
j =1
1
т
(4.15)
∑ [w(t ) − M {w}] .
nσ w2 i j =1
2
j
Так как M {w} = wi ( y ) , то (4.15) преобразуем к виду ry2, wi
≤
1
т
∑ [w(t ) − w ( y(t ))] . j
nσ w2 i j =1
i
j
2
Учитывая (4.10), получим ry2, wi ≤ π γ2w . Из последнего нераi
венства следует утверждение леммы. Замечание 1. В (4.13) вместо sgn( μ ) можно использовать sgn( a1,i ) , так как именно sgn( a1,i ) определяет величину угла ϕ . Лемма 4.1 устанавливает непротиворечивость полученных оценок ранее применяемым критериям [56] по выбору информативных переменных. Пример. Рассмотрим процесс очистки сточных вод и его влияние на эвтрофирование водоемов [34]. Он характеризуется множеством переменных W . Наибольшее влияние на качество очистки оказывает наличие таких элементов в сточных водах как азот, фосфор, железо и другие. В качестве выходной переменной можно использовать прозрачность воды. Обозначим через y — прозрачность воды, w1 — содержание азота аммонийного, w2 — содержание азота нитратов, w3 — содержание фосфора фосфатов. На основе измерений сформировано информационное множество I э и построен НИП Γo , проекции которого показаны на рис. 4.2. Полученные для рассматриваемых переменных коэффициенты взаимной корреляции приведены в табл. 4.1. Для нахождения коэффициента π γ w отобразим проекцию Γo , i
например, на плоскости ( y , w3 ) (рис. 4.3). Уравнение (4.6) имеет вид: w3 = 1,05 + 0,045 y . Из этого уравнения и рис. 4.3 видно, что угол между прямыми γ y и γ w3 является острым и равен ϕ = 42,4 o 104
( μ = 0,91) . Коэффициент взаимосвязи π y , w3 = 0,77 и совпадает со значением, приведенным в табл. 4.1. Таблица 4.1 Значение коэффициентов ry , wi и
wi
ry , wi
π y , wi
w1
–0.79
–0.79
w2
0.9
0.9
w3
0.77
0.77
π y , wi
Аналогично определяются коэффициенты взаимосвязи для других переменных. Примеры проекций НИП показаны на рис. 4.2. Описанная процедура реализована в Microsoft Excel, так как в нем наиболее просто можно добавлять секущие к имеющимся диаграммам и получать модель (4.6). 3
33
w3
y
γ w3 2
22
γ w3 1
11
γy 0
5
10
15
20
25
30
0 35 y
Рис. 4.3. Проекция НИП на плоскость ( y , w3 )
Замечание 2. Если переменные y и wi разделить на их среднеквадратические отклонения, то коэффициенты a1,i в (4.6) будут совпадать с π y , wi (4.13).
105
4.3. Нахождение коэффициента структурности статических объектов 4.3.1. Оценка коэффициента структурности
Пусть объект описывается уравнением yn = AnT U n + ξ n ,
(4.16)
где y n ∈ R — выход, U n ∈ R m — вход, An ∈ R m — вектор параметров, n — дискретное время, ξn — ограниченная помеха, действующая на выходе объекта. Для (4.16) известна измерительная информация I э ( N ) = { y n , U n , n ∈ [0, N ], N < ∞} ,
(4.17)
на основе которой получен наблюдаемый информационный портрет Γo ⊆ U × y . Необходимо, исходя анализа информационного множества I э (4.17) и отображения Γo , оценить коэффициент структурности k s для системы (4.16). 6
yn 4
y(u3)
y(u2)
2
0
y(u1) -2
-1,50
-0,75
0,00
0,75
1,50
2,25
ui,n
Рис. 4.4. Проекции наблюдаемого информационного портрета статического объекта (4.16)
106
yn
6
γ ( y , u1 )
γ ( y , u1 )
4
yn
2
0
-2
а)
-1
0
1
2
u1,n
3
1,5
y1 γ ( y1 , u 3 )
1,0 0,5
y1
0,0 -0,5
γ ( y1 , u 3 )
-1,0
б)
-1,5 -2,0
y2,n
-2
-1
0
1
2
u3,n
0,6
γ ( y2 ,u2 )
γ ( y2 ,u2 )
0,4 0,2
y2
0,0 -0,2 -0,4
в) 0,8
1,2
1,6
2,0
2,4
u2,n
Рис. 4.5. Проекция НИП объекта (4.16)
Основная трудность, не позволяющая распространить изложенный в §3.2 подход, состоит в оценке влияния элементов вектора U n на выход yn . Какие-либо интегрированные критерии для коэффициента k s предложить очень сложно. Поэтому, как и §3.2, 107
будем исходить из анализа наблюдаемого информационного портрета. Предлагаемый метод, основанный на получении локальных k s (ui ) = k s (ui , n ∈ U n ) , рассмотрим на примере объекта (4.16) с An = [ 2 0,4 0,8]T . В качестве U n используется вектор независимых случайных величин с конечным математическим ожиданием и дисперсией. Множество I э имеет вид (4.17). Пример НИП показан на рис. 4.4. Соответствующие коэффициенты взаимосвязи (взаимной корреляции) равны: π y ,u1 = 0,95 , π y ,u 2 = 0,2 , π y ,u3 = 0,6 . Метод оценки коэффициента структурности состоит в следующем. Построим сужение (проекцию) Γo на плоскости (u1 , y ) . Проведем секущую γ ( y , u1 ) = f (u1 ) , где отношение f (u1 ) задано на классе линейных по u1 функций. Тогда для γ ( y , u1 ) получим (рис. 4.5а)
γ ( y , u1 ) = 2.19u1 + 0.74 .
(4.18)
Выполним трансформацию НИП Γo Γo1 ⊆ U \ u1 × ( y − γ ( y , u1 )) .
Рассмотрим сужение Γo1 на плоскость y1 = y − γ ( y , u1 ) , и построим секущую (рис. 4.5б)
γ ( y1, u3 ) = 0.79u3 + 0.34 .
(u3 , y1 ) ,
где (4.19)
Следует заметить, что коэффициенты при u1 , u3 в (4.18), (4.19) практически совпадают с соответствующими элементами a1 , a3 вектора An , то есть их можно рассматривать в качестве локальных коэффициентов структурности k s (ui ) по соответствующим каналам. Выполняя дальнейшую трансформацию Γo1 , получаем отображение (рис. 4.5в) Γo2 ⊆ U \ (u1 , u3 ) × ( y1 − γ ( y1 , u3 )) ,
(4.20)
которое аппроксимируем секущей γ ( y2 , u2 ) = 0.38u2 + 0.542 , где y2 = y1 − γ ( y1 , u3 ) . В результате получим ks (u2 ) = 0.38 . 108
Описанную процедуру можно продолжить, если dim U > 3 . Теперь следует оценить адекватность полученных значений k s . В качестве критерия адекватности можно использовать коэффициенты взаимосвязи. Можно также эту степень отразить на информационном уровне, построив наблюдаемый информационный портрет на соответствующем множестве. Так, коэффициенты взаимосвязи между y и γ 1,3 = γ ( y , u1 ) + γ ( y , u3 ) равна 0.99. При указанных k s (u1 ) , k s (u3 ) кривая γ 1,3 совпадает с yn (см. γ y на рис. 4.6). Что касается переменной u2 , то коэффициент структурности k s (u2 ) также можно считать постоянным, но коэффициент взаимосвязи π y ,u2 является низким и эту переменную можно исключить из (4.16). Покажем, что k s (u2 ) является постоянным, то есть система (4.16) линейна по u2 . Для этого найдем секущую для отображения (4.20). Рассмотрим систему, показанную на рис. 4.7. yn
γ
6,0 4,5
γ ( y , u1 )
3,0
γ ( y , u1 ) + γ ( y1 , u3 )
1,5 0,0
γy -1,5
-2
0
2
4
6
8
yn
Рис. 4.6. Информационный портрет в пространстве ( y, γ )
Рис. 4.7. Представление объекта для определения стационарности
k s ( u2 ) 109
Для исключения смещения добавим к y2 величину 0.54. Найдем коэффициент структурности k s (u2 ) как отношение выходы объекта к его входу. Результаты представим в виде информационного портрета с отображением Γks ( u2 ) ⊆ u2 × k s (u2 ) на плоскости (u2 , k s (u2 )) (рис. 4.8). Построим секущую γ ks ( u2 ) = γ ( k s (u2 ), u2 )
γ ks ( u2 ) = a 2s ,0 + a 2s ,1 u2 .
(4.21)
Если окажется, что ширина интервала D( γ ks ( u2 ) ) изменения секущей γ ks ( u2 ) D( γ ks ( u2 ) ) ≤ ε u2 ,
где ε u2 ≥ 0 — некоторое малое число, то систему (4.16) можно линейной по u2 . Результаты идентификации показаны на рис. 4.8. Секущая (4.21) описывается уравнением
γ k s ( u2 ) = 0.39 − 0.005u2 , из которого следует вывод о линейности системы (4.16) по u2 . 0,8
ks(u2) 0,6
ks(u2)
γ k s ( u2 ) = 0,39 − 0,005u 2
0,4
0,2
1
2
3
u2,n
Рис. 4.8. Оценка коэффициента структурности k s (u2 )
110
Изложенный подход можно распространить на случай идентификации коэффициента структурности по другим входам. Итак, справедлива следующая Теорема 4.4. Пусть после i -й трансформации (4.20) наблюдаемого информационного портрета Γo системы (4.16) получена секущая γ ( yi , ui ) = ai ,0 + ai ,1ui , где ui ∈ U , yi ∈ R — переменная, вычисляемая согласно выражению yi = yi −1 − γ ( yi −1 , ui −1 ) , i = 1, m − 1 , y0 = y .
Тогда система (4.16) будет линейной по входу ui , если ширина интервала D( γ ks ( ui ) ) изменения секущей γ ks ( ui ) не превышает некоторой заданной величины ε ui ≥ 0 . Итак, предложен подход к оценке коэффициента структурности для статических объектов, основанный на определении секущих НИП. В первом приближении в качестве локальных k s (ui ) для объекта (4.16) можно использовать соответствующие параметры в уравнениях секущих наблюдаемого информационного портрета Γo . 4.3.2. Об информационном аспекте оценки коэффициента структурности
Введем показатели, позволяющие оценить возможности информационных множеств, при которых возможно решение задачи идентификации коэффициента структурности. Пусть для объекта (4.16) известно информационное множество I э (4.17). Рассмотрим переменную yn , заданную на временном интервале n ∈ [0, N ] . Назовем величину 1 Ξy = N
N
∑y
2 i
i =1
информационной мощностью или средней энергией сигнала yn . Аналогичные показатели вычислим для переменных y1, n , y2, n , введенных в §4.3.1 и получаемых в процессе трансформации наблюдаемого информационного портрета объекта (4.16). 111
В соответствии с физическими концепциями трансформация наблюдаемого информационного портрета Γo к Γo1 и Γo2 должна приводить к потере энергии и, следовательно, ухудшению процесса идентификации. Соответствующие значения для рассматриваемых переменных представлены в табл. 4.1. Таблица 4.1 Значения средней энергией для объекта (4.16)
y1, n
yn Ξ yi
y 2, n
9.898 0.967 0.02 Из таблицы видно, что после оценивания коэффициента структурности k s (u1 ) энергия переменной y1, n по отношению к yn уменьшилась на 90%, а для y2, n она составляет всего 0.2%. Но так как y2, n является функцией от y1, n , то это отношение между рассматриваемыми переменными равно 2.1%. И, как показывают результаты моделирования, имеющейся информационной мощности достаточно для выполнения процедуры идентификации. Итак, можно сделать вывод о том, что многоступенчатый процесс идентификации, к которому относится определение коэффициента структурности для объекта (4.16), приводит к расходованию информационной мощности объекта, и, следовательно, существует предел значения Ξ yi -мощности, ниже которого применение процедур идентификации является неэффективным. В отличие от шенноновской или фишеровской информации, которую очень трудно вычислять в условиях априорной неопределенности, Ξ yi -мощность достаточно легко вычисляется и может служить интегрированной мерой информационных возможностей множества I э системы идентификации. Следует заметить, что здесь речь не идет о возможностях параметрического оценивания на информационном множестве I э , так как для этого используются другие показатели [27].
112
4.4. Оценка нелинейных параметров модели на основе анализа НИП Подходы к оценке структуры модели динамической системы на основе анализа НИП рассматривались в [27, 30]. Непосредственный перенос этих результатов на статические объекты затруднен, так как он не учитывает специфику, присущую данному классу систем. В первую очередь это связано с анализом системы на множестве входов, что существенно усложняет процесс получения и анализа коэффициента структурности. Кроме этого, для статических объектов не удается разбить информационное множество системы I э на два подмножества I l и I n , содержащие данные о линейной и нелинейной части системы, что не позволяет распространить предложенный подход на данный класс объектов. Дадим постановку задачи. Рассматривается объект y n = AT U n + f (U , n ) ,
(4.22)
где U n ∈ R , yn ∈ R — вход и выход объекта, f : R k × J N → R — нелинейная функция, A ∈ Ω A ⊂ R k — вектор параметров, принадлежащий ограниченной, но априори неизвестной области Ω A , n ∈ J N — дискретное время. Для (4.22) известно множество экспериментальных данных I э = I э ( y ,U ) = { y n , U n n ∈ J N = [0, N ]}
и соответствующее ему отображение Γo . Необходимо на основе анализа множества I э и отображения Γo определить структуру функции f (U , n ) . Так как для рассматриваемого класса систем (4.22) не удается выделить множество I n ⊆ I э , то для определения вида функции f (U , n ) воспользуемся процедурой, которая сводится к реализации следующих шагов [29, 33]. 1. Применяем теорему 4.4 к k s (ui ) (i = 1, k ) и оцениваем степень линейности системы (4.22). Если хотя для одного ui условие 113
линейности не выполняется, то переходим к шагу 2. В противном случае работа процедуры заканчивается. 2. Формируем вспомогательный сигнал s ∈ R в виде линейной комбинации элементов вектора U n sn = I T U n ,
где I ∈ R k — единичный вектор, sn ∈ S ⊂ R . 3. Находим линейную модель yˆ s , n = a s sn .
(4.23)
Для этого можно построить виртуальный наблюдаемый информационный портрет Γo = γ ys = S × Y и затем провести секущую γ y ( s ) , которая в данном случае будет совпадать с yˆ s , n . 4. Определяем ошибку прогнозирования es , n = yn − yˆ s , n . es является нелинейной функцией от элементов вектора U n es , n = es (U , n ) .
5. Для определения зависимости переменной es от ui ∈ U находим коэффициенты взаимной корреляции reui . Если полученные значения reui окажутся несущественными, то систему (4.22) можно считать линейной. В противном случае необходимо искать зависимости между es и ui в виде eˆs = f e (ui , u j ) . Для этого следует перейти в шагу 6. На данном этапе возникает проблема выбора критерия для оценки степени взаимосвязи между es и eˆs . Будем предполагать, что f e (ui ) имеет вид eˆs = f e (ui ) = λα uiα ,
(4.24)
где λα < ∞ , α < ∞ . В общем случае можно положить eˆs = f e (ui , u j ) = λαβ uiα u βj ( β < ∞, λαβ < ∞ ). (4.25) В условиях априорной неопределенности в качестве критерия принятия решения о структуре функции f e можно использовать значения первых двух статистических моментов переменной es . 114
6. Подбираем параметры α и λα < ∞ в (4.24) или α , β и λαβ в (4.25) таким образом, чтобы минимизировать невязку между статистическими моментами переменной es и ее оценкой eˆs min ( M {es } − M {eˆs })2 → (α * , λ*α ),
α , λα
2
*
*
*
min ( M {es } − M {eˆs }) → (α , β , λαβ ),
(4.26)
α , β , λαβ
где M ( es ) — статистический момент es . Пример 1. Рассмотрим объект y n = AT U n + bu2α,n + ξ n ,
(4.27)
где U ∈ R 3 , A = [0,3 − 0,4 1]T , элементы ui ∈ U являются нормально распределенными случайными процессами с конечной дисперсией, b = 0,5 , α = 0,3 , ξ ∈ R — помеха с нулевым средним и конечной дисперсией. На основе результатов §4.3.1 находим коэффициенты структурности k s (ui ) и оцениваем для них величину ширины интервала D( γ ks ( ui ) ) изменения секущей γ ks ( ui ) . Соответствующие результаты представлены в табл. 4.2. Из таблицы следует, что по переменной u2 объект (4.27) не является линейным и, следовательно, к нему следует применить описанную выше процедуру. Таблица 4.2 Интервал изменения ширины коэффициента структурности k s (ui ) для объекта (4.27)
переменная D( γ ks ( ui ) )
u1
u2
u3
0,03 0,15 0,05 Для оценки степени нелинейности объекта (4.27) сначала формируем сигнал sn , а затем реализуем шаг 3. Для a s в (4.23) получаем оценку aˆ s = 0,33 . Соответствующий виртуальный НИП и секущая γ ys = yˆ s (t ) показан на рис. 4.9. Для es определяем математическое ожидание и среднее квадратическое отклонение: 115
es = 0.01 , σ s = 0.27 . После реализации шага 5 можно сделать вывод о том, что наибольший reui достигается для u2 . Он равен reu2 = −0.63 . На
шаге 6 решаем задачу идентификации сигнала es с помощью модели (4.24) на информационном множестве {es ,n , U n ∀n ∈ J N } . Результаты идентификации показаны на рис. 4.10. Из рис. 4.10 следует, что минимальное значение критериев (4.26) достигается при aˆ s = 0.33 . При этом eˆs = 0.02 , σˆ s = 0.28 . Значения статистических моментов для ошибки es обозначены кругами. 2,4
y yˆ s
y
2,0
1,6
1,2
yˆ s
0,8
0,4
s 3
4
5
6
Рис. 4.9. Информационный портрет системы (4.27) на множестве
{ y , s}
es , eˆs
σ s , σˆ s
1,0
σˆ s
0,5
σs
0,0
es -0,5
eˆs -1,0 0,0
0,2
0,33 0,4
0,6
Рис. 4.10. Результат идентификации параметра 116
αˆ 0,8
α в (4.27)
Оценки информационной мощности Ξ для переменных yn и es , n , соответственно, равны Ξ yn = 2.35 , Ξ es ,n = 0.07 .
Из этих результатов следует, что степень нелинейности системы (4.27) по переменной u2, n является невысокой, так как относительная мощность переменной es , n составляет всего лишь 3% от Ξ yn . Пример 2. Рассмотрим объект y n = AT U n + bf n + ξ n ,
(4.28)
где b = 0,25 , A = [0,3 − 0,4 1]T , f n = u1, n u3, n . Необходимо оценить структуру функции f n . es , eˆs 0,6
reui
σ s , σˆ s 0,5 reui
σs
0,4 0,3
решение
σˆ s
0,2
eˆs
0,1
es
0,0 -0,1
u1u3
u2u3
u1u2
u1u3(oбъект)
Рис. 4.11. Оценка степени нелинейности объекта (4.28)
Применим описанный выше алгоритм. Для ошибки es , n получаем: es = −0.01 , σ s = 0.347 . Соответствующие статистические оценки для eˆs в случае нелинейности u1 (t )u3 (t ) равны: eˆs = −0.013 , σˆ s = 0.2 . Остальные результаты приведены на рис. 4.11. В качестве вспомогательного критерия на рис. 4.11 приведены значения коэффициентов взаимной корреляции reui . 117
Стрелками на рис. 4.11 показаны результаты принятия решения по выбору структуры объекта (4.28). На рис. 4.12 приведен информационный портрет, показывающий изменение коэффициента структурности k s ( y , s, n ) = y n / sn . Из рисунка видно, что система (4.28) при данном подходе к идентификации не является линейной. ks(y, s) γ y (ks )
0,5
0,4
ks(y, s)
0,3
0,2
γ y (ks )
0,1
0,0 0,0
y 0,5
1,0
1,5
2,0
2,5
Рис. 4.12. Коэффициент структурности системы (4.28) на множестве
{k s ( y, s ), y} Замечание. Величины полученных коэффициентов корреляции объясняются применением “грубой” идентификации на шаге 3. Итак, приведенные примеры подтверждают работоспособность предложенного алгоритма оценки степени нелинейности статической системы. Изложим еще один подход к оценке нелинейности системы (4.22). Предположим, что функция f e (ui ) принадлежит классу f e ∈ F = { f ∈ R | f : R × J N → R, f ( x ) = x d , d ≠ 0, d < ∞} .
Пусть после исключения линейной составляющей sn = I T U n сформировано вторичное информационное множество I e = {en , ui , n n ∈ J N = [0, N ]}
для системы (4.22). На основе анализа I e определим коэффициент структурности 118
k s ( e, ui , α , n ) =
en , uiα, n
где α < ∞ . Построим информационный портрет Γe на плоскости ( k s ( e, ui ), en ) . К Γe добавим секущую γ ks ( ui ,e ) = a e,0 + a e,1k s ( e, ui ) . Воспользуемся методом выпрямления отображения Γe , т. е. будем подбирать параметр α в k s ( e, ui , n ) таким образом, чтобы коэффициент детерминации rγ2 для секущей γ k s ( ui , e ) был не меньше δ r > 0 , где δ r задается на основе анализа Γe и γ k s ( ui , e ) . В качестве второго критерия выбора α будем использовать условие max uiα,n ≤ 1 + δ α , n
где δ α > 0 — заданная константа. Утверждение 4.1. Пусть функция f e ∈ F и построено отображение Γe ⊂ k s ( e, ui ,α , n ) × en ,
а параметр α < ∞ выбирается так, чтобы ( rγ2 ≥ δ r ) & ( max uiα,n ≤ 1 + δ α ) , n
где rγ2 — коэффициент детерминации для секущей γ ks ( ui ,e ) отображения Γe , δ r > 0 , δ α > 0 . Тогда для прогнозирования переменной en на информационном множестве I e можно применить модель eˆn = aˆuiα, n , где aˆ подбирается из условия aˆ = arg min( en − aˆuiα,n ) 2 . aˆ
Доказательство утверждения 4.1. Построим информационный портрет Γe на плоскости ( k s , e , en ) , где k s , e = k s ( e, ui ,α , n ) . Проведем секущую γ ks ( ui ,e ) = a e k s ,e + be , где a e , be определяются из условия ( a e , be ) = arg min( en − γ ks ( ui ,e ) ) 2 . ae ,be
119
Подберем параметр α так, чтобы коэффициент детерминации rγ2 был не меньше некоторой заданной величины δ r > 0 . Выбор α будем осуществлять из условия ( rγ2 ≥ δ r ) & ( max | ui , n |α ≤ 1 + δ α ) , n
где δ α > 0 . Учитывая структуру отображения Γe и выбор параметра α , получаем требуемое утверждение. Результаты применения утверждения 4.1 для идентификации объекта (4.27) показаны на рис. 4.13, 4.14. Из рис. 4.13 видно, что параметр α в (4.27) можно выбрать равным 0.3, что согласуется с результатами, приведенными на рис. 4.10, так как в этом случае получаем максимальное значение коэффициент взаимной корреляции re2eˆ = −0.621 . Это же подтверждает и значение rγ2 . Кроме критериев re2eˆ и rγ2 для принятия решения, как указывалось выше, используется значение математического ожидания eˆn для прогноза eˆn . -0,600
rγ2
re2eˆ -0,605
1,00 0,20
eˆs , n 0,99 0,15
rγ2
-0,610 0,97 0,10 -0,615
re2eˆ -0,620 -0,625 0,25
0,96 0,05
eˆs , n 0,30
0,35
0,40
0,45
0,50
0,55
0,95 0,00 0,60 αˆ
Рис. 4.13. Результаты идентификации нелинейной составляющей в (4.27)
На рис. 4.14 показано действие предложенной процедуры выпрямления информационного портрета, где кружочек соответствует αˆ = 0.3 , а квадратик — αˆ = 1 . Из рисунка следует, что при 120
αˆ = 0.3 значения es , n практически совпадают с секущей γ ks ( ui ,0.3,e ) (см. рис. 4.13).
es, n
0,6 0,4 0,2 0,0 -0,2 -0,4
γ ks ( ui ,0.3, e ) γ ks ( ui , e )
-0,6
k s,e
-0,8 -0,75
-0,50
-0,25
0,00
0,25
0,50
0,75
Рис. 4.14. Результаты работы метода выпрямления при различных αˆ
Процедура выпрямления применима только к так называемым "управляемым" моделям, под которыми понимаются модели, уравнения которых содержат некоторый параметр (в рассмотренном выше примере это α ), который необходимо подобрать таким образом, чтобы выполнялись условия ( rγ2 ≥ δ r ) , max uiα,n ≤ 1 + δα . n
Это значит, что необходимо управлять параметром α таким образом, чтобы секущая γ k s ( ui ,e ) имела величину rγ2 , принадлежащую некоторой заданной области. Именно наличие управляемого параметра ограничивает область применимости предложенного подхода. Пример 3. Рассматривается трехкомпонентная система равновесия сталеплавильного процесса Fe-N-С [11], где Fe, N, С — соответственно железо, азот, углерод1. На основе теоретических предположений концентрация азота x[ N ] может быть описана следующим уравнением2 x[ N ] = kp{ N }ψ [ N ]ψ [vC ] , 1
Данная задача по оценке структуры модели была предложена автору д.т.н. А.Я. Стомахиным. 2 Уравнение предложено А.Г. Пономаренко.
121
где p{N } — парциальное давление атомарного азота, ψ [ N ] ,ψ [ C ] — некоторые известные функции, зависящие от концентрации элементов трехкомпонентной системы и других технологических параметров, k, v — неотрицательные константы. Необходимо оценить параметр v . Для выбора параметра v применялся метод выпрямления. Результаты представлены на рис. 4.15. Коэффициент структурности определялся следующим образом k s (v) =
x[ N ] p{ N }ψ [ N ]ψ [vC ]
.
0,0020
4
x[ N ]
e,%
e
0,0015
2
0,0010
0
x[ N ] 0,0005
-2
0,0000
-4 0,2
0,4
0,6
0,8
1,0
k s (v )
Рис. 4.15. Подбор параметра v
На рисунке прямая с треугольником соответствует секущей γ ks ( 0.3) , прямая с кружочком — секущей γ ks (1) , через e обозначена относительная ошибка прогнозирования x[ N ] с v = 0.3 . Коэффициент смешанной корреляции для γ ks ( 0.3) и γ ks (1) , соответственно, равны 0.99, 0.95. Что касается идентификации других видов нелинейностей для рассматриваемых статических систем, то для формализации процедур их оценивания необходимо применять нетрадиционные подходы, один из которых был предложен выше. Еще один подход к оценке структуры статических систем излагается в следующем параграфе. Он основан на введении понятия поля струк122
тур.
4.5. Поле структур для статической системы на множестве секущих Как отмечалось в предыдущем параграфе, задача структурной идентификации статических систем требует применения нетрадиционных подходов, так как корреляционная теория позволяют оценить только степень линейности, а дисперсионный анализ — степень нелинейности системы. Для рассматриваемого класса систем очень сложно вскрыть существующие взаимосвязи, так как они выражаются через интегрированный показатель — выход системы. Здесь большую помощь могут оказать априорные данные. В условиях априорной неопределенности дополнительную информацию может дать только информационный синтез системы. Для нелинейных динамических систем свойства можно оценить по фазовому или наблюдаемому информационному портрету. Для статических систем такого универсального графического представления не существует. Задача еще более усложняется тем, что в большинстве реальных систем информационное множество носит нерегулярный характер, что не позволяет однозначно оценить структуру системы по НИП. Несмотря на это, ниже излагается подход к оценке нелинейности статической системы на основе метода секущих на примере одного частного случая нелинейности, хотя предлагаемый методология применима для любой статической системы. Рассматривается объект (4.22) y n = AT U n + f (U , n ) ,
где f (⋅) — нелинейная функция вида ul , n u j , n ∈ R | f : R × J N → R, ⎧ ⎪ m p f (U , n ) ∈ F = ⎨ α lj ul , n u j , n , l ≠ j, 1 ≤ ( m, p ) < k ⎪ f (U n ) = l j ⎩
∑∑
123
⎫ ⎪ ⎬, ⎪ ⎭
y n ∈ Y ⊂ R , U n ∈ U ⊂ R — выход и вход объекта, A ∈ Ω A ⊂ R k — вектор параметров, принадлежащий ограниченной, но априори неизвестной области Ω A , α lj — некоторые числа, n ∈ J N — дис-
кретное время. Для (4.22) известно множество экспериментальных данных I э = I э ( y ,U ) = { y n , U n n ∈ J N = [0, N ]}
и соответствующее ему отображение Γo : U × y ∀n ∈ J N . Определено сужение наблюдаемого информационного портрета Γoui ⊂ Γo u ∈U ∀i = 1, k и для каждого Γoui построена секущая i
γ ( y , ui ) = a 0,i + a 1,i ui ,n , где ( a 0,i , a 1,i ) ∈ R — некоторые вещественные числа. Определены также секущие γ ( y , ul u j ) для ul u j ∈ F . Введем множество секущих Γ(U , y ) = {γ ( y , ui ),γ ( y , ul u j ), i = 1, k , (l , j ) ≥ 1} ,
заданное на I э . Определение 4.2. Полем структур S S системы (4.22) будем называть совокупность отображений γ ( y , ui ) ⊂ ui × y ∀i = 1, k , γ ( y , ul u j ) ⊂ ul u j × y ∃(l , j ) ≥ 1 на евклидовой плоскости Ε S S = {γ ( y , ui ) ∀i = 1, k , γ ( y , ul u j ), l ≠ j , (l , j ) ≥ 1} .
Необходимо на основе анализа Γo построить поле структур S S для (4.22) на множестве Γ(U , y ) . Так как отображения Γo при k ≥ 2 не поддается наглядной интерпретации, то, естественно, ограничиться его сужениями Γoui ⊂ Γo u ∈U ∀i = 1, k , построенными на плоскости (ui , y ) . В реi
зультате получим некоторое конечное множество отображений uu Γoui , Γo l j , которое представляет собой поле структур S S системы (4.22) на плоскости Ε . 124
Так как рассматриваются секущие с различными областями определения, то область определения поля S S на плоскости Ε будет равна U dom(ui ) , а область значений S S будет совпадать с i
областью значений отображения Γo rng( S S ) = rng( Γo ) = rng( y ) . uu
Построим отображения Γoui , Γo l j на плоскости Ε . Добавим к ним элементы множества Γ(U , y ) . В дальнейшем ограничимся только анализом свойств γ ( y , ui ) , γ ( y , ul u j ) . Утверждение 4.2. Система (4.22) с нелинейностью f (U , n ) ∈F имеет линейное поле структур S S . Утверждение 4.2 немедленно следует из вида класса F и структуры секущих γ ( y , ui ) , γ ( y , ul u j ) . Рассмотрим сектор Sij , ограниченный секущими γ ( y , ui ) , γ ( y , u j ) . Эти секущие имеют угловые коэффициенты a 1,i , a 1, j . Считаем, что a 1,i < a 1, j . Если окажется, что в этом секторе почти наверное лежит секущая γ ( y , ul , u j ) , т. е. ее угловой коэффициент принадлежит интервалу ( a 1,i , a 1, j ) , то составляющую ui u j ∈ F можно включить в структуру модели для системы (4.22). Аналогичным образом осуществляется анализ всех кандидатов, априори входящих в f (U , n ) в (4.22). С каждым элементом γ q ∈ Γ(U , y ) , q = 1, # Γ(U , y ) , где # Γ(U , y ) — мощность множества Γ(U , y ) , будем ассоциировать локальную структуры статической системы. Обозначим через rϑ2q y коэффициент детерминации между ϑq и y,
ϑq = (uq| q =1,k , ul u j| q > k ) . Определение 4.3. Будем говорить, что переменная ul u j когерентна с y или имеет связь с y , если секущая γ ( y , ul , u j ) ∈ Sij почти наверное. В этом случае Sij будем называть областью когерентности переменной ul u j . 125
Для оценки тесноты связи введем коэффициент когерентности Qij =
ru2i y ru2j y
.
Заметим, что Qij ≤ 1 и, в принципе, должен быть близким к ru2i u j y . Если данное условие не выполняется, то это говорит о не-
когерентности рассматриваемой составляющей ui u j . Пример поля структур S S для объекта, рассмотренного в примере 2 из §4.4, показан на рис. 4.16. y n 2,5
yn
γ ( y , ui ) 2,0
γ3
γ 13 S13
γ1
γ2 S1 2
1,5
γ 12
γ 23 1,0 S 23
0,5
0
1
2
3
4
u i ,n 5 u l , n u j ,n
Рис. 4.16. Поле структур статического объекта
На рис. 4.16 обозначено γ i = γ ( y , ui ) . Там же приведен пример сужения Γou1 (обозначение yn ). Из рисунка видно, что только u1, n u3, n когерентна с yn . Остальные комбинации можно исключить. Q13 = 0.73 , что совпадает с ru21u3 y , Q12 = 0.18 , Q23 = 0.25 . Приведенные результаты подтверждают выводы, сделанные в §4.4. Оценим уровень неопределенности, которая присуща введению указанных переменных в модель, исходя из поля структур, показанного на рис. 4.16. Ширина секторов WS ( Sij ) , выраженная в градусах, равна 126
WS ( S12 ) = 306 o , WS ( S13 ) = 25.7 o , WS ( S 23 ) = −280.6 o .
Зная ширину секторов и угловые коэффициенты a1,ij , находим уровень неопределенности V (ui u j ) , связанный с оценкой нелинейных составляющих: V (u1u2 ) = 120% , V (u1u3 ) = 22% , V (u2 u3 ) = 82% .
Такие же значения получаются при использовании угловых коэффициентов. Из рис. 4.16 видно, что наибольший вклад в нелинейность u1u3 вносит переменная u1 . Это же подтверждает и анализ отношения информационных мощностей Ξ y / Ξ u1 и Ξ y / Ξ u1u3 . На рисунке не приведены локальные структуры для случая f (U , n ) = uid,ni , так как они не являются когерентными с y . Из проведенного анализа видно, что введение составляющих u1u2 , u2 u3 в модель приводит к ухудшению ее свойств, что подтверждает сделанные ранее выводы. Изложенный подход является справедливым также для класса нелинейностей d ⎧ ⎫ uld, nl u j , nj ∈ R | f : R × J N → R, ⎪⎪ ⎪⎪ p m f (U , n ) ∈ Fd = ⎨ ⎬, dl d j α lj ul , n u j , n , l ≠ j, 1 ≤ ( m, p ) < k ⎪ ⎪ f (U n ) = ⎪⎩ ⎪⎭ l j
∑∑
где d j , d l — некоторые числа. Итак, метод секущих позволяет проводить анализ структурных свойств статической системы на основе построения поля структур. Основным достоинством данного подхода является возможность представления структуры системы на множестве линейных функций (секущих). Это же касается и метода выпрямления, изложенного в §4.4. Учитывая линейность модели статической системы к элементам класса Fd , поле структур может быть построено для любой статической системы. На основе S S можно сделать заключение о 127
структуре статической системы в условиях неопределенности и тем самым существенно сузить класс исследуемых моделей. Поле структур может строиться и на множестве I e , т.е. множестве, получаемом после исключения линейной составляющей, соттветсвующей вимртуальной переменной s = I TU . Предлагаемый подход требует проведения дальнейшего информационного анализа и обобщения полученных результатов. В частности, пока еще остается открытым вопрос покрытия поля структур секущимы, соответстующими сечениям наблюдаемого информационногой портрета на множестве нелиненйных входов системы.
4.6. Оценка области параметрических ограничений в условиях неопределенности Задаче определения области параметрических ограничений Ω A в условиях неопределенности практически не уделялось внимания, несмотря на то, что она непосредственно связана с проблемой робастности адаптивных алгоритмов и процедурами интервального оценивания. Некоторые подходы к решению этой задачи предложены в [27]. Там же описан способ получения параметрических ограничений для системы (2.1) на основе анализа НИП. В частности, для оценки области Ω A , заданной в виде неравенства сверху на норму вектора A(t ) , в [27] применялась мажоритарная модель получения ограничений. Ниже излагаются методы оценки области параметрических ограничений при различных способах ее задания. При этом предлагаемые подходы могут различаться как способами оценки, так и получаемыми результатами. 4.6.1. Оценка области параметрических ограничений, заданной в виде интервала изменения параметров
Ниже предлагается подход к оценке области Ω A , заданной в виде Ω A = { An ∈ R k |φb,i ≤ ai , n ≤ φt ,i , (φb,i ,φt ,i ) < ∞, ai , n ∈ An } , (4.29) на основе анализа НИП и метода секущих. 128
Рассмотрим объект y n = AnT U n ,
(4.30)
где A ∈ Ω A ⊂ R k — вектор параметров, принадлежащий ограниченной области Ω A (4.29) с неизвестными параметрами φb,i ∈ Φ b ∈ R k , φt ,i ∈ Φ t ∈ R k . Для объекта (4.30) имеется информация I э = I э ( y n ,U n ) и получен наблюдаемый информационный портрет Γо . Введем вектор Φ t = col(φt ,1 ,φt ,2 ,K,φt , k ) T , который мажорирует вектор An в (4.30). Рассмотрим частный случай области Ω A , соответствующей верхней границе области ограничений Ω A,t = { An ∈ R k | ai ,n ≤ φt ,i , φt ,i < ∞, ai ,n ∈ An } .
Для оценки вектор Φ t ∈ Ω A, t можно применить математическую модель ˆ Tt U n . yˆ t , n = Φ
(4.31)
Ставится задача: для объекта (4.30) на основе анализа данных I э и отображения Γо получить оценки вектора Φ t в (4.29) с помощью модели (4.31) таким образом, чтобы выполнялось условие доминирования yˆ t , n f y n для почти ∀n ≥ 0 .
(4.32)
Под доминированием будем понимать выполнение неравенства y n ≤ yˆ t , n для почти ∀n ∈ J N . Для решения задачи может применяться несколько подходов. Изложим один из них [33], основанный на проверке условия доминирования, используя в качестве вторичного критерия математическое ожидание исследуемых переменных. Рассмотрим проекции НИП Γo на плоскости (ui , y ) и построим секущие γ y (ui ) ∈ R
γ y (ui ) = ai ui + bi , i = 1, k со следующими областями определения и значений: 129
(4.33)
dom (γ y (ui )) ∈ J ui , rng(γ y (ui )) ∈ J y ,
где J ui ∈ R , J y ∈ R — интервалы изменения переменных ui , y ; ai , bi — некоторые числа. Полагаем φˆ = a и получаем приближенную оценку обласt , i ,0
i
ти Ω A,t ˆ t ,0 } , Ω 0A,t = { An ∈ R k | An ≤ Φ ˆ t ,0 понимается ˆ t ,0 = [φˆt ,1,0 φˆt ,2,0 Kφˆt , k ,0 ]T . Неравенство A ≤ Φ где Φ как поэлементное. ˆ t модели Индекс 0 обозначает уровень подстройки вектора Φ (4.31) и не совпадает с шагом изменения интервала J N . ˆ t ,0 находим прогноз yˆ t ,0, n выхода Далее по модели (4.31) с Φ объекта yn и величину коэффициента взаимной корреляции ryˆt ,0 y .
Проверяем условие доминирования yˆ t ,0, n f y n .
Если оно выполняется для почти всех n , то полагаем Ω A,t = Ω A,t ,0 и процесс определения области параметрических ограничений на этом заканчиваем. В противном случае применяем алгоритм коррекции области Ω A,t ,0 , который обеспечивает выполнение условия доминирования. Алгоритм коррекции состоит в следующем. Вычисляем математические ожидания для yn и yˆ t ,0, n y = M { y n } , yˆ t ,0 = M { yˆ t ,0,n }
и определяем величину ˆ t ,0 . ε t ,0 = y − yˆ t ,0 ∃Φ
(4.34)
Лемма 4.3. ε t ,0 ≠ 0 . ˆ t ,0 сформироДоказательство леммы 4.3. Так как вектор Φ ван на основе секущих γ y (ui ) без учета других компонент вектоˆ t ,0 будет отличаться от вектора ра U , то есть без U i = U \ ui , то Φ 130
Aˆ * , который является МНК-оценкой, аппроксимирующей yn в среднем на множестве IU = {U n n ∈ J N } . Отсюда следует утверждение леммы. Величина ε 0 показывает насколько переменная yˆ t ,0, n “недотягивает” до области доминирования над yn . Если ε t ,0 ≤ 0 , то yˆ t ,0 f y п. н. ˆ t ,0 . На основе ε 0 формируем множество поправок вектора Φ
Для этого находим величины ~
φt ε,i , n = для ε
φt , i
ε t ,0 ui , n
∀n ∈ J N ,
которых определяем математические ε = M {φt ,i , n } . Далее формируем вектор поправок ΔΦ t ,0 = [φtε,1 φtε,2 Kφtε, k ] T .
(4.35) ожидания (4.36)
Так как необходимо обеспечить условие доминирования, то ˆ t ,0 по формуле осуществляем коррекцию вектора Φ ˆ t ,1 = Φ ˆ t ,0 + Γt ΔΦ t ,0 , Φ
(4.37)
где Γt ∈ R k × k — диагональная матрица с γ t ,ii > 0 , и с помощью модели (4.31) определяем прогноз yˆ1, n для yn ∀n ∈ J N . Далее находим yˆ t ,1 и ryˆt ,1 y . Если окажется, что yˆ t ,1 ≥ y и | ryyˆt ,1 − ryyˆt ,0 | ≤ Δ r , 0 < Δ r < ∞ ,
ˆ t ,1 ) и на этом процесс построения обто полагаем Ω A,t = Ω A,t (Φ ласти параметрических ограничений заканчивается. В противном ˆ t должна продолжаться. случае адаптация вектора Φ ˆ t опУтверждение 4.3. Если начальное значение вектора Φ ределяется на основе секущих (4.33), а его коррекция в уравнении (4.31) осуществляется согласно (4.36), (4.37), то оценка области параметрических ограничений Ω A, t = { An ∈ R k | ai , n ≤ φt ,i , φt ,i < ∞, ai , n ∈ An } 131
(4.38)
является допустимой, если выполняется условие доминирования yˆ t ,1, n f y n для почти ∀n ∈ J n и ryˆt ,1 y ∈ Ω r = {ryˆt ,1 y ∈ R | | ryˆt ,1 y − ryˆt ,0 y | ≤ Δ r , 0 < Δ r < ∞} . (4.39)
Доказательство утверждения 4.3. Из (4.36) следует, что ΔΦ t ,0 = ΔΦ t ,0 (ε t ,0 ) и, следовательно, yˆ t ,1 = yˆ t ,1 (ε t ,0 ) . Учитывая (4.34), получаем yˆ t ,1 = yt ,0 +
y − y t ,0
2
=
y t ,0
y + . 2 2
Из неравенства yt ,0 > 0,5 y следует условие yˆ t ,1 ≥ y , что и доказывает утверждение 4.3. Условие (4.39) накладывает ограничение на класс допустимых моделей (4.31). За центр области Ω r принимается значение ryˆt ,0 y . Замечания. 1. В (4.35) вместо ε t ,0 можно использовать текущее (по времени n ) значение невязки ε t ,0,n = y n − yˆ t ,0,n . 2. Если процессы в системе носят стохастический характер, то для принятия решения о доминировании следует установить допустимый уровень доминирования (см. ниже). ˆ t, m можИтак, в общем случае алгоритм адаптации вектора Φ но записать в виде ˆ t , m +1 = Φ ˆ t , m + Γt ΔΦ t , m , Φ (4.40) ˆ t , m = ΔΦ ˆ t ,m ( n ) и формируется согласно изложенной выше где ΔΦ
процедуре. Для оценки качества работы системы идентификации параметров области Ω A введем количественный критерий. Будем считать, что yˆ t , n f y n почти на всем интервале J N , если вероятность Pf yˆt = P( yˆ t , n ≥ y n ) ≥ pf ∀n ∈ J N , (4.41) где pf > 0 — заданная величина. ˆ t , m ∈ R k будем называть оптиОпределение 4.4. Вектор Φ мальным, если он позволяет получить допустимую оценку облас132
ти параметрического оценивания Ω A, t и обеспечивает при этом максимальное значение показателю Pf yˆt . Утверждение 4.4. Выход модели (4.31) с вектором ˆ t , m ∈ R k , соответствующим оптимальной мажоритарной Φ ˆ t , m ) , имеет максимальную информационоценке области Ω A, t (Φ
ную мощность. Доказательство утверждения 4.4. Рассмотрим допустимые выходы модели (4.31), т. е. выходы, удовлетворяющие условиям утверждения 4.1, а их показатель доминирования удовлетворяет (4.41). Следовательно, оптимальной мажоритарной оценкой области параметрических ограничений Ω A, t следует считать ту, для которой max P( yˆ t ,k ,n ≥ y n ) = Pf yˆt ( k* )
k∈N m
∀n ∈ J N ,
(4.42)
где N m ⊆ Z ⊂ R — множество целых чисел, для которых выполˆ t,m , для которой няется (4.41), k* ∈ N m — шаг итерации по Φ справедливо (4.42). Из (4.42) немедленно следует утверждение. Алгоритм (4.40) относится к классу конечно-сходящихся. Его свойства следуют из следующей теоремы. Теорема 4.5. Система идентификации (4.30), (4.31), (4.40) с ˆ t , m ∈ Ω A, t будет иметь огдопустимым вектором параметров Φ
раниченные траектории, если матрицы Γt ∈ R k × k в алгоритме (4.31) удовлетворяет неравенству
λ2t ,max ( Γt ) 2(δAt ,m,n )T ΔΦ t ,m ≤ , λt ,min ( Γt ) || ΔΦ t ,m ||2 где λt ,min ( Γt ) , λt , max ( Γt ) — минимальное и максимальное собственные числа матрицы Γt . Оптимальное значение матрицы Γt имеет вид Γt = D (δAt ,m,n )D −1 ( ΔΦ t ,m ) .
где D — оператор преобразования вектора δAt , m, n в диагональную матрицу. 133
Доказательство теоремы 4.5. Рассмотрим допустимые траектории модели (4.31), то есть траектории, полученные на основе ˆ t,m , удовлетворяющего условиям утверждения 4.1. Завектора Φ пишем уравнение для параметрической невязки. Из (4.40) получаем
δAt , m, n = δAt , m −1, n − Γt ΔΦ t , m ,
(4.43)
ˆ t,m . где δAt , m = An − Φ Рассмотрим функцию Ляпунова ˆ t , m ||2 . VmΦ = || δAt , m, n ||2 =|| An − Φ
Для первой разности VmΦ получим ΔVmΦ,n = VmΦ,n − VmΦ−1,n = −2(δAt ,m,n )T Γt ΔΦ t ,m + T
+ ( ΔΦ t ,m )
Γt2 ΔΦt ,m .
(4.44)
Для ΔVmΦ можно получить оценку ΔVmΦ,n ≤ −2λt ,min ( Γt )(δAt ,m,n )T ΔΦ t ,m + λ2t ,max ( Γt ) || ΔΦ t ,m ||2 .
Для сходимости алгоритма (4.43) необходимо, чтобы матрица Γt удовлетворяла условию
λ2t ,max ( Γt ) 2(δAt ,m,n )T ΔΦ t ,m . ≤ λt ,min ( Γt ) || ΔΦ t ,m ||2
(4.45)
Так как рассматриваются допустимые выходы модели (4.31), то sgn[(δAt ,m,n )T ΔΦ t ,m ] ≥ 0 , || ΔΦ t ,m ||< ∞
и, следовательно, существует ограниченная матрица Γt > 0 . Найдем оптимальную матрицу Γt из условия максимального убывания функции ΔVmΦ, n . Имеем
∂ΔVmΦ, n ∂Γt 134
= 0,
(4.46)
где Γt ∈ R k — вектор с положительными элементами, Γt = D ( Γt ) , D — оператор преобразования вектора Γt в диагональную матрицу. Приведем правую часть (4.44) к виду ΔVmΦ,n = −2 ΓtT D (δAt ,m,n )ΔΦ t ,m + ΓtT D 2 ( ΔΦ t ,m ) Γt .
(4.47)
Подставляя (4.47) в (4.46) и выполняя операцию дифференцирования, для матрицы Γt получим Γt = D (δAt ,m,n )D −1 ( ΔΦ t ,m ) .
(4.48)
Итак, оптимальная матрица Γt должна выбираться согласно (4.48). Нетрудно показать, что при таком выборе матрицы Γt оценки ˆ t, m будут ограниченными. вектора Φ Рассмотрим ошибку доминирования em, n = y n − yˆ t , m, n . Введем функцию Ляпунова Vme, n = sgn(em, n ) . Для первой разности Vme, n запишем ΔVme, n = sgn(δAt , m, nU n ) − sgn(δAt , m, n −1U n −1 ) .
Если матрица Γt выбирается согласно (4.45) или (4.48), то с помощью алгоритма (4.40) можно получить допустимые оценки выхода модели (4.31) за исключением конечного числа точек. Это значит, что при заданном m для выхода модели (4.31) с допустиˆ t, m для почти ∀n ΔVme, n = 0 . Относительная вемым вектором Φ личина ошибок доминирования равна 1 − P( yˆ t , k , n ≥ y n ) . Аналогично ищется минорирующая оценка для области Ω A (4.30). В этом случае условие доминирования (4.32) записывается в виде yˆ b,n p y n для почти ∀n ≥ 0 ,
где yˆ b, n ∈ R — выход модели ˆ Tb ,mU n yˆ b,m,n = Φ 135
(4.49)
ˆ b,m ∈ R k , настраиваемым с помощью алс вектором параметров Φ горитма ˆ b , m +1 = Φ ˆ b, m − Γb ΔΦ ˆ b, m . Φ ˆ b, m ∈ R k формируется согласно (4.35), (4.36) Невязка вектора ΔΦ
с учетом замечания. В (4.49) Γb ∈ R k × k является диагональной матрицей с γ b,ii > 0 . Пример. Рассмотрим объект (4.31) с вектором параметров A = [0.3 − 0.8 1]T и действующим на выходе аддитивным ограниченным возмущением ξ n ∈ R , | ξ n | ≤ 0,3 . Вектор U ∈ R 3 имеет такой же вид, как и в примере 1 из §4.4. Необходимо оценить область параметрических ограничений (4.37). rˆyˆt , y
0,945
ˆ t ,0 Φ
φˆt ,1,0
φˆt ,3,0
0,940
φˆt ,2,0
ˆ* Φ t ,1
0,935
ˆ t ,1 Φ 0,930
A 0,925 0,25 -0,9 0,6
0,30 -0,8 0,7
0,35 -0,7 0,8
0,40 -0,6 0,9
0,45 -0,5 1,0
0,50 -0,4 1,1
φˆt ,1 φˆt ,2 φˆt ,3
Рис. 4.17. Оценивание вектора Φ
На рис. 4.17 показаны результаты идентификации вектора Φ t для области Ω A,t с помощью системы (4.31), (4.35), (4.40). Здесь приведен также вектор параметров An объекта (4.30). На основе метода наименьших квадратов получена следующая оценка векˆ t ,1 и Φ ˆ *t ,1 получены с тора A : Aˆn = [0.38 − 0.7 0.96]T Векторы Φ помощью алгоритма (4.40) с Γt = 0.3I 3 и Γt = I 3 , где I 3 ∈ R 3×3 — единичная матрица. Соответствующие значения ryˆt y равны ryˆ t ,0 y = 0.94 , ryˆ t ,1 y = 0.935 , ryˆ*t ,1 y = 0.939 . 136
1,2
1,5
Pf1 yˆt
Pf0yˆt , Pf1 yˆ t
Pf1*yˆt 1,0
0,8
Pf1*yˆt 0,5
0,4
Pf0yˆ t
0,0
0,0
1,6
1,8
2,0
2,2
2,4
2,6
2,8
Рис. 4.18. Доминирование переменной
3,0
-0,5 3,4
3,2
yn
yˆ при различных значениях
ˆt вектора Φ
Согласно утверждение 4.3, полученные оценки являются допустимыми. Для принятия окончательного решения находим показатели доминирования с помощью (4.41). Для полученных оценок они равны (рис. 4.18) Pf yˆt ,0 = 8% , Pf yˆt ,1 = 55% , Pf*yˆt ,1 = 100% . Эти же результаты подтверждает информационный портрет (рис. 4.19) в пространстве ( y n , yˆ t ,n ) . Минорируюшая оценка для Ω A имеет вид: ˆ b = [0.36 − 0.81 0.915]T . Φ Итак, результаты моделирования подтверждают работоспособность предложенного подхода. 4,0
yn yˆ t ,n
yˆ t ,1,n
3,6
yˆ t*,1,n
3,2
yn
2,8
yˆ t ,0,n
2,4 2,0 1,6 1,2 1,6
2,0
2,4
2,8
3,2
3,6
yn
Рис. 4.19. Оценки выхода модели (4.31) в пространстве ( y n , yˆ t ,n ) 137
4.6.2. Адаптивный алгоритм определения параметров области Ω A ˆ t , n в (4.31) можно воспользоваться Для настройки вектора Φ адаптивным алгоритмом
ˆ t , n +1 Φ
ˆ t , n − γ n {( yˆ n − y n )U n }, ( yˆ n p y n ) ∨ (ryˆy ∉ Ω r ), ⎧⎪Φ =⎨ (4.50) ˆ ˆ Φ ∧ ∈ Ω , ( y ) f y ) ( r ), ⎪⎩ t,n n n yˆ y r
где γ n ≥ 0 — параметр, обеспечивающий сходимость алгоритма. Здесь встает вопрос о том, как определить принадлежность выхода модели (4.31) области Ω f = { y n ∈ R, yˆ n ∈ R | yˆ n f y n п.в. ∀n ∈ J N } . Чисто визуально это сделать нетрудно, но для реализации (4.50) нужен количественный критерий. В частности, для этого воспользуемся показателем Pf yˆ t (4.41) на всем интервале J N . Алгоритм (4.50) относится к классу конечно-сходящихся, а (4.41) является условием принятия решения по оценке Ω A,t . Сходимость алгоритма (4.50) следует из следующей теоремы [33]. Теорема 4.6. Пусть вектор U n ∈ R k в (4.30) удовлетворяет ˆ t ,0 в (4.50) находится условию предельной невырожденности, а Φ с помощью секущих наблюдаемого информационного портрета. Тогда алгоритм (4.50) позволяет получить допустимую оценку ˆ t , n ∈ Ω A, t , обеспечивающую выполнение целевого неравектора Φ венства yˆ n ≥ y n , если
γ n ≤ || U n ||−1 , а относительное число ошибок алгоритма на интервале J N равно Pf yˆ = 1 − Pf yˆ . Для статического объекта (4.30) с вектором A , рассмотренным в примере 3, результаты работы алгоритма (4.50) показаны ˆ 0 вектора Φ в (4.31) принина рис. 4.20. За начальную оценку Φ малось значение Φ 0 , полученное в примере 3. Для рассматривае138
мого случая Pf yˆ = 0.77 , а pf полагалась равной 0,6. Оценки коэффициентов взаимной корреляции ryyˆ 0 = 0.94 и ryyˆ = 0.939 позволили сделать вывод о том, что полученное значение вектора Φ является допустимой, так как ryyˆ ∈ Ω r . Возможны также некоторые модификации (4.50). В частности, можно потребовать выполнения условия δ -доминирования yˆ f y ⇔ ( yˆ − y ) ≥ δy [33]. δy
1,0
ϕ^
i
ϕ^3
0,8 0,6 0,4
ϕ^1
0,2 -0,4 -0,5 -0,6
ϕ^2
-0,7 -0,8 0
5
10
15
20
t
Рис. 4.20. Результаты работы адаптивного алгоритма (4.50)
4.6.3. Оценка области параметрических ограничений, заданной в виде ограничения на норму изменения параметров
Рассмотрим объект
yn = AnT U n + ξ n ,
(4.51)
где An ∈ R k — вектор, принадлежащий априори неизвестной области Ω A = { An ∈ R k | α b ≤ || An || ≤ α t , 0 ≤ (α b ,α t ) < ∞ } ,
(4.52)
U n ∈ R k — вектор входа, ξ n ∈ R — ограниченное возмущение, действующее на выходе системы (1). 139
Для системы (4.51) получено информационное множество I э = I э ( y n ,U n , J N ) . Необходимо на основе анализа множества I э на заданном классе структур системы (4.51) оценить параметры α b ,α t области Ω A (4.52). Рассматриваемая задача существенно отличается от постановки, изложенной в предыдущем параграфе. Задание области Ω A в виде (4.51) не позволяет применить предложенные ранее подходы. Это объясняется прежде всего нелинейностью рассматриваемой задачи как по параметрам, так и информационным переменным. Основным здесь является выбор подходящей векторной нормы, которая во многом зависит от свойств вектора U n и его взаимосвязи с выходом yn . В зависимости от применяемой нормы будут получаться различные оценки для области Ω A . Приведем зависимости, связывающие между собой искомые параметры [27]. В результате анализа I э ( J N ) можно получить множество I s обобщенных характеристик экспериментальных данных I s ( I э ) = { max || U n ||, min || U n ||, max | yn |, n
n
n
min | yn | ∀n ∈ J N }
.
(4.53)
n
Для выхода y n справедливо неравенство | y n | = | AnT U n | ≤ || An || || U n || ∀n ≥ 0 .
Тогда для ∀n ≥ 0 получаем max | y n | ≤ || An || max || U n || . n
n
Из этого неравенства следует оценка снизу для вектора An || An || ≥
max | y n | n
max || U n ||
.
(4.54)
n
Найдем оценку сверху для вектора параметров An . Для ∀n ∈ J N справедлива следующая цепочка неравенств 140
max | y n | ≥ min | AnT U n | ≥ || An || min || U n || . n
n
Отсюда || An || ≤
n
max | y n | n
min || U n ||
.
(4.55)
n
Объединяя оценки (4.54) и (4.5), для нормы вектора An можно записать
αˆ b ≤ || An || ≤ αˆ t , где
αˆ b =
max | y n | n
max || U n ||
,
αˆ t =
(4.56)
max | y n | n
min || U n ||
.
n
n
Следует заметить, что оценка сверху для нормы вектора An является завышенной. Это объясняется как применяемым подходом, так и действием на выходе возмущения ξ n . Поэтому ее следует уточнять в процессе идентификации. Если An и U n измеряются с ошибками, то в (4.56) обходимо использовать их сглаженные значения. Воспользуемся в качестве нормы следующей функцией [42]
ρ ( X ) = max | xi | , xi ∈ X , i
X ∈ Rk .
(4.57)
Нетрудно заметить, что применение ρ ( X ) к (4.56) позволяет найти оценку для максимального по модулю элемента вектора An . Для принятия решения об адекватности полученных оценок следует воспользоваться условием доминирования. Введем модель
ρˆ μ , n = αˆ μ ρ μ (U n )
n ∈ JN ,
(4.58)
где μ = t, b , ρˆ μ , n — мажоритарная или миноритарная оценка нормы ρ ( y n ) , ρ μ (U n ) — соответствующие оценки для ρ (U n ) . На основе (4.58) проверяется условие доминирования ρˆ μ , n f ρ ( y n ) путем вычисления показателя Pf ρˆ μ . Для достиже141
ния требуемого уровня доминирования в (4.41), как уже отмечалось, потребуется коррекция полученных оценок в (4.56). Для этого можно воспользоваться подходом, предложенным в § 4.6.1. Следующий этап состоит в нахождении соответствия между αˆ μ и соответствующим элементом вектора An . Для этого можно воспользоваться установлением взаимосвязи между ρ (U n ) и | ui , n | на всем интервале принятия решения J N . Пример. Рассмотрим пример из §4.6.1 и найдем оценку области Ω A для вектора параметров в случае действия возмущения ξ n , | ξn | ≤ 0.3 . Для вектора An на основе (4.56) и (4.57) получены оценки αˆ t = 1.35 , αˆ b = 1.07 . Анализ показывает, что это оценки элемента a3, n ∈ An . Они являются завышенными, так как ρ ( An ) = 1. Принимаем эти оценки за начальные, т. е. полагаем αˆ t ,0 = 1.35 , αˆ b,0 = 1.07 . Воспользуемся средними значениями ρ ( y n ) , ρ (U n ) на интервале J N . В этом случае оценки равны: αˆ t ,m = 1.01 , αˆ b,m = 0.86 . Применим к ρ ( y n ) процедуру скользящего среднего. Тогда получим массив ρ s ( y n ) . Подставляя параметры ρ s ( y n ) в (4.56), находим αˆ t , s = 1.14 , αˆ b, s = 0.9 . Результаты оценивания отражает рис. 4.21. ρ ( yn )
4,2
1
ρ ( yˆ n ) 3,6
2 3,0
7
3 4
2,4
5 6
1,8 1,2 1,5
ρ ( yn ) 2,0
2,5
3,0
3,5
Рис. 4.21. Информационный портрет, отображающий результаты оценивания в пространстве ( ρ ( y n ), ( ρ ( yˆ n )) 142
3,5
ρˆ t, s
ρ s ( yn ) ρ ( y n ) 3,0
ρ s ( yn )
ρ ( yn )
2,5
ρˆ b, s
2,0
1,5 2,0
ρ s ( yn ) 2,2
2,4
2,6
2,8
Рис. 4.22. Информационный портрет, отображающий результаты оценивания в пространстве ( ρ s ( y n ), ( ρ ( y n ))
На рисунке использованы следующие обозначения: 1 — выход модели с αˆ t ,0 , 2 — нижняя граница выхода модели с αˆ t ,0 , 3 — ρ ( y n ) , 4 — нижняя граница выхода модели с αˆ b ,0 , 5 — нижняя граница выхода модели с αˆ t , s , 6 — нижняя граница выхода модели с αˆ b , s , 7 — выход модели с αˆ b,0 . Результаты моделирования подтверждают, что для получения оценок области параметрических ограничений следует применять процедуру сглаживания выхода системы y n . Рис. 4.22 отражает результаты оценивания на основе сглаженных данных. Здесь же приведены уровни для нормы ρ s ( y n ) — ρˆ t , s , ρˆ b, s , полученные на основе значений αˆ t , s и αˆ b, s . Учитывая характер оценивания параметров области Ω A и результаты моделирования, для принятия решения о доминировании траекторий модели (4.58) над ρ s ( y n ) вместо (4.41) будем использовать следующие показатели Pf ρˆt ,s = P( ρˆ t ,s ≥ ρ s ( y n )) ≥ pt f ∀n ∈ J N ,
(4.59)
Pf ρˆb ,s = P( ρˆ b ,s ≤ ρ s ( y n )) ≥ pbf ∀n ∈ J N ,
(4.60)
где pt f > 0 , pb f > 0 — некоторые заданные величины. Соответствующие величины равны Pf ρˆt ,s = 1 , Pf ρˆ b , s = 0.95 . 143
Результаты моделирования подтверждают сделанный выше вывод о том, что оценки на основе (4.54)-(4.56) являются завышенными. Изложим два подхода к коррекции оценок (4.56). Первый подход основан на анализе изменения коэффициента структурности [27]. Он будет изложен в следующем параграфе. Для уточнения оценок можно применить адаптивный подход. В этом случае в качестве критериев принятия решений будем применять показатели (4.59), (4.60) и условие δ -доминирования 0 ≤ ρˆ t , n − ρ ( y n ) ≤ δ ρ , 0 ≤ ρ ( y n ) − ρˆ b, n ≤ δ ρ ,
(4.61)
где ρˆ t ,n — выход модели (4.58), δ ρ ≥ 0 . Для уменьшения чувствительности алгоритма к действию возмущений условие (4.61) будем рассматривать относительно усредненных значений переменных. В качестве начальных оценок αˆ μ в (4.58) возьмем значения, полученные на основе (4.56). Адаптивную модель запишем в виде
ρˆ μ , n = αˆ μ , n −1ρ (U n ) ,
μ = t, b .
(4.62)
ϕ -алгоритм настройки параметра αˆ μ , n имеет вид ρˆ μ , n = F ( ρˆ μ , n ) ,
(4.63)
⎧αˆ μ , n −1 − γ μ ( ρˆ μ , n − ρ ( yn ))ρ (U n ), s( μ )eμ ,n > δ y , (4.64) αˆ μ ,n = ⎨ ˆ α , s ( μ ) e δ , ≤ μ , n −1 μ ,n y ⎩ где ρˆ μ , n — среднее значение выхода модели (4.62) на интервале F — оператор усреднения (сглаживания), [0, n] , eμ ,n = ρˆ μ , n − ρ ( yn ) ,
ρ ( y n ) — среднее значение ρ ( y n ) на всем интервале J N , γ μ ∈ R — положительный параметр, обеспечивающий сходимость алгоритма, ⎧ 1, μ = t , s( μ ) = ⎨ ⎩− 1, μ = b. 144
Процедуру (4.64) можно представить в следующем виде αˆ = αˆ − γ~ ( ρˆ − ρ ( y ))ρ (U ), μ ,n
μ , n −1
μ
μ ,n
n
n
⎧γ μ , s( μ )eμ , n > δ y , γ~μ = ⎨ ⎩ 0, s( μ )eμ , n ≤ δ y .
(4. 65)
Обозначим через e μ , n ошибку прогнозирования eμ ,n = ρˆ μ , n − ρ ( yn ) .
Теорема 4.7. Пусть | ξ n | ≤ υ . Тогда алгоритм (4.65) является решением целевого неравенства s( μ )eμ ,n > δ y , если 2 0 < γ~μ ≤ 2 .
ϑ
Число ошибок алгоритма (4.65) m≤
Δα μ2 ,0 c 2δ y2
ϑ2 ,
где c ≥ 1 , ϑ 2 = max ρ (U n ) . n
Доказательство теоремы 4.7. Запишем алгоритм (4.65) относительно невязки Δα μ ,n = Δα μ ,n−1 − γ~μ ( ρˆ μ ,n − ρ ( y n ))ρ (U n ) , (4.66)
где Δα μ ,n = αˆ μ ,n − α μ . Введем функцию Ляпунова Vμ ,n = Δα μ2 ,n . Для первой разности ΔVμ ,n = Vμ ,n − Vμ ,n−1 получаем ΔVμ ,n = −2γ~μ ( ρˆ μ ,n − ρ ( y n ))Δα μ ,n−1 ρ (U n ) + γ~μ2 ( ρˆ μ ,n − ρ ( y n )) 2 ρ 2 (U n ) .
Пусть μ = t . Рассмотрим область, где выполняется условие
αˆ μ ,n ∈ G μ = {αˆ μ ,n ∈ R | ( ρˆ μ ,n − ρ ( y n )) > δ y } , 145
(4.67)
Учитывая (4.67), ρˆ μ , n − ρ ( y n ) и Δα μ ,n−1 ρ (U n ) преобразуем к виду
ρˆ μ ,n − ρ ( y n ) ≥ cδ y , Δα μ ,n−1 ρ (U n ) = ρˆ μ ,n − ρ ( y n ) + υ ≥ cδ y + υ ,
где c ≥ 1 . Тогда для ΔVμ , n ΔVμ ,n ≤ −2γ~μ eμ ,n ( eμ ,n + υ n ) + γ~μ2eμ2 ,nϑ 2 ≤ ≤ −2γ~μ eμ2 ,n + γ~μ2eμ2 ,nϑ 2 ,
(4.68)
где υ n =| ξ n | . Алгоритм (4.56) будет сходиться при 2 0 < γ~μ ≤ 2 .
ϑ
В этом случае ΔVμ , n ≤ 0 . Найдем оптимальное значение γ~μ из условия ∂ΔVμ ,n / ∂γ~μ = 0
γ~μopt =
1
ϑ2
.
При таком выборе γ~μopt ΔV μ ,n ≤ −
eμ2 ,n
ϑ
2
≤ −d , d =
c 2δ y2
ϑ
2
.
Так как рассматривается решение задачи на конечном интервале J N , то для числа ошибок m алгоритма (4.65) получаем m≤
Δα μ2 ,0 c
2
δ y2
ϑ2.
Аналогичным образом определяются оценки для случая μ = b .
146
1,4
αˆ t,n αˆ b,n 1,2
αˆ t,n
1,0
αˆ b,n 0,8
0
10
20
30
40
50
60
n
Рис. 4.23. Настройка параметров модели (4.62) с помощью алгоритма (4.65)
Результаты работы алгоритма (4.65) оценки области параметрических ограничений для системы, рассмотренной в примере, показаны на рис. 4.23. В качестве начальных значений αˆ μ ,0 использовались оценки, полученные на основе (4.56). Для определения текущего усредненного значения выхода модели (4.62) применялась процедура экспоненциального сглаживания. Рис. 4.24 отражает условие доминирования выхода модели (4.62). Полученные результаты подтверждают значения показателей (4.59), (4.60), которые, соответственно, равны δ y = 0.2 , Pf ρˆt = 88% , Pf ρˆb = 63% . Параметр ⎧ 2, μ = t , c=⎨ ⎩1.5, μ = b.
3,5
ρ ( yn )
ρ ( yn )
ρˆ t,n
ρˆ t,n 3,0
ρˆ b,n 2,5
ρˆ b,n 2,0
1,5 1,5
2,0
2,5
3,0
3,5
ρ ( yn )
Рис. 4.24. Результаты доминирования выхода модели (4.62) после настройки ее параметров 147
Итак, для получения оценок области параметрических ограничений Ω A использовалась норма (4.57). Очень часто для формирования ограничений применяют также нормы с функциями [42]
γ (X ) =
n
n
∑| x | , i
h( X ) =
∑x
2 i
(4.69)
i =1
i =1
Сравнение ρ ( X ) и функций (4.69) показывает, что
ρ ( X ) ≤ γ ( X ) , ρ ( X ) ≤ h( X ) . Следовательно использование норм (4.69) для статической системы (4.51) приведет к получению заниженных (пессимистических) оценок (4.56). Чтобы обойти эту проблему, поступим следующим образом. Возьмем в качестве исходной нормы функцию ρ ( X ) и с помощью изложенных выше подходов получим оценки (4.56). Для удобства обозначим их следующим образом
αˆ bρ ≤ || An || ≤ αˆ tρ ,
(4.70)
Сформируем множества
Gv = {k v ( X n ) ∀n ∈ J N } v = γ , h , где kv ( X n ) =
v( X n ) . ρ( X n )
Будем искать такие αˆ bv ,αˆ tv , чтобы они позволяли покрыть некоторую область, соответствующую среднему значению v( y n ) . Для этого найдем средние значения k v ( X n ) 1 υ v = kv ( X n ) = N
N
∑k (X v
n ).
n =1
Тогда при использовании нормы v( X ) получаем следующие оценки для области Ω A
αˆ bv ≤ v( An ) ≤ αˆ tv , 148
αˆ bv = υ vαˆ bρ , αˆ tv = υ vαˆ tρ . Применение полученных оценок для объекта, рассмотренного в примере, дает: а) при использовании нормы h( X ) αˆ bh = 1.17 , αˆ th = 1.38 . Норма h( An ) для вектора параметров объекта равна 1.32;
б) при использовании нормы γ ( X ) αˆ bγ = 1.96 , αˆ th = 2.29 . γ ( An ) = 2.1 . Итак, выбор нормы для оценки области параметрических ограничений требует предварительного анализа информационного множества системы. Наиболее правдоподобные оценки дает применение нормы ρ ( X ) . Использование норм γ ( X ) , h( X ) приводит к получению пессимистических оценок. В случае применения функций γ ( X ) , h( X ) предварительно необходимо находить оценки (αˆ bρ , αˆ tρ ) ∈ Ω ρA , а затем, следуя изложенному выше, опре-
делять оценки для областей Ω γA или Ω hA .
4.6.4. Получение параметрических ограничений на основе анализа НИП
Рассмотрим систему, описываемую псевдорегрессионным уравнением, линейным относительно вектора параметров A ∈ R m , y n = AnT Pn ,
(4.71)
где P ∈ R m — обобщенный вход (регрессор), An принадлежит ограниченной, но априори неизвестной области Ω A . Для системы (4.69) известна экспериментальная информация I э ( J ) = { y n , Pn n ∈ J N = [ 0, N ]} . Необходимо на основе анализа множества I э ( J ) для системы (4.71) определить оценку для области Ω A , заданной в виде (4.52). Предлагаемая процедура нахождения области параметрических ограничений основана на уточнении полученных ранее оценок (4.56) на основе анализа информационного портрета [27]. Для этого осуществляется предварительный анализ информационного 149
множества I э и затем определяются обобщенные характеристики I s ( I э ) (4.53) (рис. 4.25).
Рис. 4.25. Система получения текущих оценок нормы вектора параметров объекта (4.71)
На основе множества I s ( I э ) формируются переменные π y , n ∈ R , π P, n ∈ R , равные текущему значению нормы от yn , Pn
π y , n = | y n | , π P ,n = || Pn || , где || ⋅ || — некоторая норма вектора Pn . Выходом системы (рис. 4.25) является переменная (коэффициент структурности)
κn =
π y,n , π P, n
которая является текущей оценкой нормы вектора параметров An . Возьмем в качестве α b, ks значение, лежащее в окрестности среднего значения переменной такое κ n , что | κ n − α b | ≤ ε b , где ε b — заданное положительное число. Построим отображение ΓA : {π P ,n } ×{π y ,n } на евклидовой плоскости Ε . Проведем секущую γ κ (π P , n ) = aγ π P , n , где aγ — некоторое число. Найдем на плоскости Ε точку κ β пересечения ΓA и γ κ , ближайшую к α b, ks . Определим в ее окрестности две ближайшие точки, лежащие слева и справа от κ β на кривой ΓA , т. е. κ 1 , κ 2 . Найдем коэффициент коррекции как kπ = π P2 / π 1P . Тогда в качестве α t можно взять оценку
α t ,ks = ρ t ,ks = kπ α b,ks .
150
ρ ( An ) α t, k s
1,2
α t, k s
α b, k s κn
1,0
κn
κ1
κβ
ρ ( An )
γκ
α b, k s 0,8
0,6 2,2
αb
κ2
π 1P 2,4
π P2 2,6
2,8
3,0
π P,n 3,2
Рис. 4.26. Информационный портрет, отображающий результаты оценивания параметров области ограничений на основе анализа коэффициента структурности
Такой выбор точек κ 1 , κ 2 объясняется необходимостью получения оценок, близких к γ κ . После нахождения оценок области Ω A следует проверить условия доминирования и найти показатели (4.41). Результаты определения оценок области Ω A (4.52) для системы, рассмотренной в примере в §4.6.3, показаны на рис. 4.26.
4.7. Заключение Изложены методы структурной идентификации статических систем, описываемых алгебраическими уравнениями. Предложен способ выбора информативных переменных на основе применения секущих наблюдаемого информационного портрета. В отличие от динамических систем проблема нахождения коэффициента структурности для статических систем является более сложной. Для ее решения применяется метод секущих. Локальный коэффициент структурности является текущей оценкой параметра модели при соответствующем элементе вектора входа системы. 151
Введено понятие информационной мощности сигнала ( Ξ y мощности). Показано, что применение многошаговой процедуры нахождения коэффициента структурности приводит к расходованию информационной мощности объекта. Существует предел значения Ξ y k -мощности ( k — номер итерации), ниже которого применение процедур идентификации является неэффективным. Предложен метод информационного синтеза структуры нелинейных статических систем в условиях неопределенности на основе анализа наблюдаемого информационного портрета. Информационный синтез позволяет выделить некоторое подмножество данных, которое содержит информацию о нелинейных свойствах системы. Предложены критерии и алгоритмы принятия решений о структуре модели. Для случая нелинейностей, относящихся к классу степенных функций, разработан метод выпрямления информационного портрета, который позволяет подобрать показатель степень. Данный метод применим только к "управляемым" моделям, то есть моделям, которые содержат параметр, который можно изменять таким образом, чтобы выполнялось заданное целевое условие. Для оценки структуры модели статической системы, нелинейная часть которой содержит произведения элементов вектора входа системы, предложен метод, основанный на построении поля структур на множестве секущих. Показано, что нелинейной системе соответствует линейное поле структур. Для принятия решения о структуре исследуемой модели введено секторное условие, алгоритм построения которого изложен в работе. Секторное условие широко применяется для анализа свойств нелинейных динамических систем. В задачах идентификации, насколько известно автору, данное условие не применялось. Впервые такая процедура была предложена в третьей главе данной книги. Было показано, как секторное условие можно применить для оценки структуры нелинейных динамических систем, не прибегая к задаче параметрической идентификации. В данной главе секторное условие возникло благодаря введению поля структур и позволяет выделить ограничения (сектор), которому должна удовлетворять секущая наблюдаемого информационного портрета при соответствующем его сужении. Заключительная часть главы посвящена проблеме оценки об152
ласти параметрических ограничений модели в условиях неопределенности. Рассмотрены преимущества и недостатки векторных норм, применяемых для описания области ограничений. Изложены алгоритмы оценки параметров области ограничений. Большое место в предлагаемых алгоритмах занимают процедуры анализа данных и принятия решений. Работоспособность практически всех изложенных процедур и методов подтверждается результатами моделирования. В заключение хотелось бы сказать, что в силу многообразия существующих подходов и методов к проблеме идентификации в условиях неопределенности новые задачи могут возникать во многом благодаря анализу информационного множества системы. Это направление еще не получило должного развития, но учитывая прогресс в информационных и математических технологиях, позволяющих автоматизировать процесс предварительного анализа данных, может появиться возможность расширения рамок оценивания структурных параметров и характеристик данных, а, следовательно, и самой изучаемой системы.
153
Библиографический список 1. Арнольд В. И. Обыкновенные дифференциальные уравнения. — М.: Наука. 1971. — 240 с. 2. Барбашин Е.А. Метод сечений в теории динамических систем. — Минск: Наука и техника, 1979. — 120 с. 3. Баутин Н.Н., Леонтович Е.А. Методы и приемы качественного исследования динамических систем на плоскости. — М.: Наука, 1990. — 486 с. 4. Биркгоф Д. Динамические системы. — Ижевск: Издательский дом «Удмуртский университет», 1999. — 408 с. 5. Блюмин С.Л., Шмырин А.М. Окрестностные системы. — Липецк: ЛЭГИ, 2005. — 132 с. 6. Бокс Д., Дженкинс Г. Анализ временных рядов, прогноз и управление. Вып. 1. — М.: Мир, 1974. — 406 с. 7. Бунич А. Л. Вырожденные задачи синтеза системы управления линейным дискретным объектом // Автоматика и телемеханика. 2005. № 11. — С. 35–45. 8. Вентцель Е.С. Теория вероятности. — М.: Наука, 1964. — 596 с. 9. Вучков И., Бояджиева Л., Солаков Е. Прикладной регрессионный анализ / Пенр. с болг. — М.: Финансы и статистика, 1987. — 239с. 10. Горский В. Г., Адлер Ю. П., Талалай А. М. Планирование промышленных экспериментов. — М.: Металлургия, 1978. — 112 с. 11. Григорян В.А., Белянчиков Л.Н., Стомахин А.Я. Теоретические основы электросталеплавильных процессов. Издание 2-е, переработанное и дополненное. — М.: Металлургия. 1987. – 272 с. 12. Гропп Д. Методы идентификации систем. — М.: Мир, 1975. — 302 с. 13. Дейч А. М. Методы идентификации динамических объектов. — М.: Энергия, 1979. — 240 с. 14. Ершов А. А. Стабильные методы оценивания параметров (обзор) // Автоматика и телемеханика. 1978. № 8. — С. 66-100. 15. Ивахненко А.Г., Мюллер И.А. Самоорганизация прогнозирующих моделей. — Киев: Техника, 1984. — 350 с. 16. Ильин В.А., Позняк Э.Г. Аналитическая геометрия. — М.: 154
Наука, 1971. — 271 с. 17. Казаков И. Е., Доступов Б. Г. Статистическая динамика нелинейных автоматических систем. — М.: Физматгиз, 1962. — 278 с. 18. Карабутов Н.Н. Идентификация типа особой точки динамической системы по данным “вход-выход” // Труды 2-й международной конференции “Математическое моделирование социальной и экономической динамики” (MMSED-2007). 20-22 июня 2007 года. Москва, Россия. — М.: РУДН, 2007. — С. 103-106. 19. Карабутов Н.Н. Определение порядка линейной динамической системы // Автоматика и телемеханика. 1991. № 4. — С. 180-183. 20. Карабутов Н.Н. Структурная идентификация статических объектов // Фундаментальные физико-математические проблемы и моделирование технико-технологических систем. Сб. науч. трудов. Выпуск 10. — М.: Изд-во «Янус-К», 2007. — С. 168-175. 21. Карабутов Н. Н. Идентификация неопределенных систем. I. Адаптивные пропорционально-интегральные алгоритмы с неопределенностью // Автоматика и телемеханика. 1997. № 9. — C. 168–182. 22. Карабутов Н. Н. Идентификация неопределенных систем. II. Получение параметрических ограничений // Автоматика и телемеханика. 1999. № 8. — С. 85–95. 23. Карабутов Н. Н. Построение адаптивных наблюдателей динамических объектов при наличии ограничений // Автоматика и телемеханика. 1995. № 3. — С. 77–85. 24. Карабутов Н. Н., Пятецкий В. Е. Параметрическая идентификация металлургических процессов: учет информационных аспектов. — М.: Металлургия, 1992. — 144 с. 25. Карабутов Н. Н., Салыга В. И. Адаптивная идентификация объектов управления с анализом экспериментальных данных // Адаптивные и экспертные системы в управлении. 5-й Ленинградский симпозиум по теории адаптивных систем. — Ленинград, 1991. — С. 100–102. 26. Карабутов Н. Н., Сполысов М. А. Разработке алгоритма определения параметрических ограничений в условиях неопределенности // Труды межд. научно-технич. семинара «Современные технологии в задачах управления и обработки информации». 155
Алушта. 1996. — М.: МАИ, 1996. — C. 124-125. 27. Карабутов Н.Н. Адаптивная идентификация систем: информационный синтез. — М.: УРРС, 2006. — 384 с. 28. Карабутов Н.Н. Идентификация типа особой точки динамической системы по данным “вход-выход” // Труды 2-й международной конференции “Математическое моделирование социальной и экономической динамики” (MMSED-2007). 20-22 июня 2007 года. Москва, Россия. — М.: РУДН, 2007. — С. 103-106. 29. Карабутов Н.Н. Информационный синтез системы идентификации объектов управления // Приборы и системы. Управления, контроль, диагностика. № 8, 2007. — С. 20–24. 30. Карабутов Н.Н. Наблюдаемые информационные портреты и задача структурной идентификации //Труды VI Международной Конференции «Идентификация систем и задачи управления» SICPRO ’07. Москва 29 января-1 февраля 2007. — М.: Институт проблем управления им. В.А. Трапезникова РАН. 2007. — С. 89115. 31. Карабутов Н.Н. Наблюдаемые информационные портреты и их применение в задачах идентификации // Приборы и системы. Управления, контроль, диагностика. 2006. № 2. С. 3-6. № 4. — С. 34-36. 32. Карабутов Н.Н. Наблюдаемые информационные портреты. Оценка структуры динамической системы с помощью индексов // Приборы и системы. Управления, контроль, диагностика. 2006. № 7. — С. 30-34. 33. Карабутов Н.Н. Структурная идентификация статических объектов // Фундаментальные физико-математические проблемы и моделирование технико-технологических систем. Сб. науч. трудов. Выпуск 10. — М.: Изд-во «Янус-К», 2007. — С. 168-175. 34. Карабутов Н.Н., Шмырин А.М. Окрестностные системы идентификация и оценка состояния. — Липецк: ЛЭГИ, 2005. — 132 с. 35. Кашьяп Р. Л., Рао А. Р. Построение динамических стохастических моделей по экспериментальным данным. — М.: Наука, 1983. — 389 с. 36. Красовский А. А. Оптимальные алгоритмы в задачах идентификации с адаптивной моделью // Автоматика и телемеханика. 1975. № 12. — С. 75-82. 156
37. Красовский А. А., Буков В. Н., Шендрик В. С. Универсальные алгоритмы оптимального управления непрерывными процессами. — М.: Наука, 1977. — 272 с. 38. Крылов Н. М., Боголюбов Н. Н. Введение в нелинейную механику. — Киев: Изд-во АН УССР, 1937. — 345 с. 39. Кунцевич В. М., Лычак М. М. Синтез оптимальных и адаптивных систем управления. — Киев: Наукова думка, 1985. — 248 с. 40. Куржанский А. Б. Задача идентификации — теория гарантированных оценок (обзор) // Автоматика и телемеханика. 1991. № 4. — С. 9–26. 41. Куржанский А. Б. Управление и наблюдение в условиях неопределенности. — М.: Наука, 1977. — 392 с. 42. Ланкастер П. Теория матриц. — М.: Наука, 1973. — 280 с. 43. Левин Б. Р. Теоретические основы статистической радиотехники. Кн. 3. — М.: Советское радио, 1976. — 257 с. 44. Лефшец С. Геометрическая теория дифференциальных уравнений. — М.: ИЛ, 1961. — 388 с. 45. Лукашин Ю. П. Адаптивные методы краткосрочного прогнозирования. — М.: Статистика, 1974. — 254 с. 46. Льюнг Л. Идентификация систем. Теория для пользователя. — М.: Наука, 1991. — 432 с. 47. Ляпунов А.М. Общая задача об устойчивости движения. — М.: Государственное изд-во технико-теоретической литературы, 1950. — 471 с. 48. Мартынюк А. А., Гутовски Р. Интегральные неравенства и устойчивость движения. — Киев: Наукова думка, 1979. —272 с. 49. Пасаран М., Слейтер Л. Динамическая регрессия: Теория и алгоритма. — М.: Финансы и статистика, 1984. — 310 с. 50. Перельман И.И. Методология выбора структуры модели при идентификации объектов управления // Автоматика и телемеханика. 1983. № 11. — С. 5-29. 51. Перельман И. И. Оперативная идентификация объектов управления. — М.: Энергоиздат, 1982. — 272 с. 52. Погорелов А.В. Дифференциальная геометрия. — М.: Наука, 1974. — 176 с. 53. Поляк Б. Т., Цыпкин Я. З. Адаптивные алгоритмы оценивания (сходимость, оптимальность, стабильность) // Автоматика и 157
телемеханика. 1979. № 3. — С. 71–84. 54. Прангишвили И. В., Лотоцкий В. А., Гинсберг К. С., Смолянинов В. В. Идентификация систем и задачи управления: на пути к современным системным технологиям // Проблемы управления. 2004. № 4. — С. 2-16. 55. Пугачев В. С. Основы автоматического управления. — М.: Наука, 1968. — 387 с. 56. Райбман Н.С., Чадеев В.М. Построение моделей процессов производства. — М.: Энергия, 1975. — 376 с. 57. Рашевский П.К. Курс дифференциальной геометрии. — М.: Государс. издательство научно-технической литературы, 1950. — 428 с. 58. Салыга В. И., Карабутов Н. Н. Идентификация и управление процессами в черной металлургии. — М.: Металлургия, 1986. — 192 с. 59. Сейдж Э. П., Мелса Дж. Л. Идентификации систем управления. — М.: Наука, 1974. — 284 с. 60. Труды VI Международной конференции «Идентификация систем и задачи управления» SICPRO’07. Москва, 29 января - 1 февраля 2007 г. — М.: Институт проблем управления им. В.А. Трапезникова РАН, 2006. — 1768 с. 61. Фомин В. Н., Фрадков А. Л., Якубович В. А. Адаптивное управление динамическими объектами. — М.: Наука, 1981. — 448 с. 62. Фурасов В. Д. Задачи гарантированной идентификации. Дискретные системы. — М.: БИНОМ. Лаборатория знаний, 2005. — 150 с. 63. Фурасов В. Д. Устойчивость движения, оценки и стабилизация. — М.: Наука, 1977. – 248 с. 64. Хасьминский Р. З. Устойчивость систем дифференциальных уравнений при случайных возмущениях параметров. — М.: Наука, 1969. — 368 с. 65. Хубер П. Робастность в статистике. — М.: Мир, 1984. — 304 с. 66. Цыпкин Я. З. Основы информационной теории идентификации. — М.: Наука, 1995. — 336 с. 67. Черноусько Ф. Л. Оценивание фазового состояния динамических систем. Метод эллипсоидов. — М.: Наука, 1988. — 158
320 с. 68. Шарый С. П. Оптимальное внешнее оценивание множеств решений интервальных систем уравнений. Ч. 1 // Вычислительные технологии. 2002. Т. 7. № 6. — С. 90-113. 69. Эйкхофф П. Основы идентификации систем управление. — М.: Мир, 1975. — 648 с. 70. Якубович В. А. Метод рекуррентных целевых неравенств в теории адаптивных систем // Вопросы кибернетики: Адаптивные системы. — М.: Научн. совет по кибернетике АН СССР, 1976. — С. 32–64. 71. Astrom J. K. J., Eykhoff P. System Identification — A survey // Automatica. 1971. Vol. 7. № 2. — P. 123-162. 72. Crutchfield J.P., McNamara B.S. Equations of motion from a data series // Complex Systems, 1987. V. 1. — P. 417-452. 73. Desrochers A., Mohseni S. On determining the structure of non-linear systems // Int. J. Control. 1984. V. 40. N 5. — P. 923-938. 74. Kreisselmeier G. A robust indirect adaptive control approach // Int. J. Control. 1986. Vol. 43. № 1. — P. 161–175. 75. Kreisselmeier G., Anderson B. Robust // IEEE Trans. Autom. Control. 1987. Vol. AC-31. № 2. — P. 127-133. 76. Kreisselmeier G., Narendra K. Stable model reference adaptive control in the presence of bounder disturbances // IEEE Trans. Autom. Control. 1982. Vol. AC-27. № 6. — P. 1169–1175. 77. Ljung L. System Identification — Theory for the User. Prentice Hall, Upper Saddle River, N. J. 2nd edition, 1999. — 499 p. 78. Narendra K. S., Kudva B. Stable adaptive schemes for system: identification and control // IEEE Trans. on Syst., Man and Cybern. 1974. Vol. SMC-4. № 6. — P. 542-560. 79. Nuyan S., Carrol R. L. Minimal order arbitrarily fast adaptive observer and identifies // IEEE Trans. Automat. Control. 1979. Vol. AC-24. № 2. P. 496-499. 80. Poincare H. Les methodes nonvelles de mecanique celeste. — Ganthier-Villars, 1899, T. 3. — 175 p. 81. Schweppe F. C. Uncertain dynamic system. New Jersey: Prentic-Hall Inc., Englewood Cliff, 1973. — 210 p. 82. Tsakalis K., Ionnou P. A new indirect adaptive schemes for time-varying plants // IEEE Trans. Autom. Control. 1990. Vol. AC-35. № 6. — P. 697-705. 159