Казанцев Э.Ф. Математика

Page 1

М о сква 20 12

учебное пособие

Международный университет в Москве

Э.Ф. Казанцев

Математика


УДК 51:658.01 (075) К 14

К 14

К а з а н ц е в Э.Ф. Математика. Учебное пособие для менеджеров и экономистов. – М.: Издательский дом Международного университета в Москве, 2012. – 332 с. Учебно-методическое пособие состоит из трех разделов. Раздел 1 посвящен некоторым вопросам дискретной математики и содержит основные сведения из теории множеств, математической логики, теории матриц и линейной алгебры. Раздел 2 посвящен теории пределов, дифференциальному и интегральному исчислению, теории рядов и дифференциальным уравнениям. Раздел 3 посвящен некоторым вопросам теории вероятностей и математической статистики. Приводятся также основные сведения из теории вариационных рядов и комбинаторики. Пособие может быть использовано как рабочая тетрадь при самостоятельной работе с домашними заданиями и как справочник для менеджера и экономиста по прикладной математике. Для студентов Международного университета в Москве, обучающихся по экономическим и управленческим специальностям.

© Казанцев Э.Ф., 2012 © АНОВПОА «Международный университет в Москве», 2012


Соде ржание В в е д е н и е . ........................................................................................... 6 Р а з д е л 1. Алгебра......................................................................... 18 1.1. Алгебра множеств........................................................................ 18 1.1.1. Основные понятия................................................................ 18 1.1.2. Операции на множествах..................................................... 20 1.1.3. Алгебра Кантора................................................................... 21 1.1.4. Уравнения с множествами................................................... 23 1.1.5. Упорядоченные множества.................................................. 26 1.1.6. Специальные бинарные отношения..................................... 29 Задания для самостоятельной работы............................... 33 1.1.7. Нечеткие множества............................................................. 34 Задания для самостоятельной работы............................... 43 1.2. Алгебра логики............................................................................. 43 1.2.1. Основные понятия................................................................ 43 1.2.2. Логические операции (связки)............................................. 44 1.2.3. Основные равносильности................................................... 49 1.2.4. Графическое представление связок..................................... 52 1.2.5. Контактные схемы................................................................ 53 1.2.6. Тождественно-истинные формулы (тавтологии)................ 55 1.2.7. Нормальная форма формул.................................................. 59 1.2.8. Логические функции............................................................. 62 1.2.9. Алгебра Жегалкина............................................................... 65 1.2.10. Логика предикатов.............................................................. 69 Задания для самостоятельной работы............................. 73 1.3. Алгебра матриц............................................................................ 73 1.3.1. Операции с матрицами......................................................... 73 1.3.2. Определители........................................................................ 77 1.3.3. Преобразование матриц........................................................ 80 Задания для самостоятельной работы............................... 82 1.4. Линейная алгебра......................................................................... 84 1.4.1. Основные понятия................................................................ 85 1.4.2. Линейное векторное пространство...................................... 89 1.4.3. Базис линейного пространства............................................. 94


1.4.4. Решение системы линейных уравнений.............................. 99 1.4.5. Линейные экономические модели..................................... 105 Р а з д е л 2. Математический анализ.............................................. 120 2.1. Дифференциальное исчисление функций одной переменной.............................................................................. 121 2.1.1. Числовые последовательности........................................... 121 2.1.2. Предел функции.................................................................. 127 2.1.3. Производная функции одной переменной......................... 134 Задания для самостоятельной работы............................ 151 2.1.4. Исследование функций с помощью производных............ 151 Задания для самостоятельной работы............................ 158 2.2. Элементы теории функций нескольких переменных........... 159 2.2.1. Основные понятия.............................................................. 159 2.2.2. Производная и дифференциал функции двух переменных........................................................... 161 2.2.3. Экстремум функции двух переменных.............................. 169 Задания для самостоятельной работы............................ 173 2.3. Интегральное исчисление......................................................... 173 2.3.1. Неопределенный интеграл................................................. 173 2.3.2. Определенный интеграл..................................................... 178 2.3.3. Геометрические приложения определенного интеграла...... 185 2.3.4. Несобственные интегралы.................................................. 189 Задания для самостоятельной работы............................ 192 2.4. Теория рядов............................................................................... 193 2.4.1. Числовые ряды.................................................................... 193 2.4.2. Функциональные ряды....................................................... 195 2.4.3. Степенные ряды.................................................................. 198 Задания для самостоятельной работы............................ 203 2.5. Обыкновенные дифференциальные уравнения.................... 204 2.5.1. Основные понятия.............................................................. 204 2.5.2. Некоторые интегрируемые дифференциальные уравнения 1-го порядка.................................................................................. 207 2.5.3. Уравнения 1-го порядка, не разрешенные относительно производной.......................................................... 214 2.5.4. Особые решения................................................................. 216 Задания для самостоятельной работы............................ 216


2.6. Элементы теории функций комплексного переменного...... 217 2.6.1. Комплексные числа............................................................ 217 Задания для самостоятельной работы............................. 222 2.6.2. Интеграл от комплексной функции................................... 222 Раздел 3. Теория вероятностей и математическая статистика......................................................... 227 3.1. Вариационные ряды.................................................................. 228 3.1.1. Основные понятия.............................................................. 228 3.1.2. Характеристики вариационного ряда................................ 234 3.1.3. Показатели вариации.......................................................... 239 Задания для самостоятельной работы............................. 245 3.2. Комбинаторный анализ............................................................. 246 3.2.1. Правила суммы и произведения........................................ 246 3.2.2. Размещения, сочетания и перестановки............................ 247 3.2.3. Разбиения............................................................................ 251 3.2.4. Метод включения и исключения....................................... 253 Задания для самостоятельной работы............................. 254 3.3. Теория вероятностей................................................................. 256 3.3.1. Случайные события............................................................ 256 3.3.2. Случайные величины.......................................................... 263 3.3.3. Закон больших чисел.......................................................... 281 Задания для самостоятельной работы............................. 284 3.4. Математическая статистика.................................................... 285 3.4.1. Выборочный метод............................................................. 285 3.4.2. Законы распределения........................................................ 291 3.4.3. Корреляционный анализ..................................................... 298 Задания для самостоятельной работы............................. 317 3.5. Случайные процессы........................................................... 318 3.5.1. Основные понятия.............................................................. 318 3.5.2. Цепи Маркова..................................................................... 322 3.5.3. Уравнение Чепмена – Колмогорова................................... 326 Л и т е р а т у р а . ................................................................................ 331


В веден ие

Математика (по-гречески буквально – «знание») – это наука о количественных отношениях и пространственных формах действительного мира. Но чтобы исследовать эти формы и отношения в чистом виде, необходимо отделить их от содержания. В результате мы приходим к, так называемой, абстрактной математике. И чем больше развивается абстрактная математика, тем больше ее приложений мы используем в рамках, так называемой прикладной математики. Существует и обратный процесс – потребности практики или других наук приводят к появлению новых математических методов. Однако это всегда мешало формированию математики как независимой, самостоятельной абстрактной науки – о чем мечтает любой профессиональный математик. Хотя большая часть математики была создана благодаря потребностям практики, в первую очередь – физики, название «прикладная математика» во многом условно, так как математики постоянно стремятся создать свою науку, такую же фундаментальную, как физика. У физики есть объективные правила игры – законы природы, есть объективный критерий правильности теории – опыт, есть четко сформулированная цель – Единая теория всех частиц и полей. Физика единственная из всех наук, которая четко сформулировала систему своих основных понятий: материальной точки, пространства, движения, скорости и так далее. Благодаря этому ей удалось успешно пройти длинный и сложный путь от основных понятий до общих принципов. Однако обусловленный успехами физики технический прогресс опережает биологические возможности человека в осмыслении


Математика

7

его негативных последствий. Физику можно достаточно строго разделить на теоретическую (дающую предсказания) и экспериментальную (проверяющую эти предсказания). Долгое время физический эксперимент был единственным критерием правильности физической теории. Но для многих современных физических теорий постановка эксперимента стала невозможной (например, в теории Вселенной), поэтому правильность таких теорий может быть подтверждена только непротиворечивостью используемой математики. Таким образом, у прикладной математики (долгое время «обслуживающей» теоретическую физику) появился свой собственный критерий правильности – абстрактная («чистая») математика. В этой связи, позиции теоретической физики и прикладной математики (которую иногда называют теоретической математикой) чрезвычайно сблизились и даже часто эти названия воспринимаются как синонимы. В настоящее время прикладная математика стремится придать физическим теориям, страдающим недостатком математической строгости, необходимую им непротиворечивость, восполняя, таким образом, отсутствующий экспериментальный критерий правильности. Именно это обстоятельство обуславливает необходимость создания такого курса прикладной математики для экономистов, который служил бы проводником к более строгим критериям абстрактной математики. Как известно, критерий – это количественная оценка цели, ее аппроксимация, и он должен как можно больше соответствовать сходству с целью, чтобы оптимизация системы по критерию соответствовала максимальному приближению к цели. К сожалению, глобальная цель, которую физика для себя сформулировала достаточно четко, в математике еще не созрела. Современная математика растет стремительно и непрерывно, не зная, типичных для физики, кризисов и перестроек, обогащая нас все новыми идеями и фактами. Но любая деятельность, лишенная цели, тем самым теряет и смысл. Не имея цели, математика не может выработать и представление о своей форме, ей


8

Э.Ф. Казанцев

остается в качестве идеала ничем не регулируемый рост, а вернее, расширение по всем направлениям. Справедливости ради следует заметить, что отсутствие цели и смысла относится почти ко всей деятельности современного человечества. Более чем двухтысячелетняя история убеждает нас в том, что математика, по-видимому, не способна сама сформулировать ту конечную цель, благодаря которой может направлять свое развитие. Она должна, следовательно, заимствовать цель извне и вероятней всего это должно произойти на основе все большего сближения теоретической физики и теоретической математики. Исторически первыми зачатками математики были арифметика, геометрия, алгебра и тригонометрия, развитие которых полностью определялось практическими потребностями человека (VI в. до н.э. – XVI в. н.э.). Этот период можно назвать периодом статической математики (числа, величины, фигуры и так далее). В XVII веке появились первые идеи описать математическим языком явления движения или изменения. Самостоятельным предметом изучения математики становится сама зависимость между величинами. На первый план выдвигается понятие функции. Появилась возможность ввести в явном виде идею бесконечности, с парадоксами которой столкнулись еще философы древних веков (например, парадокс черепахи и Ахиллеса). Строго говоря, идея бесконечности привела к введению понятия непрерывной функции, которое позволило построить дифференциальное исчисление, получившего название математического анализа, хотя точнее надо было бы все это назвать непрерывной (бесконечной) математикой. Причем новые понятия в математическом анализе получали свое оправдание будто бы в соответствии с реальными соотношениями действительного мира. Так, например, реальность понятия производной вытекала из реальности понятия скорости в механике, хотя это далеко не очевидно.


Математика

9

Парадоксально, но до XIX века никто не обратил внимания на тот факт, что реальный мир состоит из дискретных объектов и понятие непрерывной функции не имеет никаких аналогов в реальном мире. Бурное развитие математики в XIX веке заставило обратить внимание на необходимость логического обоснования математики, т.е. необходимо было критически пересмотреть ее исходные положения (аксиомы). Как мы уже отмечали, критерием правильности математики может быть только ее непротиворечивость. Однако до сих пор идет сильное отставание математики в строгом логическом обосновании многих математических методов, широко применяемых в современной теоретической физике, где много ценных результатов получается при помощи незаконных математических приемов. Только в конце XIX века сложился стандарт требований к логической строгости развития математических теорий. Этот стандарт основан на теоретико-множественной концепции строения любой математической теории. С этой точки зрения любая математическая теория имеет дело с дискретным множеством объектов, связанных между собой некоторыми логическими отношениями. Новый стандарт позволил не только обосновать многие математические теории, но и систематизировать их. Однако вопрос цели в математике по-прежнему оставался открытым, вызывая головную боль у философски думающих математиков. Тем не менее, в конце XIX века определился круг интересов так называемой дискретной (конечной) математики, основные разделы которой (теория матриц, теория групп, теория множеств, математическая логика, теория вероятностей, теория алгоритмов и так далее) разрабатывались еще в XVII–XVIII вв. одновременно с элементами непрерывной математики. Само деление математики на непрерывную и дискретную достаточно условно, так как в настоящее время происходит интенсивный обмен идей и методов между ними. Правильней было бы говорить о становлении в XX веке новой современной математики, существенно


Э.Ф. Казанцев

10

отличающейся от классической математики XVII–XIX вв., хотя, к сожалению, еще большинство школ и вузов придерживаются методики преподавания математики по канонам, не изменившимся со времен Архимеда. В XX веке появились новые направления в науке, требующие своих специфических математических теорий, такие, как информатика, программирование, вычислительные методы с применением ЭВМ. От физики поступил заказ на развитие и обоснование суперструнных теорий, где пришлось отказаться от основного понятия классической физики и математики – понятия математической точки. Можно сказать, что на рубеже XXI века математика уже вместе с физикой переживает очередной острейший кризис, совпадающий с кризисом мировоззрения и самого человечества. В настоящее время фрагмент структуры математики можно представить следующим образом: Множества

Категории

Топология

Алгебраические системы

Общая алгебра

Группы

Модули

Математическая логика

Модели

Кольца

Решетки


Математика

11

Первичной основой математики служит теория множеств. Понятие множества, строго говоря, не определяется. Прибли­ женно множеством можно считать любое собрание объектов, мыслимое как единое целое. Категории – это совокупность однотипных математических объектов и морфизмов между этими объектами. Теория категорий играет в математике роль параллельную и дополнительную к роли теории множеств. Топология – раздел математики, имеющий своим назначением выяснение и исследование идеи непрерывности. В настоящее время понятие непрерывного отображения предполагает только, что точки и множества рассматриваемой фигуры могут находиться в некотором интуитивно ясном отношении близости, отличном от отношения принадлежности. Такие фигуры называются топологическими пространствами. Алгебраические системы – это множество с определенными на нем операциями и отношениями. Алгебраическая система называется алгеброй (общей, универсальной, абстрактной), если множество отношений пусто, и моделью, если пусто множество операций. Математическая логика – раздел математики посвященный изучению доказательств оснований математики. На основе математической логики были построены различные системы аксиоматической теории множеств. Наиболее известная из них – система Цермело-Френкеля. Прикладное значение математической логики – конструкция ЭВМ. В современной математике приняты следующие обозначения чисел: N – натуральные числа (0; 1; 2; …), P – простые числа (2; 3; 5; 7; 11; …), Z – целые числа (… –3; –2; –1; 0; 1; 2; 3;…), Q – рациональные числа (… –3,1; –2,5; –1,1; 0; 1,2; 2,3; 3,5 …), R – действительные числа (добавляются числа типа 3 2 ),


12

Э.Ф. Казанцев

GR – гипердействительные (трансфинитные) числа (добавляются бесконечно малые и бесконечно большие числа). Наиболее часто мы будем сталкиваться с понятиями операции, отношения и отображения. Понятие операции интуитивно ясно на примере хорошо известных операций сложения и умножения. Это – бинарные операции. Примером унарной операции является отрицание. Отношения устанавливают связь между множествами. При­ мерами отношения могут служить следующие: 1) принадлежность элемента к множеству «∈»; 2) принадлежность подмножества к множеству «⊂»; 3) отношения порядка: меньше «<»; больше «>»; равно «=» и др. Отображения – это закон, по которому каждому элементу x некоторого заданного множества X сопоставляется однозначно определенный элемент y другого заданного множества Y, и пишут f: X → Y. Если множества состоят из чисел, то вместо термина «отображение» применяют термин «функция» и пишут y = f(x). Если заданы три множества X, Y, Z и есть два отображения f: X → Y и g: Y → Z, то существует отображение h: X → Z, которое называется композицией, или суперпозицией, или произведением отображений f и g, и обозначается f × g. Фундаментальными понятиями математики являются также понятия ассоциативности, коммутативности и дистрибутивности. Ассоциативность – это сочетательный закон для операции, выражаемый тождеством: (a ∗ b) ∗ c = a ∗ (b ∗ c), где ∗ обозначает какую-либо операцию. Коммутативность – это переместительный закон для операции, выражаемый тождеством: a ∗ b = b ∗ a. Дистрибутивность – это распределительный закон для двух операций, выражаемый тождеством: a ∗ (b • c) = a ∗ b • a ∗ c, где ∗ и • – произвольные бинарные операции.


Математика

13

Одним из главных разделов математики является алгебра. Множество М вместе с заданной на нем совокупностью операций {ϕ1…ϕn}, то есть система А = (М; ϕ1…ϕn) называется алгеброй. Множество М называется носителем алгебры. Вектор арности операций алгебры называется ее типом. Совокупность операций называется сигнатурой. П р и м е р 1: алгебра (R; +; ⋅) называется полем действительных чисел R. Сигнатура алгебры (+; ⋅), обе операции сложение (+) и умножение (⋅) бинарны, следовательно ее тип (2, 2). П р и м е р 2: алгебра ({0, 1}; ¬, &, ∨) называется булевой. Сигнатура ее (¬, &, ∨), операции конъюнкции &) и дизъюнкции (∨) бинарны, операция отрицания (¬) унарна, следовательно ее тип (1,2, 2). П р и м е р 3: алгебра (U; ∪, ∩, ¬) называется алгеброй множеств (Кантора). U – универсальное множество. Сигнатура алгебры (∪, ∩, ¬), операции объединения (∪) и пересечения (∩) бинарны, отрицание – унарно, следовательно ее тип (2, 2, 1). Из приведенных примеров видно, что алгебр, в принципе, может быть огромное количество. Особенно ясно это видно из следующего примера. П р и м е р 4: пусть дано множество Np = {0, 1, 2,…, p–1}. Определим на этом множестве операции ⊕- («сложение по модулю p») и ⊗- («умножение по модулю p») следующим образом: a ⊕ b = c; a ⊗ b = d, где c и d – остатки от деления на p чисел (a + b) и (a ⋅ b) соответственно. Например, если p = 7, то N7 = {0, 1, 2, 3, 4, 5, 6}. Тогда 3 ⊕ 4 = [(3+4) / 7] = 0 (нет остатка); 4 ⊕ 6 = = [(4 + 6) / 7] = 3 (остаток от деления 10 на 7); 3 ⊗ 4 = [(3 ⊗ 4) / 7] = 5 (остаток от деления 12 на 7) и так далее. Если p – простое число, алгебра (N p; ⊕; ⊗) называется конечным полем характеристики p. Данная алгебра нашла свое практическое применение в современной криптографии. Аналогичная алгебра на множестве {0, 1} – ({0, 1}, ⊕, &) играет чрезвычайно важную роль в математической логике – это алгебра Жегалкина.


Э.Ф. Казанцев

14

П р и м е р 5: алгебра Жегалкина. Ее сигнатура (⊕, &), p = 2, операции «сложение по модулю 2» и конъюнкция & – бинарны, следовательно тип алгебры – (2, 2). Сложение по модулю 2 выглядит так: 0 ⊕ 1 = [(0 + 1) / 2] = 1, 1 ⊕ 1 = [(1 + 1) / 2] = 0. Кроме вышеприведенных к классу фундаментальных алгебр относятся также группы, кольца, поля, решетки и др. Навести порядок в этом необозримом море различных алгебр помогает свойство гомоморфизма, которым обладают алгебры одного и того же типа. Гомоморфизм – это одно из наиболее важных понятий в математике. Пусть даны две алгебры: А=(К; ϕ1… ϕр) и В = (М; ψ1… ψр) одинакового типа. Гомоморфизмом алгебры А в алгебру В называется отображение Г: К → М с сохранением операции, удовлетворяющее условию:

>

* : Mi ( Ȁ j1 ,...Ȁ jl ( i ) )

@ \ >* : (K i

j1 ),...ī : ( Ȁ j l ( i ) )

@.

(1)

Для всех i = 1,…p. Здесь l(i) – арность операций ϕi и ψi (она должна быть одинакова). Смысл условия (1) состоит в том, что результат будет одинаков независимо от того, выполнена ли сначала операция ϕi в алгебре А и затем произведено отображение Г в алгебру В, либо сначала произведено отображение Г алгебры А в алгебру В, а затем в алгебре В выполнена соответствующая операция ψi. Изоморфизмом алгебры А на алгебру В называется вза­ имно-однозначный гомоморфизм. В этом случае существует обратное отображение Г -1: М → К, также взаимнооднозначное. Если алгебры А и В изоморфны, то элементы и операции алгебры В можно переименовать так, что алгебра В совпадет с алгеброй А. Если А = В, то изоморфизм называется автоморфизмом. П р и м е р 6. Рассмотрим алгебры (N; +; ⋅ ) и (N7; ⊕; ⊗), где N – бесконечное множество натуральных чисел.


Математика

15

Определим отображение Г 7: N → N 7 следующим образом: Г7 (n) равно остатку от деления числа n на 7, то есть, если n = 7a + b (b < 7), то Г7(n) = b. Проверим условие гомоморфизма (1): пусть n1 = 7a1 + b1; n2 = 7a2 + b2. Для сложения: Г 7 (n 1 + n 2 ) = Г 7 (b 1 + b 2 ) = b 1 ⊕ b 2 = = Г7(n1) ⊕ Г7(n2). Для умножения: Г 7 (n 1 × n 2) = Г 7 (b 1 × b 2) = b 1 ⊗ b 2 = = Г 7(n 1) ⊗ Г 7 (n 2), то есть условие (1) выполнено, значит Г 7 – гомоморфизм. Нетрудно показать, что Г 7 не является изоморфизмом. Полученный результат интересен тем, что возможен гомоморфизм бесконечной алгебры в конечную. П р и м е р 7. Рассмотрим алгебры (R+; ⋅) и (R; + ), где R+ – положительное подмножество всех действительных чисел R. Отображение a → log a является изоморфизмом для данных алгебр. Условие (1) имеет вид: log (a × b) = log a + log b. С другими важными понятиями современной математики мы познакомимся позже в конкретных случаях их применения. К сожалению, огромное количество новых правил в современной математике отпугивает от нее множество людей, формируя общую неприязнь к математике, что в гуманитарной сфере даже возводится в ранг достоинства. Это происходит, видимо, потому, что человек изначально воспринимает только ту информацию, которая доступна его пониманию. Именно особое понимание природы на уровне интуиции определяет принадлежность человека к физике, хотя опыт показывает, что зачастую с трудом достигнутое понимание рано или поздно оказывается ложным. В математике ситуация несколько другая, здесь все основные понятия – это правила игры, к которым надо привыкнуть, а не понять. В традиционной (школьной) математике мы привыкли оперировать числами, для которых были сформулированы одни правила. Сейчас мы будем иметь дело с более сложными


16

Э.Ф. Казанцев

объектами, которые будут описываться, например, матрицами. И здесь уже будут действовать другие правила. Например, для чисел мы твердо усвоили, что если a × b = 0, то или a = 0, или b = 0. Для матриц это не так. Если a и b – матрицы и a × b = 0, § 0 1 · §1 0 ·

то может быть и a ≠ 0, и b ≠ 0: ¨¨ ¸¸ ¨¨ ¸¸ 0. . ©0 0¹ © 0 0¹ Объекты, удовлетворяющие такому новому правилу, называются делителями нуля. Дискретная математика (историческая справка) Элементы дискретной математики возникли в глубокой древности. Типичными для того периода были задачи, связанные со свойствами целых чисел – Диофант (III век), и приведшие затем к созданию теории чисел – Л. Эйлер (1707–1783), К. Гаусс (1777–1855). Позже (XVII–XVIII века), в основном в связи с игровыми задачами, появились элементы комбинаторного анализа и дискретной теории вероятностей – Б. Паскаль (1623–1662), П. Ферма (1601–1665). Затем (XVIII–XIX века) возникли важнейшие понятия алгебры, такие как группа, поле, кольцо и др. – Ж. Лагранж (1763–1813), Э. Галуа (1811–1832), имевшие, по существу, дискретную природу. В середине XIX века Л. Эйлер заложил основы теории графов, которая в дальнейшем привела к созданию эффективных методов решения транспортных задач. Тогда же появилась теория матриц – У. Гамильтон (1805–1865), А. Кэлли (1821–1895), К. Вейерштрасс (1815–1897). Теорию множеств разработал Г. Кантор (1845–1918), которая встретила со стороны его современников резкое сопротивление, но впоследствии оказала большое влияние на развитие математики. Теория множеств является фундаментом ряда новых математических дисциплин. Постепенно теоретикомножественные методы находят все большее применение и в классических частях математики – дифференциальные урав-


Математика

17

нения, вариационное исчисление, теория вероятностей и др. Однако в вопросах обоснования математики, теория множеств сама нуждается в обосновании применяемых в ней методов рассуждения. Более того, все логические трудности, связанные с обоснованием математического учения о бесконечности, при переходе на точку зрения общей теории множеств, приобретают лишь большую остроту. Стремление к строгости математических рассуждений привело к появлению (XIX–XX века) математической логики – Дж. Буль (1815–1864), О. Морган (1806–1871), Э. Пост (1897– 1954), И.И. Жегалкин (1869–1947), К. Гедель (1906–1978). Наибольшего развития дискретная математика достигла (XX век) в связи с запросами практики, приведшими к появлению новых наук – кибернетики, теории кодирования, теории алгоритмов, теории автоматов и др. – Н. Винер (1894–1964), К. Шеннон (1916–1989), А. Черч (1903–1992), А. Тьюринг (1912– 1954).


18

Э.Ф. Казанцев

Раздел 1 Алгебра

1.1. Алгебра множеств 1.1.1. Основные понятия 1) Под множеством S будем понимать любое собрание определенных и различных между собой объектов, мыслимое как единое целое. Эти объекты называются элементами множества S. П р и м е р : множество целых чисел, множество студентов, присутствующих на лекции (даже если их нет – это пустое множество), множество точек на плоскости и так далее. 2) Символ ∈ обозначает отношение принадлежности элемента. Запись x ∈ S обозначает, что «элемент x принадлежит множеству S». Если x не принадлежит множеству S, то пишут x ∉ S, или x ∈ S. 3) Если множество содержит конечное число элементов, говорят, что оно конечно; в противном случае множество называется бесконечным. 4) Множества A и B считаются равными, если они состоят из одних и тех же элементов. Записывается A = B. В противном случае A ≠ B. Данное правило называется принципом объемности. П р и м е р . Множество A всех положительных четных чисел равно множеству B положительных целых чисел представленных в виде суммы двух положительных нечетных чисел.


Математика

19

Действительно: Если x ∈ A, то x = 2m; тогда x = (2m – 1) + 1, то есть x ∈ B. Если x ∈ B, то x = (2p – 1) + (2q – 1) = 2(p + q – 1) то есть x ∈ A. Таким образом, x ∈ A и x ∈ B или x ∈ B и x ∈ A, значит A = B. 5) Если элементами множества являются объекты a1,..., an, то оно обозначается {a1,..., an}. П р и м е р : а) множество четных чисел: P = {2, 4, 6, 8}; б) множество трехзначных чисел в двоичной системе: B3 = {000, 001, 010, 011, 100, 101, 110, 111}. 6) В силу принципа объемности {2, 4, 6} = {4, 2, 6} = {2, 4, 4, 6}, но {{1, 2}} ≠ {1, 2}, т.к. единственным элементом множества {{1,2}} является множество {1, 2}, а множество {1, 2} состоит из двух элементов: чисел 1 и 2. 7) Другим способом задания множества является так называемая, «форма от x». Обозначается: A = {x | P(x)}. П р и м е р : {x | x – четное число} – бесконечное множество четных чисел. 8) Символ ⊆ обозначает отношение включения между множествами: пишут A ⊆ B – если каждый элемент из A принадлежит B; говорят: «B содержит A» или «A есть подмножество B». Если A ⊆ B и A ≠ B, то говорят, что A есть собственное подмножество B, и пишут A ⊂ B. П р и м е р : {1, 2} ⊂ {1, 2, 3, 4}. Свойства включения: а) A ⊆ A; б) если A ⊆ B, B ⊆ C, то A ⊆ C – свойство транзитивности; в) если A ⊆ B и B ⊆ A, то A = B. Не смешивать отношения принадлежности и включения: 1 ∈ {1} и {1} ⊆ {{1}}, но неверно, что 1 ∈ {{1}}, так как единственным элементом множества {{1}} является {1}, а не 1. 9) Множество, не содержащее элементов, называется пус­ тым множеством и обозначается ∅. Пустое множество есть подмножество любого множества.


20

Э.Ф. Казанцев

10) Множеством подмножеств A (множеством – степенью) называется множество P(A), элементами которого являются подмножества A. Пустое множество ∅ также является элементом Р(А). П р и м е р . Если A = {1, 2, 3}, то P(A) = {∅; {1}, {2}, {3}, {1, 2}, {1, 3}, {2, 3}, А}. Если множество A состоит из n элементов, то множество P(A) состоит из 2n элементов. 1.1.2. Операции на множествах 1) Объединением множеств A и B называется множество A ∪ B, все элементы которого являются элементами множества A или B: A ∪ B = {x | x ∈ A или x ∈ B}. 2) Пересечением множеств A и B называется множество A ∩ B, элементы которого являются элементами обоих множеств A и B: A ∩ B = {x | x ∈ A и x ∈ B}. Очевидно, что A ∩ B ⊆ A ⊆ A ∪ B и A ∩ B ⊆ B ⊆ A ∪ B. Если A ∩ B = ∅, то такие множества называются непересекающимися. 3) Относительным дополнением множества A до множества B, называется множество B\A всех тех элементов множеств B, которые не принадлежат множеству A: B\A = {x | x ∈ B и x ∉ A}. 4) Симметрической разностью множеств A и B называется множество A ⊕ B = (A\B) ∪ (B\A) – это множество элементов, принадлежащих или A или B. Его также называют дизъюнктивной суммой. 5) Если все рассматриваемые множества являются подмножествами некоторого множества U, то это множество U называется универсальным. 6) Абсолютным дополнением множества A называется множество Ā всех тех элементов U, которые не принадлежат множеству A: Ā = U/A.


21

Математика

7) Наглядное представление об операциях на множествах какого-либо универсального множества U дают диаграммы Эйлера. Универсальное множество U изображают в виде прямоугольника, а его подмножества – в виде кругов внутри прямоугольника (рис. 1.1.1):

включение А ⊆ U

объединение А ∪ В

пересечение А ∩ В

относительное дополнение В\А

дизъюнктивная сумма А ⊕ В

абсолютное дополнение Ā

Рис. 1.1.1. Круги Эйлера

1.1.3 Алгебра Кантора Для любых подмножеств A, B и C универсального множества U выполняются следующие тождества: коммутативность: 1) А ∪ В = В ∪ А; 1'') А ∩ В = В ∩ А; ассоциативность: 2) А ∪ (В ∪ С) = (А ∪ В) ∪ С; 2'') А ∩ (В ∩ С) = (А ∩ В) ∩ С; дистрибутивность: 3) А ∪ (В ∩С) = (А ∪ В) ∩ (А ∪С); 3'') А ∩ (В ∪ С) = (А ∩ В) ∪ (А ∩ С);


22

Э.Ф. Казанцев

4) А ∪ ∅ = А; 4'') А ∩ U = А; 5) А ∪ Ā = U; 5'') А ∩ Ā = ∅; 6) А ∪ А = А; 6'') А ∩ А = А; 7) А ∪ U = U; 7'') А ∩ ∅ = ∅; законы де Моргана: 8) А ∪ В = (А ∩ В); 8'') А ∩ В = А ∪ В; законы поглощения: 9) А ∪ (А ∩ В) = А; 9'') А ∩ (А ∪ В) = А; 10) ∅ = U; 10'') U = ∅. Данные тождества доказываются с помощью принципа объемности. П р и м е р 1. Доказательство тождества 3): А ∪ (В ∩ С) = = (А ∪ В) ∩ (А ∪ С). Сначала покажем, что А ∪ (В ∩ С) ⊆ (А ∪ В) ∩ (А ∩ С). Действительно, если x ∈ А ∪ (В ∩ С), то x ∈ А или x ∈ В ∩ С. Если x ∈ А, то x ∈ А ∪ В и x ∈ А ∪ С. Следовательно, x ∈ (А ∪ В) ∩ (А ∩ С). Если x ∈ В ∩ С, то x ∈ В и x ∈ С. Отсюда x ∈ В ∪ А и x ∈ С ∪ А, а значит, x ∈ (А ∪ В) ∩ (А ∪ С). Теперь покажем, что (А ∪ В) ∩ (А ∪ С) ⊆ А ∪ (В ∩ С). Если x ∈ (А ∪ В) ∩ (А ∪ С), то x ∈ А ∪ В и x ∈ А ∪ С. Следовательно, x ∈ А или x ∈ В и x ∈ С, то есть x ∈ В ∩ C. Отсюда x ∈ А ∪ (В ∩ С). Таким образом, по принципу объемности, если N ⊆ М, а М ⊆ N, то N = М. Тождества можно доказывать путем преобразований. П р и м е р 2. Доказательство тождества 6): А ∪ А = А; А ∪ А = = (А ∪ А) ∩ U = (А ∪ А) ∩ (А ∪ ) = А ∪ (А ∩ ) = = А ∪ ∅ = А.


Математика

23

Дополнительные тождества: 11) если A ∪ B = U и A ∩ B = ∅, то B = Ā; 12) B\A = B ∩ Ā; 13) А ⊕ В = (А ∩ B) ∪ (Ā ∩ В); 14) Ā = U\A; = 15) А = A (инволюция); 16) А ⊕ В = В ⊕ А; 17) (А ⊕ В) ⊕ С = А ⊕ (В ⊕ С); 18) A ⊕ ∅ = ∅ ⊕ A = A; 19) A ⊂ B, если и только если A ∩ B = A или A ∪ B = B или A ∩ B = ∅; 20) A = B, если и только если (А ∩ B) ∪ (Ā ∩ В) = ∅. Алгебра множеств – это аналог обычной алгебры действительных чисел. Одним из разделов алгебры множеств являются тождественные преобразования, с помощью которых можно упрощать различные выражения. П р и м е р : а) (А ∩ В ∩ С) ∪ (Ā ∩ С) ∪ (B ∩ С) = (А ∩ В ∩ С) ∪ [(Ā ∪ B) ∩ С] = [(А ∩ В) ∪ (Ā ∪ B)] ∪ С = [(А ∩ В) ∪ (А ∩ В)] ∩ С = = U ∩ С = С; б) (М\N) ∩ (N\М) = (M ∩ N) ∩ (N ∩ М) = M ∩ (N ∩ N) ∩ М = = M ∩ ∅ ∩ M = ∅. 1.1.4. Уравнения с множествами 1) Уравнение может содержать известные множества A1, A2,..., An и подлежащие определению множества X1, X2,..., Xm. Пусть в уравнение входит одно неизвестное множество X. Требуется ответить на вопрос, при каких условиях уравнение имеет решение и каково это решение. Решение уравнения с одним неизвестным множеством X основывается на последовательности тождественных преобразований: а) В соответствии с тождествами 13) и 20) уравнение преобразуется в дизъюнктивную сумму его левой и правой частей, которая приравнивается пустому множеству.


24

Э.Ф. Казанцев

б) Полученное уравнение преобразуется к виду: (М ∩ Х) ∪ (N ∩ X) = ∅, где M и N – известные множества, не содержащие X. (Любое уравнение приводится к такому виду.) в) Так как объединение множеств пусто только при условии, что каждое из них также пустое множество, преобразованное уравнение можно записать в виде системы двух уравнений: M ∩ X = ∅ и N ∪ X = ∅. г) Полученная пара уравнений (а, следовательно, и исходное уравнение) имеет смысл тогда и только тогда, когда N ⊂ X и X ⊂ M (тождество 19). Это значит, что условием существования решения является N ⊂ M (свойство транзитивности отношения включения). А решением уравнения является любое множество X такое, что N ⊂ X ⊂ M. П р и м е р . X ∪ C = D. а) [(X ∪ C) ∩ D] ∪ [(X ∪ C) ∩ D] = ∅. б) [(X ∪ C) ∩ D] ∪ [(X ∪ C) ∩ D] = [(X ∩ D) ∪ (C ∩ D)] ∪ [X ∩ C ∩D] = (X ∩ D) ∪ [(C ∩ D) ∩ (X ∪ X)] ∪ [D ∩ C ∩ X] = = (D ∩ X) ∪ (C ∩ D ∩ X) ∪ (C ∩ D ∩ X) ∪ (D ∩ C ∩ X) = = {[D ∪ (C ∩ D)] ∩ X} ∪ {[(C ∩ D) ∪ (D ∩ C)] ∩ X} = (D ∩ X) ∪ [(C ⊕ D) ∩ X] =∅. в) D ∩ X = ∅ и (C ⊕ D) ∩ X = ∅. г) условие существования решения: C ⊕ D ⊂ X и X ⊂ D; то есть C ⊕ D ⊂ D или C ⊂ D. Причем, решением будет множество X такое, что C ⊕ D ⊂ X ⊂ D. Если C ⊂ D, то C ∩ D = ∅ и C ⊕ D = ∅ и (C ⊕ D) = = ∅ ∪ (C ∩ D) = D ∩ C = D\C, поэтому D\C ⊂ X ⊂ D. Следовательно, любое множество X, которое входит в D и содержит дополнение множества C до D, является решением уравнения X ∪ C =D; 2) С помощью кругов Эйлера можно доказывать основные тождества множеств. Пример, А ∪ (В ∩ С) = (А ∪ В) ∩ (А ∪ С). Изобразим правую и левую части этого тождества с помощью кругов Эйлера (рис. 1.1.2):


Математика

25

A ∪ (B ∩ C)

(A ∪ B) ∩ (A ∪ C)

(B∩C) – это пересечение В и С

(А ∪ С) – это и А и С – штрих / / /

A ∪ (B ∩ C) – это А и пересечение (А ∪ В) – это А и В – штрих \ \ \ \ \ В и С– \ \ \ \ \ \ (A ∪ B) ∩ (A ∪ C) – это область с двойной штриховкой Рис. 1.1.2

Видно, что слева и справа заштрихованные области сов­ падают. 3) С помощью кругов Эйлера можно выполнять тождественные преобразования: П р и м е р . (А ∩ В ∩ С) ∪ (Ā ∩ С) ∪ (В ∩ С) (рис. 1.1.3). а) Обозначим наклонной штриховкой выражение А ∩ В ∩ С – их общая часть – / / / / / /. б) Обозначим вертикальной штриховкой выражение Ā ∩ C – все C кроме A – | | | | | | |. в) Обозначим горизонтальной штриховкой выражение В ∩ C – все C кроме B – ======. г) Теперь надо объединить все заштрихованные области. Видно, что заштрихована только область C. Значит: (А ∩ В ∩ С) ∪ (Ā ∩ С) ∪ (В ∩ С) = С.


26

Э.Ф. Казанцев

Рис. 1.1.3

1.1.5. Упорядоченные множества 1) Совокупность, состоящая из двух элементов x и y, расположенных в определенном порядке называется упорядоченной парой <x, y>. Две пары <x, y> и <u, v> считаются равными тогда и только тогда, когда x = u, y = v. Упорядоченная n-ка элементов x1... xn обозначается <x1,..., xn> и по определению есть <<x1,..., xn-1>, xn>. 2) Бинарным (или двуместным) отношением ρ называется множество упорядоченных пар. Если ρ есть некоторое отношение и пара <x, y> принадлежит этому отношению, то наряду с записью <x, y> ∈ ρ, употребляется запись xρy. Элементы x и y называются координатами (или компонентами) отношения ρ. n-нарным отношением называется множество упорядоченных n-ок. 3) Областью определения бинарного отношения ρ называется множество D(ρ) = {x | существует такое y, что x1ρy}. Областью значений бинарного отношения ρ называется множество R(ρ) = {y | существует такое x, что xρy}. 4) Прямым произведением множеств X и Y называется совокупность всех упорядоченных пар <x, y> таких, что x ∈ X и


Математика

27

y ∈ Y. Обозначается прямое произведение множеств X и Y через X×Y. Каждое отношение ρ есть подмножество прямого произведения некоторых множеств X и Y таких, что D(ρ) ⊆ X и R(ρ) ⊆ Y. Если X = Y, то говорят, что ρ есть отношение на множестве X. П р и м е р : a) Пусть X = {1, 2, 3}; Y = {0, 1}, тогда X × Y = {<1,0>, <1,1>, <2,0>, <2,1>, <3,0>, <3,1> }, Y × X = {<0,1>, <0,2>, <0,3>, <1,1>, <1,2>, <1,3>} при этом X × Y ≠ Y × X. б) Пусть X – множество точек отрезка [0, 1], а Y – множество точек отрезка [1, 2]. Тогда X × Y – множество точек квадрата [0, 1] × [1, 2] с вершинами (0, 1); (0, 2); (1, 1); (1, 2). Для бинарных отношений обычным образом определены операции объединения, пересечения и так далее. Обратным отношением для ρ называется отношение ρ–1 = {<x, y> | <y, x> ∈ ρ}. 7) Композицией отношений ρ 1 и ρ 2 называется отношение ρ2 o ρ1 = {<x, z> | существует такое y, что <x, y> ∈ ρ1 и <y, z> ∈ ρ2}. 8) Свойства: a) (ρ–1)–1 = ρ; б) (ρ2 o ρ1)–1 = ρ1–1 o ρ2–1. 9) Бинарное отношение f называется функцией, если из <x, y> ∈ f и <x, z > ∈ f, следует, что y = z. 10) Поскольку функции являются бинарными отношениями, а те являются множествами, то к ним применим принцип объемности, то есть: две функции f и g равны, если они состоят из одних и тех же элементов. Область определения функции обозначается Df, а область ее значений – Rf. 11) Если Df = X и Rf ⊆ Y, то говорят, что функция f задана на множестве X со значениями во множестве Y и осуществляет отображение множества X во множество Y (или устанавливает соответствие между множествами X и Y). Это отображение обозначается: f : X → Y.


28

ция; цией;

Э.Ф. Казанцев

П р и м е р : а) отношение {<1,2>, <2,3>, < , ∆>} – это функб) отношение {<1,2>, <1,3>, <2,4>} – не является функ-

в) отношение {<x, x2 + 2x + 1> | x – действительное число} – это функция, которую обычно обозначают y = x2 + 2x + 1. 12) Назовем f n-местной функцией из X в Y, если f: Xn → Y. Тогда пишем y = f (x1,..., xn) и говорим, что y – значение функции при значениях аргументов x1,..., xn. 13) Пусть f: X → Y. Функция (отображение) f называется инъективной, если для любых x1; x2; y из y = f(x1) и y = f(x2) следует, что x1 = x2 (<x1, y> ∈ f и <x2, y> ∈ f, то x1 = x2). 14) Функция (отображение) f называется сюръективной, если для любого элемента y ∈ Y существует элемент x ∈ X такой, что y = f(x). 15) Функция (отображение) f называется биективной, если f одновременно сюръективна и инъективна. Если существует биективная функция f : X → Y, то говорят, что f осуществляет взаимнооднозначное соответствие между множествами X и Y. П р и м е р . Рассмотрим функции, отображающие множество действительных чисел R во множество действительных чисел: fi : R → R, i = 1, 2, 3. а) функция f1(x) = ex – инъективна, но не сюръективна; б) функция f2(x) = x2 – сюръективна, но не инъективна; в) функция f3(x) = 2x + 1 – биективна (рис. 1.1.4). 16) Композиция двух функций f и g есть отношение g o f = = {<x, z> | существует такое y, что xfy и ygz}. Композиция двух функций есть функция. При этом, если f: X → Y; g: Y → Z, то g o f: X → Z. Действительно, если <x, y> ∈ g o f и <x, z> ∈ g o f, то существует такое u, что xfu, ugy, и существует такое v, что xfv и vgz. Поскольку f – функция, то u = v. Поскольку g – функция, то y = z, и, следовательно, g o f – функция. Композиция двух биективных функций есть биективная функция.


Математика

29

Рис. 1.1.4. Инъективная (а), сюръективная (б) и биективная (в) функции

17) Тождественным отображением множества X в себя называется отображение ex: X → X такое, что для любого x ∈ X, ex(x) = x. Тогда, если f: X → Y, то ey o f = f, f o ex = f. 18) f–1 называется обратной функцией (обратным отображением). Отображение f: X → Y имеет обратное отображение f-–1: Y → X тогда и только тогда, когда f – биекция. Для того чтобы обратное отношение f-–1 было функцией, достаточно инъективности функции f. 19) Свойства инъективных функций f и g: a) (f–1)–1 = f; б) (g o f)–1 = f–1 o g–1. Свойства биективной функции f: а) (f–1 o f) = eх; б) (f o f–1) = eх. 1.1.6. Специальные бинарные отношения А. Отношение эквивалентности 1) Отношение ρ на множестве X называется рефлексивным, если для любого элемента x ∈ X выполняется xρx.


30

Э.Ф. Казанцев

2) Отношение ρ на множестве X называется симметричным, если для любых x, y ∈ X, из xρy следует yρx. 3) Отношение ρ на множестве X называется транзитивным, если для любых x, y, z ∈ X, из xρy и yρz следует xρz. 4) Рефлексивное, симметричное и транзитивное отображение на множестве X называется отношением эквивалентности на множестве X. Пример: а) отношение равенства на множестве целых чисел есть отношение эквивалентности; б) отношение подобия на множестве треугольников есть отношение эквивалентности; в) отношение x < y на множестве действительных чисел не рефлексивно, не симметрично, но транзитивно; г) отношение принадлежности к группе студентов на множестве студентов института – отношение эквивалентности. Итак, пусть ρ – отношение эквивалентности на множестве X. 5) Классом эквивалентности, порожденным элементом x, называется подмножество множества X, состоящее из тех элементов y ∈ X, для которых xρy, и обозначается [ x ] : [ x ] = {y | y ∈ X и xρy}. П р и м е р : для отношения принадлежности к группе студентов классом эквивалентности является множество студентов этой группы. 6) Пусть ρ – отношение эквивалентности на множестве X. Тогда: а) если x ∈ X, то x ∈ [ x ]; б) если x, y ∈ X и xρy, то [ x ] = [ y ] (то есть класс эквивалентности порождается любым своим элементом). 7) Разбиением множества X называется совокупность попарно непересекающихся подмножеств X таких, что каждый элемент множества X принадлежит одному и только одному из этих подмножеств.


Математика

31

П р и м е р : а) X = {1, 2, 3, 4, 5}. Тогда разбиение множества X: {{1, 2}, {3, 5}, {4}}. б) пусть X – множество студентов института. Тогда разбие­ ние X – это, например, совокупность студенческих групп. 8) Всякое разбиение множества X определяет на X отношение эквивалентности ρ (xρy) тогда и только тогда, когда x и y принадлежат одному подмножеству разбиения. 9) Всякое отношение эквивалентности ρ определяет разбиение множества X на классы эквивалентности относительно этого отношения. 10) Совокупность классов эквивалентности элементов множества X по отношению эквивалентности ρ называется фактормножеством X по отношению ρ и обозначается: X/ρ. 11) Отношение ρ на множестве X называется антисиммет­ ричным, если для любых x, y ∈ X из xρy и yρx следует x = y. Б. Отношение порядка 1) Рефлексивное, антисимметричное и транзитивное отношение называется отношением частичного порядка на множестве X и обозначается символом ≤. Пример: а) отношение x ≤ y на множестве действительных чисел есть отношение частичного порядка; б) во множестве подмножеств универсального множества U отношение A ⊆ B есть отношение частичного порядка; в) схема организации подчинения в учреждении есть отношение частичного порядка на множестве должностей. 2) Отношение частичного порядка на множестве X, для которого любые два элемента сравнимы, то есть для любых x, y ∈ X x ≤ y или y ≤ x, называется отношением линейного порядка. Предыдущий пример а) – это отношение линейного порядка; а пример б) таковым не является. 3) Мы определили тип отношений, используя интуитивное понятие порядка (кто главнее). Пусть на множестве X задано отношение частичного порядка ρ. Как теперь сравнить пары эле-


Э.Ф. Казанцев

32

ментов из множества X, то есть как задать отношение частичного порядка на множестве X × X (как сравнить подчиненных различных отделов)? Один из возможных способов состоит в следующем: на множестве X × X определим отношение П условием: <a, b> П <c, d> ⇔ aρc и bρd. Отношение П есть отношение частичного порядка. Оно называется отношением Парето. 4) Множество X с заданным на нем частичным (линейным) порядком называется частично (линейно) упорядоченным. Обозначим x < y, если x ≤ y и x ≠ y. Говорят, что элемент y покрывает элемент x. 5) Частично упорядоченное множество можно представить в виде схемы, в которой каждый элемент изображается точкой на плоскости, и если y покрывает x, то точки x и y соединяют отрезком, причем точку x располагают ниже точки y. Такие схемы называются диаграммами Хассе. П р и м е р : а) пусть A = {1, 2, 3}. На множестве P(A) рассмотрим отношение «быть подмножеством». Множество P(A) содержит восемь элементов: {∅, {1}, {2}, {3}, {1,2}, {1, 3}, {2, 3}, {1, 2, 3}}. Ему соответствует диаграмма Хассе (рис. 1.1.5); б) пусть X = {1, 2, 3, 5, 6, 10, 15, 30}. На этом множестве рассматривается отношение частичного порядка: «x ≤ y ⇔ y делится на x»; Ему соответствует диаграмма Хассе (рис. 1.1.6).

Рис. 1.1.5

Рис. 1.1.6


33

Математика

в) На множестве X = {1, 2, 3, 4, 5, 6, 7, 8} рассматривается отношение линейного порядка ≤. На диаграмме Хассе (рис. 1.1.7):

Рис. 1.1.7

6) Два частично упорядоченные множества X и Y называются изоморфными, если существует биекция ϕ: X → Y, сохраняющая отношение частичного порядка. Предыдущий пример: а) и б) – это изоморфные частично упорядоченные множества. 7) Всякое частично упорядоченное множество X изоморфно некоторой системе подмножеств множества X, частично упорядоченной отношением включения. Задания для самостоятельной работы 1) Какие из приведенных ниже соотношений неверны? а) x ∈ {2, a, x}; б) 3 ∈ {1, 2, 3, 4}; в) x ∈ {1, sin x}; г) {x, y} ∈ {a, {x, y}, b}. 2) Равны ли между собой множества A и B? а) A = {2, 5, 4}; B = {5, 4, 2}; б) A = {1, 2, 4, 2}; B = {1,2,4}; в) A = {2, 4, 5}; B = {2, 4, 3}; г) A = {1, {2, 5}, 6}; B = {1, {5, 2}, 6}; д) A = {1, 2, 5, 6}; B = {1, 2, 5, 6}. 3) В каких отношениях находятся между собой следующие три множества: A = {1, 3}; B – множество нечетных положительных чисел; C – множество решений уравнения x2 – 4x + 3 = 0? 4) Приняв множество первых 20 натуральных чисел в качестве универсального множества, запишите следующие его подмножества:


34

Э.Ф. Казанцев

A – четных чисел; B – нечетных чисел; C – квадратов чисел; D – простых чисел. В каких отношениях находятся эти подмножества между собой? 5) Доказать тождества: а) (A ∩ E) ∪ (A ∩ Ē) = A; б) (A ∪ B) ∩ A = A; в) (A ∩ B ∩ C) ∪ (Ā ∩ B ∩ C) = B ∩ C; г) (Ā ∩ B) ∪ B = Ā ∪ B; д) A ∪ (B \ A) = A ∪ B; е) A ∩ (Β \ Α) = ∅; ж) А \ (A ∩ B) = A \ B; з) (Α ∩ E) ∪ (Α ∩ Ē) ∪ (Ā ∩ E) = Α ∪ E; е) (Ā ∪ Ē) ∩ (А ∪ Ē) ∩ (А ∪ E) ∩ (E ∪ Ā) = ∅; и) (Α ∩ Ε ∩ C ∩ Ī) ∪ (Ā ∩ C) ∪ (Ē ∩ C) ∪ (C ∩ I) = C. 6) С помощью кругов Эйлера доказать тождества: а) (N\M) ∩ (M\N) = ∅; б) A \ (A \ B) = B \ (B \ A); в) (A \ B) \ C = (A \ C) \ (B \ C).

1.1.7. Нечеткие множества Пожалуй, наиболее поразительным свойством человеческого интеллекта является способность принимать правильные решения в обстановке неполной и нечеткой информации. Построение моделей приближенных рассуждений человека и использование их в компьютерных системах будущих поколений представляет сегодня одну из важнейших проблем науки. Значительное продвижение в этом направлении сделано более 40 лет тому назад профессором Калифорнийского университета (Беркли) Лотфи А. Заде (Lotfi A. Zadeh). Его работа «Fuzzy Sets», появившаяся в 1965 году, заложила основы моделирования интеллектуальной деятельности человека и явилась начальным толчком к развитию новой математической теории. Основанные на этой теории методы построения компьютерных нечетких систем существенно расширяют области при-


Математика

35

менения компьютеров. В последнее время нечеткое управление является одной из самых активных и результативных областей исследований применения теории нечетких множеств. Нечеткое управление оказывается особенно полезным, когда технологические процессы являются слишком сложными для анализа с помощью общепринятых количественных методов, или когда доступные источники информации интерпретируются качественно, неточно или неопределенно. Экспериментально показано, что нечеткое управление дает лучшие результаты, по сравнению с получаемыми при общепринятых алгоритмах управления. 1) Пусть U – универсальное множество, x – элемент U, а R – некоторое свойство. Обычное (четкое) подмножество A универсального множества U, элементы которого удовлетворяют свойству R, определяется как множество упорядоченных пар А = {μA(х) / х}, где μA(х) – характеристическая функция, принимающая значение 1, если x удовлетворяет свойству R, и 0 – в противном случае. Нечеткое подмножество отличается от обычного тем, что для элементов x из U нет однозначного ответа «да-нет» относительно свойства R. В связи с этим, нечеткое подмножество A универсального множества U определяется как множество упорядоченных пар А = {μA(х) / х}, где μA(х) – характеристическая функция принадлежности (или просто функция принадлежности), принимающая значения в некотором вполне упорядоченном множестве M (например, M = [0, 1]). Функция принадлежности указывает степень (или уровень) принадлежности элемента x подмножеству A. Множество M называют множеством принадлежностей. Если M = {0, 1}, то нечеткое подмножество A может рассматриваться как обычное или четкое множество. П р и м е р . Пусть U = {x1, x2, x3, x4, x5}, M = [0, 1]; A – нечеткое множество, для которого μA(x1) = 0,3; μA(x2) = 0; μA(x3) = 1; μA(x4) = 0,5; μA(x5) = 0,9. Тогда A можно представить в виде: А = {0,3/х1; 0/х2; 1/х3; 0,5/х4; 0,9/х5}.


Э.Ф. Казанцев

36

2) Основные характеристики нечетких множеств Пусть M = [0, 1] и A – нечеткое множество с элементами из универсального множества U и множеством принадлежностей M. а) величина

sup P A x называется высотой нечеткого мно­ x U

жества A. Нечеткое множество A нормально, если его высота равна 1, т.е. верхняя граница его функции принадлежности равна 1 ( sup P A x 1 ). При sup P A x 1 нечеткое множество называется x U

x U

субнормальным; б) нечеткое множество пусто, если ∀х ∈U µА(х) = 0. Непус­ тое субнормальное множество можно нормализовать по формуле P A x

P A x

; sup P A x

x U

в) нечеткое множество унимодально, если µА(х) = 1 только на одном x из U; г) носителем нечеткого множества A является обычное подмножество со свойством μ A (x)>0, т.е. носитель А = {x / µА(х) > 0}∀х ∈U; д) элементы х ∈U, для которых μA(x) = 0,5 называются точками перехода множества A. Примеры. а) Пусть U = {0, 1, 2,..,10}, M = [0, 1]. Нечеткое множество «несколько»: «несколько»={0,5/3; 0,8/4; 1/5; 1/6; 0,8/7; 0,5/8}; его характеристики: высота = 1, носитель = {3, 4, 5, 6, 7, 8}, точки перехода – {3, 8}. б) Пусть U = {«Запорожец», «Жигули», «Мерседес»,...} – множество марок автомобилей, а U' = [0, ∞) – универсальное множество «стоимость», тогда на U' мы можем определить нечеткие множества типа: «для бедных», «для среднего класса», «престижные», с функциями принадлежности типа:


Математика

37

Рис. 1.1.8. Графическое представление множества марок автомобилей

Имея эти функции и зная стоимости автомобилей из U в данный момент времени, мы тем самым определим на U' нечеткие множества с этими же названиями. Так, например, нечеткое множество «для бедных», заданное на универсальном множестве U = {Запорожец, Жигули, Мерседес,...} выглядит следующим образом.

Рис. 1.1.9. Нечеткое множество «автомобиль для бедных»

Аналогично можно определить нечеткое множество «скоростные», «средние», «тихоходные» и так далее. 3) Операции над нечеткими множествами а) Включение. Пусть A и B – нечеткие множества на универсальном множестве U. Говорят, что A содержится в B, если ∀х∈U µА(х) ≤ µВ(х). Обозначение: A ⊂ B. Иногда используют термин «доминирование», то есть в случае, когда A ⊂ B, говорят, что B доминирует A. б) Равенство. A и B равны, если ∀х∈U µА(х) = µВ(х). Обозначение: A = B.


Э.Ф. Казанцев

38

в) Дополнение. Пусть M = [0, 1], A и B – нечеткие множества, заданные на A и B, дополняют друг друга, если ∀х∈U µА(х) = = = 1 – µВ(х). обозначение: B = Ā или А = B. Очевидно, что (A) = = A. (Дополнение определено для M = [0, 1], но очевидно, что его можно определить для любого упорядоченного M.) г) Пересечение. A ∩ B – наименьшее нечеткое подмножество, содержащееся одновременно в A и B, µА∩В(х) = min (µA(х), µВ(х)). д) Объединение. А ∪ В – наибольшее нечеткое подмножество, включающее как А, так и В, с функцией принадлежности: µА∪В(х) = max (µA(х), µВ(х)). е) Относительное дополнение. Α\B = A ∩ B с функцией принадлежности: P A\ B ( x)

P A B ( x)

min(P A ( x) , 1 P B ( x)).

ж) Дизъюнктивная сумма. А ⊕ В = (Α\B) ∪ (B\A) = = (А ∪ В) ∪ (A ∩ B) с функцией принадлежности: ȝ A\ B ( x )

max^>min( ȝ A ( x ), 1 ȝ B ( x )) @; >min (1 ȝ A ( x ) , ȝ B ( x )) @`.

Примеры. Пусть даны нечеткие множества: А = {0,4/х1; 0,2/х2; 0/х3; 1/х4;}; В = {0,7/х1; 0,9/х2; 0,1/х3; 1/х4;}; С = {0,1/х1; 1/х2; 0,2/х3; 0,9/х4;}. а) Здесь: A ⊂ B, то есть A содержится в B или B доминирует A, С несравнимо ни с A, ни с B, т.е. пары {A, С} и {B, С} – пары недоминируемых нечетких множеств. б) A ≠ B ≠ C. в) А = {0,6/х1; 0,8/х2; 1/х3; 0/х4}; В = {0,3/х1; 0,1/х2; 0,9/х3; 0/х4}. г) А ∩ В = {0,4/х1; 0,2/х2; 0/х3; 1/х4;}. д) А ∪ В = {0,7/х1; 0,9/х2; 0,1/х3; 1/х4;}. е) AB = А ∩ В = {0,3/х1; 0,1/х2; 0/х3; 0/х4}; B – A = А ∩ В = {0,6/х1; 0,8/х2; 0,1/х3; 0/х4}. ж) А ⊕ В = {0,6/х1; 0,8/х2; 0,1/х3; 0/х4;}.


Математика

39

5) Наглядное представление операций над нечеткими множествами Для нечетких множеств можно строить визуальное представление. Рассмотрим прямоугольную систему координат, на оси ординат которой откладываются значения μA(x), на оси абсцисс в произвольном порядке расположены элементы U (мы уже использовали такое представление в примерах нечетких множеств). Если U по своей природе упорядочено, то этот порядок желательно сохранить в расположении элементов на оси абсцисс. Такое представление делает наглядными простые операции над нечеткими множествами.

Рис. 1.1.10. Графическое представление операций над нечеткими множествами

На верхней части рисунка заштрихованная часть соответствует нечеткому множеству A и, если говорить точно, изображает область значений А и всех нечетких множеств, содержащихся в A. На нижней даны Ā, A ∩ Ā, A ∪ Ā. 6) Свойства операций ∪ и ∩ Пусть А, В, С – нечеткие множества, тогда выполняются следующие свойства: x

A B A B

B A½ ¾ – коммутативность; B A¿

x

( A B) ɋ ( A B) C

A ( B A)½ ¾ – ассоциативность; A ( B A)¿


Э.Ф. Казанцев

40

x

A A A A

x

A (B ɋ) A (B C)

• • • • x

A½ ¾ – идемпотентность; A¿ ( A B) ( A C )½ ¾ – дистрибутивность; ( A B) ( A C )¿

A ∪ ∅ = A, где ∅ – пустое множество, т.е. µ∅(x) = 0 ∀>x∈U; A ∩ ∅ = ∅; A ∩ U = A, где U – универсальное множество; A ∪ U = U; A B A B

A B ½° ¾ – теоремы де Моргана. A B °¿

В отличие от четких множеств, для нечетких множеств в общем случае: A ∩ Ā ≠ ∅, A ∪ Ā ≠ U. Что, в частности, проиллюстрировано выше в примере наглядного представления нечетких множеств (рис. 1.1.10). 7) Алгебраические операции над нечеткими множествами а) Алгебраическое произведение A и B обозначается A⋅B и определяется так: ∀x∈U; µA⋅B(x) = µA(x)·µB(x). б) Алгебраическая сумма этих множеств обозначается

ˆ B и определяется так: A ∀x∈U; P A ˆ B P A ( x ) P B P A ( x)P B ( x).

Для операций {⋅, x x

ˆ } выполняются свойства:

A B B A ½ – коммутативность; ˆ B B ˆ A¾¿ A ( A B) ɋ ˆ B) ˆ C (A

A⋅∅ = ∅, A

A ( B A) ½ – ассоциативность; ˆ (B ˆ A) ¾¿ A

ˆ ∅ = A, A⋅U = A, A ˆ U = U;


Математика

x

41

ˆ B ½° A ¾ – теоремы де Моргана. ˆ B A B °¿ A A B

Не выполняются свойства идемпотентности и дистрибутивности: x

A A z A ½ ; ˆ A z A¾¿ A

x

ˆ ɋ ) z ( A B) ˆ ( A C) ½ A (B ; ˆ ˆ ˆ C )¾¿ A ( B C ) z ( A B) ( A

а также A·Ā ≠ ∅, A ˆ A z U . Для примера докажем закон де Моргана A B A ˆ B . Обо­ значим µA(x) через a, µB(x) через b. Тогда в левой части закона де Моргана имеем: 1 – ab, а в правой: (1 – a) + (1 – b) – (1 – a)(1 – b) = 1 – a + 1 – b + a + b – ab = = 1 – ab. Таким образом, левая и правая части совпадают. Докажем, что свойство дистрибутивности не выполняется, то есть A ( B ˆ C ) z ( A B) ˆ ( A C ). Для левой части имеем: а(b + + c – bc) = ab + ac – abc; для правой: ab + ac – (ab)(ac) = ab + + ac + a2bc. Это означает, что дистрибутивность не выполняется при a ≠ a2. г) На основе операции алгебраического произведения (по крайней мере для целых α эта основа очевидна) определяется операция возведения в степень α нечеткого множества A, где α – положительное число. Нечеткое множество Aα определяется функцией принадлежности P DA . Частным случаем возведения в степень являются: CON(A) = A2 – операция концентрирования, DIL(A) = A0,5 – операция растяжения, которые используются при работе с лингвистическими неопределенностями.


Э.Ф. Казанцев

42

Рис. 1.1.11. Графическое представление операции возведения в степень принадлежности нечеткого множества A

8) Расстояние между нечеткими множествами Пусть A и B – нечеткие подмножества универсального множества U. Введем понятие расстояния ρ(A, B) между нечеткими множествами. При введении расстояния обычно предъявляются следующие требования: а) ρ(A, B) ≥ 0 – неотрицательность; б) ρ(A, B) = ρ(A, B) – симметричность; в) ρ(A, B) < ρ(A, C) + ρ(C, B). К этим трем требованиям можно добавить четвертое: ρ(A, A) = 0. Определим следующие расстояния по формулам. Расстояние Хемминга (или линейное расстояние): U( A, B)

n

¦P

A ( xi ) P B ( xi )

.

i 1

Очевидно, что ρ(A, B) ∈ [0, n]. Евклидово или квадратичное расстояние: H ( A, B )

n

¦ P

A ( xi ) P B ( xi )

2 ,

> @

H ( A, B ) 0 , n .

i 1

Относительное расстояние Хемминга: U( A, B)

1 n

n

¦P i 1

A ( xi ) P B ( xi )

, U( A, B ) >0, 1@.


43

Математика

Относительное евклидово расстояние: H ( A, B )

1 n

n

¦ P

A ( xi ) P B ( xi )

2 ,

H( A, B ) >0, 1@ .

i 1

Задания для самостоятельной работы Даны нечеткие множества: А = {0,3 | х; 0,5 | у; 0,7 | z}; В = {1,0 | x; 0,6 | y; 0,4 | z} Найти: а) Α ∪ Ε, А ∩ Е, Ā, Ē; б) Α\Е, E\A, Ē\A; в) Α ⊕ Ε, A ⊕ Ē; г) Α ∩ Ē, Ē ∪ Α; д) A·E, E·Ā; е) ε(A, E), ρ(A, E).

1.2. Алгебра логики 1.2.1. Основные понятия Одной из главных задач математической логики является анализ оснований математики. Математическая логика нашла также свое приложение и в вопросах конструкции ЭВМ. С другой стороны, математическая логика – современный вид формальной логики, изучающей различные умозаключения. Пример: а) «Все люди смертны. Сократ – человек. Следовательно, Сократ смертен». б) «Все граждане России имеют право на образование. Иванов – гражданин России. Следовательно, Иванов имеет право на образование». Легко видеть, что везде использована одна и также формальная схема: «Все M суть P, S есть M. Следовательно, S есть P».


44

Э.Ф. Казанцев

Умозаключения, составленные по этой схеме, схоласты средних веков называли «силлогизмами первой фигуры по модусу Barbara». Начиная с Буля (конец XIX в.), который использовал идею Лейбница ввести в логику математическую символику, логика превратилась в математическую науку. Основная цель – свести операции с логическими заключениями к формальным действиям с символами. Приведем основные понятия математической логики. 1) Объекты с двумя возможными состояниями характеризуются булевыми переменными. Их обозначают символами: 0 и 1, или буквами: Л (ложно) и И (истинно). Множество {И, Л} называется множеством истинностных значений. 2) Высказыванием называется языковое предложение, о котором имеет смысл говорить, что оно истинно или ложно. Пример: «2 ⋅ 2 = 4», «5 – простое число» – это истинные высказывания. «Волга впадает в Черное море» – ложное высказывание. Предложения: «x + y = 4» и «Который час?», «Сегодня хорошая погода», «Город стоит на берегу реки» – не являются высказываниями, ввиду их недостаточной уточненности. 3) С помощью союзов «и», «или», «не», из нескольких простых высказываний можно составить сложное (составное) высказывание. П р и м е р : простые высказывания: «Москва стоит на берегу Невы» – ложное, «Санкт-Петербург стоит на берегу Невы» – истинное; сложные высказывания: «Москва не стоит на берегу Невы» – истинное, «Москва стоит на берегу Невы или Санкт-Петер­ бург стоит на берегу Невы» – истинное, «Москва стоит на берегу Невы и Санкт-Петербург стоит на берегу Невы» – ложное. 1.2.2. Логические операции (связки) 1) Отрицанием высказывания P называется высказывание, истинное тогда и только тогда, когда высказывание P ложно. Отрицание P обозначается через ¬P и читается как


45

Математика

«не P». Операция отрицания определяется таблицей истинности (табл. 1.2.1). Иногда отрицание обозначается y = x: y принимает значение 1, когда x = 0, и значение 0, когда x = 1 (читается «не x») (табл. 1.2.1а).

Таблица 1.2.1

Таблица 1.2.1а

Р

¬Р

х

x

И

Л

0

1

Л

И

1

0

2) Конъюнкцией двух высказываний P и Q называется высказывание, истинное тогда и только тогда, когда истинны оба высказывания. Конъюнкция обозначается через P & Q и читается как «P и Q». Операция конъюнкции определяется таблицей истинности (табл. 1.2.2). Конъюнкция иногда обозначается через x1 ∧ x2 и читается «x1 и x2». Значение 1 принимается тогда, когда x1 и x2 равны 1 (табл, 1.2.2а).

Таблица 1.2.2

Таблица 1.2.2а

P

Q

P&Q

x1

x2

И

И

И

0

1

И

Л

Л

0

0

0

Л

И

Л

1

0

1

Л

Л

Л

3) Дизъюнкцией двух высказываний P и Q называется высказывание, ложное тогда и только тогда, когда оба высказывания ложны.


Э.Ф. Казанцев

46

Дизъюнкция обозначается через P ∨ Q и читается «P или Q». Операция дизъюнкции определяется таблицей истинности (табл. 1.2.3). Другое обозначение дизъюнкции: y = x1 ∨ x2; y принимает значение 0 тогда, когда x1 и x2 равны 0 (табл. 1.2.3а).

Таблица 1.2.3 P

Q

P ∨ Q

И

И

И

И

Л

И

Л

И

И

Л

Л

Л

Таблица 1.2.3а x2

x1

0

1

0

0

1

1

1

1

В разговорной речи дизъюнкция соответствует союзу «или» в неразделительном смысле. 4) Импликацией двух высказываний P и Q называется высказывание, ложное тогда и только тогда, когда P истинно, а Q ложно. Импликация обозначается через P ⊃ Q (или P ⇒ Q) и читается как «P влечет Q», или «если P, то Q», «из P следует Q». Высказывание P называется посылкой импликации, а высказывание Q – заключением импликации. Операция импликации определяется таблицей истинности (табл. 1.2.4).

Таблица 1.2.4

Таблица 1.2.5

P

Q

P⊃Q

P

Q

P~Q

И

И

И

И

И

И

И

Л

Л

И

Л

Л

Л

И

И

Л

И

Л

Л

Л

И

Л

Л

И


Математика

47

5) Эквиваленцией двух высказываний P и Q называется высказывание, истинное тогда и только тогда, когда истинностные значения P и Q совпадают. Эквиваленция обозначается через P ~ Q и читается как «P эквивалентно Q». Операция эквиваленции определяется таблицей истинности (табл. 1.2.5). 6) Алфавитом логики высказываний называется любое непустое множество. Элементы этого множества называются символами данного алфавита. Словом в данном алфавите называется произвольная конечная последовательность символов. Слово A называется подсловом B, если B = B1⋅A⋅B2 для некоторых слов B1 и B2. Алфавит логики высказываний содержит следующие символы: а) высказывательные переменные X1; X2; X3;...; б) логические символы &, ∨, ~, ⊃; в) символы скобок (,). 7) Слово в алфавите логики высказываний называется формулой, если оно удовлетворяет следующему определению: а) любая высказывательная переменная – формула; б) если A и B – формулы, то (¬A), (A & B), (A ∨ B), (A ⊃ B), (A ~ B) – тоже формулы; в) только те слова являются формулами, для которых это следует из а) и б). Подформулой формулы A называется любое подслово A, само являющееся формулой. 8) Выражения типа (X1 ⊃ X2)∨(X1 ⊃ (X1&X2)) называются логическими формулами и имеют таблицы истинности. П р и м е р 1. Вычислим формулу (X1 ⊃ X2) ∨ (X1 ⊃ (X1 & X2)) (табл. 1.2.6).


Э.Ф. Казанцев

48

Таблица 1.2.6 X1

X2

X1 ⊃ X2

X2 & X1

X1 ⊃ (X2 & X1)

(X1 ⊃ X2) ∨ (X1 ⊃ (X2 & X1)

И

И

И

И

И

И

И

Л

Л

Л

Л

Л

Л

И

И

Л

И

И

Л

Л

И

Л

И

И

П р и м е р 2. Вычислим формулу (X 1 ⊃ X 2 )∨ ¬X 3 (табл. 1.2.7). Таблица 1.2.7 X1

X2

X3

X1 ⊃ X2

¬X3

(X1 ⊃ X2) ∨ ¬X3

И

И

И

И

Л

И

И

И

Л

И

И

И

И

Л

И

Л

Л

Л

И

Л

Л

Л

И

И

Л

И

И

И

Л

И

Л

И

Л

И

И

И

Л

Л

И

И

Л

И

Л

Л

Л

И

И

И

9) Упорядоченный набор высказывательных переменных <X1,..., Xn> называется списком переменных формулы A, если все переменные формулы A содержатся в этом наборе. Часть переменных может быть фиктивной (избыточной), то есть не входить в формулу A. Оценкой списка называется сопоставление каждой переменной списка некоторого истинностного значения. Если список содержит k переменных, то имеется 2k различных оценок. Следовательно, таблица истинности этой формулы имеет 2k строк.


Математика

49

10) Пусть A и B – две формулы, зависящие от одного и того же списка переменных <X1,..., Xn>. Будем называть их равносильными, если на любой оценке списка <X1,..., Xn> они принимают одинаковые значения. Равносильность обозначается A = B. Нужно различать символы ~ и =. Так, ~ является символом формального языка, с помощью которого строятся формулы, а символ = заменяет слово «равносильно». 1.2.3. Основные равносильности а) Булева алгебра: 1) A & B = B & A (коммутативность относительно &). 2) A & A = A (идемпотентность относительно &). 3) A & (B & C) = (A & B) & C (ассоциативность относительно &). 4) A ∨ B = B ∨ A (коммутативность относительно ∨). 5) A ∨ A = A (идемпотентность относительно ∨). 6) A ∨ (B ∨ C) = (A ∨ B) ∨ C (ассоциативность относительно ∨). 7) A ∨ (B & C) = (A ∨ B) & (A ∨ C) (дистрибутивность ∨ относительно &). 8) A & (B ∨ C) = (A & B) ∨ (A & C) (дистрибутивность & относительно ∨). 9) A & (A ∨ B) = A (первый закон поглощения). 10) A ∨ (A & B) = A (второй закон поглощения). 11) ¬¬A = A (снятие двойного отрицания). 12) ¬(A & B) = ¬A ∨ ¬B (первый закон де Моргана). 13) ¬(A ∨ B) = ¬A & ¬B (второй закон де Моргана). 14) A = (A & B) ∨ (A & ¬B) (первая формула расщепления). 15) A = (A ∨ B) & (A ∨ ¬B) (вторая формула расщепления). 16) Свойства констант: X ∨ 0 = X; X & 1 =1; X ∨ 1 = 1; X & 0 = 0. 17) Свойства отрицания: X ∨ ¬X = 1; X & ¬X = 0; ¬1 = 0; ¬0 = 1.


Э.Ф. Казанцев

50

б) Любая равносильность может быть доказана с помощью таблиц истинности. П р и м е р . Докажем равносильность 7): A ∨ (B & C) = = (A ∨ B) & (A ∨ C). Вычислим левую и правую часть данной равносильности (табл. 1.2.8). Таблица 1.2.8 A

B

C

B&C

A∨ (B & C)

A∨B

A∨C

(A ∨ B) & (A ∨ C)

1

2

3

4

5

6

7

8

И

И

И

И

И

И

И

И

И

И

Л

Л

И

И

И

И

И

Л

И

Л

И

И

И

И

И

Л

Л

Л

И

И

И

И

Л

И

И

И

И

И

И

И

Л

И

Л

Л

Л

И

Л

Л

Л

Л

И

Л

Л

Л

И

Л

Л

Л

Л

Л

Л

Л

Л

Л

Нетрудно видеть, что 5 и 8 колонки совпадают, то есть равносильность 7 доказана. в) Равносильности можно доказывать допустив некоторое значение формулы: И или Л. П р и м е р . Докажем равносильность 12): ¬(A & B) = ¬A ∨ ¬B. Пусть ¬(A & B) → Л, тогда (A & B) → И, т.е. A, B → И, поэтому правая часть равносильности 12: Л ∨ Л → Л, таким образом Л ≡ Л. г) Равносильности можно доказать, делая тождественные преобразования. П р и м е р . Докажем равносильность 5): A ∨ A = A.


Математика

51

A ∨ A = (A ∨ A) & 1 ≡ (A ∨ A) & (A ∨ ¬A) = A ∨ (X & ¬X) = = A ∨ 0 = A. Одни связки могут быть выражены через другие: 18) A ~ B = (A ⊃ B) & (B ⊃ A) = (A & B) ∨ (¬A & ¬B). 19) A ⊃ B = ¬A ∨ B = ¬(A & ¬B). 20) A ∨ B = ¬A ⊃ B = ¬(¬A & ¬B). 21) A & B = ¬(A ⊃ ¬B) = (¬(¬ A ∨ ¬B)). В силу транзитивности отношения равносильности, если A1 = A2, A2 = A3,..., Ak-1 = Ak, то A1 = Ak. Для простоты будем записывать цепочку: A1 = A2 = A3 =…= Ak. ж) Правила перехода от одних равносильностей к другим: П р а в и л о 1. Пусть A = B и C – произвольная формула. Тогда ¬A = ¬B, A & C = B & C, C & A = C & B, A ∨ C = B ∨ C, C ∨ A = C ∨ B, A ⊃ C = B ⊃ C, C ⊃ A = C ⊃ B, A ~ C = B ~ C, C ~ A = C~B. П р а в и л о 2. Пусть A = B и C – формула, в которой выделено одно вхождение переменной Xi. Пусть CA получается из C заменой этого вхождения Xi на A, а CB – из C заменой того же вхождения Xi на B. Тогда CA = CB. П р а в и л о 3. (Правило равносильных преобразований). Пусть CA – формула, содержащая A в качестве своей подформулы. Пусть CB получается из CA заменой A в этом вхождении на B. Тогда, если A = B, то CA = CB. П р а в и л о 4. (Правило устранения логических символов ⊃ и ~). Для каждой формулы можно указать равносильную ей формулу, не содержащую логических символов ⊃ и ~. A ~ B = (A & B) ∨ (¬A & ¬B). A ⊃ B = ¬A ∨ B. П р и м е р : (X1 ⊃ (X2 ⊃ X3)) ~ ¬(X2 ⊃ X1) = (X1 ⊃ (¬X2 ∨ X3)) ~ (¬(¬X2 ∨ X1)) = (¬X1 ∨ (¬X2 ∨ X3)) ~ ¬(¬X2 ∨ X1) = ((¬X1 ∨ (¬X2 ∨ X3)) & ¬(¬X2 ∨ X1) ∨ (¬(¬X1 ∨ (¬X2 ∨ X3)) & (¬X2 ∨ X1)).


52

Э.Ф. Казанцев

1.2.4. Графическое представление связок

Здесь области истинных значений заштрихованы. Операцию конъюнкции называют логическим умножением, поэтому часто вместо X1 & X2 пишут X 1X2. Операцию дизъюнкции ∨ называют логическим сложением. Булева алгебра имеет дело с двумя логическими операциями: & и ∨. Если имеется формула, то можно заменить буквы предложениями. Пример: P ⊃ Q & R (P – «идет снег», Q – «2 ⋅ 2 = 4», R – «слоны зеленые»). Получим фразу: «Если идет снег, то 2 ⋅ 2 = 4 и слоны зеленые». Истинность этой фразы определяется таблицей истинности и не связана с ее конкретным содержанием. Наш здравый смысл подсказывает нам, что нелепо подвергать сомнению истину «2 ⋅ 2 = 4», или нелепо утверждать:


Математика

53

«слоны зеленые». Кроме того, между посылкой и следствием нет причинной связи. Однако не надо спешить. Надо преодолеть психологический барьер и не основываться на здравом смысле! Человек, не видевший снег, считает фразу «идет снег» бессмысленной, а слоны могут быть игрушечными и так далее. Поиск смысла предложения должен быть проведен после завершения всех логических операций. 1.2.5. Контактные схемы Приложение логики высказываний к теории электрических сетей. 1) Рассмотрим электрическую схему, состоящую из следующих элементов:

На рис. 1.2.9 изображены три электрические схемы: Пусть ключи управляются кнопками, (1) – кнопка нажата, (0) – кнопка отпущена. В исходном состоянии – ключ разомкнут.

Рис. 1.2.9


54

Э.Ф. Казанцев

При нажатии кнопки – ключ замыкается. Нормально замкнутые ключи обозначим через X1 и X2. Лампочка горит – (1); не горит – (0). Состояние кнопок – значение булевых переменных; состояние лампочки – значение формулы (функции): На рис. 1.2.9: а) X – отрицание – ключ разомкнут, лампочка не горит; б) лампочка горит при нажатии хотя бы одной кнопки – это можно изобразить в виде дизъюнкции; в) лампочка горит только при нажатии обеих кнопок одновременно – это можно изобразить в виде конъюнкции. 2) В электрических цепях роль ключей играют многочисленные устройства: выключатели, электромагнитные реле и так далее. В более широком смысле ключом является всякое устройство, способное принимать одно из двух возможных состояний: механические защелки, дверные замки, ж/д светофоры и так далее. Разомкнутый контакт – Xi, замкнутый контакт – Xi. Вместо ключей на схеме можно сразу писать или Xi, или X i. Электрической схеме на рисунке 1.2.10 соответствует формула: Y = ((X1 ∨ X2) & X3) ∨ (X2 & X3) ∨ ((X1 & X3) ∨ (X2 & X3) & X4).

Рис. 1.2.10

3) Контактные схемы можно упрощать с помощью тождественных преобразований соответствующих им формул.


Математика

55

Электрической схеме на рис. 1.2.11 соответствует формула: y = (Y & Z) ∨ (X & Y & Z) ∨ (X & Y & Z).

Рис. 1.2.11

Упростим данную формулу путем тождественных преобразований: (Y & Z) ∨ (X & Y & Z) ∨ (X & Y & Z) = (Y & Z) ∨ (Y & Z) & (X ∨ X) = Z & (Y ∨ Y) = Z Таким образом, исходной электрической схеме соответствует эквивалентная схема, изображенная на рисунке:

1.2.6. Тождественно-истинные формулы (тавтологии) Пусть формула A зависит от списка переменных (Xi,...,Xi). 1) Формула A называется тавтологией (или тождественноистинной), если на любых оценках списка переменных (Xi,..., Xi) она принимает значение И. 2) Формула A называется выполнимой, если на некоторой оценке списка переменных (Xi,..., Xi) она принимает значение И. 3) Формула A называется тождественно-ложной, если на любых оценках списка переменных (Xi,..., Xi) она принимает значение Л. 4) Формула A называется опровержимой, если на некоторой оценке списка переменных (Xi,..., Xi) она принимает значение Л. Как и в определении равносильности, здесь не имеет значения, будут ли в списке фиктивные переменные.


56

Э.Ф. Казанцев

С точки зрения логики тавтология суть не что иное, как логические законы, ибо при любой подстановке вместо переменных тавтологии конкретных высказываний в результате получим истинные высказывания. 10) Основные тавтологии: а) A ∨ ¬A (закон исключения третьего или tertium nondatur); б) A ⊃ A; в) A ⊃ (B ⊃ A); г) (A ⊃ B) ⊃ ((B ⊃ C) ⊃ (A ⊃ C)) (цепное рассуждение); д) (A ⊃ (B ⊃ C)) ⊃ ((A ⊃ B) ⊃ (A ⊃ C)); е) (A & B) ⊃ A; (A & B) ⊃ B; ж) A ⊃ (B ⊃ (A & B); з) A ⊃ (A ∨ B); B ⊃ (A ∨ B); и) (¬ B ⊃¬ A) ⊃ ((¬ B ⊃ A) ⊃ B); к) ((A ⊃ B) ⊃ A) ⊃ A (закон Пирса). Доказательство каждой тавтологии можно провести, составив таблицу истинности при произвольных значениях A, B и C. При доказательстве мы используем рассуждения, которые на языке логики можно выразить формулами. 11) Рассуждение называется правильным, если из конъюнкции посылок следует заключение, то есть всякий раз, когда все посылки истинны, заключение тоже истинно: (P1 &...& Pn) ⊃ Q. Схема правильного рассуждения: (P1...Pn) / Q – то есть из данных посылок P1...Pn следует заключение Q. Пример: а) «Если число 5 простое, то оно нечетное. Пусть число 5 нечетное. Следовательно, оно простое». Заключение истинно, но рассуждение неправильное. Это рассуждение по схеме: (A ⊃ B, B) / A; легко проверить, что формула ((A ⊃ B) & B) ⊃ A не является тождественно-истинной. б) «Если Петр занимается спортом, то Петр никогда не болеет. Петр занимается спортом. Следовательно, Петр никогда не болеет». Это рассуждение по схеме: (A ⊃ B, A)/B. Формула ((A ⊃ B) & A) ⊃ B – тождественно – истинно, значит рассуждение правильное.


Математика

57

Правильными рассуждениями будут схемы: (A ⊃ B, A) / B и (A ⊃ B, ¬B) / ¬A. 12) Пусть дано условное высказывание A ⊃ B, где A – конъюнкция посылок, B – заключение. Иногда удобнее доказывать истинность не этого условия, а установить логическую истинность другого высказывания, равносильного исходному. Такие формы доказательств называются косвенными методами доказательства. Одним из них является способ доказательства от противного. Предположим, что утверждение A ⊃ B ложно. Тогда, исходя из этого предположения, приходим к противоречию, то есть доказываем, что некоторое утверждение (C) выполняется и не выполняется (одновременно): A ⊃ B = ¬(A B) ⊃ (C & ¬C) = (A & ¬B) ⊃ (C & ¬C). Существуют и другие схемы доказательства от противного: A ⊃ B = (A &¬ B) ⊃ A. A ⊃ B = (A &¬ B) ⊃ D. A ⊃ B = ¬B ⊃ ¬A (закон контрапозиции). П р и м е р . Проверить правильность рассуждения «Если цены высоки, то и заработная плата высока, цены высоки или применяется регулирование цен. Если применяется регулирование цен, то нет инфляции. Наблюдается инфляция. Следовательно, заработная плата высока». Обозначим: A – цены высоки, B – заработная плата высока, C – применяется регулирование цен, D – наблюдается инфляция. Запишем четыре посылки и заключение каждого рассуж­ дения: P1 P2 P3 P4

A B ½ A C °° ¾ B. C D ° °¿ D


58

Э.Ф. Казанцев

Логическая схема: A B , A C ,C D , D . B

Задача сводится к проверке на тождественность истинность формулы: F = ((A ⊃ B) & (A ∨ C) & (C ⊃ ¬D) & D) ⊃ B. Рассуждаем от противного: F → Ложно, то есть найдутся такие переменные (оценки), что F = Л, таким образом, B = Л, а слева все скобки → И. Следовательно: (A ⊃ B) = И; (A ∨ C) = И; (C ⊃ ¬D) = И; D = И. Из (C ⊃ ¬D) = И, так как D = Л, следует C = Л. Из (A ∨ C) = И следует (A ∨ Л) = И, то есть A = И. Из (A ⊃ B) = И следует (И ⊃ B) = И, то есть B = И. То есть мы получим, что заработная плата высока – это истина (B = И), а предполагали, что это ложь: B = Л. Таким образом, мы получили противоречие, значит, наша формула тождественно-истинна и рассуждение является правильным. 13) Двойственность Символы &, ∨ называются двойственными друг другу. Формула A* называется двойственной формуле A, если она получена из A одновременной заменой всех символов &, ∨ на двойственные. Очевидно, что (A*)* = A. П р и м е р : формула X1 & (X2 ∨ X1) двойственна формуле X1 ∨(X2 & X1). П р а в и л о 1. Пусть (Xi,..., Xi) – список переменных, а (s1,..., sk) – его оценка. Назовем оценку (t1,..., tk) двойственной оценке (s1,..., sk), если она получается из (s1,..., sk) заменой всех И на Л и Л на И. Пусть A – формула, а (Xi,..., Xi) – список ее переменных. Тогда A принимает значение И на оценке (s1,..., sk) в том и только в том случае, если A* принимает значение Л на оценке (t1,..., tk), двойственной оценке (s1,..., sk). П р а в и л о 2. (Принцип двойственности). Если A = B, то * A = B*. Это можно использовать для нахождения новых равно-


Математика

59

сильностей: из равносильности: Xi & (Xj ∨ Xk) = (Xi & Xj) ∨ (Xi & Xk) можно получить: Xi∨(Xj&Xk) = (Xi ∨ Xj) & (Xi ∨ Xk). 1.2.7. Нормальная форма формул 1) В силу ассоциативности операций & и ∨, как бы мы не расставляли скобки в выражениях A1 & A2 &...& Ak; A1 ∨ A2 ∨...∨ Ak всегда будем приходить к равносильным формулам. Будем считать каждое из этих выражений формулой и называть соответственно многочленной конъюнкцией и дизъюнкцией формул A1...Ak. Для этих формул нетрудно получить равносильности, выражающие обобщенную дистрибутивность: а) (A1 & A2 &...& Ak) ∨ (B1 & B2 &...& Bl) = (A1 ∨ B1) & (A1 ∨ B2) &...& (A1 ∨ Bl) & (A2 ∨ B1) & (A2 ∨ B2) &...& (A2 ∨ Bl) &...& (Ak ∨ B1) & (Ak ∨ B2) &...& (Ak ∨ Bl); б) (A1 ∨ A2 ∨...∨ Ak) & (B1 ∨ B2 ∨...∨ Bl) = (A1 & B1) ∨ (A1 & B2) ∨...∨ (A1 & Bl) ∨ (A2 & B1) ∨ (A2 & B2) ∨...∨ (A2 & Bl) ∨...∨ (Ak & B1) ∨ (Ak & B2) ∨...∨ (Ak & Bl); а также имеет место обобщенный закон де Моргана: а) ¬(A1 &...& Ak) = ¬A1 ∨...∨ ¬Ak; б) ¬(A1 ∨...∨ Ak) = ¬A1 &...& ¬Ak; 2) Формулу называют элементарной конъюнкцией, если она является конъюнкцией переменных и отрицаний переменных (конъюнкция может быть и одночленной). Пример. а) X2; ¬X3; X2 & ¬X3; X2 & X3; X1 & ¬X2 & X4 & X2. б) X1 & X2 & X3 – то есть не обязательно регулярное чередование переменных и их отрицаний. 3) Говорят, что формула находится в дизъюнктивной нормальной форме (ДНФ), если она является дизъюнкцией элементарных конъюнкций (ДНФ может быть и одночленной).


60

Э.Ф. Казанцев

П р и м е р . X2; ¬X3; (X1 & X2 & X3); (X1 & X2 & ¬X3)∨(X1 & ¬X2 & X3). Правило приведения к ДНФ: для любой формулы A можно найти такую формулу B, находящуюся в ДНФ, что A = B. 1 этап: для формулы A строим такую формулу A1, что A = A1 и в A1 не содержится символов ~, ⊃. 2 этап: для формулы A1 находим такую формулу A2, что A1 = A2 и в A2 отрицание находится только перед переменными. Такая форма называется формулой с «тесными» отрицаниями. Здесь используются законы де Моргана и уничтожения пар стоящих рядом отрицаний: П р и м е р . ¬[¬¬(X1 & ¬X2)∨(X2 & ¬X1)] = (¬ ¬ ¬X1 & X2) & ¬(X2 & ¬X1) = ¬(X1 & ¬X2) & (¬X2 ∨ ¬¬X1) = (¬X1 ∨ ¬¬X2) & (¬X2 ∨ X1) = (¬X1 ∨ X2) & (¬X2 ∨ X1). 3 этап: A2 – то формула из переменных и их отрицаний в форме многочленной конъюнкции и дизъюнкции. Теперь, применив обобщенную дистрибутивность & относительно ∨, последовательно преобразуем полученную формулу (помним, что ∨ – аналогична сложению, & – умножению). Продолжаем начатый пример: (¬X1 ∨ X2) & (¬X2 ∨ X1) = (¬X1 & ¬X2) ∨ (¬X1 & X1) ∨ (X2 & ¬X2) ∨ (X2 & X1), т.е. получили формулу, находящуюся в ДНФ. 4) Говорят, что формула A находится в конъюктивной нормальной форме (КНФ), если формула A* определена (то есть в A нет символов ~ и ⊃) и находится в ДНФ. Формулу называют элементарной дизъюнкцией, если она является дизъюнкцией переменных и отрицаний переменных (дизъюнкция может быть и одночленной). Таким образом, формула находится в КНФ, если она является конъюнкцией элементарных дизъюнкций. Правило приведения к КНФ: для любой формулы A можно найти такую формулу B, что A находится в КНФ и A = B. Формула B называется конъюнктивной нормальной формой формулы A.


Математика

61

5) Совершенная дизъюнктивная нормальная форма Очевидно, что ДНФ не является однозначно определенной. Например, формула X1 ∨ (X2 & X3) уже находится в ДНФ. В то же время, сделав преобразование: X1 ∨ (X2 & X3) ≡ (X1 ∨ X2) & (X1 ∨ X3) ≡ (X1 & X1) ∨ (X1 & X3) ∨ (X2 & X1) ∨ (X2 & X3), мы получим другую ДНФ. Конечно, все ДНФ данной формулы будут равносильны. Свойством единственности обладает, так называемая, совершенная дизъюнктивная нормальная форма. Говорят, что формула А находится в совершенной дизъюнктивной нормальной форме (СДНФ), если выполняются следующие условия: а) формула А находится в ДНФ; б) каждый дизъюнктивный член формулы А является k-членной конъюнкцией, причем на l-м месте (1 ≤ l ≤ k) этой конъюнкции стоит либо переменная Х, либо ее отрицание Х; в) все дизъюнктивные члены формулы А попарно различны. П р и м е р : 1) ¬X1 & ¬X2 & ¬X3; 2) (X1 & X2 & X3) ∨ (¬X1 & X2 & X3) ∨ (X1 & X2 & ¬X3). Правила получения СДНФ: 1) для формулы А получаем любую ДНФ; 2) из ДНФ формулы А путем преобразований получаем СДНФ следующим образом: а) пусть формула В есть слагаемое ДНФ не содержащее переменной Х, тогда надо заменить слагаемое В на слагаемое B & (x ∨ x) ≡ (B & x) ∨ (B & x) по формуле расщепления; б) если в ДНФ формулы А встретятся два одинаковых слагаемых B ∨ B, то лишнее надо отбросить, так как B ∨ B ≡ B; в) если в некоторое слагаемое В переменная Х входит дважды, лишнюю переменную надо отбросить, так как X & X ≡ X; г) если слагаемое В содержит конъюнкции X & X, то это слагаемое можно отбросить, так как X ∨ X ≡ 0, следовательно, B ≡ 0, а ложное высказывание из дизъюнкции можно выбросить, так как C ∨ C ≡ C. П р и м е р : привести к СДНФ следующую формулу: (X1 & ¬X1 & X3) ∨ (X1 & ¬X3 & X1) ∨ X2 ≡


Э.Ф. Казанцев

62

Первую элементарную конъюнкцию (X1 & ¬X1 & X3) отбрасываем по свойству г), во второй элементарной конъюнкции (X1 & ¬X3 & X1) можно оставить только одно вхождение Х1 по свойству в). Затем проводим преобразования по формуле расщепления: ≡ (X1 & ¬X3) ∨ X2 ≡ (X1 & ¬X3 & X2) ∨ (X1 & ¬X3 & ¬X2) ∨ (X2 & X1) ∨ (X2 & ¬X1) ≡ (X1 & ¬X3 & X2) ∨ (X1 & ¬X3 & ¬X2) ∨ (X1 & X2 & X3) ∨ (X2 & X1 & ¬X3) ∨ (X2 & ¬X1 & X3) ∨ (X2 & ¬X1 & ¬X3) ≡ (X1 & X2 & ¬X3) ∨ (X1 & ¬X2 & ¬X3) ∨ (X1 & X2 & X3) ∨ (¬X1 & X2 & X3) ∨ (¬X1 & X2 & ¬X3). Здесь (X2 & X1 & ¬X3) встречается два раза, поэтому одно отбрасываем, а остальные располагаем в порядке возрастания индексов, что позволяет легко обнаружить одинаковые и отбросить лишние. Различные СДНФ формулы А могут отличаться только порядком следования своих дизъюнктивных членов, то есть СДНФ – единственна. Аналогично определяется совершенная конъюнктивная нормальная форма (СКНФ). 1.2.8. Логические функции Функцией алгебры логики (или логической функцией) от n переменных f(x1…xn) называется n-арная операция на множестве {0, 1}, то есть функция, принимающая значения 0 и 1. Всякая логическая функция n переменных может быть задана таблицей истинности. Логических функций одной переменной – четыре: (табл. 2.1.13). Таблица 2.1.13 х

ϕ0

ϕ1

ϕ2

ϕ3

0

0

0

1

1

1

0

1

0

1


63

Математика

Функции ϕ0 и ϕ3 – константы 0 и 1, ϕ1 = х; ϕ2 = х. Логических функций двух переменных – 16: (табл. 2.1.14). Таблица 2.1.14 x1

x2

ψ0

ψ1

ψ2

ψ3

ψ4

ψ5

ψ6

ψ7

ψ8

ψ9

ψ10

ψ11

ψ12

ψ13

ψ14

ψ15

0

0

0

0

0

0

0

0

0

0

1

1

1

1

1

1

1

1

0

1

0

0

0

0

1

1

1

1

0

0

0

0

1

1

1

1

1

0

0

0

1

1

0

0

1

1

0

0

1

1

0

0

1

1

1

1

0

1

0

1

0

1

0

1

0

1

0

1

0

1

0

1

ψ0 и ψ15 – константы 0 и 1; ψ 3 = x 1; ψ 5 = x 2; ψ12 = x1; ψ10 = x2; ψ3 = x1 & x2 – конъюнкция; ψ7 = x1 ∨ x2 – дизъюнкция; ψ13 = x1 ⊃ x2 – импликация; ψ9 = x1 ~ x2 – эквиваленция; ψ8 = x1 ↓ x2 – стрелка Пирса; ψ14 = x1  x2 – штрих Шеффера; ψ11 = x1 o x2 – функция Вебба; ψ4 = x2 ⊃ x1 – импликация; ψ6 = x1 ⊕ x2 – сложение по модулю 2 (функция Жегалкина); ψ2 = ψ13. Суперпозицией функций f1…fn называется функция f, полученная с помощью подстановок этих функций друг в друга и переименования переменных. Формулой называется выражение, описывающее эту суперпозицию. Символы переменных (x1…xn) называются формулами глубины 0. Формула глубины 1 получается путем переименования одной из переменных. Формула глубины 2 получается подста-


64

Э.Ф. Казанцев

новкой некоторой функции fl вместо какой-либо переменной xj и т.д. Например, формула глубины 3, содержащая одну подформулу глубины 2 и две – глубины 1, выглядит так: f3 (f1(x3, x1); f2 (x1, f1(x1, x2)). Всякая формула, выражающая функцию f как суперпозицию других функций, задает способ ее вычисления. П р и м е р : F = (x3 ∨ x1) ⊕ (x1 & (x1 ⊕ x2)). Вычислим F при значении x1 = 1; x2 = 1; x3 = 0: x1 ⊕ x2 = 0; x3 ∨ x1 = 1; x1 & (x1 ⊕ x2) = x1 & 0 = 0; F = (x3 ∨ x1) ⊕ ⊕ (x1 & (x1 ⊕ x2)) = 1 ⊕ 0 =1, то есть мы вычислили одну строчку из таблицы истинности 1.7.8. Вычислив все остальные строчки, можно восстановить таблицу функции. ДНФ всегда имеет глубину 2. Нетрудно заметить, что СДНФ функции f содержит ровно столько конъюнкций, сколько единиц в таблице истинности для f. Таким образом, существует взаимнооднозначное соответствие между таблицей функции f(x1…xn) и ее СДНФ. Следовательно, как мы уже видели ранее, СДНФ для всякой логической функции единственна. Пример: функция, заданная таблицей 1.5.8, имеет следующую СДНФ: ( x1 & x2 & x3 ) ( x1 & x2 & x3 ) ( x1 & x2 & x3 ) ( x1 & x2 & x3 ).

Алгебра (P 2; ∨; &; ¬) – основным множеством которой является множество логических функций, а операциями – дизъюнкция, конъюнкция и отрицание, называется булевой алгеброй логических функций. Фактически мы имеем дело не с самими функциями, а с представляющими их формулами, то есть с алгеброй формул, которых гораздо больше, чем функций (каждую функцию представляет бесконечное число формул). Таким образом, логическую функцию можно задать двумя способами: табличным и формульным. Табличный способ универсален, единственен, но громоздок. Формула более ком-


Математика

65

пактна, но задает функцию через композицию других функций. Возникает вопрос, всякая ли логическая функция представима формулой. Для булевой системы функций Σ0 = {&, ∨, ¬} – такая формула существует – это СДНФ, значит она функционально полна. Как решается этот вопрос для произвольной системы функции ∑? Этот вопрос решается с помощью понятий полноты и замкнутости функций. Система функций ∑ называется функционально полной системой, если любая логическая функция может быть представлена формулой, т.е. является суперпозицией функций из системы ∑. а) система Σ0 = {&, ∨, ¬} функционально полна; б) системы Σ 1 = {&, ¬} и Σ 2 = {∨, ¬} также функционально полны. Действительно, из законов де Моргана и двойного отрицания следует, что в каждой из этих двух систем, недостающая до ∑ 0 функция выражается через остальные две: x1 x2

x1 & x2 ; x1 & x2

x1 x2 .

Например, булева формула x1 x2 x2 ( x3 x4 ) в системе ∑ 1 перейдет в формулу x1 x2 x2 x3 x4 , в системе ∑2 – в формулу x1 x2 x2 x3 x4 .

То есть с точки зрения функциональной полноты систему ∑0 можно считать избыточной, так как она сохраняет свойства полноты и при удалении из нее дизъюнкции или конъюнкции. Однако, как видно из примеров, за неизбыточность систем ∑1 и ∑2 приходится платить избыточностью формул (большое число отрицаний). 1.2.9. Алгебра Жегалкина 1) Алгебра с двумя бинарными операциями & и ⊕ называется алгеброй Жегалкина. Функцию X & Y можно писать XY. См. табл. 2.1.16 истинности для X ⊕ Y и XY:


Э.Ф. Казанцев

66

Таблица 2.1.16 X

Y

X ⊕ Y

XY

1

1

0

1

1

0

1

0

0

1

1

0

0

0

0

0

Основные равносильности алгебры Жегалкина: 1) X ⊕ Y = Y ⊕ X; 1′) X ⋅ Y ≡ Y ⋅ X; 2) X(Y ⊕ Z) = XY ⊕ XZ; 2′) X(Y ⋅ Z) = XY ⋅ XZ 3) (X ⊕ Y) ⊕ Z ≡ X⊕ (Y ⊕ Z); 3′) (X ⋅ Y)Z ≡ X(Y ⋅ Z); 4) X ⊕ X = 0; 4′) X ⋅ X = X; 5) X ⊕ 0 = X; 5′) X ⋅ 0 = 0; X ⋅ 1= X. Все тождества, кроме 4) и 4′), аналогичны арифметическому сложению и умножению, поэтому эта алгебра иногда называется арифметикой по mod2. Отрицание: X ≡ X ⊕ 1, т.к. 1 = 1 ⊕ 1 = 0; 0 = 0 ⊕ 1 = 1. Дизъюнкция: x ∨ y ≡ (X ⋅ Y) ≡ (X ⊕ 1)(Y ⊕ 1)⊕ 1 ≡ XY ⊕ X ⊕ Y ⊕ 1 ⊕ 1 ≡ ≡ XY ⊕ X ⊕ Y; x ∨ y ∨ Z ≡ XYZ ⊕ XY ⊕ XZ ⊕ X ⊕ Y ⊕ Z ⊕ XZ. Нетрудно видеть, что если в произвольной формуле алгебры Жегалкина раскрыть скобки и произвести все возможные упрощения, то получится формула, имеющая вид суммы произведений, называемая полиномом по mod2. От булевой формулы всегда можно перейти к формуле алгебры Жегалкина, и, следовательно, многочлену Жегалкина.


67

Математика

Дифференцирование булевых функций f (X1, X2, …, Xm): а) производная 1-го порядка: wf wxn

f X 1 , X 2 ,..., X n 1 , 1, X n 1 , X m f X 1 , X 2 ,..., X n 1 , 0, X n 1 , X m ;

б) производная k-го порядка: w k f x1 x2 ...xk1 ...xk

w x1 x2 xk

w2 f

wf

w3 f

¦ wx ¦ wx wx ¦ wx wx wx 1

i

i, j

i

j

i

i , j ,s

j

... s

wk f . wxi wxk

Пример: f (X1, X2, X3) = (X2X3) ∨ (X1X2X3);

X

> X X X X X X @ > X X X X X > X X X X X X @ X X X

wf wx1

2

2

2X3

X2X3 X 2 X 3

3

2

3

2

3

2

3

3

2

2

3

3

2

2

3

3

@

X

2X3 2X3

2X3

> X 2 X 3 X 2 X 3 X 2 X 3 @ > X 2 X 3 X 2 X 3 X 2 X 3 @ X 2 X 3 X 2 X 3

> X 2 X 3 X 2 X 3 @ X 2 X 3 X 2 X 3 ; в) смешанная производная: w k f x1 x2 ...xk1 ...xk

wx1wx2 ...wxk 1wxk

w wxk

§ w k 1 f x1 ...xk1 ...xk · ¸. ¨ ¸ ¨ wx wx ...wx 1 2 k 1 ¹ ©

Пример: f (X1, X2, X3) = X1X2 ∨ X1X3; wf wx1

X2 X3 0

X2 X3 ;

wf X1 X1 X 3 X1 X 3 wx 2 X1 1 X 3 1 X1X 3 ;

X1 X1 X 3

X1 1 X 3


Э.Ф. Казанцев

68

wf wx3

>X

X1 X 2 X1 X 2 X1

X 1 X 2 1

@

X1 X 2 X1

1

X1 X 2 ;

w2 f wx1wx2

w X2 X 3 wx2

w2 f w x1 x2

wf wf w2 f wx1 wx2 wx1wx2

X X X

0; X 3

3

1 X 3

1 X 3 1

X

X 3;

X 3 X1X 3 X 3

2

X X X X

X X X X X X

X X X X X X X X X

2

X 3 X 3 X 1 1

2

X3

2

X3

1

3

2

3

1

3

3

1

3

2

3

1

2

1

3

3

3

1

2

X 1 X 2X3

X 3 X1 X 2 X 3.

w2 f wx1wx3

w § wf · ¨ ¸ wx3 ¨© wx3 ¸¹

w2 f wx2 wx3

w § wf · ¨ ¸ wx3 ¨© wx2 ¸¹

w3 f w x1 x2 x3

X X X X > X X X

2 2 2 2 2

3

3

w X2 X 3 wx3

X 2 X 2 1

X 2 1

w §¨ w 2 f ·¸ wx1 ¨© wx2 wx3 ¸¹

3 w X1 X 3 ; w f wx3 wx1wx2 wx3

X 2;

w x1 1; wx1

wf wf wf w2 f w2 f w2 f w3 f wx1 wx2 wx3 wx1wx2 wx1wx3 wx2wx3 wx1wx2wx3

X X X 1 X X 1 X X X X X X X 1

X X X X X X X X X X X X X X X X X X @ X X X X X X X X X X X X X X X X X X X X X X X X X X X X X

X 3 X1 X 3 X1 X 2 X 3 X 2 X1 1 3

3

3

1

3

1

2

3

1

3

1

2

3

2

1

1

3

1

2

1

1

2

1

1

2

1

3

1

2

3

2

3

2

2

2

1

1

2

3

1

3

3

1

1

1

2

2

1

2

2

1

3

1

2

2

1

1

2

2

X1 X 3 X1 X 2 X 2 X 3 X 1 X 2 X 1 X 2 X 3 X1 X 2 X 3 X1 X 2 X 3 X1 X 2 X 3 X 1 X 2 X 3 X 1 X 2 X 3 X 1 X 2 X 3 .


Математика

69

1.2.10. Логика предикатов Мы рассмотрели описание логики высказываний с помощью таблиц истинности. Однако некоторые логические рассуждения не могут быть осуществлены в рамках логики высказываний. Например: а) Всякий друг Ивана есть друг Петра. Сидор не есть друг Петра. Следовательно, Сидор не есть друг Ивана. б) Простое число 2 – четное. Следовательно, существуют простые четные числа. Корректность этих умозаключений основана на внутренней структуре предложений и на смысле слов «всякий» и «существует». 1) Содержательная часть высказывания, которая играет роль определяющего свойства совокупности объектов, и для которых это высказывание истинно, – называется предикатом. П р и м е р : а) Высказывание «Иванов – отличник» или истинно, или ложно – это простое высказывание. б) «х – отличник» – это предикат, который определяет подмножество отличников на некотором множестве студентов. Подставив вместо х фамилии студентов, получим множество высказываний – истинных или ложных. Совокупность истинных высказываний и будет соответствовать подмножеству отличников. Таким образом, предикатом P(x 1...x n) называется функция, переменные которой принимают значения из некоторого множества M, а сама она принимает два значения: истинно или ложно: P(x1...xn): Mn → {И, Л}. Предикат от n аргументов называется n-местным предикатом: P(n)(x1...xn). Высказывание – это нуль-местный предикат. Предикаты обозначаются большими буквами латинского алфавита. Над предикатами можно производить обычные логические операции. В результате получаются новые предикаты. П р и м е р . Пусть P (1)(x) – предикат «x делится на 2», а Q (1) (x) – предикат «x делится на 3». Тогда выражение


70

Э.Ф. Казанцев

P(1 (x) & Q(1 (x) означает предикат «x делится на 2 и х делится на 3», то есть определяет предикат делимости на 6. 2) Кроме операций логики высказываний введем еще операцию связывания квантором. а) Квантор общности. Пусть P(x) – некоторый предикат, принимающий зна­чения И или Л для каждого элемента x множества M. Тогда под выражением (∀x)P(x) будем подразумевать высказывание истинное, когда P(x) истинно для каждого элемента из множества M, и ложно – в противном случае. Читается это выражение так: «для всех x из P(x)». Это высказывание уже не зависит от x. Символ ∀x называется квантором общности: все х ∈ М обладают свойствами P(x). б) Квантор существования. Пусть P(x) – некоторый предикат. Под выражением (∃x)P(x) будем понимать высказывание истинное, когда существует хотя бы один элемент множества M, для которого P(x) истинно, и ложное – в противном случае. Читается так: «существует x такое, что P(x)», или «существует x, для которого P(x)». Символ ∃x называется квантором существования. П р и м е р (условие предыдущего примера): а) (∃x)(P(1)(x) & Q(1)(x)) – истинное высказывание; б) (∀x)(P(1)(x) & Q(1)(x)) – ложное высказывание. На языке предикатов можно составить гораздо более сложные предложения, чем на языке логики высказываний. Перемен­ ные, к которым применяются кванторы называются связанными, а остальные – свободными. 3) Алфавит логики предикатов содержит следующие символы: – символы предметных переменных: x1, x2,...,xn,...; – символы предикатов: A1(t), A2(t),..., Ak(t); t = 0, 1, 2,...; – логические символы: &, ⊃, ∨, ~; – символы кванторов: ∀, ∃; – скобки и запятую: ),(.


Математика

71

4) Слово в алфавите логики предикатов называется формулой, если оно удовлетворяет следующему определению: а) Если Aj(t) – символ предиката, а (x1, x2,..., xn) – символы предметных переменных (не обязательно различные), то Aj(t)(x1, x2,..,xn) – формула. Такая формула называется атомарной. Все предметные переменные атомарных формул свободные, связанных переменных нет. б) Пусть A – формула. Тогда (¬A) тоже формула. Свободные и связанные переменные формулы (¬A) – это соответственно свободные и связанные переменные формулы A. в) Пусть A и B – формулы, причем нет таких предметных переменных, которые были бы связаны в одной формуле и свободны в другой. Тогда (A ∨ B), (A & B), (A ⊃ B), (A ~ B)

(1.5.1)

– есть формулы, в которых свободные переменные формул A и B остаются свободными, A связанные переменные A и B остаются связанными. г) Пусть A – формула, содержащая свободную переменную x. Тогда (∀x) A, (∃x) A

(1.5.2)

– тоже формулы. Переменная x в них связана. Остальные же переменные, которые в формуле A свободны, остаются свободными и в формулах (1.5.2). Переменные, которые в формуле A связаны, остаются связанными и в формулах (1.5.2). В формуле (∀x) A, формула A называется областью действия квантора ∀x, а в формуле (∃x) A – областью действия квантора ∃x. д) Слово в алфавите логики предикатов является формулой только в том случае, это следует из правил а) – г). 5) Кванторы ∀x и ∃x связывают переменную x, превращая одноместный предикат в высказывание. Очевидно, что ∀xP(x)


72

Э.Ф. Казанцев

истинно только при условии, что P(x) тождественно истинный предикат, а во всех остальных случаях это высказывание ложно. Высказывание ∃x P(x) всегда истинно, кроме единственного случая, когда P(x) – тождественно ложный предикат. П р и м е р ы . а) Трехместный предикат P(x1, x2, x3) = «x1 есть сумма x2 и x3» при подстановке x1 = 5 переходит в двухместный предикат P(5, x 2, x 3) = «5 есть сумма x 2 и x 3», а при дальнейшей подстановке x2 =2 – в одноместный предикат P(5, 2, x3) = «5 есть сумма 2 и x3». Очевидно, при x3=3 он становится истинным высказыванием, а при всех x3 ≠ 3 – ложным. б) Предикат P(x) = «x – простое число», определен на множестве натуральных чисел. Подставляя вместо x числа натурального ряда, получаем счетное множество высказываний. Некоторое из них, например, P(1), P(2), P(3), P(5) и так далее являются истинными. Высказывание ∀x P(x) = «все натуральные числа простые» – ложно, а ∃x P(x) = «некоторые из натуральных чисел – простые» – истинно. 6) Порядок следования одноместных кванторов не имеет значения, но разноименные кванторы переставлять нельзя. П р и м е р . ∀x ∀y P(x, y) = ∀y ∀x P(x, y). ∀x ∃y P(x, y) ≠ ∃y ∀x P(x, y). ∃x ∃y P(x, y) = ∃y ∃x P(x, y). 7) Для формул логики предикатов сохраняются все равносильности логики высказываний. Кроме того существуют еще следующие правила: а) Перенос квантора через отрицание: ¬(∀x) A(x) = (∃x) ¬A(x). ¬(∃x) A(x) = (∀x) ¬A(x). б) Вынос квантора за скобки (В – не содержит х): (∃x) (A(x) & B) = (∃x) A(x) & B. (∀x) (A(x) & B) = (∀x) A(x) & B. (∃x) (A(x) ∨ B) = (∃x) A(x) ∨ B. (∀x) (A(x) ∨ B) = (∀x) A(x) ∨ B.


Математика

73

Задания для самостоятельной работы 1) Составить таблицы истинности для формул: а) (x1 ⊃ ¬x2) & (¬x1 ∨ x2); б) (x1 ⊃ (x2 ⊃ x3)) ⊃ ((x1 ⊃ x2) ⊃ (x1 ⊃ x3)). 2) Записать составные высказывания в виде формул: а) если идет дождь, то дует ветер; б) неверно, что ветер дует тогда и только тогда, когда нет дождя. 3) Доказать равносильности: а) ¬(A ⊃ B) = A & ¬B; б) A ⊃ ¬A = A; в) A ∨ (¬A & B) = A ∨ B. 4) Проверить правильность следующего рассуждения: «Если Джонс не встречал этой ночью Смита, то либо Смит был убийцей, либо Джонс лжет. Если Смит не был убийцей, то Джонс не встречал Смита этой ночью, и убийство имело место после полуночи. Если убийство было совершено после полуночи, то либо Смит был убийцей, либо Джонс лжет. Следовательно, Смит был убийцей». 5) Привести к ДНФ и КНФ следующие формулы: а) (x1 & x2) ⊃ (¬x2 & x3); б) ¬(¬(x1 ∨ ¬x2) ⊃ (x2 & ¬x1); в) (¬x1 ⊃ x2) ~ (x2 ~ x3).

1.3. Алгебра матриц 1.3.1. Операции с матрицами 1) Матрица – это совокупность чисел или объектов, расположенных в виде прямоугольной таблицы (m × n), где m – число строк, n – число столбцов. Запись (m × n) – называется размером матрицы. Числа или объекты называются элементами матрицы. В каждой клетке должен быть только один матричный элемент. Обозначение матричного элемента: aij; i – номер строки, j – номер столбца.


Э.Ф. Казанцев

74

A=

a11

a12

...

a1n

a21

a22

...

a2n

...

...

...

...

am1

am2

...

amn

Две матрицы равны (A = B), если равны их матричные элементы a ij = b ij. Сравнивать можно только матрицы одного размера. Используют следующие обозначения матриц: ª a11 « « a21 « « ... « «am1 ¬

a12 a22 ... am 2

... a1n º » ... a2 n » »; ... ... » » ... amn »¼

§ a11 ¨ ¨a ¨ 21 ¨ ... ¨ ¨ © am1

a12 a22 ... am 2

... a1n · a11 ¸ ... a2 n ¸ a21 ¸; ... ... ¸¸ ... ¸ ... amn ¹ am1

a12

... a1n

a22

... a2 n

... am 2

...

...

.

... amn

2) Матрица в общем случае может иметь любое количество строк и столбцов. Если матрица состоит из одного столбца или одной строки, то она называется соответственно столбцовой или строчной. Такие матрицы иногда называют векторами.

Столбцовая матрица: x

§ x1 · ¨ ¸ ¨x ¸ ¨ 2 ¸; строчная матрица: y = (y y … y ). 1 2 n ¨ ... ¸ ¨ ¸ ¨ ¸ © xn ¹

Матрица, все элементы которой равны нулю, называется нулевой матрицей. Нулевая матрица 3-го порядка:

O 3

§o o o· ¨ ¸ ¨ o o o ¸. ¨ ¸ ¨o o o¸ © ¹


Математика

75

Матрица, количество строк и столбцов которой одинаково и равно n, называется квадратной матрицей порядка n. Совокупность aii элементов образуют главную диагональ. Матрица, все элементы которой, кроме диагональных равны нулю, называется диагональной матрицей. Если все диагональные элементы равны единице, то имеем единичную матрицу En (все это относится к квадратной матрице):

E

§1 ¨ ¨0 ¨ ¨ ... ¨ ¨ ©0

... 0 · ¸ 1 ... 0 ¸ ¸. ... ... ...¸¸ ¸ 0 ... 1 ¹ 0

3) Суммой матриц A и B называется матрица C, матричные элементы которой равны сумме соответствующих матричных элементов матриц А и В: cij = aij + bij. Свойство суммы матриц: A + B = B + A. Пример: § a11 a12 ¨ ¨a © 21 a22

a13 · § b11 b12 b13 · ¸ ¨ ¸ ¸ ¨ a23 ¹ © b21 b22 b23 ¸¹

§ a11 b11 a12 b12 ¨ ¨a b © 21 21 a22 b22

a13 b13 · ¸. a23 b23 ¸¹

4) Произведением матрицы A на число α является матрица C = αA, элементы которой получаются умножением каждого элемента матрицы A на α: cij = αaij. Свойства произведения матриц: α(A + B) = αA + αB; (α + β)A = αA+βA; (αβ)A = α (βA); C = A – B = A + (–1)B, то есть cij= aij – bij. Умножение матрицы A на матрицу B допустимо (существует), если число столбцов матрицы A равно числу строк мат­ рицы B.


Э.Ф. Казанцев

76

Произведением матрицы A размера (m × n) на матрицу B размера (n × r) называется матрица C = AB размера (m × r), матричный элемент cij которой равен сумме произведений элементов i-ой строки матрицы A на соответствующие элементы j-го столбца матрицы B: cij

ai1b1 j ai 2b2 j ... ain bnj

n

¦a

ik bkj .

k 1

Пример: §1 §2 0 3 1· ¨ ¨ ¸ ¨2 ¨5 1 2 0¸ u ¨ ¨ ¸ ¨4 ¨0 0 4 1¸ ¨ © ¹ ¨ ©3

3· ¸ 1¸ ¸ 0 ¸¸ ¸ 5¹ § 2 1 0 2 3 4 1 3 2 3 0 1 3 0 1 5 · ¨ ¸ ¨ 5 1 1 2 2 4 0 3 5 3 1 1 2 0 0 5 ¸ ¨ ¸ ¨ 0 1 0 2 4 4 1 3 0 3 0 1 4 0 1 5 ¸ © ¹

§17 11 · ¨ ¸ ¨15 16 ¸ . ¨ ¸ ¨19 5 ¸ © ¹

При умножении матриц удобно использовать следующие схемы:

cij = ai1b1j + ai2b2j + ainbnj

–6 = 0 ⋅ 0 + 1 ⋅ 2 + (–2) ⋅ 4


77

Математика

строка × столбец

матрица × столбец

строка × матрица

матрица × матрица

В общем случае AB ≠ BA; если же AB = BA, то такие матрицы называются коммутирующими. 5) Свойства матриц: а) Ассоциативность: (AB)C = A(BC) = ABC. б) Дистрибутивность: A(B + C) = AB + AC. в) Умножение на единичную матрицу: EmA = AEm = A. г) Умножение на нулевую матрицу: AB = 0 (если A или B = 0). Однако, если AB = 0, то это не значит, что A = 0 или B = 0. Пример: § 4 1 · § 1 2· ¨ ¸ ¨ ¸ ¨ 2 0,5 ¸ ¨ 4 8 ¸ © ¹ © ¹

§ 0 0· ¨ ¸. ¨ 0 0¸ © ¹

1.3.2. Определители 1) Количественной характеристикой матрицы является ее определитель. Определитель ∆ – это некоторое число, соответствующее квадратной матрице. Только квадратная матрица имеет определитель:

'

a11

a12

... a1n

a21

a22

... a2 n

...

...

an1

an 2

...

...

... ann

.


Э.Ф. Казанцев

78

По форме он совпадает с матрицей и его называют определителем матрицы. Обозначают ∆ = det A, или A. Читают: «детерминант А». det (AB) = det (BA) = det A ⋅ det B. По определению определитель 2-го порядка равен разности произведений элементов главных диагоналей: a11

a12

a21

22

a11a22 a12 a21 .

3) Определитель 3-го порядка может быть вычислен несколькими способами: а) первый способ: к определителю справа приписываются два первых столбца, и определитель вычисляется следующим образом:

б) второй способ (правило треугольника): a1

b1

c1

a2

b2

c2

a3

b3

c3

a1b2 c3 b1c2 a3 c1a2b3 c1b2 a3 a1c2b3 b1a2 c3 ;

в) третий способ: правило алгебраического дополнения. Алгебраическое дополнение (или минор) – это определитель, полученный из исходного определителя, удалением s-ой строки и k-го столбца, причем этот определитель умножается на (–1)s+k. По данному правилу определитель n-го порядка можно представить через определители (n – 1)-порядка.


Математика

79

Пример: 5 3 2 4

1

5

1

2

1

1 5 5

3 2 4

2 1

3 2 1

2

1

1

5

5 9 4 7 1 17 34.

Здесь использовано правило знаков: .

Свойства определителя: а) при перестановке двух любых строк (столбцов) определитель меняет знак; б) определитель равен нулю, если все элементы какогонибудь столбца (строки) равны нулю или один из столбцов (строки) является линейной комбинацией любых его других столбцов (строки) (т.е. равны два столбца или строки); в) умножение определителя на число к равнозначно умножению всех элементов какого-нибудь столбца (строки) на к; г) величина определителя не изменится, если к какомунибудь столбцу (строке) прибавить другой столбец (строку), умноженный на число к; д) сумма произведений элементов любой строки (столбца) на алгебраические дополнения к соответствующим элементам другой строки (столбца) равна нулю. 4) Вычисление определителей более высокого порядка, предложенными выше способами, связано с громоздкими вычислениями. Поэтому здесь следует воспользоваться перечисленными свойствами определителей.


Э.Ф. Казанцев

80

Пример: 1

3

2 2

0

2

2

1

1

2

1

1

1

1

3

0

Так как во второй строке определителя уже имеется один ноль, то преобразуем определитель так, чтобы во второй строке большинство элементов оказались равными нулю. Для этого ко второму столбцу прибавим четвертый столбец, умноженный на 2, и к третьему столбцу прибавим четвертый, умноженный на –2. В результате получим: 1 0

1 2 2 0 0 1

1

0

1

1 3

1

1

1 1 ( 1) 2 4 1

0

1

1 2 0

1

1 3

Далее к третьему столбцу прибавим первый столбец. В результате получим: 1

1 3

1

0

1

1 4

0

( 1) ( 1) 2 1

1 3 1 4

( 1) 4 3 ( 1)

4 3

1 .

1.3.3. Преобразование матриц 1) Преобразование матрицы А, состоящее в замене строк столбцами (или наоборот) при сохранении их нумерации, называется ее транспонированием. Транспонированная матрица обозначается AT.


81

Математика

Исходная матрица: Транспонированная матрица: § a11 a12 ¨ ¨a a22 21 A ¨ ¨ ... ... ¨ ¨ © am1 am 2

... a1n · ¸ ... a2 n ¸ ¸; ... ... ¸¸ ¸ ... amn ¹

AT

§ a11 ¨ ¨a ¨ 12 ¨ ... ¨ ¨ © a1n

a21 a22 ... a2 n

... am1 · ¸ ... am 2 ¸ ¸. ... ... ¸¸ ¸ ... amn ¹

(A ⋅ B)T = BT ⋅ AT. (m × n)-матрица при транспонировании становится (n × m)матрицей. Если квадратная матрица совпадает со своей транспонированной (А = AT), то она называется симметричной (симметрия относительно главной диагонали) аij = аji. Матрица, для которой А = –AT, называется кососимметричной. Пример: Симметричная матрица: § 2 0,5 3 5 · ¨ ¸ ¨ 0,5 0 0 7 ¸ ¨ ¸; ¨ 3 0 0,1 0 ¸¸ ¨ ¨ ¸ 0 4¹ © 5 7

Кососимметричная матрица: § 0 ¨ ¨ 2 ¨ ¨ 0,1 ¨ ¨ © 0

2 0,1

0 · ¸ 0 3 0 ¸ ¸. 3 0 7 ¸¸ ¸ 0 7 0 ¹

2) Две квадратные матрицы, произведение которых равно единичной матрице, называются взаимно обратными: AA -1 = = A-1A = Е; (A-1 обратна A). Если обратная матрица существует, то она – единственна для данной. Правила определения обратной матрицы. а) элементы аij данной матрицы А n-го порядка заменяются их алгебраическими дополнениями ∆ij с учетом правила знака, б) матрица алгебраических дополнений транспонируется, в результате чего получаем присоединенную или взаимную мат­ рицу к А; обозначается AP.


Э.Ф. Казанцев

82

в) вычисляется определитель матрицы А и присоединенная матрица умножается на величину, обратную этому определителю. § '11 ¨ ¨ 1 ¨ '12 ' ¨ ... ¨ ¨ © '1n

A 1

' 21 ' 22 ... ' 2n

... ' n1 · ¸ ... ' n 2 ¸ ¸. ... ... ¸¸ ¸ ... ' nn ¹

Обратная матрица существует для матрицы А при условии, что det A ≠ 0. Такие матрицы называются неособенными (невырожденными). Если матрица А симметрична, то присоединенная к ней матрица и обратная также симметричные. Для диагональной матрицы обратная – тоже диагональна. Задания для самостоятельной работы: 1. Вычислить определитель: 2

1 4

ɚ) 3 2 5 ; 1 3 6 1 ɛ) 3

2 0

1 2 ;

2

4

5

1

2

3

ɜ) 2

1

4;

5

3 2


Математика

ɝ)

0

2

0

2

1

4

4

3

1 4 3

2

2 8 2

;

1

1 0 3 4 ɞ)

5

2 1 6

2 3 4 5 6

;

1 2 3

ª§ 3 2 · § 0 1·º ¸ ¨ ¸» ; ɟ) det «¨ «¬¨© 1 4 ¸¹ ¨© 0 2 ¸¹»¼ ª§ 3 3 0 · § 1 3 0 ·º ¸» ¸ ¨ «¨ ɠ) «¨ 9 9 3 ¸ ¨ 1 3 1¸» . ¸» ¸ ¨ «¨ «¨ 4 3 6 ¸ ¨ 2 1 0 ¸» ¹¼ ¹ © ¬©

2. Перемножить матрицы:

§ 2 3· § 9 6· ¸ ¨ ¸; ɚ) ¨ ¨ 4 6¸ ¨6 4¸ © ¹ © ¹ §1· ¨ ¸ ɛ) 1 1 4 ¨ 3 ¸; ¨ ¸ ¨ 1¸ © ¹ 6 7· §4 ¨ ¸ ɜ) 1 3 2 ¨ 1 0 1 ¸; ¨ ¸ ¨ 0 4 1¸ © ¹

83


Э.Ф. Казанцев

84

§5 ¨ ¨4 ɝ) ¨ ¨3 ¨ ¨ ©0

0

2

3· § 6 · ¸ ¨ ¸ 1 5 3¸ ¨ 2¸ ¸ ¨ ¸; 1 1 2 ¸¸ ¨¨ 7 ¸¸ ¸ ¨ ¸ 1 0 1¹ © 4 ¹

§ 2 5 6· §1 3 2· ¨ ¸ ¨ ¸ ɞ) ¨ 1 2 5 ¸ ¨ 3 4 1 ¸. ¨ ¸ ¨ ¸ ¨ 1 3 2¸ ¨ 2 5 3¸ © ¹ © ¹

3. Найти матрицу, обратную А: ɚ) Ⱥ

§ 4 5· ¨ ¸; ¨ 3 2¸ © ¹

ɛ) Ⱥ

§ 1 2· ¨ ¸; ¨ 0 3¸ © ¹

ɜ) Ⱥ

§1 0 1· ¨ ¸ ¨ 2 1 0 ¸; ¨ ¸ ¨1 3 1¸ © ¹

ɝ) A

§ 1 4 2 · ¨ ¸ ¨ 2 0 4 ¸. ¨ ¸ ¨ 3 1 6¸ © ¹

1.4. Линейная алгебра Историческая справка Исторически первым разделом линейной алгебры была теория линейных уравнений, в связи с чем возникло понятие


Математика

85

определителя (Г. Крамер, 1750). В 1849 г. К. Гаусс предложил новый метод для практического вычисления решений систем линейных уравнений. А в 1877 г. Ф. Фробениус ввел понятие матрицы, что позволило явно выразить условия совместности и определенности системы линейных уравнений. В XX веке центральное положение в линейной алгебре занимает изучение векторного пространства, одним из важнейших понятий которого является понятие линейного отображения (преобразования). Главной задачей в теории линейных преобразований служит задача о выборе базиса, в котором матрица преобразований принимает простейший вид. На основе понятия векторного пространства определяются различные классические пространства, изучаемые в геометрии: евклидовы, аффинные, проективные и др. Метод координат сводит к задачам линейной алгебры различные вопросы аналитической геометрии. Теория векторных пространств имеет тесные связи с теорией групп (всякое векторное пространство – это группа по сложению) (см. раздел 1). Следом за векторной алгеброй возникла тензорная алгебра, как обобщение векторного исчисления и теории матриц (Г. Риччи-Курбастро, 1910). 1.4.1. Основные понятия 1) Все события разворачиваются в пространстве, которое состоит из точек P, Q,… Пространство – это множество точек. 2) Чтобы количественно определить пространство надо ввести декартовы координаты. Это означает, что каждой точке пространства поставлен в соответствие набор действительных чисел x1, x2,…xn, называемых ее координатами. Такое пространство называется n-мерным декартовым пространством: R n. Число n называется числом измерений или размерностью про-


86

Э.Ф. Казанцев

странства. Теперь результаты будут зависеть от выбора системы координат или от ее движения. Оси координат не обязательно перпендикулярны друг другу. Набор чисел (x1, x2, … xn) называется точкой декартового пространства (индекс – вверху, это имеет смысл, который будет раскрыт ниже). Примеры декартовых пространств: а) одномерное декартово пространство n = 1 (x1) – числовая прямая; б) двумерное декартово пространство n = 2 (x1, x2) – плоскость; в) трехмерное декартово пространство n = 3 (x 1, x 2, x 3) (рис. 1.4.1).

Рис. 1.4.1. Трехмерное пространство

г) четырехмерное пространство – время n = 4 (t, x1, x2, x3) – точкой в этом пространстве является событие. Процесс жизни каждого объекта (точечной частицы) отож­ дествляется с линией xα(t), α = 1, 2, 3, в четырехмерном пространстве. Эта линия называется мировой линией (рис. 1.4.2).

Рис. 1.4.2. Мировая линия в четырехмерном пространстве (α = 1, 2, 3)


87

Математика

Мы в основном будем иметь дело с трехмерным пространством. 3) Объект, характеризующийся одним числом (угол, объем, масса, плотность, заряд, сопротивление, температура), называется скаляром. а) Чистый скаляр – определяется одним числом, не зависящим от выбора координат (температура, масса). б) Псевдоскаляр – абсолютное значение числа не зависит от выбора координат, но знак – зависит (угол, объем). П р и м е р : объем параллелепипеда: V

ax bx

ay by

az bz

cx

cy

cz

– абсолютная величина всегда одинакова, но если изменить направление одной из осей, то определитель изменит знак. 4) Объект, характеризующийся величиной и направлением, & называется вектором: a . Величина вектора называется его мо& дулем: a . Вектор, идущий из начала координат О в точку P, & называется радиусом – вектором этой точки r . Тогда коорди& наты точки P( x10 , x02 , x03 ) называются координатами вектора r (рис. 1.4.1). 5) Введем единичные векторы (индекс – внизу): i1 ,i2 ,i3 , & & (орты) с координатами i1 = (1, 0, 0), i2 = (0, 1, 0), i3 = (0, 0, 1), которые имеют длину 1 и взаимно перпендикулярны. Тогда любой вектор примет вид: & & & x1i1 x 2 i2 x 3i3

3

&

¦x i . & Для двух векторов a x , x , x и a& ,b& ¦ x y & a

k

1

3

i 1

i

i

(1)

k

k 1

2

3

& b

y , y 1

2

, y 3 число

(2)

называется евклидовым скалярным произведением векторов. Декартовы координаты x1, x2, x3, в которых скалярное произве-


Э.Ф. Казанцев

88

дение имеет вид (2) называются евклидовыми, а пространство – евклидовым. 6) Можно дать другое определение евклидового пространства. Пусть даны две точки: P(x1, x2, x3) и Q(y1, y2, y3). Тогда, если квадрат длины прямолинейного отрезка PQ равен: l2 = (x1 – y1)2 + (x2 – y2)2 +(x3 – y3)2 (по теореме Пифагора), тогда пространство называется евклидовым и координаты – евклидовыми: l2

3

¦ (x

i

yi )2 .

i 1

(3) &

&

Угол& между векторами a и b определяется по формуле: cos M

& (a , b ) & & . ab

Если в рассматриваемом пространстве не предполагается возможным введение длины l, то такое пространство называется аффинным векторным пространством. Пример аффинного пространства: по координатным осям откладываются давление, объем, температура. Понятие расстояния между точками в таком пространстве бессмысленно. Евклидово пространство, в котором введено расстояние (3) называется линейным (векторным) пространством (или метрическим). В дальнейшем принимается правило Эйнштейна – суммирование по дважды встречаемому индексу пишется без знака суммы: 3

¦x y

i i

{ xi y i .

(4)

i 1

Такой индекс называется немым. Выше дано неполное определение вектора. Для полного определения вектора еще надо задать правило его преобразования при переходе в другую систему координат.


Математика

89

7) Представление вектора в виде набора чисел (x1, x2, x3) можно рассматривать как строчную матрицу. Вектор можно задавать и столбцовой матрицей. Объект, характеризующийся девятью числами в виде квадратной матрицы: § t11 t12 ¨ ¨ t21 t22 ¨t © 31 t32

t13 · ¸ t23 ¸ t33 ¸¹

с указанием правила преобразования при переходе в другую систему координат называется тензором второго ранга. Тензором третьего ранга будет трехмерная матрица и т.д. Нетрудно видеть, что скаляр есть частный случай вектора, а вектор – частный случай тензора. 1.4.2. Линейное векторное пространство 1) Линейно зависимые и линейно независимые системы векторов Операции сложения векторов и умножения вектора на число лежат в основе обширного и богатого приложениями раздела математики, называемого линейной алгеброй. Одним из центральных понятий линейной алгебры является понятие линейной зависимости. Сначала заметим следующее: если при рассмотрении некоторого вопроса приходится иметь дело с несколькими векторами, то, как правило, их обозначают одной и той же буквой а с разными индексами: a1, a2, … Весь набор {a1, a2, …} называют системой векторов. О п р е д е л е н и е 1. Пусть даны векторы a1, a2, … as из Rп. Любой вектор a вида a = k1a1 + k2a2, … ksas,

(1)

где k1, k2,…, ks – какие угодно числа, называется линейной комбинацией векторов a1, a2,…, as.


90

Э.Ф. Казанцев

При наличии равенства (1) также говорят, что вектор а линейно выражается через векторы a1, a2,…, as или что а разлагается по векторам a1, a2,…, as. Например, если a1 = (2, 2, 3), a2 = (0, –4, 5), a3 = (3, 13, –8), то 3a1 – 5а2 – 2а3 = (6, 6, 9) – (0, –20, 25) – (6, 26, –16) = (0, 0, 0). Таким образом, вектор (0, 0, 0) является линейной комбинацией векторов а1а2а3. О п р е д е л е н и е 2. Система векторов a 1, a 2,…, a s из R п называется линейно зависимой, если существуют такие числа с1, с2,..., сs, неравные одновременно нулю, что справедливо равенство: c1a1 + c2a2, +… csas = 0.

(2)

В частности, система a1, a2, a3 из предыдущего примера линейно зависима. О п р е д е л е н и е 3. Если система векторов a1, a2,…, as такова, что равенство (2) возможно только при c1 = c2 = … = cs = 0, то эта система называется линейно независимой. Перечислим ряд свойств линейной зависимости. 1) Система из одного вектора линейно зависима: а = 0. Д о к а з а т е л ь с т в о . Пусть система {а}, состоящая из одного вектора а, линейно зависима. Тогда найдется число с ≠ 0, такое, что са = 0. Умножим обе части этого равенства (оба вектора) на число c–1. Получим c–1 (ca) = c–1 ⋅ 0 или (c–1с)а = 0. Таким образом, 1а = 0 или a =0. 2) Система, содержащая более одного вектора, линейно зависима в том и только в том случае, когда среди данных векторов имеется такой, который линейно выражается через остальные Д о к а з а т е л ь с т в о . Пусть среди данных векторов a1, a2,…, as имеется такой, например, вектор а, который линейно


Математика

91

выражается через остальные: a = k2a2 +… + ksas. Прибавляя к обеим частям равенства вектор (–a) получим: –a + k2a2 +… + ksas = = 0, т.е. линейная комбинация векторов a1, a2, … as равна нулю, причем среди коэффициентов имеются коэффициенты, не равные нулю (коэффициент при а1 равен –1). Следовательно, система a1, a2,… as линейно зависима. Обратно, пусть векторы a 1, a 2, … a s линейно зависимы, т.е. имеет место равенство (2) с не равными нулю одновременно коэффициентами с1, с2, … сs. Пусть, скажем, с1 ≠ 0. Перепишем равенство (2) в виде –сa = с2a2 +… + сsas и, умножив обе части 1 на c1 , получим равенство

a1

§c · §c · ¨¨ 2 ¸¸a2 ¨¨ s ¸¸as , © c1 ¹ © c1 ¹

означающее, что вектор а1 линейно выражается через остальные векторы системы. 3) Если часть системы линейно зависима, то и вся система линейно зависима С л е д с т в и е : система, включающая вектор 0, линейно зависима. Д о к а з а т е л ь с т в о . Пусть дана система, например, из трех векторов a1, a2, a3, причем часть системы, состоящая из двух векторов a1, a2, линейно зависима, т.е. справедливо равенство c2a2 + c3a3 = 0, где c2 или c3 отличны от нуля. Добавив к обеим частям вектор 0 = 0а1, получим равенство оa1 + c2a2 + c3a3 = 0, означающее линейную зависимость всей системы a1, a2, a3. 4) Если система {a1, a2,…, as} линейно независима, но при добавлении к ней еще одного вектора а становится линейно зависимой, то вектор а линейно выражается через a1, a2,…, as. Д о к а з а т е л ь с т в о . По условию справедливо равенство вида (3) с1a1 + c2a2 + … + csas + ca = 0, где не все числа с1, с2, … сs, с равны нулю. Нетрудно видеть, что именно с ≠ 0. В противном случае мы получили бы равенство


92

Э.Ф. Казанцев

с1a1 + c2a2 + … + csas + = 0, означающее линейную зависимость системы a1, a2, … as. Пользуясь тем, что с ≠ 0, можно из равенства (3) выразить а через векторы a1, a2, … as. П р и м е р . Рассмотрим систему из векторов a = (α 1, α 2, α 3, …, αn); b = (0, β2, β3, …, βn); c = (0, 0, γ3, …, γn), где αi, βj, γk, … обозначают какие-то числа. Причем α1, β2, γ3, … (числа, стоящие на «диагонали») отличны от нуля. Такая система векторов называется лестничной. Понятно, что число векторов в лестничной системе не превосходит п (число координат в каждом векторе). Докажем, что любая лестничная система векторов линейно независима. Предположим противное. Тогда один из данных векторов должен линейно выражаться через остальные. Пусть, например, a линейно выражается через b, c,...: a = kb + lc+ … Но такое равенство невозможно, поскольку первая координата вектора а отлична от нуля, а первая координата вектора kb + lc +... равна нулю. Полученное противоречие доказывает, что система a, b, c,... линейно независима. О п р е д е л е н и е 4. Векторы а и b называются коллинеарными, если a = kb или b = ka. Если один из векторов а или b равен нулю, то такие векторы заведомо коллинеарны: если, например, а = 0, то имеем а = 0b. Практически распознать коллинеарность совсем просто: координаты a 1,…a n вектора a должны быть пропорциональны координатам b1,…bn вектора b. Пример коллинеарных векторов дает любая таблица обменных курсов валют. Чтобы лучше «прочувствовать» смысл понятия линейной зависимости, обратимся к векторам из R3: а) пусть дана система из двух векторов a и b. Если система линейно зависима, то один из векторов, допустим a, линейно выражается через другой: а = кb. Два вектора, связанные такой зависимостью, как уже сказано, называются коллинеарными. Итак, система из двух векторов


Математика

93

линейно зависима тогда и только тогда, когда эти векторы коллинеарны. Заметим, что такое заключение относится не только к R3, но и к любому Rп; б) пусть система в R 3 состоит из трех векторов a, b, c. Линейная зависимость означает, что один из векторов, скажем а, линейно выражается через остальные: a = kb + lc. (4) Если считать, что все векторы a, b, c имеют общее начало, то из (4) следует, что все три вектора лежат в одной плос­ кости. О п р е д е л е н и е 5. Три вектора a, b, c в R 3, лежащие в одной плоскости или параллельные одной плоскости, называются компланарными (см. рис. 1.4.3, где слева указаны векторы a, b, c из одной плоскости, а справа те же векторы отложены от разных начал и лишь параллельны одной плоскости).

Рис. 1.4.3

Итак, если три вектора в R 3 линейно зависимы, то они компланарны. Справедливо и обратное: если векторы a, b, c из R3 компланарны, то они линейно зависимы. Пусть теперь дана система из s векторов в Rs, где s > 3. В этом случае система обязательно линейно зависима. Это вытекает из следующей общей теоремы.


Э.Ф. Казанцев

94

Т е о р е м а . В пространстве Rп любая система из s векторов, где s > n, линейно зависима. П р и м е р 1. Векторы из R3: a1 = (–1, 3, 7), a2 = (0, 4, 6), a3 = (0, 7, 1), a4 = (1, 0, 0) линейно зависимы, так как их число больше 3. Если дана конкретная система векторов, то установить, будет ли эта система линейно зависима, вообще говоря, не так просто (исключая разве лишь тот случай, когда число векторов больше числа координат в каждом векторе, т.е. s > n). Например, в системе a1 = (2, –5, 1, –1), a2 = (1, 3, 6, 5), a3 = (–1, 4, 1, 2) при поверхностном рассмотрении трудно заметить какие-либо зависимости, хотя на самом деле эти векторы связаны соотношением 7a1 – 3a2 + 11a3 = 0. Практический способ решения вопроса о линейной зависимости будет дан ниже. 1.4.3. Базис линейного пространства О п р е д е л е н и е 6. Базисом линейного пространства называют любую упорядоченную систему векторов, для которой выполнены два условия: 1) эта система векторов линейно независима; 2) каждый вектор в линейном пространстве может быть представлен в виде линейной комбинации векторов этой системы. Пусть b1, …, bn – базис в линейном пространстве. Мы знаем, что любой вектор х в данном пространстве может быть записан следующим образом: x = x1b1 + …+ xnbn.


Математика

95

Такую запись называют разложением вектора х по базису b1,…, bn. Данное здесь определение базиса согласовывается с понятием базиса в пространстве свободных векторов. Например, в трехмерном пространстве базисом была любая тройка некомпланарных векторов. Такая тройка векторов является линейно независимой, так как представление одного ее вектора в виде линейной комбинации двух других равносильна компланарности трех векторов. Но, кроме того, мы знаем, что любой вектор в пространстве можно выразить через произвольные три некомпланарных вектора в виде их линейной комбинации. Три компланарных вектора не могут быть базисом в трехмерном пространстве, так как любая линейная комбинация таких векторов даст вектор, им компланарный. В линейном пространстве разложение любого вектора по данному базису единственно. Действительно, выберем в линейном пространстве произвольный базис b1,…, bn и предположим, что вектор х имеет в этом базисе два разложения: x = x1b1 + ...xnbn, x

x1' b1 x'n bn .

Воспользуемся тем, что аксиомы линейного пространства позволяют преобразовывать линейные комбинации так же, как и обычные алгебраические выражения. Вычитая записанные равенства почленно, получим: ( x1 x1' )b1 ( xn x'n )bn 0. Так как базис – это линейно независимая система векторов, то ее линейная комбинация равна 0, когда она тривиальная. Значит, все коэффициенты этой линейной комбинации равны нулю: x1 x1c 0,..., xn xnc 0. Таким образом, x1 x1c ,..., xn xcn и два разложения вектора х в базисе b1,…, bn совпадают. Условие линейной независимости векторов базиса означает, что нулевой вектор имеет в этом базисе единственное разло­ жение, а именно тривиальное: все коэффициенты этого раз-


Э.Ф. Казанцев

96

ложения равны нулю. Из единственности разложения нулевого вектора по данной системе векторов вытекает единственность разложения любого другого вектора. Согласно данному определению, базис является упорядоченной системой векторов. Это значит, что, изменив порядок векторов в системе, мы получим другой базис. Порядок векторов в базисе фиксируют для того, чтобы задать определенный порядок коэффициентов разложения произвольного вектора. Это позволяет заменить линейную комбинацию, представляющую вектор, упорядоченным набором ее коэффициентов и тем самым упростить запись. Порядок векторов в базисе определяется их нумерацией. О п р е д е л е н и е 7. Коэффициенты разложения вектора по базису линейного пространства, записанные в соответствии с порядком векторов в базисе, называют координатами вектора в этом базисе. Фиксация порядка векторов в базисе преследует еще одну цель – ввести матричные способы записи векторных соотношений. Базис b1,…, bn в данном линейном пространстве удобно записывать как матрицу-строку b = (b1…bn), а координаты вектора х в этом базисе – как матрицу-столбец: x

§ x1 · ¨ ¸ ¨ ¸. ¨ ¸ ¨x ¸ © n¹

Тогда разложение x = x1b1 + … xnbn вектора х по базису b1,…, bn можно записать как произведение матрицы-строки на матрицу-столбец: x = bx. Векторы ортонормированного базиса в трехмерном пространстве имеют стандартное обозначение и порядок: i, j, k. В мат­ ричной записи это будет выглядеть так: b = (i j к). Запись линейных операций над свободными векторами в координатной форме обобщается на случай произвольного линейного пространства.


Математика

97

При сложении любых двух векторов в линейном пространстве их координаты в одном и том же базисе складываются, а при умножении вектора на число его координаты умножаются на это число. Рассмотрим в линейном пространстве базис b = (b1…bn). Пусть даны разложения векторов x и y в этом базисе: x = x1b1 + …+ xnbn, y = y1b1 + …+ ynbn. В силу аксиом линейного пространства x + y = (x1b1 + …+ xnbn) + (y1b1 + …+ ynbn) = (x1 + y1)b1 + …+ + (xn + yn)bn. Таким образом, при сложении двух векторов их координаты, отвечающие одному базисному вектору, складываются. В матричной записи координат этому соответствует матричная сумма столбцов координат. Аналогично для произвольного действительного числа λ λx = λ(x1b1 + …+ xnbn) = (λx1)b1 + …+ (λxn)bn, т.е. при умножении вектора на число каждая из его координат умножается на это число. Запись координат векторов в матричной форме снимает вопрос о том, что понимать, например, под сложением координат: координаты складываются как матрицы-столбцы. Аналогично столбец координат умножается на число по правилам умножения матрицы на число. Запись bx + by = b(x + y), λbx = b(λx) соответствует свойствам матричных операций: дистрибутивности сложения относительно умножения и ассоциативности умножения. Линейная независимость (зависимость) векторов линейного пространства эквивалентна линейной независимости (зависимости) их столбцов координат в одном и том же базисе


Э.Ф. Казанцев

98

этого линейного пространства. Если вектор а равен линейной комбинации векторов a1, …, ak,…, тo есть: a = α1a1 + …+ αkak, то его столбец координат а в заданном базисе b равен такой же линейной комбинации столбцов координат a 1, …, a k векторов a1,…, ak в этом же базисе: a = α1a1 + …+ αkak. Это следует из равенств: ba = α1a1 + …+ αkak= α1(ba1) + …+ + αk(bak) = b(α1a1 + …+ αkak). П р и м е р . В линейном Rn пространстве векторы e1 = (1, 0,..., 0), e2 = (0, 1,..., 0), ………………. en = (0, 0,..., 1) образуют базис e = (e1…en), так как они линейно независимы и любой вектор x = (x1, …, xn), принадлежащий Rn представим в виде x = x1e1 + … + xnen. Данный базис в пространстве Rn называют стандартным. П р и м е р . Покажем, что в R3 система векторов а1 = (1, –1, 2), а2 = (2, 1, 0), а3 = (4, –1, 1) образует базис и найдем в этом базисе координаты вектора с = (2, 1, 3). Для того чтобы доказать, что система векторов a1, a2, a3 образует базис, надо убедиться в линейной независимости этих векторов и в том, что любой вектор b = (b1, b2, b3) принадлежащий R3 является их линейной комбинацией. В стандартном базисе e в R3 векторы a1, a2, a3, b, c имеют следующие столбцы координат: a1

рицу

§1· ¨ ¸ ¨ 1¸, a ¨ ¸ 2 ¨2¸ © ¹

§ 2· ¨ ¸ ¨ 1 ¸, a ¨ ¸ 3 ¨ 0¸ © ¹

§4· ¨ ¸ ¨ 1¸, b ¨ ¸ ¨1¸ © ¹

§ b1 · ¨ ¸ ¨ b ¸, c ¨ 2¸ ¨b ¸ © 3¹

§ 2· ¨ ¸ ¨1¸ . ¨ ¸ ¨ 3¸ © ¹

Из столбцов координат векторов a1, a2, a3 составим мат­


Математика

99

§1 2 4· ¨ ¸ A ¨ 1 1 1¸ ¨ ¸ ¨ 2 0 1¸ © ¹

и рассмотрим квадратную систему линейных алгебраических уравнений (СЛАУ) Ах = b, x = (x1x2,x3)T. Так как det А = –9, то матрица A невырожденная, ее ранг равен 3 и все ее столбцы являются базисными. Поэтому, во-первых, эти столбцы линейно независимы, что означает линейную независимость векторов a1, a2, a3, а во-вторых, СЛАУ Ах = b при любом столбце b правых частей имеет решение x ( x1' x'2 x3' )T , что после записи этой СЛАУ в векторной форме a1x1 + a2x2 + a3x3 = b позволяет сделать вывод о выполнении равенства x1' a1 x'2 a2 x3' a3 b. В частности, решив СЛАУ Ах = с, которая в координатной форме имеет вид: x1 + 2x2 + 4x3 = 2, –x1 + x2 – x3 = 1, 2x1 + x3 = 3, находим координаты вектора с в базисе (a1a2a3): x1 = 2, x2 = 2, x3 = –1. 1.4.4. Решение системы линейных уравнений 1) Система т линейных уравнений с п неизвестными или, как будем дальше говорить, система т × n, запишется в общем виде так: a11x1 + a12x2 + … + a1nxn = b1 a21x1 + a22x2 + … + a2nxn = b2 (1) am1x1 + am2x2 + … + amnxn = bm Решением системы (1) является любой набор значений неизвестных: x1 = α1, x2 = α2, …, xn = αn, удовлетворяющий всем уравнениям системы. Система, не имеющая ни одного решения, называется несовместной.


100

Э.Ф. Казанцев

Две системы уравнений с одними и теми же неизвестными x1,…, xn называются равносильными, если они имеют одно и то же множество решений. Отметим, что для любой системы (1) возможны только три случая: а) система не имеет ни одного решения; б) система имеет единственное решение; в) система имеет бесчисленное множество решений. Множество всех решений системы (1) называется ее общим решением. Решить систему (1) означает найти ее общее решение. Опишем некоторые действия над системой (1), называемые элементарными преобразованиями. Это: а) перестановка уравнений; б) вычеркивание из системы (1) уравнения вида 0x1 + 0x2 + …+0xn = 0 или, проще, 0 = 0; в) умножение обеих частей одного из уравнений системы на число λ ≠ 0; г) прибавление к обеим частям одного из уравнений системы соответствующих частей другого уравнения, умноженных на одно и то же число. Очевидно, что любое из элементарных преобразований, совершенное над системой уравнений, приводит к системе, равносильной исходной системе. При выполнении элементарных преобразований над системой может возникнуть уравнение вида 0x1 + 0x2 +...+ 0xn = b, где b ≠ 0. Ясно, что это уравнение не имеет решений; будем называть такое уравнение противоречивым. Система, содержащая противоречивое уравнение, несовместна; заниматься решением такой системы нет смысла. Для нахождения общего решения системы (1) имеется простой и удобный метод Гаусса.


Математика

101

2) Метод Гаусса Суть метода заключается в том, что с помощью элементарных преобразований системы (1) либо получают систему, содержащую противоречивое уравнение (и тогда система (1) оказывается несовместной), либо система (1) приводится к некоторому специальному виду. Особенность этого вида заключается в том, что для каждого уравнения имеется неизвестное, которое входит в это уравнение с коэффициентом, не равным нулю, а в остальные уравнения – с коэффициентом 0. Если для каждого уравнения зафиксировано такое неизвестное, то это неизвестное называется базисным, а весь набор базисных неизвестных – базисом неизвестных. Остальные неизвестные (если они имеются) называются свободными. Пример: 2x1 + x2 – 5x3 + x6 = 7 (2) 3x1 + 4x3 + x5 – 3x6 = –2 x1 – x3 + x4 – 2x6 = 8. Здесь х2, х4, х5 – базисные неизвестные, х1, х3, х6 – свободные неизвестные. Заметим, что коэффициенты при базисных неизвестных в соответствующих уравнениях системы (2) равны 1. В общем случае это необязательно, но можно этого добиться с помощью элементарного преобразования типа 4). Переписав систему (2) в виде: x2 = 7 – 2x1 + 5x3 – x6 x5 = –2 – 3x1 – 4x3 + 3x6 (3) x4 = 8 –x1 + x3 + 2x6 (в левых частях системы стоят базисные неизвестные, в правых частях – свободные неизвестные), получаем фактически общее решение. Действительно, уравнения (3) показывают, что вместо свободных неизвестных x1, x3, x6 можно подставить любые числа и затем найти из уравнений (3) значения базисных неизвестных х2, х4, х5. Например, взяв x1 = 0, x3 = 1, х6 = 2, найдем х2 = 10, х4 = 13, х5 = 0, а значит, получим конкретное (частное) решение: x1 = 0, х2 = 10, х3 = 1, x4 =13, х5 = 0, x6 = 2.


102

Э.Ф. Казанцев

Таким образом, запись системы в виде (3) позволяет непосредственно получить любое частное решение системы; в этом смысле запись (3) можно считать общим решением. Очевидно, при наличии хотя бы одного свободного неизвестного система имеет бесчисленное множество решений. Если свободных неизвестных нет (все неизвестные – базисные), то решение единственно. Изложим теперь алгоритм метода Гаусса. Для этого дадим описание очередного k-го шага (k = 1, 2,...). Итак, очередной k-й шаг состоит из следующих действий: а) из системы, полученной ранее (после k – 1 предыдущих шагов) удаляем уравнения 0 = 0. Если в оставшейся системе имеется хотя бы одно противоречивое уравнение, то система несовместна – работа с ней прекращается; б) пусть противоречивых уравнений не оказалось. Тогда одно из уравнений выбирается за разрешающе уравнение и одно из неизвестных за разрешающее неизвестное. К этому выбору предъявляются следующие два требования: – на предыдущих шагах это уравнение не было разрешающим; – в разрешающем уравнении коэффициент при разрешающем неизвестном должен быть отличен от нуля; этот коэффициент называют разрешающим элементом; в) из всех уравнений, кроме разрешающего, исключаем разрешающее неизвестное. Для этого к каждому из таких уравнений прибавляем разрешающее уравнение, умноженное на подходящее число. Процесс заканчивается, если ни одно из уравнений уже нельзя выбрать за разрешающее (т.е. все уравнения перебывали в этой роли). Тогда для каждого уравнения имеется свое базисное неизвестное, входящее в это уравнение с коэффициентом, отличным от нуля, а в остальные уравнения – с коэффициентом 0. Таким образом, процесс прекращается после получения базиса


103

Математика

неизвестных. Из полученной системы находим (как в указанном примере) общее решение. Разберем п р и м е р . В примере весь процесс решения записан в виде вертикальной последовательности таблиц. Каждому шагу метода Гаусса соответствует переход от очередной таблицы к следующей. Разрешающие элементы выделены жирным шрифтом: x1 + 2x2 + 3x3 = 2 x1 – x2 – x3 = –2 x1 + 3x2 – x3 = –2 x1

x2

x3

1

2

3

2

1

–1

–1

–2

1

3

–1

–2

1

2

3

2

0

–3

–4

–4

–0

1

–4

–4

1

0

11

10

0

0

–16

–16

0

1

–4

–4

1

0

11

10

0

0

1

1

0

1

–4

–4

1

0

0

–1

0

0

1

1

0

–1

0

0


Э.Ф. Казанцев

104

Последней таблице соответствует система x1 = –1, x3 = 1, х2 = 0. Ответ: решение единственно, x1 = –1, x2 = 0, х3 = 1. 3) Формулы Крамера. Для сокращения записей рассмотрим случай n = 2. Итак, пусть дана система a11x1 + a12x2 = b1 a21x1 + a22x2 = b2 или в матричной записи: АХ = В, (6) § a11

a12 ·

¸; X где A ¨¨ ¸ © a21 a22 ¹

§ x1 · ¨ ¸; B ¨x ¸ © 2¹

§ b1 · ¨ ¸. ¨b ¸ © 2¹

Предположим, что матрица А является невырожденной: A ≠ 0. Тогда существует обратная матрица A–1, равная 1 A

§ A11 ¨ ¨A © 12

A21 · ¸. A22 ¸¹

Умножив обе части уравнения (6) слева на A–1, получим X

т.е.

A 1B

1 A

§ A11 ¨ ¨A © 12

A21 ·§ b1 · ¸¨ ¸ , A22 ¸¹¨© b2 ¸¹

x1

1 ( A11b1 A21b2 ); A

x2

1 ( A12b1 A22b2 ). A

Полученные выражения дня неизвестных допускают интересную интерпретацию. Рассмотрим наряду с матрицей А еще две матрицы:


Математика

A1

§ b1 ¨ ¨b © 2

a12 · ¸; A 2 a22 ¸¹

105

§ a11 b1 · ¸ ¨ ¸ ¨a b © 21 2 ¹

– каждая из них получается из А заменой соответствующего столбца столбцом В. Тогда будем иметь: A1 = b1A11 + b2A22 (разложение определителя Ai по первому столбцу) и A2 = b1A12 + b2A22 (разложение по второму столбцу). Таким образом, x1

A1 A

; x2

A2 A

.

Написанные формулы носят название правила Крамера для системы 2 × 2. Аналогичным путем можно получить правило Крамера для системы п × n. Правило Крамера для системы п × n. Пусть дана система АХ = В n линейных уравнений с n неизвестными. Если A ≠ 0, то система имеет единственное решение: x1

A1 A

; x2

A2 A

; , xn

An A

;

(7)

где Ai означает матрицу, полученную из А заменой i-го столбца столбцом В (i = 1, 2,..., n). 1.4.5. Линейные экономические модели 1) Уравнение линейного межотраслевого баланса Эффективное ведение народного хозяйства предполагает наличие баланса между отдельными отраслями. Каждая отрасль при этом выступает двояко: с одной стороны, как производитель некоторой продукции, а с другой – как потребитель продуктов,


106

Э.Ф. Казанцев

вырабатываемых другими отраслями. Для наглядного выражения взаимной связи между отраслями пользуются определенного вида таблицами, называемыми таблицами межотраслевого баланса. Идея таких таблиц была сформулирована в работах советских экономистов, а первая таблица опубликована ЦСУ в 1926 г. Однако вполне развитая математическая модель межотраслевого баланса, допускающая широкие возможности анализа, появилась позже (1936) в трудах американского экономиста В. Леонтьева. Предположим, что вся производящая сфера народного хозяйства разбита на некоторое число п отраслей, каждая из которых производит свой однородный продукт, причем разные отрасли производят разные продукты. Разумеется, такое представление об отрасли является в значительной мере абстракцией, так как в реальной экономике отрасль определяется не только названием выпускаемого продукта, но и ведомственной принадлежностью своих предприятий (например, данному министерству, тресту и т. п.). Однако представление об отрасли в указанном выше смысле (как «чистой» отрасли) все же полезно, так как оно позволяет провести анализ сложившейся технологической структуры народного хозяйства, изучить функционирование народного хозяйства «в первом приближении». Итак, предполагаем, что имеется п различных отраслей O1,…, On каждая из которых производит свой продукт. В дальнейшем отрасль Oi будем коротко называть «i-я отрасль». В процессе производства своего продукта каждая отрасль нуждается в продукции других отраслей (производственное потребление). Будем вести речь о некотором определенном промежутке времени [T0, T1] (обычно таким промежутком служит плановый год) и введем следующие обозначения: xi – общий объем продукции отрасли i за данный промежуток времени – так называемый валовой выпуск отрасли i; xij – объем продукции отрасли i, расходуемый отраслью j в процессе производства; yi – объем продукции отрасли i, предназначенный к потреблению в непроизводственной


107

Математика

сфере – объем конечного потребления. Этот объем составляет обычно более 75% всей произведенной продукции. В него входят создаваемые в хозяйстве запасы, личное потребление граждан, обеспечение общественных потребностей (просвещение, наука, здравоохранение, развитие инфраструктуры и т.д.), поставки на экспорт. Указанные величины можно свести в таблицу. Производственное потребление

Конечное потребление

Валовой выпуск

x11x12…x1n

y1

x1

x21x22…x2n

y2

x2

xn1xn2…xnn

yn

xn

Балансовый характер этой таблицы выражается в том, что при любом i = 1,..., п должно выполняться соотношение (1) xi = xi1 + xi2 + …+ xin + yi, означающее, что валовой выпуск xi расходуется на производственное потребление, равное xi1 + xi2 + …+ xin + yi, и непроизводственное потребление, равное yi. Будем называть (1) соотношениями баланса. Единицы измерения всех указанных величин могут быть или натуральными (кубометры, тонны, штуки, киловатт-часы и т.п.), или стоимостными. В зависимости от этого различают натуральный и стоимостной межотраслевой балансы. Для определенности в дальнейшем будем иметь в виду (если не оговорено противное) стоимостной баланс. В. Леонтьев, рассматривая развитие американской экономики в предвоенный период, обратил внимание на важное обстоятельство, а именно: величины aij остаются постоянными в течение ряда лет. Это обусловливается примерным постоянством используемой технологии.


Э.Ф. Казанцев

108

В соответствии со сказанным сделаем такое допущение: для выпуска любого объема xj продукции отрасли j необходимо затратить продукцию отрасли i в количестве aijxj где aij – постоянный коэффициент. Проще говоря, материальные издержки пропорциональны объему производимой продукции. Это допущение постулирует, как говорят, линейность существующей технологии. Принцип линейности распространяется и на другие виды издержек, например на оплату труда, а также на нормативную прибыль. Итак, согласно гипотезе линейности имеем (2) xij = aijxij (i, j = 1,…n) Коэффициенты aij называют коэффициентами прямых затрат (коэффициентами материалоемкости). В предположении линейности соотношения (1) принимают вид: x1 = a11x1 + a12x2 + …+ a1nxn + y1 x2 = a21x1 + a22x2 + …+ a2nxn + y2 xn = an1x1 + an2x2 + …+ annxn + yn или, в матричной записи, x = Ax + y, § a11 a12 ¨ ¨a 21 a22 где A ¨¨ ¨ ¨ © an1 an 2

(3) a1n · ¸ a2 n ¸ ¸, x ¸¸ ¸ ann ¹

§ x1 · ¨ ¸ ¨x ¸ ¨ 2 ¸, y ¨ ¸ ¨ ¸ ¨ ¸ © xn ¹

§ y1 · ¨ ¸ ¨y ¸ ¨ 2¸. ¨ ¸ ¨ ¸ ¨ ¸ © y¹

Вектор x называется вектором валового выпуска, вектор y – вектором конечного потребления, а матрица A – матрицей прямых затрат. Соотношение (3) называется уравнением линейного межотраслевого баланса. Вместе с изложенной интерпретацией матрицы А и векторов x и y это соотношение называют также моделью Леонтьева.


Математика

109

Уравнения межотраслевого баланса можно использовать для целей планирования. В этом случае задача ставится так: для предстоящего планового периода [T0, T1] задается вектор у конечного потребления. Требуется определить вектор x валового выпуска. Проще говоря, нужно решить задачу: сколько следует произвести продукции различных видов, чтобы обеспечить заданный уровень конечного потребления? В этом случае необходимо решить систему линейных уравнений (3) с неизвестным вектором x при заданных матрице А и векторе y. При этом нужно иметь в виду следующие особенности системы (3): а) все компоненты матрицы А и вектора y неотрицательны (это вытекает из экономического смысла А и у). Для краткости будем говорить о неотрицательности самой матрицы А и вектора и записывать это так: А ≥ 0, y ≥ 0; б) все компоненты вектора x также должны быть неотрицательными: x ≥ 0. З а м е ч а н и е . Обратим внимание на смысл коэффициентов aij прямых затрат в случае стоимостного (а не натурального) баланса. В этом случае из (2) видно, что aij совпадает со значением xij при xj = 1 (1 руб.). Таким образом, a ij есть стоимость продукции отрасли i, вложенной в 1 руб. продукции отрасли j. Отсюда, между прочим, видно, что стоимостной подход по сравнению с натуральным обладает более широкими возможностями. При таком подходе уже необязательно рассматривать «чистые», т.е. однопродуктовые, отрасли. Ведь и в случае многопродуктовых отраслей тоже можно говорить о стоимостном вкладе одной отрасли в выпуск 1 руб. продукции другой отрасли; скажем, о вкладе промышленной сферы в выпуск 1 руб. сельскохозяйственной продукции или о вкладе промышленной группы А (производство средств производства) в выпуск 1 руб. продукции группы В (производство предметов потребления). Вместе с тем надо понимать, что планирование исключительно в стоимостных величинах может легко привести к дисбалансу потоков материально-технического снабжения.


110

Э.Ф. Казанцев

2) Продуктивные модели Леонтьева О п р е д е л е н и е . Матрица А > 0 называется продуктивной, если для любого вектора y ≥ 0, существует решение x ≥ 0, уравнения x = Ax + y. (4) В этом случае и модель Леонтьева, определяемая матрицей А, тоже называется продуктивной. Итак, модель Леонтьева продуктивна, если любой вектор y ≥ 0 конечного потребления можно получить при подходящем валовом выпуске x ≥ 0. Покажем, что нет необходимости требовать существования решения x ≥ 0 уравнения (4) для любого вектора y ≥ 0. Достаточно, чтобы такое решение существовало хотя бы для одного вектора y ≥ 0. Условимся в дальнейшем писать y ≥ 0 и называть вектор y положительным, если все компоненты этого вектора строго положительны. Т е о р е м а 1 (первый критерий продуктивности). Если А ≥ 0 и для некоторого положительного вектора y* уравнение (4) имеет решение x* ≥ 0, то матрица А продуктивна. Заметим, что на самом деле x* > 0, что следует из x* = Ax* + + y* и A ≥ 0, x* > 0, y* > 0. Уравнение Леонтьева (4) можно записать следующим образом: (Е – А)x = y, (5) где Е – единичная матрица. Возникает, естественно, вопрос об обращении матрицы Е – А. Понятно, что если обратная матрица (Е – А)–1 существует, то из (5) вытекает x = (Е – А)y. (6) Т е о р е м а 2 (второй критерий продуктивности). Матрица А ≥ 0 продуктивна тогда и только тогда, когда матрица (Е – А)–1 существует и неотрицательна.


111

Математика

П р и м е р 1. Исследуем на продуктивность матрицу § 0,2 0,6 · ¸. A ¨ ¨ 0,9 0,7 ¸ ¹ ©

§ 0 ,8 0 ,6 · ¸. В данном случае E A ¨ ¨ 0,9 0 ,7 ¸ ¹ ©

Проведя необходимые вычисления, получим матрицу § 35 30 · ¸ . Мы видим, что ¨ 45 40 ¸ © ¹

(Е – А)–1, которая существует и равна ¨

эта матрица неотрицательна. Следовательно, А продуктивна. Продолжим анализ продуктивности модели Леонтьева. Пусть а – некоторое число. Из курса математического анализа известно, что если ряд 1 + a + a2 +… (бесконечная геометрическая прогрессия) сходится (условием этого является a < 1), то его сумма равна (1 – а)–1. Аналогичное предложение имеет место при замене числа а матрицей А. Л е м м а . Если бесконечный ряд (из матриц) 1 + А + Аг + ...

(7)

сходится, то его сумма есть матрица (Е – А)–1. Т е о р е м а 3 (третий критерий продуктивности). Матрица А > 0 продуктивна тогда и только тогда, когда сходится бесконечный ряд E + A + A2 +… П р и м е р 2. Для матрицы A

(8) § 0 ,1 0 0 ,6 · ¨ ¸ ¨ 0 ,2 0 ,7 0 ¸ сумма элемен¨ 0 ,4 0 ,2 0 ,3 ¸ © ¹

тов каждого столбца меньше единицы. Следовательно, А продуктивна.


Э.Ф. Казанцев

112

Аналогично доказывается, что если в неотрицательной матрице А сумма элементов любой строки меньше 1, то матрица А продуктивна. Впрочем, то же самое можно вывести и из следующего предложения: если продуктивна матрица А, то продуктивна и матрица AT, что следует из теоремы 2. Пусть А > 0 — продуктивная матрица. Запасом продуктивности матрицы А назовем такое число α > 0, что все матрицы λА, где 1 ≤ λ ≤ 1 + α, продуктивны, а матрица (1+α)A – непродуктивна. П р и м е р 3. Выясним, какой запас продуктивности имеет матрица А из примера 1. Р е ш е н и е . Будем руководствоваться критерием продуктивности из теоремы 2 (существование неотрицательной матрицы (Е – А)–1). В данном случае: §1 0,2O 0,6O · ¸. E OA ¨ ¨ 0 ,9O 1 0,3O ¸ ¹ ©

Определитель этой матрицы: ∆ = E – λA = (1 – 0,2λ)(1 – 0,3λ) = –0,48λ2 – 0,5λ + 1. Обратной матрицей будет: ( E OA)

1

§ 1 0,3O ¨ ¨ ' ¨ 0 ,9O ¨ © '

0,6O · ¸ ' ¸. 1 0,2O ¸ ¸ ' ¹

Для продуктивности матрицы λА нужно, чтобы все элементы обратной матрицы были неотрицательны. Это возможно лишь, если ∆ > 0, 1 – 0,2λ > 0, 1 – 0,3λ > 0. Приближенные корни уравнения ∆ = 0 суть λ 1 = –2,06 и λ 2 = 1,015, поэтому (Е – λА)–1 > 0 если λ < 1,015. При λ < λ2 матрица λА будет продуктивной, при λ = λ2 – нет. Запас продуктивности матрицы А равен 0,015. Мы видим, что матрица А находится где-то «на пределе» продуктивности.


Математика

113

Обычно матрицы А межотраслевого баланса обладают большим запасом продуктивности. Например, для межотраслевых балансов в бывшем СССР такой запас, как правило, был больше 0,4. Рост производственных расходов (в частности, учет затрат на преодоление негативных воздействий производства на окружающую среду) вызывает увеличение элементов матрицы А и, как следствие, снижение ее запаса продуктивности. 3) Модель равновесных цен Рассмотрим теперь балансовую модель, двойственную к модели Леонтьева – так называемую модель равновесных цен. Пусть, как и прежде, А – матрица прямых затрат, x = (x1, x2,..., xn) – вектор валового выпуска. Обозначим через p = (p1, p2,..., pn) – вектор цен, i-я координата которого равна цене единицы продукции i-й отрасли; тогда, например, первая отрасль получит доход, равный p1x 1. Часть своего дохода эта отрасль потратит на закупку продукции у других отраслей. Так, для выпуска единицы продукции ей необходима продукция первой отрасли в объеме a11, второй отрасли в объеме a21, n-й отрасли в объеме an1 и т.д. На покупку этой продукции ею будет затрачена сумма, равная a11p1 + a21p2 +…+an1pn. Следовательно, для выпуска продукции в объеме x1 первой отрасли необходимо потратить на закупку продукции других отраслей сумму, равную x1(a11p1 + a21p2 +…+an1pn). Оставшуюся часть дохода, называемую добавленной стоимостью, мы обозначим через V1 (эта часть дохода идет на выплату зарплаты и налогов, предпринимательскую прибыль и инвестиции). Таким образом, имеет место следующее равенство: x1p1 = x1 (a11p1 + a21p2 +…+an1pn) + V1. Разделив это равенство на x1, получаем: p1 = (a11p1 + a21p2 +…+an1pn) + ν1, где v1

V1 – норма добавленной стоимости (величина добавленx1

ной стоимости на единицу выпускаемой продукции).


Э.Ф. Казанцев

114

Подобным же образом получаем для остальных отраслей: p2 = a12p1 + a22p2 +…+an2pn + ν2, pn = a1np1 + a2np2 +…+annpn + νn. Найденные равенства могут быть записаны в матричной форме следующим образом: p = ATp + ν, где ν = (ν1, ν2,...,νn) – вектор норм добавленной стоимости. Как мы видим, полученные уравнения очень похожи на уравнения модели Леонтьева с той лишь разницей, что x заменен на p, y – на ν, A – на AT. Модель равновесных цен позволяет, зная величины норм добавленной стоимости, прогнозировать цены на продукцию отраслей. Она также позволяет прогнозировать изменение цен и инфляцию, являющиеся следствием изменения цены в одной из отраслей. П р и м е р . Рассмотрим экономическую систему, состоящую из трех отраслей. Назовем их условно: топливно-энергетическая отрасль, промышленность и сельское хозяйство. Пусть AT

§ 0,1 0,1 0,2 · ¸ ¨ ¨ 0,3 0,2 0,2 ¸ ¨ 0,2 0,3 0,2 ¸ ¹ ©

– транспонированная матрица прямых затрат, ν = (4; 10; 4) – вектор норм добавленной стоимости. Определим равновесные цены. Для этого, как и в модели Леонтьева, воспользуемся формулой p = CTν, где CT = = (E – AT)–1 – транспонированная мат­ рица полных затрат. После необходимых вычислений имеем CT

§ 0,58 0 ,14 0 ,18 · ¨ ¸ 1 ¨ 0,28 0 ,68 0,24 ¸ . ¸ 0 ,444 ¨ ¨ 0,25 0 ,29 0,69 ¸ © ¹


Математика

115

Отсюда получаем, что p

CT v

§ 10 · ¨ ¸ ¨ 20 ¸ . ¨ ¸ ¨ 15 ¸ © ¹

Допустим теперь, что в топливно-энергетической отрасли произойдет увеличение нормы добавленной стоимости на 1,11. Определим равновесные цены в этом случае. Принимая во внимание, что ν = (5,11; 10; 4), находим, что p

CT v

§ 11,45 · ¨ ¸ ¨ 20 ,7 ¸ . ¨ ¸ ¨15,625 ¸ © ¹

Таким образом, продукция первой отрасли подорожала на 14,5%, второй – на 3,5%, третьей отрасли – на 4,17%. Нетрудно также, зная объемы выпуска, подсчитать вызванную этим повышением инфляцию. 4) Модель международной торговли Модель международной торговли (кратко: модель обмена) служит для ответа на следующий вопрос: какими должны быть соотношения между государственными бюджетами стран, торгующих между собой, чтобы торговля была взаимовыгодной, т.е. не было значительного дефицита торгового баланса для каждой из стран-участниц. Проблема достаточно важна, так как дефицит в торговле между странами порождает такие явления, как лицензии, квоты, таможенные пошлины и даже торговые войны. Для простоты изложения рассмотрим три страны – участницы торговли с государственными бюджетами X1, X2, X3, которые условно назовем США, Германия и Кувейт. Будем считать, что весь госбюджет каждой страны тратится на закупки товаров либо внутри страны, либо на импорт из других стран. Пусть,


Э.Ф. Казанцев

116

скажем, США тратят половину своего бюджета на закупку товаров внутри страны, 1/4 бюджета – на товары из Германии, оставшуюся 1/4 бюджета – на товары из Кувейта. Германия тратит поровну свой бюджет на закупку товаров в США, внутри страны и у Кувейта. Кувейт, в свою очередь, тратит 1/2 бюджета на закупку товаров у США, 1/2 бюджета на закупки в Германии и ничего не закупает внутри страны. Введем структурную мат­ рицу торговли: США

Германия §1 ¨ ¨2 1 A ¨ ¨4 ¨1 ¨ ©4

1 3 1 3 1 3

Кувейт

1· ¸ 2¸ 1¸ 2¸ ¸ 0¸ ¹

Вообще, пусть aij – часть госбюджета, которую j-я страна тратит на закупки товаров i-й страны. Заметим, что сумма элементов матрицы А в каждом столбце равна единице. После подведения итогов торговли за год страна под номером i получит выручку p i = a i1X 1 + a i2X 2 + a i3X 3. Например, США будут иметь выручку p1 доля Германии + доля Кувейта).

1 1 1 x1 x2 x3 (доля США + 2 3 2

Для того чтобы торговля, была сбалансированной, необходимо потребовать бездефицитность торговли для каждой страны: pi ≥ Xi для всех i

(9)

Условием бездефицитной торговли являются равенства pi = Xi = 1, 2, 3.


117

Математика

В матричной форме данное утверждение выглядит следующим образом: AX = X, где X

§ X1 · ¨ ¸ ¨X ¸ ¨ 2¸ ¨X ¸ © 3¹

(10)

X 1 X 2 X 3 T .

Обобщая равенство (10), рассмотрим следующее.

О п р е д е л е н и е 1. Ненулевой вектор x

§ x1 · ¨ ¸ ¨ x2 ¸ ¨ ¸ называет¨ ¸ ¨x ¸ © n¹

ся собственным вектором квадратной матрицы А порядка n, если Ax = λx,

(11)

где λ – некоторое число. При этом число λ называется собственным значением мат­ рицы А. Говорят так: x есть собственный вектор матрицы A принадлежащий ее собственному значению λ. Таким образом, в разбираемом примере из соотношения (10) следует, что «вектор бюджетов» X является собственным вектором структурной матрицы торговли А, а соответствующее собственное значение равно 1. Существование такого собственного вектора вытекает из следующей теоремы. Т е о р е м а . Если в матрице А сумма элементов каждого столбца равна 1, то имеется собственный вектор, принадлежащий собственному значению 1.


Э.Ф. Казанцев

118

П р и м е р 1. Найдем собственные векторы и собственные §1

2· ¸ . Положим, ¨ 1 4¸ ¹ ©

значения следующей матрицы порядка 2: A ¨

x = (x1, x2)T – вектор-столбец. Тогда из соотношения (11) следует, 2 ·§ x1 · ¸¨ ¸ ¸¨ x ¸ 1 4 ¹© 2 ¹ © §1

что ¨¨

§ x1 · O¨ ¸ . ¨x ¸ © 2¹

Т.е. x1 + 2x2 = λx1; –x1 + 4x2 = λx2 или (1 – λ)x1 + 2x2 = 0 –x1 + (4 – λ)x2 = 0.

(12)

Если вектор x – собственный, то это означает, что однородная система уравнений (12) имеет ненулевое решение. Это условие эквивалентно тому, что определитель системы (12) равен нулю: 1 O

2

1

4 O

, или λ2 – 5λ + 6 = 0; λ1 = 2, λ2 = 3.

Таким образом, собственными значениями матрицы А будут числа 2 и 3. Найдем соответствующие собственные векторы. Подставим λ = 2, λ = 3 в систему (12): λ = 2: –x1 + 2x2 = 0 –x1 + 2x2 = 0 –x1 + 2x2 = 0 x1 = 2t, x2 = t x = t (2, 1), t ≠ 0.


Математика

119

λ = 3: –2x1 + 2x2 = 0 –x1 + x2 = 0 x1 = t, x2 = t x = t (1, 1), t ≠ 0. Рассуждения из примера 1 можно обобщить на случай произвольной матрицы А порядка п. Условие (11) можно переписать в виде: Ax – λx = 0 или (A – λE)x = 0.

(13)

Однородная система уравнений (13) тогда и только тогда имеет ненулевое решение, когда ее определитель равен нулю: A – λE = 0

(14)

Если раскрыть данный определитель, как в рассмотренном примере 1, то получится многочлен степени п относительно λ, называемый характеристическим многочленом матрицы А. О п р е д е л е н и е 2. Уравнение A – λE = 0 называется характеристическим уравнением матрицы А. Таким образом, собственные значения матрицы А являются корнями ее характеристического уравнения. 3 а м е ч а н и е 1. Если вектор x является собственным вектором матрицы А, принадлежащим собственному значению λ то для любого числа k ≠ 0 вектор kx – тоже собственный вектор А, принадлежащий λ. Действительно, если x – решение уравнения (12), то (A – λE)x = 0. Но тогда (A – λE)(kx) = k(A – λE)x = = k0 = 0. З а м е ч а н и е 2. Одному собственному значению может соответствовать несколько линейно независимых собственных векторов.


120

Э.Ф. Казанцев

Раздел 2 Математический анализ

Математический анализ как единое целое сложился в трудах И. Ньютона (1642–1727), Г. Лейбница (1646–1716), Л. Эйлера (1734–1800), Ж. Лагранжа (1736–1813), хотя его основа – теория пределов была разработана значительно позже О. Коши (1789–1857). Объектом изучения математического анализа являются функции. В природе и технике повсеместно встречаются процессы, которые удобно описывать функциями, поэтому математический анализ охватывает весьма большую часть прикладной математики. В него входят дифференциальное и интегральное исчисления, теория дифференциальных уравнений, теория пределов, теория рядов, теория функций комплексного переменного, вариационное исчисление. Понятие функции существенно базируется на понятии действительного числа. Благодаря Р. Декарту (1596–1650), который ввел в математику прямоугольную систему координат, появилась возможность устанавливать связь между числами (координатами) и изображать функции в виде графиков. В настоящее время понятие функции базируется на более фундаментальном понятии множества (см. часть 1). Методом изучения функций является теория пределов. Хотя процесс предельного перехода был известен еще Архимеду (III век до н.э.), окончательное понятие предела было сформулировано только в XIX веке. Сведения о рядах мы находим еще в египетских папирусах (2 тыс. лет до н.э.), а древние греки уже рассматривали бесконечные ряды.


Математика

121

Важнейший класс функций образуют так называемые непрерывные функции. Понятие предела и непрерывности непосредственно связаны с понятием бесконечности. Представление о бесконечно малых и бесконечно больших переменных величинах является одним из основных в математическом анализе. Главные трудности математического учения о бесконечности в настоящее время сосредоточились на вопросе о природе бесконечных множеств, который еще далеко нельзя считать решенным. В математической практике не делается принципиальных различий между конечными и бесконечными множествами. Последние рассматриваются таким образом, как будто все их элементы уже даны нам одновременно. Другим подходом к понятию бесконечности является представление о топологическом пространстве, служащем предметом изучения современной геометрии. 2.1. Дифференциальное исчисление функций одной переменной 2.1.1. Числовые последовательности 1) Если каждому натуральному числу n поставлено в соответствие число xn, то говорят, что задана последовательность x1, x2, x3,…, xn или {xn}; xn – называется общим членом последовательности и он является функцией натурального аргумента n: xn = f (n), n = 1, 2, 3… П р и м е р : {xn} = {1/n}: 1, 1/2, 1/3, 1/4,… {xn} = {sin (nπ/2)}: 1, 0, –1, 0, 1,… 2) Последовательность {xn} называется ограниченной, если существует число M > 0 такое, что для всех n выполняется неравенство: xn ≤ M, т.е. члены последовательности принадлежат интервалу (–М, М).


122

Э.Ф. Казанцев

Последовательность {xn} называется ограниченной сверху (справа), если все ее члены меньше некоторого числа М, т.е. xn ≤ M. Последовательность {xn} называется ограниченной снизу (слева), если выполняется неравенство xn ≥ M. П р и м е р ы : {xn} = {n} – ограничена снизу, {xn} = {–n} – ограничена сверху, {xn} = {(–1)nn} = –1, 2, –3, 4, –5,… – не ограничена. Число a называется пределом последовательности {an} если для любого положительного числа ε найдется такой номер N, что для всех n > N выполняется неравенство a – xn ≤ ε. Другими словами: если у последовательности {xn} есть предел a, то члены последовательности при всех n > N удовлетворяют неравенству: a – ε < xn < a + ε. Предел последовательности записывается так: lim xn = a или xn → a. В этом случае говорят, что последовательность сходится. Т е о р е м а 1. Последовательность может иметь не более одного предела. Д о к а з а т е л ь с т в о (от противного): Пусть xn → a; xn → b (a ≠ b). Возьмем число ε > 0. Т.к. xn → a, то a – xn ≤ ε/2 при n > N1. Т.к. xn → b, то b – xn < ε/2 при n > N2. Тогда для n > N, где N > N1, N2 должны выполняться оба неравенства, следовательно: a – b = (a – xn) + (xn – b) ≤ a – xn + xn – b < ε/2 + ε/2 = ε, т.е. разность может быть меньше любого положительного числа, следовательно, a = b. Т е о р е м а 2. Если xn → a, то xn → a. Д о к а з а т е л ь с т в о : Для любого ε > 0 при n > N выполняется неравенство: a – xn < ε. Но по свойству абсолютной величины: a – x ≤ a – xn, следовательно, при n > N должно выполняться неравенство a – x ≤ ε, т.е. xn → a. Т е о р е м а 3. Если x n → a, то последовательность {x n} ограничена.


Математика

123

Д о к а з а т е л ь с т в о : Пусть ε = 1, тогда найдется такой номер N, что для n > N  a – an < 1; следовательно: an = (an – a) + + a+ ≤  (an – a) + a < 1 + a. Откуда: an < a + 1, для всех n > N. Обозначим через M наибольшее из чисел: a1, a2,…an, a + 1, т.е. an ≤ M, значит, последовательность {xn}ограничена. Обратная теорема неверна: из ограниченности последовательности не следует ее сходимость. 4) Последовательность {xn}, не имеющая конечного предела, называется расходящейся. П р и м е р : {n2}. Последовательность {xn} называется бесконечно большой, если для любого числа M > 0 найдется номер N, такой, что для всех n > N, выполняется неравенствоxn > M. Геометрически это означает, что все члены последовательности кроме конечного числа лежат вне отрезка [–M; M]. П р и м е р : {n}; {–n}. Бесконечно большая последовательность записывается в виде: xn → ∞ или lim xn = ∞. 5) Последовательность {xn} называется бесконечно малой, если lim xn = ∞. П р и м е р : {xn} = {1/n2}. Общие члены бесконечно малых последовательностей обозначают буквами греческого алфавита: αn, βn, γn. По определению предела {αn} будет бесконечно малой, если для любого ε, n > N выполняется αn < ε. Если последовательность {αn} бесконечно малая и все ее члены отличны от нуля, то последовательность {xn} = {1/αn} – бесконечно большая, и обратно, если последовательность {xn} – бесконечно большая, то последовательность {αn} = {1/xn} – бесконечно малая.


124

Э.Ф. Казанцев

Т е о р е м а 4. Алгебраическая сумма двух бесконечно малых есть бесконечно малая: αn → 0, βn → 0 ⇒ αn + βn → 0. Д о к а з а т е л ь с т в о : Возьмем ε > 0, тогда существует такой номер N1, что при n > N1 будет αn < ε/2, и такой номер N2, что при n > N2 будет βn < ε/2. Обозначим через N наибольшее из чисел N1 и N2,тогда при n > N выполняются оба неравенства, следовательно: αn + βn ≤ αn + βn < ε/2 + ε/2 = ε, т.к. для любого ε > 0 при n > N α n ± β n < ε, то последовательность {αn ± βn} – бесконечно малая.

Т е о р е м а 5. Произведение ограниченной последовательности и бесконечно малой последовательности есть бесконечно малая последовательность. Пусть {xn} – ограниченная последовательность, {αn} – бесконечно малая последовательность. Надо доказать, что xnαn → 0.

Д о к а з а т е л ь с т в о : Существует такое число M > 0, что для всех n выполняется неравенство xn < M. Возьмем любое число ε > 0, ему соответствует такое число N, что при всех n > N αn < ε/M. Тогда xnαn < M < ε/M = ε, т.е. xnαn < ε при n > N. Это означает, что xnαn → 0. Т е о р е м а 6. Алгебраическая сумма двух сходящихся последовательностей есть сходящаяся последовательность, ее предел равен соответствующей сумме пределов данных последовательностей: xn → a, yn → b; xn ± yn → a ± b. Д о к а з а т е л ь с т в о : Пусть n = a + αn, где αn → 0, yn = b + + βn, где βn → 0. Тогда xn ± yn = (a ± b) + (αn ± βn), но {αn ± βn} – бесконечно малая, следовательно: lim (x n ± y n) = a ± b, т.е. lim (xn ± yn) = lim xn ± lim yn. Коротко: предел суммы равен сумме пределов.


Математика

125

Т е о р е м а 7. Произведение двух сходящихся последовательностей есть сходящаяся последовательность, ее предел равен произведению пределов данных последовательностей: xn → a, yn → b; xnyn → ab. Доказательство: xn = a + αn; αn → 0; yn = b + βn; βn → 0. Тогда xnyn = (a + αn)(b + βn) = ab +(aβn + bαn + αnβn), но (aβn + bαn + αnβn) → 0 – т.е. это бесконечно малая последовательность. Значит: lim (xnyn) = ab, т.е. lim (xnyn) = lim xn lim yn. Коротко: предел произведения равен произведению пределов. Чтобы доказать теорему о пределе частного двух сходящихся последовательностей, рассмотрим две леммы. Л е м м а 1. Если lim xn = a, a ≠ 0, то существует число K > 0 и натуральное число N, такие, что при n > N выполняется неравенство: xn > K, т.е. говорят, что последовательность {xn} отделима от нуля. Д о к а з а т е л ь с т в о : по условию lim xn = a, тогда lim xn = = a > 0, следовательно, для любого ε > 0 и для n > N, выполняется неравенство: a – ε < xn < a + ε. Возьмем такое ε: 0 < ε < a/2, тогда получим xn > a/2, полагая K = a/2, получим утверждение леммы 1. Л е м м а 2. Если lim xn = a, a ≠ 0 и все члены последовательности отличны от нуля, то последовательность {1/xn} ограничена. Д о к а з а т е л ь с т в о : по лемме 1 существует число K > 0, такое, что при n > N имеет место неравенство: xn > K, следовательно: 1/xn > K. Если обозначим через M наибольшее из чисел 1/x1, 1/x2,…,1/xn, 1/K, 1/x1, 1/x2,…,1/xn, 1/K,


Э.Ф. Казанцев

126

1/x1, 1/x2,…,1/xn, 1/K, 1/x1, 1/x2,…,1/xn, 1/K, то 1/xn ≤ M для всех n.

Т е о р е м а 8. Если последовательности {xn} и {yn} сходятся, lim xn = a; lim yn = b, причем yn ≠ 0, то последовательность {xn/yn} сходится и ее предел равен отношению пределов последовательностей {xn} и {yn}: xn/yn → a/b. Доказательство: xn = a + αn; αn → 0; yn = b + βn; βn → 0. Тогда: xn a yn b

bxn ayn byn

b(a D n ) a (b E n ) byn

bD n aE n . byn

Так как последовательность {1/yn} ограничена (лемма 2), (bαn – aβn)/b → 0 (по теоремам о бесконечно малых) следовательно последовательность {(bαn – aβn)/byn} – бесконечно малая (по теореме 7). Значит: xn/yn → a/b или lim xn/yn = lim xn/ lim yn. 2) Число e Рассмотрим последовательность x = (1 + 1/n)n: (1 + 1)1, (1 + 1/2)2,...,(1 + 1/n)n. Докажем, что она имеет конечный предел. Воспользуемся формулой бинома Ньютона: xn

1 n(n 1) 1 n(n 1)(n 2)...(n (k 1)) 1 ... n (1 1/n) n 1 n 1 2 n2 1 2 ... n n n

или 1 § 1· 1 § 1 ·§ 2 · § k 1· 1 § 1 ·§ 2 · § n 1· xn 1 1 ¨1 ¸ ... ¨1 ¸¨1 ¸...¨1 ¸ ... ¨1 ¸¨1 ¸...¨1 ¸. 2! © n ¹ k! © n ¹© n ¹ © n ¹ n! © n ¹© n ¹ © n ¹

Покажем, что эта последовательность возрастающая, для этого сравним xn с xn+1: 1§ 1 · 1§ 1 · § 2 · § k 1· ¨1 ¸ ... ¨1 ¸...¨ ¸...¨1 ¸ ... 2! © n 1 ¹ k! © n 1 ¹ © n 1 ¹ © n 1 ¹ 1§ 1 ·§ 2 · 1 § n · 1 · § ¨1 ¸¨1 ¸ ¨1 ¸...¨1 ¸. n! © n 1 ¹© n 1 ¹ (n 1)! © n 1 ¹ © n 1 ¹ xn 1 1 1


Математика

127

Нетрудно видеть, что каждое слагаемое в xn+1 больше соответствующего слагаемого в xn, кроме того, в xn+1 есть одно дополнительное положительное слагаемое. Таким образом последовательность {xn} – возрастающая. Докажем, что при любом n ее члены не превосходят 3: xn > 3. 1 1 / 2n 1 1 1 1 1 1 1 xn 1 1 ... 1 1 2 ... n 1 1 1 3. 1 1 / 2 2! 3! n 2 2 1 1 / 2 2

Итак, последовательность (1+1/n)n монотонно возрастает и ограничена сверху, следовательно, она имеет предел. Этот предел обозначается буквой e: lim (1 + 1/n)n = e. Значит e ≤ 3. Оставим в xn только три слагаемых: (1 + 1/n)n > 2 + 1/2 (1 – 1/n), переходя к пределу: e ≥ 2 + 1/2 = 2,5, т.е. 2,5 < e ≤ 3. Более точные вычисления показывают, что e – иррациональное число, e = 2,71828... Логарифмы чисел по основанию e называются натуральными логарифмами и обозначаются ln x. Связь между натуральным и десятичным логарифмами: y = logax; ay = x. Прологарифмируем это равенство по основанию e: y logba = logbx или logbx =logba ⋅ logax. В частности, при x = b: logba·logab = 1. Обозначим M = logba, тогда: logbx = M logax. Пусть a = e, b = 10; lg x = M ln x, где M = lg e~0,43429. 2.1.2. Предел функции 1) Число A называется пределом функции f (x) при x, стремящемся к a (или в точке a), если для любого положительного числа e найдется такое положительное число δ, что для всех x, удовлетворяющих условию: 0 < |x – a| < δ, выполняется неравенство:  f (x) – A < ε


Э.Ф. Казанцев

128

или, другими словами: для любого e > 0 найдется δ > 0 такое, что для всех x, удовлетворяющих условию a – δ < x < a + δ, выполняется условие: A – ε < f (x) < A + ε. Записывается: lim f (x) = A, или f (x) → A при x → a. 2) Число A называется пределом функции f (x) при x → a, если для любой последовательности значений аргумента x: x1, x2,...,xn, сходящейся к a, xn ≠ a, соответствующая последовательность значений функций f (x1), f (x2),..., f (xn) сходится к A. Примем следующие теоремы без доказательств. Т е о р е м а 1. Предел суммы функций равен сумме пределов функций: lim [f (x) ± ϕ(x)] = lim f (x) ± lim ϕ (x). Т е о р е м а 2. Предел произведения функций равен произведению пределов функций: lim [f (x) ⋅ ϕ(x)] = lim f (x) ⋅ lim ϕ (x). Т е о р е м а 3. Предел частности двух функций равен частности пределов этих функций: lim

A > 0.

f ( x) M ( x)

lim f ( x) , при условии, что lim ϕ (x) ≠ 0. lim M ( x)

Т е о р е м а 4. Если f  (x) > 0 вблизи a и lim f (x) = A, то

Аналогично для f (x) < 0; A < 0. Т е о р е м а 5. Если вблизи а выполняются неравенства: ϕ(x) ≤ f (x) ≤ ψ(x) и lim ϕ(x) = lim ψ (x) = A, то lim f (x) = A. 3) Функция f (x) называется ограниченной вблизи а, если существует число M > 0, такое, что |f (x)| < M вблизи а. Т е о р е м а 6. Если функция f (x) при x → a имеет конечный предел, то она ограничена вблизи а.


Математика

129

4) Функция f (x) называется бесконечно малой при x → a, если lim f (x) = 0. П р и м е р : f (x) = sin x; lim (sin x) = 0. Т е о р е м а 7. Для того чтобы функция f (x) имела предел A при x → a, необходимо и достаточно, чтобы вблизи а выполнялось равенство: f (x) = A + α(x), где α(x) → 0 при x → a. Т е о р е м а 8. Сумма фиксированного числа бесконечно малых функций при x → a есть функция бесконечно малая при x → a. Т е о р е м а 9. Произведение фиксированного числа бесконечно малых функций при x → a есть функция бесконечно малая при x → a. Т е о р е м а 10. Произведение функции бесконечно малой при x → a на функцию, ограниченную вблизи а, есть функция бесконечно малая при x → a. 5) Функция f (x) называется бесконечно большой при x → a, если lim f (x) = ±∞. Т е о р е м а 11. Если функция f (x) – бесконечно малая при x → a и f (x) ≠ 0 вблизи а, то функция 1/f (x) – бесконечно большая при x → a, и обратно, если функция f (x) – бесконечно большая при x → a, то функция 1/f (x) – бесконечно малая при x → a. Примеры: f (x) = x – бесконечно малая функция при x → 0, f (x) = 1/x – бесконечно большая функция при x → 0, f (x) = x – бесконечно большая функция при x → ∞, f (x) = 1/x – бесконечно малая функция при x → 0. 6) Сложная функция: u = ϕ(x), y = f (u), y = f [ϕ(x)]. Т е о р е м а 12. Если lim ϕ(x) = b, lim f(u) = A и, кроме того, A = f(b), то сложная функция y = f [ϕ(x)] имеет предел при x → a равный A.


Э.Ф. Казанцев

130

7) Число A называется пределом справа функции f (x) при x → a, если для любого числа ε > 0, найдется число δ > 0, такое, что неравенство A – f (x) < ε , выполняется для всех x, удовлетворяющих условию: 0 < x – a < δ. Обозначается: f (a + 0). Число A называется пределом слева функции f (x) при x → a, если неравенство f (a) – a < ε выполняется для всех x, для которых 0 < a – x < δ. Обозначается: f (a – 0). 8) Некоторые замечательные пределы а) Пусть P(x) = a0xn + a1xn–1 +…+an; Q(x) = b0xm + b1xm–1 +…+bm, тогда: P ( x) Q( x) xn m

a0 x n a1 x n 1 ... an b0 x m b1 x m 1 ... bm

x n (a0 a1 / x ... an / x n ) x m (b0 b1 / x ... bm / xm )

a0 a1 / x ... an / x n . b0 b1 / x ... bm / x m

n Но lim a0 a1 / x ... an / x m x o f b0

P( x) lim x o f Q( x)

b1 / x ... bm / x

a0 , следовательно b0

ɟɫɥɢ n m ­0, ° ®a0 / b0 , ɟɫɥɢ n m . °f , ɟɫɥɢ n ! m ¯

Пример: 3x 2 7 x 5 x of 4x2 9 lim

3 x3 3 ; lim 4 4 x of 3x 5 x 3

0.

б) lim

sin x sin x – четная, так как ; функция x x

f ( x)

sin ( x) x

xo 0

sin x x

f ( x),

поэтому достаточно рассмотреть значения 0 < x < π/2.


131

Математика

T M R x O

A

Рис. 2.1.1

Возьмем дугу радиуса R и угол в x радиан. ОМ = ОА = R; sin x или

MK ; tg x R

AT . R

Площадь ΔОАМ < площади сектора ОАМ < площади ΔОАТ (1/2)ОА·МК < (1/2)ОА·МК < (1/2)ОА·АТ и

(1/2)R2·sin x < (1/2)R2x < (1/2)R2·tg x, т.е. sin x < x < tg x. Разделим это неравенство на sin x: 1

x 1 или 1 ! sin x ! cos x; sin x cos x x

cos x → 1 при x → 0, поэтому lim

x o0

sin x x

1; x ! 0.

sin x 1; x 0. В силу четности функции sin x имеем: lim x

Окончательно: lim

xo0

sin x x

x o0

x

1.

в) lim (1 + 1/x) x = e; мы знаем что lim (1 + 1/n)n = e Пусть x > 1; положим n = E(x), тогда x = n + α(0 ≤ α ≤ 1), при x → +∞ (n → ∞) имеем: n

x

1· 1· 1 · § § § ¨1 ¸ ¨1 ¸ ¨1 ¸ n 1¹ x¹ n¹ © © ©

n 1

, но


Э.Ф. Казанцев

132

§ 1· ¨1 ¸ © n¹ § ©

и ¨1

n 1

n

§ 1· § 1· ¨1 ¸ ¨1 ¸ o e 1 e © n¹ © n¹

1 1 / n 1

n 1 o e 1 · ¸ n 1¹ 1 1 / n 1

1 n

e, т.е. lim (1 + 1/x) x = e.

Пусть теперь x < –1; положим x = –y. Тогда: § 1· ¨1 ¸ x¹ ©

x

§ 1· ¨¨1 ¸¸ y¹ ©

§ 1 · ¨¨1 ¸ y 1 ¸¹ ©

y 1

y

§ y · ¨¨ ¸¸ © y 1¹

y

§ 1 · ¨¨1 ¸ y 1 ¸¹ ©

§ 1 · ¨¨1 ¸ o e 1 e y 1 ¸¹ ©

при y → ∞ (x → ∞). Таким образом, в обоих случаях lim (1 + 1/x)x = e. Если положить 1/x = α (α → 0 при x → ∞), то lim (1 + α)1/α = = e. 9) Непрерывность функций Функция f (x), определенная в точке x0 и в некоторой ее окрестности, называется непрерывной в точке x 0, если предел функции при x → x0 равен значению функции в точке x 0: lim f (x) = f (x0) или иначе: lim f (x) = f (lim x), то есть для непрерывной функции, знаки функции и предела можно переставлять. Если функция f (x) определена в точке x0 и не является непрерывной в этой точке, то ее называют разрывной в точке x0. Т е о р е м а 13. Сумма, разность, произведение фиксированного числа функций, непрерывных в точке, непрерывны в этой точке. Т е о р е м а 14. Частное от деления двух функций, непрерывных в некоторой точке, непрерывно в этой точке при условии, что знаменатель не равен нулю в этой точке.


Математика

133

Т е о р е м а 15. Если u = φ(x) – непрерывная в точке x0, а функция y = f (u) непрерывна в точке u0, то функция y = f [φ(x)] непрерывна в точке x0. Функция f (x) называется непрерывной на интервале (a, b), если она непрерывна в каждой точке интервала. Функция f (x) называется непрерывной на отрезке [a, b], если она непрерывна на интервале (a, b), и, кроме того, непрерывна справа от точки a и непрерывна слева от точки b. То есть не требуется непрерывности на концах отрезка. Точка x0 называется точкой разрыва первого рода, если функция f (x) имеет конечные пределы справа и слева в этой точке, т.е. в точке x 0 функция имеет конечный скачок. Во всех остальных случаях x 0 называется точкой разрыва второго рода. Примеры: а) f (x) = e1/x, x = 0 – точка разрыва второго рода. б) f ( x)

sin x , x = 0 – точка разрыва первого рода. x

Функция f (x) называется ограниченной на промежутке, если существует число M > 0, такое, что для всех точек этого промежутка выполняется неравенство  f (x) < M. Это означает, что график функции на рассматриваемом промежутке не выходит из полосы –M < y < M. Т е о р е м а 16. Функция, непрерывная на отрезке [a, b] ограничена на этом отрезке. Т е о р е м а 17. Функция f(x), непрерывная на отрезке [a, b] принимает на этом отрезке свое наибольшее и наименьшее значение. Т е о р е м а 18. Функция, непрерывная на отрезке [a, b], принимает на этом отрезке все значения между любыми двумя ее значениями. Т е о р е м а 19. Функция, непрерывная на отрезке, равномерно непрерывна на нем.


Э.Ф. Казанцев

134

2.1.3. Производная функции одной переменной 1) Рассмотрим функцию y = f (x); x – значение аргумента. Разность x – x1 = ∆x называется приращением аргумента. Предполагаем, что ∆x ≠ 0. Точке x1 = x + ∆x соответствует функция f (x + ∆x). Разность f (x + ∆x) – f (x) = ∆y называется приращением функции. Функция f(x) называется непрерывной в точке x, если бесконечно малому приращению аргумента соответствует бесконечно малое приращение функции. Возьмем на кривой две точки M и N. Соединим их прямой MN – называющейся секущей. Будем приближать точку N к точке M неограниченно, то есть расстояние между MN стремится к нулю (рис. 2.1.2). y

N

y0 + 'y

y0 Рис. 2.1.2

M

x0

x0 + 'x

x

Предельное положение секущей MN при неограниченном приближении точки N по кривой к точке M называется касательной к кривой в точке M. Напишем уравнение касательной. Кривая с уравнением y = f (x) в точке M принимает значение y 0 = f (x 0), аргументу x0 + ∆x0 соответствует значение функции y0 + ∆y = f (x0 + ∆x) в точке N. Уравнение секущей: y – y0 = ∆y/c(x – x0).


Математика

135

Устремим ∆x → 0, тогда точка N стремится к точке M. Се­ кущая превратится в касательную. β – угол наклона секущей NM; α – угол наклона касательной в точке M. Если ∆x → 0, то β → α и tg β → tg α, но tg β = ∆y/∆x, следовательно, tg α = lim ∆y/∆x. Таким образом, уравнение касательной: y – y0 = lim ∆y c(x – x0). 2) Предел отношения приращения функции к приращению аргумента ∆y/∆x при стремлении приращения аргумента к нулю, если этот предел существует и конечен, называется производной функции f (x) в точке x. Обозначения: y′; f ′(x); dy/dx; df/dx yc

'y ; 'x o 0 'x lim

f c( x)

lim

'x o 0

f ( x 'x ) f ( x ) . 'x

Очевидно, что в каждой точке x производная будет иметь различные значения, то есть f ′(x) является функцией переменной x. Если фиксировать значения x, например, x = x0, то производная в точке x = x0 обозначается: yc x

x0

; f c( x0 );

df ( x0 ) . dx

Так как y′ = tg α, это означает, что производная функции f (x) в точке x равна угловому коэффициенту касательной в точке M(x, f (x)) к кривой, заданной уравнением y = f (x). П р и м е р : y = x 2; ∆y = f(x + ∆x) – f(x) = (x + ∆x)2 – x2 = 2x∆x + (∆x)2 и ∆y/∆x = = 2x + ∆x, следовательно y c lim

'y 'x

2x, или (x2)′ = 2x.

В частности при x = 1 f ′(1) = 2. Пусть y = 1, тогда для уравнения касательной y – 1 = 2(x – 1) и y = 2x – 1.


Э.Ф. Казанцев

136

3) Необходимо уточнить условие существования производной. Т е о р е м а 1. Если функция f (x) имеет производную в точке x, то она непрерывна в этой точке. Д о к а з а т е л ь с т в о : по условию, если существует производная, то существует предел: lim

'x o 0

f ( x 'x) f ( x) 'x

f c( x).

По определению предела: f ( x 'x) f ( x) 'x

f c( x) D , D o 0 ɩɪɢ 'x o 0.

Откуда ∆y = f (x + ∆x) – f (x) = [f ′(x) + α]∆x. Следовательно, ∆y → 0 при ∆x → 0, а это означает, что функция f (x) непрерывна в точке x. Заметим, что непрерывность функции в точке не является достаточным условием существования производной в данной точке. В определении производной речь идет о конечном пределе ∆y/∆x при ∆x → 0. Если этот предел бесконечен, то говорят, что производная не существует. Геометрически – это случай вертикальной касательной. Нахождение производной данной функции называется ее дифференцированием. 4) Производные элементарных функций а) y = c (c – const). ∆x ≠ 0, ∆y = 0, следовательно,

'y 'x

0 и yc

б) y = x. 'y

'x , lim

'xo0

'y 'x

1, xc 1.

'y 'x o 0 'x lim

0 , cc

0.


137

ĐœĐ°Ń‚оПаŃ‚ика

x 'x n x n nx n 1'x n n 1 x n 2 'x 2 ... 'x n , 1˜ 2 n n 1 n 2 n 1 n 1 nx x ... 'x , Ń ĐťĐľĐ´ĐžĐ˛Đ°Ń‚оНŃŒнО:

в) y = xn. 'y 'y 'x

ĐžŃ‚ĐşŃƒĐ´Đ° yc

lim

'x o 0

1˜ 2

'y 'x

nx n 1 , Ń‚Đž ĐľŃ Ń‚ŃŒ (xn)′ = nxn–1.

Đł) y = sin x. ∆y = sin (x + ∆x) – sin x. 'y lim 'x o 0 'x

yc

иНи y c

sin( x 'x ) sin x lim 'x o 0 'x

sin lim

'x o 0

(sin x)′ = cos x.

'x 'x ¡ § cos¨ x ¸ 2 2 š Š 'x 2

2 sin lim

'x o 0

'x 'x ¡ § cos¨ x ¸ 2 2 š Š 'x

'x ¡ § lim cos¨ x ¸ 2 š Š

'x o 0

cos x.

Đ´) y = cos x ∆y = cos (x + ∆x) – cos x yc

'y lim 'x o 0 'x sin

lim

'x o 0

2 sin lim

'x o 0

'x § x 'x ¡ sin¨ ¸ 2 Š 2 š 'x

'x § 'x ¡ sin¨ x ¸ 2 2 š Š 'x 2

sin x.

(cos x)′ = –sin x. 5) ĐžŃ Đ˝ĐžĐ˛Đ˝Ń‹Đľ правиНа диффоронциŃ€ОваниŃ?. Đ°) Đ&#x;Ń€ОиСвОднаŃ? Ń ŃƒППŃ‹ Ń„ŃƒнкциК. y = u Âą ν, u = f (x), ν = Ď•(x), Đ°Ń€ĐłŃƒПонŃ‚Ńƒ дадиП ĐżŃ€иращонио ∆x, Ń‚Огда u и ν пОНŃƒŃ‡Đ°Ń‚ Ń ĐžĐžŃ‚воŃ‚Ń Ń‚воннО ĐżŃ€иращонио ∆u и ∆ν.


Đ­.Ф. ĐšаСанцов

138

∆y = [(u + ∆u) Âą (ν + ∆ν)] â€“ u Âą ν = ∆u + ∆ν 'y 'x yc

'u 'v r 'x 'x § 'u 'v ¡ lim ¨ r ¸ 'x o 0Š 'x 'x š

lim

'x o 0

'u 'v r lim . ' x o 0 'x 'x

ĐžкОнчатоНŃŒнО: (u Âą ν)′= u′ Âą ν′. Đą) Đ&#x;Ń€ОиСвОднаŃ? прОиСводониŃ?. y = uν ∆y = (u + ∆u)(ν + ∆ν) â€“ uν = ν∆u + u∆ν. 'y 'v 'u ¡ § 'u lim ¨ v u 'v ¸ 'x o0 'x 'x o0Š 'x 'x 'x š 'u 'v 'u lim v lim u lim lim 'v 'x o0 'x 'x o0 'x 'x o0 'x 'x o0 lim

'u 'x o 0 'x

Так как lim

'v 'x o 0 'x

u c, lim

vc, lim 'v 'x o 0

0, Ń‚Đž y′ = (u â‹… ν)′ =

u′ν + ν′u. Đ’ Ń‡Đ°Ń Ń‚Đ˝ĐžŃ Ń‚и, ĐľŃ ĐťĐ¸ ν = c (c â€“ const), Ń‚Đž (cu)′ = c′u + cu′ = cu′, Ń‚.Đľ. ĐżĐžŃ Ń‚ĐžŃ?ннŃ‹Đš ПнОМиŃ‚оНŃŒ ПОМнО вŃ‹Đ˝ĐžŃ Đ¸Ń‚ŃŒ Са Снак прОиСвОд­ нОК. Đ&#x;Ń€иПоŃ€: y = 2x3 + 5x2 â€“ 7; y′ = 2(x3)′ + 5(x2)′ = 6x2 + 10x. Đ•Ń ĐťĐ¸ даны Ń‚Ń€и Ń„Ńƒнкции: y = uνw, Ń‚Đž (uνw)′ = [(uν)w] = (uν)′w + (uν)w′ = (u′ν + uν′)w + (uν)w′ = = u′νw + uν′w + uνw′. в) Đ&#x;Ń€ОиСвОднаŃ? Ń‡Đ°Ń Ń‚нОгО. y ν = Ď•(x) ≠0. 'y

u 'u u v 'v v

'y lim 'x o 0 'x

lim

'x o 0

v

v'u u'v ; v v 'v

'v 'u u 'x ; 'x v v 'v

u v


139

ĐœĐ°Ń‚оПаŃ‚ика

uc v

u cv vcu . v2

Đ’оСдо приПонŃ?оП Ń‚оОŃ€оПŃ‹ Đž продоНаŃ… Ń‡Đ°Ń Ń‚нОгО, прОиСводониŃ?, Ń ŃƒППŃ‹ и Đž нопŃ€ĐľŃ€Ń‹Đ˛Đ˝ĐžŃ Ń‚и Ń„Ńƒнкции в тОчко x. Đ&#x;Ń€иПоры: c c c 2 2 § sin x ¡ sin x cos x cos x sin x cos x sin x tg xc ¨ ¸ cos 2 x cos 2 x Š cos x š 1 , ÉŹ.É&#x;. tg x c sec 2 x . 2 cos x c c c 2 2 ctg x c §¨ cos x ¡¸ cos x sin x 2 sin x cos x sin x 2cos x sin x sin x Š sin x š 1 , ÉŹ.É&#x;. ctg x c cosec 2 x . 2 sin x

sec x c cosec x c

c

cos x c cos 2 x

§ 1 ¡ ¸ ¨ Š cos x š

c

§ 1 ¡ ¨ ¸ Š sin x š

sin x c sin 2 x

sin x , ÉŹ.É&#x;. sec x c cos 2 x cos x , ÉŹ.É&#x;. cosec x c 2 sin x

tg x sec x. ctg x cosec x.

Đł) Đ&#x;Ń€ОиСвОднаŃ? Ń ĐťĐžĐśĐ˝ĐžĐš Ń„Ńƒнкции. y = f (u), u = Ď•(x) 'y 'x

'y 'u  â€“ Ń‚ĐžĐśĐ´ĐľŃ Ń‚вО. ˜ 'u 'x

'y 'x o0 'x lim

dy 'y 'u ˜ lim иНи 'u o0 'u 'x o0 'x dx lim

dy du ˜ . du dx

Đ&#x;Ń€иПоŃ€: y = (2 + x2)10 ĐžйОСначиП: y = u10, u = 2 + x2, Ń‚Огда y′ = 10u9u′ = 10(2 + x2)(2 + x2)′= 20x(2 + x2)9.


Đ­.Ф. ĐšаСанцов

140

Đ´) Đ&#x;Ń€ОиСвОднаŃ? НОгаŃ€иŃ„ПиŃ‡ĐľŃ ĐşĐžĐš Ń„Ńƒнкции. y = ln x. Đ&#x;ŃƒŃ Ń‚ŃŒ x > 0 'y 'x

ln( x 'x ) ln x 'x x 1 ˜

§ 'x ¡ 'x x ln¨1 ¸ x š Š

1

§ x 'x ¡ 'x ln¨ ¸ Š x š

1

§ 'x ¡ 'x ln¨1 ¸ x š Š

x

1 § 'x ¡ 'x ln¨1 ¸ . x š x Š x

x

1 § ' x ¡ 'x y c lim ln¨1 ¸ 'x o 0 x Š x š 1 1 . ln e x x

1 § 'x ¡ ' x lim ln¨1 ¸ x 'x o o Š x š

ТакиП ОйŃ€аСОП, (ln x)c

1 . x

Đ•Ń ĐťĐ¸ y = loga x, и Ń‚Đ°Đş как log a x

x

1 § ' x ¡ 'x ln lim ¨1 ¸ x 'x o 0Š x š

ln x , Ń‚Đž log a x c lg a

1 . x ˜ ln a

Đ&#x;ŃƒŃ Ń‚ŃŒ y = ln x â€“ Ń„ŃƒнкциŃ? ОпŃ€одоНоннаŃ? воСдо, крОПо тОчки x = 0. y

­ln x , x ! 0 , Ž ¯ln x , x 0

ln x

ln x c

c ln x

c x

1 , x

x

1 c , , Ń‚акиП ОйŃ€аСОП, ln x

x

1 . x

Đ?аКдоП ĐżŃ€ОиСвОднŃƒŃŽ y = ln f(x). ĐžйОСначиП y = ln u, u = f (x). ТОгда yc

ln u c ˜ uc

1 ˜ uc u

f c x

f(x)

ln f ( x ) c .

f c x

наСŃ‹ваоŃ‚Ń Ń? НОгаŃ€иŃ„ПиŃ‡ĐľŃ ĐşĐžĐš прОиСвОf x

yc днОК Ń„Ńƒнкции f (x), Ń‚Đž ĐľŃ Ń‚ŃŒ f′ (x) = (ln f (x))′ â‹… f (x) иНи ln y c . y

ОтнОŃˆонио

Đ­Ń‚Đž ŃƒĐżŃ€ĐžŃ‰Đ°ĐľŃ‚ вСŃ?Ń‚ио прОиСвОднŃ‹Ń… От Ń ĐťĐžĐśĐ˝Ń‹Ń… Ń„ŃƒнкциК.


141

Математика

Пример: y

x 1 10 e sin x . (1 x 2 ) 3

3

Логарифмируем ln y 10 ln x 1 sin x ln (1 x 2 ), диффе2 ренцируем f c x

f x

ln y c

10 3 2x cos x 2 1 x2 x 1

yc , y

откуда yc

10 3 x x 1 10 e sin x . cos x x 1 1 x2 2 3 1 x

Способ логарифмического дифференцирования применим, если x ≠ 1. е) Производная степенных функций. y = xα, где x ≠ 0 yc . y

c Прологарифмируем ln y = α ⋅ ln x, тогда ln y

yc y

1 D ; yc x

D y x

D x 1 .

Таким образом (xα)′ = α ⋅ x–1. §1· В частности: при α = –1 ¨ ¸ ©x¹

c

1 , при D x2

1 2

x c

y = ax; a > 0; a ≠ 1; ln y = x ln a;

yc y

ln a;

y′ = ln a ⋅ y = ax ⋅ ln a; (ax)′ = ax ⋅ ln a. Пусть a = e, тогда (ex)′ = ex. 2 x

c П р и м е р : y 2ln x ; yc 2ln x ln x ln 2 2ln x ln .

1 x. 2


Đ­.Ф. ĐšаСанцов

142

Đś) Đ&#x;Ń€ОиСвОднаŃ? пОкаСаŃ‚оНŃŒнО-Ń Ń‚опоннОК Ń„Ńƒнкции. y = uν; u = f(x); ν = Ď•(x); ln y = ν ln u yc y

vc ln u v

§ uc ¡ u v ¨ v vc ln u ¸; Š u š

uc , ĐžŃ‚ĐşŃƒĐ´Đ°: y , u

((u)ν)′ = νuν–1u′ + uνν′ln u. С) Đ&#x;Ń€ОиСвОднŃ‹Đľ Ойратных Ń„ŃƒнкциК. y = arcsin x, Ń‚Đž ĐľŃ Ń‚ŃŒ x = –sin x. Đ”иффоронциŃ€ŃƒоП: 1 = cos y â‹…  y′, ĐžŃ‚ĐşŃƒĐ´Đ° y c

yc

1 x 2 , Ń‚акиП ОйŃ€аСОП,

1 sin 2 y

cos y

1

arcsin x c

1 . cos y

1 x2

, –1 < x < 1.

y = arccos x; x = cos y. Đ”иффоронциŃ€ŃƒоП: 1 = –sin y â‹… y′. yc

1 sin y

1 2

1 cos y

1 1 x2

.

y = arctg x; x = tg y. Đ”иффоронциŃ€ŃƒоП: 1 = sec2 y â‹… y′ yc

1 sec 2 y

1 1 tg 2 y

1 . 1 x2

y = arcctg x; x = ctg x. Đ”иффоронциŃ€ŃƒоП: 1 = –cosec2x â‹… y′ yc

1 cosec 2 x

1 1 ctg 2 x

1 . 1 x2

y = f(x); x = Ď•(y). Đ”иффоронциŃ€ŃƒоП: 1 = ϕ′(y) y′; yc

1 ; c M y

dy dx

1 . dx dy


ĐœĐ°Ń‚оПаŃ‚ика

ТайНица Ń„ĐžŃ€ĐźŃƒĐť диффоронциŃ€ОваниŃ?

1. y = c

y′ = 0

2. y = x

y′ = 1

3. y = x

y′ = axa â€“ 1

a

y

y

x 1 x

yc

1 2 x

yc

1 x2

4. y= a

y′ = ax ln a

y = e x

y′ = ex

5. y = loga x

yc

1 x ln a

y = ln x

yc

1 x

6. y = sin x

y′ = cos x

7. y = cos x

y′ = –sin x

8. y = tg x

y′ = sec2 x

9. y = ctg x

y′ = –cosec2 x

10. y = sec x

y′ = sec x ⋅ tg x

x

11. y = cosec x y′ = –cosec x ⋅ ctg x 2 12. y = arcsin x yc 1 1 x

13. y = arcos x

yc

14. y = arctg x

yc 1

1

1 x2 1 x2

15. y = arcctg x yc 1 1 x 2

143


Э.Ф. Казанцев

144

6) Производные высших порядков О п р е д е л е н и е 1: производная функции f ′(x) в точке x называется второй производной функции f (x), или производной второго порядка в этой точке. 2 2 Обозначения: y′′; f ′′(x); d y ; d f ; y ; f . xx xx 2 2

dx

dx

d2y dx 2

Таким образом: y′′ = (y′)′ или

d § dy · ¨ ¸. dx © dx ¹

О п р е д е л е н и е 2: производная от второй производной называется третьей производной. О п р е д е л е н и е 3: n-ой производной, или производной n-го порядка функции f(x) в точке х, называется производная от производной (n – 1)-го порядка в этой точке и обозначается: y( n ) ; f

(n)

( x );

dny dx n

;

df n x d n y ; dx n dx n

d §¨ d n 1 y ·¸ . dx ¨© dx n 1 ¸¹

П р и м е р : y = x4 + 5x + 4; y′ = 4x3 + 5; y′′ = 12x2; y′′′ = 24x; y = 24; y(5) = 0. Вторая производная имеет механический смысл ускорения. Пусть (4)

S

f (t ) ;

ds dt

V (t ) – скорость;

d 2S dt

2

d § dS · ¨ ¸ dt © dt ¹

dV – ускорение. dt

Общие правила нахождения производных: а) (cu)′ = cu ′; (cu)′′ = (cu′)′ = cu ′′; cu(n) = cu(n); (n)

б) (u ± ν)′ = u′ ± ν′; (u ± ν)′′ = (u′ ± ν′)′ = u′′ ± ν′′; (u′ ± ν′) = u(n) ± ν(n);

в) (uν)′ = u′ν + uν′; (uν)′′ = (u′ν + uν′)′ = u′′ν + u′ν′ + u′ν′ + uν′′ = u′′ν + 2u′ν′ + uν′′; (uν)′′′ = (u′′ν + 2u′ν′ + uν′′)′ = u′′′ν + u′′ν′ + 2u′′ν′ + 2u′ν′′ + u′ν′′ + uν′′′ = u′′′ν + 3u′′ν′ + 3u′ν′′ + uν′′′.


Математика

145

Формула Лейбница:

uv n

u n v nu n 1 vc

n n 1 n 2

u vcc 2!

n n 1 >n k 1 @ n k k

u v uv n . k!

7) Дифференциал функции Пусть y = f (x); lim Тогда

'y 'x

x of

'y 'x

f c x .

f c x D , где α → 0 при ∆x → 0, следовательно,

первое слагаемое f ′(x)∆x является бесконечно малым 1-го порядка (главная часть), второе слагаемое α∆x является бесконечно малым второго порядка. О п р е д е л е н и е 1: функция y = f (x) называется дифференцируемой в точке х, если приращение функции в точке х можно записать как сумму главной части относительно ∆x и бесконечно малой части более высокого порядка, чем ∆x. О п р е д е л е н и е 2: дифференциалом функции f (x) в точке x называется главная, линейная относительно ∆x часть приращения функции. Дифференциал обозначается dy; df(x); dy = f ′(x)dx; то есть fc

dy – отношение дифференциалов. dx

Геометрический смысл дифференциала: из ∆MLK: KL = dy = = tg α ⋅ ∆x; dy = y′ ⋅ ∆x, (рис. 2.1.3) Понятия «функция, дифференцируемая в точке» и «функция, имеющая производную в точке» равносильны. Свойства дифференциала: а) d(u ± ν) = (u ± ν)′dx = u′dx ± ν′dx = du ± dν; б) d(uν) = (uν)′dx = (u′ν + ν′u)dx = νdu + udν; u uc в) d §¨ ·¸ §¨ ·¸dx ©v¹

©v¹

u cv vcu dx v2

vdu udv ; v2


Э.Ф. Казанцев

146

Рис. 2.1.3

г) d 2y = d(dy) = f ′′(x)dx2; d 3y = d(d 2y) = f ′′′(x)dx3; dny = f(n)(x)dxn. 8) Теоремы о среднем Т е о р е м а Р о л л я . Если функция f (x) непрерывна на отрезке [a, b], дифференцируема на интервале (a, b) и значения функции на концах отрезка равны, f (a) = f (b), то на интервале (a, b) существует точка ξ, a < ξ < b в которой производная функции f (x) равна нулю: f'(ξ)=0, то есть если выполняются условия теоремы, то в точке ξ касательная параллельна оси ОХ. Точек может быть много. Д о к а з а т е л ь с т в о : пусть в точке ξ  f (ξ)= M – наибольшее значение функции, тогда: ∆f (ξ) = f (ξ + ∆x) – f (ξ) < 0. 'x ! 0 0 При этом: 'f [ ­® , ɟɫɥɢ . 'x

¯! 0

'x 0

Так как по условию теоремы производная существует в точке ξ, то существует и предел lim lim

'f 'f [

0, а значит lim 'x o 0 'x 'x

валось доказать.

'f [

. Учитывая, что 'x

0, то есть f ′(ξ) = 0, что и требо-


147

Математика

Т е о р е м а Л а г р а н ж а . Если функция f (x) непрерывна на отрезке [a, b] и дифференцируема на интервале (a, b), то на этом интервале найдется точка ξ, a < ξ < b, такая что f (b) f (a) b a

f c([).

Заметим, что теорема Ролля является частным случаем теоремы Лагранжа при f (a) = f (b). щей.

Геометрически

f (b) f (a ) – угловой коэффициент секуb a

Д о к а з а т е л ь с т в о : рассмотрим вспомогательную функцию F(x) = f (x) – yсек. Уравнение секущей в точке (a, f (a)): y f (a)

f b f a

x a . b a

При этом: F ( x)

f ( x) f (a )

f (b) f (a) ( x a) . b a

Функция F(x) удовлетворяет теореме Ролля, так как при x = a, x = b, F(a) = 0, F(b) = 0, то есть F(a) = f (b). Таким образом, F'(ξ) = 0. Так как F c( x) откуда f c([)

f c( x)

f (b ) f ( a ) , то F c([) b a

f c([)

f (b) f (a ) , b a

f (b) f (a ) , что и требовалось доказать. b a

Формула f (b) – f (a)=f'(ξ)(b – a) называется формулой Лагранжа или формулой конечных приращений. Т е о р е м а К о ш и . Если функции f (x) и ϕ(x) непрерывны на отрезке [a, b], дифференцируемы на интервале (a, b), и ϕ′(x) ≠ 0, то существует точка ξ, a < ξ < b, такая, что f (b) f (a ) M(b) M(a)

f c [

. Mc [


Э.Ф. Казанцев

148

Д о к а з а т е л ь с т в о : заметим, что ϕ(b) – ϕ(a) ≠ 0. Дей­ ствительно, если бы ϕ'(b) = ϕ(a), то по теореме Ролля найдется точка η, где ϕ'(η) = 0, а это противоречит условию теоремы: ϕ'(x) ≠ 0. Рассмотрим вспомогательную функцию: F ( x)

f ( x) f (a)

f (b) f (a) >M x M a @ . M(b) M(a)

Нетрудно видеть, что на отрезке [a, b] эта функция удовлетворяет теореме Ролля, то есть F(a) = F(b), таким образом, F'(ξ) = 0. Так как F c( x) F c [ 0 f (b) f (a ) M b M a

f c([)

f c( x)

f (b ) f (a ) Mc x , то M(b) M(a)

f (b) f (a) Mc [ , то есть M(b) M(a)

f c [

, что и требовалось доказать. Mc [

Это формула Коши. Теорема Лагранжа – частный случай теоремы Коши. 9) Неопределенности Рассмотрим бесконечные последовательности. Последова­ тельность может иметь конечный предел: xn = n2; yn = –n2 + 5; xn + yn = 5 → 5. Последовательность может стремиться к ∞: xn = n2 + n; yn 2 = –n ; xn + yn = n → ~. Последовательность может стремиться к 0: xn = n2; yn = –n2 + 1/n; xn + yn = 1/n → 0. Может встретиться такой случай: xn = n2 → ∞; yn = –n2 + (–1)n → –∞; xn + yn = (–1)n – предела нет. В этом случае говорят, что имеет место неопределенность вида «∞, –∞».


149

Математика

При делении последовательностей могут встретиться не­ определенности вида 0/0 и ~/~. Чтобы выяснить, как себя ведет в этом случае последовательность, говорят, что надо «раскрыть» неопределенность. П р и м е р 1: найти lim ( n n 1) – неопределенность (∞, nof –∞), lim ( n n 1)

nof

lim

n (n 1)

nof

n n 1

0.

n 4 5n 3 (неопределенность ∞, –∞) = n of n 3n 1 5 / n3 3 / n 4 n 4 (1 5 / n 3 3 / n 4 ) lim 3 lim n f. nof n (1 7 / n 2 6 / n 3 ) nof 1 7 / n 2 6 / n 3

П р и м е р 2: lim

То же самое встречается, при рассмотрении предела отношений функции

f ( x) , если в точке а функция f (a) = f (a) = 0. M( x)

Раскрытие таких неопределенностей делается с помощью правила Лопиталя. П р а в и л о Л о п и т а л я : если функции f(x) и ϕ(х) дифференцируемы в точке а, непрерывны в точке а, ϕ'(a) ≠ 0 и f(a) = = ϕ(a) = 0, то предел отношения функции при x → a, равен пределу отношений их производных (если тот существует): lim

x oa

f ( x) M( x)

lim

x oa

f c( x) . Mc( x)

Д о к а з а т е л ь с т в о : применим формулу Коши: f ( x) f ( a ) M( x) M(a)

f c [

, x < ξ < a. Mc [

Учитывая, что f (a) = ϕ(a) = 0; тогда ξ → a и lim

xoa

f ( x) M( x)

lim

xoa

f ( x) M( x)

f c([) . Пусть x → a, Mc([)

f c( x) , что и требовалось доказать. Mc( x)

Если окажется, что f ′(x) и ϕ'(x) – бесконечно малые при x → a, то правило Лопиталя надо применить еще раз, до тех пор, пока не появится определенность.


Э.Ф. Казанцев

150

Пример: ex 1 xo0 x

ex xo0 1

lim

lim

1.

Правило Лопиталя справедливо и при x → ∞: f c( x) . x o f Mc( x)

f ( x) x of M( x ) lim

lim

f (x) o f и lim M( x) o f, То же и для: xlim oa x oa lim

xoa

f ( x) M( x)

lim

xoa

f c( x) . Mc( x)

Пример: lim

xof

ln x x

x xof a x lim

lim

xof

1/ x 1

Dx x xof a ln a lim

0,

Į(D 1) (D (n 1) x) n xof a x (ln a) n lim

0.

Неопределенность типа 0 ⋅ ∞ и ∞⋅ ∞ можно свести к известным 0/0 и ∞/∞. Пусть f(x) → 0, ϕ (x) → ∞, x → a, f ( x ) M( x)

­ f ( x) °1 / M( x) ° . ® ° M( x) °¯1 / f ( x)

f ( x) – неопределенность типа 0/0, 1 / M( x) M( x) – неопределенность типа ∞/∞. 1 / f ( x)

Пример: Неопределенности вида 00, 1, ∞0 встречаются при рассмотрении функции y = [f (x)]ϕ(x). Для нахождения предела у доста-


151

Математика

точно найти предел ln y = ϕ(x) ⋅ ln f (x). Действительно, если lim ln y

xoa

A, то lim y x oa

e A , а при отыскании lim ln y придется расxoa

крывать неопределенность вида 0, ∞, которая приводится к 0/0 и ∞/∞. Пример: lim x x ; y

x o0

x x ; ln y

x ln x , lim ln y x o0

Следовательно: lim y lim x x x o0

x o0

lim x ln x

x o0

0.

e 0 1.

Задания для самостоятельной работы 1) Найти производную второго порядка: а) y = x²·ln x б) y = exp (–x²) в) y = sin² x г) y = (exp x)·cos x д) y = (exp x³) / x² 2) Найти производную четвертого порядка: а) y = (x + 1) / (x – 1) б) y = (exp x)·sin x в) y = cos x·(3x³ – 4)

2.1.4. Исследование функции с помощью производных 1) Возрастание и убывание функций О п р е д е л е н и е : функция f(x) называется возрастающей на данном промежутке, если для любых двух точек x1 и x2 этого промежутка из неравенства x1 < x2 следует неравенство f (x1) < f (x2), то есть функция возрастает, если знак приращения функции ∆y совпадает со знаком приращения аргумента ∆x. О п р е д е л е н и е : функция f (x) называется убывающей на данном промежутке, если для неравенства x1 < x2 следует неравенство f (x1) > f (x2), то есть приращение функции аргумента разного знака.


Э.Ф. Казанцев

152

Т е о р е м а (необходимое условие возрастания и убывания функции). Если дифференцируемая функция f (x) возрастает на данном промежутке, то в любой точке х этого промежутка f ′(x) > 0. Если функция f (x) убывает, то f ′(x) < 0 в любой точке этого промежутка. Д о к а з а т е л ь с т в о : пусть f (x) – возрастает. Рассмотрим точку х, дадим х приращение ∆x, соответствующее приращению функции ∆y, 'ɯ ! 0, так как они одного знака. Приведем 'y 'x o 0 'x

к пределу: lim

'ɭ f c( x) t 'x. Аналогично доказывается и для

убывающей функции. Геометрически это означает, что касательная к возрастающей функции образует острый угол с ОХ, а к убывающей – тупой угол с ОХ. Т е о р е м а (достаточное условие возрастания и убывания функции). Если в каждой точке х данного промежутка f ′(x) > 0, то функция f (x) возрастает на этом промежутке. Если в каждой точке х f ′(x) < 0, то функция f (x) убывает на этом промежутке. Д о к а з а т е л ь с т в о : по условию f ′(x) > 0. Возьмем две точки x1 и x2. По формуле Лагранжа: f (x2) – f (x1) = f ′(ξ)(x2 – x1). Так как = f ′(ξ) > 0, то знаки (x2 – x1) и f (x2) – f (x1) совпадают, то есть функция возрастает. Аналогично и для f ′(x) < 0. Точка, в которой f ′(x) = 0 называется точкой стационарности функции. Еще могут быть точки, где производной не существует. Эти точки называются критическими для функции f(x). Критические точки разбивают область определения функции на интервале, где f ′(x) сохраняет знак. Правила исследования функций: а) находим критические точки функции и разбиваем на интервалы; б) исследуем знак f ′(x) на каждом из этих интервалов. Если f ′(x) > 0, то функция возрастает, если f ′(x) < 0 – убывает.


Математика

153

2) Экстремум функции О п р е д е л е н и е 1. Точка x0 называется точкой максимума функции f (x), если в окрестности точки x0 выполняется неравенство f (x) < f (x0). О п р е д е л е н и е 2. Точка x0 называется точкой минимума функции f (x), если в окрестности точки x0 выполняется неравенство f (x) > f (x0). Точки максимума и минимума называются точками экстремума. Функция может иметь на отрезке несколько экстремумов, причем некоторые минимумы функции могут быть больше максимумов. Т е о р е м а (необходимые условия экстремума функции). Если дифференцируемая функция f (x) имеет в точке x0 экстремум, то f ′(x0) = 0. Д о к а з а т е л ь с т в о : пусть y = f (x) имеет в точке x0 max. Тогда ∆y = f (x0 + ∆x) – f (x0) < 0. 'y ­ 0 ɩɪɢ 'x ! 0 . ® 'x ¯! 0 ɩɪɢ 'x 0 'y 'y ! 0. d 0, lim Переходя к пределу: 'lim x o 0 'x 'x o 0 'x

Следовательно:

'x ! 0

'x 0

По определению эти пределы равны: f ′(x0) = 0. Т е о р е м а (достаточное условие существования экстремума). Если функция f (x) непрерывна в точке x0 и дифференцируема в некоторой ее окрестности и при переходе через точку x 0 f ′(x) меняет знак с плюса на минус, то функция f (x) имеет максимум в точке x0, если же f ′(x) меняет свой знак с минуса на плюс, то в точке x0 функция f (x) имеет минимум. Д о к а з а т е л ь с т в а : пусть f ′(x) меняет знак при переходе точки x0 с плюса на минус. Тогда по функции Лагранжа: f (x) – f (x0) = f ′(ξ)(x – x0), x < ξ <x0. Если x < x0, то f ′(ξ) > 0 и f (x) – f (x0) < 0.


154

Э.Ф. Казанцев

Если x > x0, то f ′(ξ) < 0 и f (x) – f (x0) < 0. Таким образом в окрестности точки x0 f (x) – f (x0) < 0, то есть это максимум. Аналогично рассматривается случай минимума. Правила нахождения экстремума: а) найти точки, в которых f ′(x) = 0 или не существует; б) исследовать знак f ′(x) в окрестности критической точки. Если f ′(x) меняет знак при переходе через критическую точку, значит в этой точке f (x) имеет экстремум. 3) Точка перегиба О п р е д е л е н и е 1. Кривая называется выпуклой в точке x0, если в некоторой окрестности точки x0 кривая расположена ниже касательной в точке x0. О п р е д е л е н и е 2. Кривая называется вогнутой в точке x0, если в некоторой окрестности точки x0 кривая расположена ниже касательной в точке x0. О п р е д е л е н и е 3. Точка x0 называется точкой перегиба кривой y = f (x), если с одной стороны от x0 кривая выпукла, с другой стороны от x0 кривая вогнута, то есть касательная в точке перегиба кривой пересекает эту кривую. Т е о р е м а . Если функция f (x) в некоторой окрестности точки x0 дважды дифференцируема и f ′′(x) ≠ 0, то необходимым и достаточным условием выпуклости кривой является условие f ′′(x) < 0, а вогнутости – f ′′(x) > 0. Из этой теоремы непосредственно получаем необходимые условия точек перегиба. Если f(x) – дважды дифференцируемая функция на некотором промежутке, то в точках перегиба кривой у = f(x) на этом промежутке, вторая производная равна нулю f ′′(x) = 0. Но этого еще не достаточно для существования точки перегиба. П р и м е р : y = x3; y′ = 3x2; y′′ = 6x; х = 0 – точка перегиба. y = x4; y′ = 4x3; y′′ = 12x2; х = 0 – не точка перегиба. Т е о р е м а (достаточное условие точки перегиба). Если в некоторой окрестности точки x0 вторая производная f ′′(x) не-


155

Математика

прерывна и при переходе через точку x0 меняет знак, то точка x0 – точка перегиба. Д о к а з а т е л ь с т в о : действительно, если знак второй производной при переходе через точку x0 меняет знак с «+» на «–», то это означает, что вогнутость сменилась на выпуклость, то есть x0 – точка перегиба. Если f ′′(x) не меняет знак при переходе через точку x0, то в этой точке перегиба нет. Правила исследования на точку перегиба: а) находим точки, где f ′′(x)= 0 или f ′′(x) – не существует – это критические точки функции f(x) по второй производной; б) эти точки делят область определения функции f(x) на интервалы, где f ′′(x) сохраняет знак. Если f  ′′(x) > 0 – это вогнутость. Если f ′′(x) < 0 – это выпуклость. Точка перегиба – разделяет интервалы вогнутости и выпуклости. Уравнение асимптоты Асимптотой называется прямая, расстояние от которой до точки на кривой, стремится к нулю при неограниченном удалении этой точки по кривой от начала координат (рис. 2.1.4).

Рис. 2.1.4


Э.Ф. Казанцев

156

Yкр = f (x) – кривая; Yкас = kx + b – асимптота; | Yɤɪ Yɤɚɫ | MN

MP o 0 при x → ~, то есть Yкр – Yкас = α(x); cos M

α(x) → ~; x → ~ или f (x) – (kx + b) = α(x); определим k и b. Разделим на х: f ( x) f ( x) D( x) k , перейдем к пределу: lim (k b / x) x of x x x f ( x) откуда k lim . x of x

0,

Теперь определим b: b = f (x) – kx – α(x), перейдем к преде-

лу: b y = b;

х = а.

lim [ f ( x) kx] :

x of

а) если при х → ~: y → b – это горизонтальная асимптота б) если при х → ~: y → ~ – возможна наклонная асимптота; в) если при x → a: y → ∞ – эта вертикальная асимптота:

Построение графиков Правила: а) найти область определения функции; б) проверить функцию на четность и нечетность; в) исследовать знак функции f (x) по ее критическим точкам, то есть там, где f (x) = 0; г) найти асимптоты функции; д) исследовать функцию на возрастание, убывание и экстремум: f ′(x); е) исследовать функцию на выпуклость, вогнутость и перегиб: f ′′(x); ж) кроме того, следует посмотреть, как ведет себя функция при стремлении к граничным точкам области ее определения.


157

Математика

П р и м е р : f ( x)

x3 : x2 1

а) область определения: везде, кроме x = ±1; б) f (x) – нечетная, так как f (–x) = –f (x), то есть достаточно исследовать функцию только для x ≥ 0; в) критические точки: f (x) = 0 при х = 0, не существует при x = ±1. При 0 < x < 1: f (x) – отрицательна, 1 < x < ∞: f (x) – положительна (рис. 2.1.5).

Рис. 2.1.5

Заштриховываем те области, где функция не существует. г) асимптоты: х = –1, х = 1 – вертикальные асимптоты, так как при x → ±1; f (x) → ~; x3 xof x 2 1 lim k b

lim

x of

3x 2 xof 2 x lim

f ( x) x

lim

x of

lim [ f ( x) kx]

x of

lim

xof

6x ~ , то есть асимптота наклонная; 2

x2 x 1 2

lim

x of

lim

x of

x x2 1

2x 2x lim

x of

Уравнение асимптоты: у = х,

lim

x of

1 2x

2 2 0.

1;


Э.Ф. Казанцев

158

д) точки экстремума: yc

3 x 2 ( x 2 1) 2 x x3

x 2 ( x 2 3)

( x 2 1) 2

( x 2 1) 2

y′′ = 0 при х = 0; x r 3 | 1,7 , при 0 < x < 1 y′ отрицательно, значит, у убывает; при 1 x 3 y′ отрицательно, значит, у убывает; при 3 x ~ y′ положительно, значит, у возрастает. е) y cc

[2 x( x 2 3) x 2 2 x]( x 2 1) 2 2( x 2 1)2 x x 2 ( x 2 3) , ( x 2 1) 4

при х = 0; y″ = 0 – значит точка х = 0 – точка перегиба, при x f ( 3)

при x

3 2 3 (3 1) 2 3 3 ! 0 – минимум, 2 (3 1) 4 3 3 3 3 ;, 3 1 2 3 3 3 ; y cc 0 – максимум. 2 3 ; y cc

Задания для самостоятельной работы 1) Найти предел функций:

б) lim [ x 5 x 6 x 3 ] в) lim [ x 5 x 3 ] г) lim [ x x 1 x 1 ] д) lim [ 2 x 4 x 5 ]

2 а) lim [ x 25 x 5 ] x o5

2

x o3

3

xof

x of

2

2

2

3

2

x of

е) lim x ctg x

x o0

2) Найти производную функций: а) y = x³ + 2x² + 4 б) y = [(x³ – 1) / (x² + 1)]


Математика

159

в) y = (sin x) / x г) y = sin x – (sin³ x)/3 д) y = cos (1 – 3x) е) y = (cos x)³ ж) y = ln (2x) з) y = ln² x и) y = ln (x²) к) y = ln (sin 2x) 3) Исследовать функцию и построить график: а) y = (exp x) / x б) y = x² / exp (–x) в) y = x / (x² + 1) г) y = (ln x) / x д) y = x³ – 3x 4) Раскрыть неопределенности:

а) lim [ x3 3 x 2 2 2 x 3 4 x 2 3 ] x of

б) lim [ x3 exp x ] x of

в) lim [ exp x 1 x] x of

2.2. Элементы теории функций нескольких переменных 2.2.1. Основные понятия О п р е д е л е н и е 1. Переменная z называется функцией двух переменных x и y, если каждой паре чисел (x, y) по определенному правилу ставится в соответствие одно или несколько значений переменной z.


Э.Ф. Казанцев

160

Если одно значение, то z называют однозначной функцией, если много значений, то многозначной функцией. х и у – независимые переменные, z – зависимая переменная или функция. Множество пар чисел (х, у) для которых определена функция z, называется областью определения этой функции. Обозначается: z = f (x, y); z = ϕ(x, y); z = F(x, y). Частное значение функции z при х = х0, у = у0 обозначается f (x0, y0). Функция z может задаваться аналитически, графически, таблично. Примеры: z = ln (1 + x4 + y4), или V = 1/3πR2H – объем конуса (переменные R, H), или z = x2 + y2 – параболоид вращения. В прямоугольной системе координат область определения обозначается некоторым множеством точек. Например, для функции z = ln (1 + x4 + y4) – это вся плоскость ХОY кроме круга с центром в точке (0, 0) и радиуса 1. Геометрически функция z= f (x, y) изображается в виде поверхности. О п р е д е л е н и е 2. Линией уровня функции z = f (x, y) называется геометрическое множество точек (х, у) плоскости, в которой функция принимает одно и то же значение с: f (x, y) = с. Аналогично вводится понятие функций трех переменных и так далее. Здесь мы ограничимся рассмотрением функций двух переменных. 1) Понятие предела функции двух переменных Рассмотрим последовательность точек на плоскости ХОY: М1(х1, у1); М0(х0, у0)…Мn(xn, yn). О п р е д е л е н и е 3. Последовательность точек M1, M2…Mn сходится в точке М0(х0, у0), если расстояние M nM 0

( x n x0 ) 2 ( y n y 0 ) 2

стремится к нулю при n → ∞, или, что то же, если xn → x0, yn → y0, при n → ∞.


Математика

161

Пусть функция z = f (x, y) задана в некоторой области точки М0. О п р е д е л е н и е 4. Если для любой последовательности точек M1, M2…Mn в окрестности точки М0, сходящейся к точке М0, соответствующая последовательность значений функции f (x1, y1), f (x2, y2)…f (xn, yn) имеет пределом число А, то это число А называется пределом функции f (x, y) при х → х0, у → у0: lim f (x, y) = A, или f (x, y) → A при х → х0, у → у0. П р и м е р : функция f (x, y) = x 2 + y 2 определена на всей плоскости ХОY. Рассмотрим точку М0(1, 2). Для любой последовательности точек плоскости ХОY, сходящихся к точке М 0 имеем: lim( xn2 yn2 ) 12 2 2 5 . Следовательно: lim( xn2 yn2 ) 5 . О п р е д е л е н и е 5. Функция f (x, y) называется бесконечно малой при х → х0, у → у0, если lim f (x, y) = 0. В дальнейшем будем рассматривать только конечные пределы. Аналогично вводится понятие предела функции трех переменных и т.д. Только здесь уже нет геометрической наглядности. 2) Непрерывность функции двух переменных О п р е д е л е н и е 6. Функция z = f (x, y), определенная в некоторой области точки (х0, у0), называется непрерывной в этой точке, если lim f (x, y) = f (x0, y0). Если функция f (x, y) определена в окрестности точки М 0(х0, у0) и не является непрерывной в этой точке, будем называть ее разрывной в этой точке М0. П р и м е р ы . Функция Z = х2 + у2 непрерывна всюду. Функция Z

1

2

ɯ ɭ 2

разрывна в точке (0, 0).

2.2.2. Производная и дифференциал функции двух переменных 1) Пусть задана функция двух переменных z = f (x, y). Возь­ мем точку M(x, y) и дадим х приращение ∆х при y = const, при


Э.Ф. Казанцев

162

этом функция f (x, y) получит приращение ∆xz = f (x + ∆x, y) – f (x, y) – оно называется частным приращением функции по х. Отношение:

'xz 'x

f ( x 'x , y ) f ( x , y ) – это средняя ско'x

рость изменения функции z = f (x, y) по переменной х от точки М до М ′. Предел этого отношения при ∆х → 0 lim

'xo0

f ( x 'x , y ) f ( x , y ) 'x

называется частной производной z = f (x, y) по переменной х. Обозначается

wf ( x , y ) wz ; f xc ( x , y ) . ; z cx ; wx wx

Аналогично, считая x = const и давая приращение ∆у, мы получим частную производную по у: wz wy

lim

'y o 0

'yz 'y

Обозначается

lim

'y o 0

f ( x , y 'y ) f ( x , y ) . 'y

wz wf ( x , y ) ; z cy ; ; f yc ( x , y ) . wy wy

Частные производные f xc ( x , y ) и f yc ( x , y ) являются функциями двух переменных. Вычисление частных производных производится по известным правилам для функции одной переменной. Пример: f (x, y) = x2 + xy2 + y3; f xc ( x , y ) 2 x y 2 ; f yc ( x , y ) 2 xy 3 y 2 . Геометрический смысл частной производной: f xc ( x , y ) – это tg угла наклона к оси ОХ касательной в точке N0(x0 y0, f (x0, y0)) к сечению поверхности S плоскостью y = y0. Аналогично вводится понятие частной производной любого числа переменных. 2) Полное приращение Дадим точке N(x, y) приращение и по x, и по y. Выражение ∆z = f (x + ∆x, y + ∆y) – f (x, y) называется полным приращением функции. Если функция z = f (x, y) непрерывна в точке (x, y), то lim f (x + ∆x, y + ∆y) = f (x, y). Обратно, если lim ∆z = 0, то функция f (x, y) непрерывна в точке (x, y).


Математика

163

О п р е д е л е н и е 10. Функция z = f (x, y) называется дифференцируемой в точке (x, y), если ее полное приращение в этой точке можно представить в виде: ∆z = A(x, y)∆x + B(x, y)∆y + + α 1∆x + α2∆y, где α1 и α2 – бесконечно малые при ∆х → 0 и ∆у → 0, или более сжато: ∆z = A(x, y)∆x + B(x, y)∆y + αρ, где U

('x0 ) 2 ('y0 ) 2 , α = (α1∆x + α2∆y) / ρ, α → 0, ρ → 0.

Выражение A(x, y)∆x + B(x, y)∆y, линейное относительно ∆х и ∆у, называется главной частью приращения, так как α1∆x + α2∆y = αρ есть бесконечно малая более высокого порядка. Т е о р е м а 1. Если функция z = f (x, y) дифференцируема в точке (x, y), то она непрерывна в этой точке. Т е о р е м а 2. Если функция z = f (x, y) дифференцируема в точке (x, y), то она имеет в этой точке частные производные f xc ( и x , yf)yc (. x , y ) Т е о р е м а 3. Если в некоторой окрестности точки (x, y) x , y) x , yf)yc (функции z = f (x, y) и существуют частные производные f xc ( и эти производные непрерывны в точке f (x, y), то функция дифференцируема в этой точке. О п р е д е л е н и е 11. Главная часть приращения дифференцируемой функции z = f (x, y) в точке f (x, y) называется ее полным дифференциалом в этой точке: dz f xc ( x , y )'x f yc ( x , y )'y . П р и м е р : z = x2y; dz = 2xy∆x + x2∆y. По определению разность между полным приращением и полным дифференциалом есть бесконечно малая более высокого порядка, чем ∆x и ∆y: ∆z – dz = α1∆x + α2∆y. Поэтому в приближенных выражениях можно заменить приращение функции z = f (x, y), которое может сложно зависеть от ∆x и ∆y, ее дифференциалом, зависящим от ∆x и ∆y линейно. Напомним случай одной переменной. Приращение функции y = x 3; ∆y = (x + ∆x) 3 = 3x 2∆x + + 3x(∆x)2 + (∆x)3, в то время как дифференциал dy = 3x2∆x – главная часть. Аналогично поступают и в случае двух переменных:


Э.Ф. Казанцев

164

'z f ( x 'x , y 'y ) f ( x , y ) | f xc ( x , y )'x f yc ( x , y )'y, откуда f ( x 'x , y 'y ) | f ( x , y ) f xc ( x , y )'x f yc ( x , y )'y . .

3) Производная сложной функции Пусть z = f (x, y) – функция двух переменных x и y, каждая из которых, в свою очередь, является функцией независимой переменной t: x(t) и y(t). Тогда z = f (x(t), y(t)) – сложная функция независимой переменной t. Переменные x и y называются промежуточными переменными. Т е о р е м а 4. Если функции x(t) и y(t) дифференцируемы в точке t, а функция z = f (x, y) дифференцируема в точке (x, y), где x = x(t), y = y(t), то сложная функция z = f (x(t), y(t)) также дифференцируема в точке t, причем в этой точке

dz dt

wz dx wz dy . wx dt wy dt

Д о к а з а т е л ь с т в о : дадим приращение ∆t: ∆x = x(t +∆t) – x(t); ∆y = y(t +∆t) – y(t). Соответствующее приращение функции ∆z: 'z f ( x 'x , y 'y) f ( x , y) f xc ( x , y)'x f yc ( x , y )'y D1'x D 2 'y, где α1 и α2 – бесконечно малые при ∆x → 0, ∆y → 0. Разделим ∆z на ∆t: 'z 't

'x 'x 'y 'y f yc ( x , y ) D1 D2 't 't 't 't 'y dy 'x dx ; lim в точке t. по условию lim dt 't o0 't dt 't o0 't f xc ( x , y )

Кроме того, так как функции x(t) и y(t) дифференцируемы в точке t, то они непрерывны в этой точке, значит, при ∆t → 0 и ∆x → 0, ∆y → 0 и, как следствие, α1 → 0 и α2 → 0. Таким образом, при ∆t → 0 существует предел: lim

'z 't

dz dt

f xc ( x , y )

dx dz f yc ( x , y ) o dt dt

wz dx wz dy . wx dt wy dt

П р и м е р : z = x ⋅ sin (x/y); x = 1 + 3t; y

1 t 2 ;

dz dt

§ x· x2 x t x x ¨¨ sin cos ¸¸ 3 2 cos . y¹ y 1 t 2 y y y ©


165

Математика

В частности, если z = f (x, y), где y = ϕ(x), П р и м е р : z = x2y5 + exy; y dz dx

2 xy 5 ye xy (5 x 2 y 4 xe xy )

du dt

wu dx wu dy wu dz . wx dt wy dt wz dt

1

(1 x 2 ) 2 x

, тогда

(1 x 2 ) 2

dz dx

wz wz dy . wx wy dx

.

В случае функции трех переменных u = f (x, y, z); x = x(t); y = y(t); z = z(t):

Более общий случай u = f (x, y, z); x = x(t); y = y(t): wz wu

wz wx wz wy wz ; wx wu wy wu wy

wz wx wz wy . wx wy wy wy

4) Дифференциал функции двух переменных wz

wz

dx dy для х и у как независиЕсли z = f (x, y); то dz wx wy мых переменных. Пусть x = x(u, ν), y = y(u, ν) дифференцируемы в точке (u, ν), а f(x, y) дифференцируема в точке (x, y), тогда: § wz wx wz wy · § wz wx wz wy · ¸¸du ¨¨ ¸¸dv ¨¨ x u y u w w w w ¹ © © wx wv wy wv ¹ , wz § wx wx · wz § wy wy · ¨ du dv ¸ ¨ du dv ¸ wx © wu wv ¹ wy © wu wv ¹ wz wz dx dy и для х, и у как зависимых переменных. т.е. dz wx wy dz

wz wz du dv wu wv

Эта форма записи дифференциала называется инвариантной, так как относится и к независимым, и к зависимым переменным. Используя эту форму, можно получить для функции двух переменных следующие свойства. Пусть z1 = f (x, y); z2 = ϕ(x, y) а) d(cf) = cdf: c – const; б) d(f ± ϕ) = df ± dϕ;


Э.Ф. Казанцев

166

в) d(f ⋅ ϕ) = df ⋅ ϕ + f ⋅ dϕ; § f ·

г) d ¨¨ ¸¸ ©M¹

dfM fdM . M2

Аналогично записываются формулы для функции нескольких переменных: u = f (x, y, z,…w); du

wu wu wu wu dx dy dz ..... dw . wx wy wz ww

5) Неявные функции а) функции одной переменной О п р е д е л е н и е 13. Если каждому значению х поставить в соответствие те значения у, для которых F(x, y) = 0, то мы получим функцию y, заданную неявно уравнением F(x, y) = 0. Производная неявной функции:

y'

dF ( x , y ) dx Fxc ( x , y ) . Fyc ( x , y )

0, где y = f (x), или Fxc ( x , y ) Fyc ( x , y ) y c

0, откуда

Таким образом, мы можем найти производную неявной функции, не имея непосредственного задания самой функции. П р и м е р : x 4 + y 5 + e xy = 0 – это уравнение удовлетворяется при x 0 = 0, y 0 = –1. F(x, y) = x4 + y 5 + e xy; Fxc 4 x 3 ye xy , Fyc

5 y 4 xe xy .

Все эти функции непрерывны в окрестностях точки (0, –1), причем Fyc (0, 1) z 0, значит, y' yc

1 . 5

(4 x 3 ye xy ) ; в точке (0, –1) (5 y 4 xe xy )

б) функции двух переменных Функцию z = f (x, y) будем называть неявно заданной уравнением F(x, y, z) = 0.


167

Математика

Частные производные: wz wx

Fxc ( x , y , z ) wz ; Fzc ( x , y , z ) wz

Fyc ( x , y , z ) . Fzc ( x , y , z )

Причем Fzc( x , y , z ) z 0 – это условие существования неявной функции. 6) Частные производные высших порядков f xc ( x , y ) и f yc ( x , y ) называются частными производными первого порядка. Частные производные по x и по y от функций f xc ( x , y ) и f yc ( x , y ) , если они существуют, называются частными производными второго порядка. f xxcc ( x , y )

w 2 f (x, y) wx

w2z

z cxxc

2

wx 2

f xycc ( x , y )

w 2 f ( x , y) wxwy

z cxyc

w2 z ; wxwy

cc ( x , y ) f yx

w 2 f ( x , y) wywx

z cyxc

w2z ; wywx

cc ( x , y ) f yy

w 2 f ( x , y) wy 2

z cyyc

w2z . wy 2

2 По определению: w f ( x , y )

wxwy

;

w § wf ( x , y ) · ¸. ¨ wy © wx ¹

П р и м е р : f (x, y) = x 4 + 3x 2y 2; f xc 4 x 3 6 xy 2 ; f yc

f xxcc

12 x 2 6 y 2 ; f xycc

cc 12xy; f yx

cc 12xy; f yy

6 x 2 y;

6x2 .

Частная производная по различным переменным называется смешанной. Аналогично находятся частные производные высших порядков. ccc f xxx

ccc 24x; f xxy

ccc 12 y; f xyx

ccc 12 y; f xyy

ccc 12x; f yyy

Нетрудно заметить, что: f xycc

cc ; f xxy ccc f yx

ccc f xyx

ccc ; f xyy ccc f yxx

ccc f yyx

ccc . f yxy

0 и т.д.


Э.Ф. Казанцев

168

Т е о р е м а 5. Если в некоторой окрестности точки (х0, у0) функция z = f (x, y) имеет смешанные частные производные f xycc cc ; и эти производные непрерывны в точке (х , у ), то они в f xycc и f yx 0 0 этой точке равны: f xycc f yxcc .; Д о к а з а т е л ь с т в о . Рассмотрим вспомогательное выражение: A = f (x0 + ∆x, y0 + ∆y) – f (x0 + ∆x, y0) – f (x0, y0 + ∆y) + f (x0, y0), то есть A = ∆x(∆yz), где ∆yz = f (x0, y0 + ∆y) – f (x0, y0). Очевидно, что ∆x(∆yz) = ∆y(∆xz). Обозначим ϕ(x) = f (x, y + ∆y) – f (x, y0). Тогда: A = [f (x0 + ∆x, y0 + ∆y) – f (x0 + ∆x, y0) – f (x0, y0 + ∆y) + f (x0, y0)] = ϕ(x0 + ∆x) – – ϕ(x0). Применим к этому выражению теорему Лагранжа (по ∆x): А = ϕ′(x0 + Θ∆x)∆x, то есть A

> f xc ( x0 41'x , y0 'y) f xc ( x0 41'x , y0 )@ 'x.

Применим еще раз теорему Лагранжа (по ∆у): A

f xycc ( x0 41'x , y0 4 2 'y )'x'y .

Аналогично, меняя ролями х и у, находим: cc ( x0 43'x , y0 44'y )'x'y, откуда A f yx f xycc ( x0 41'x , y0 4 2 'y )'x'y

cc ( x0 4 3'x , y0 4 4 'y )'x'y . f yx

При ∆x → 0, ∆y → 0, в силу непрерывности двух производных, получим: f xycc f yxcc .; С л е д с т в и е . Если функция z = f (x, y) в некоторой области имеет все частные производные n-го порядка включительно и это производные непрерывны, то смешанные производные порядка m (m ≤ n), отличающиеся лишь последовательностью дифференцирований, совпадают между собой. 5

5 . П р и м е р : n = 5; f xxyxy f xyxxy ccc f xc s xy Действительно: f xxy 5

ренцируя по х, а потом по у: f xxyxy

f xc s yx 5 . f xyxxy

ccc . Затем, диффеf xyx

cc ; f yx


169

Математика

Аналогично для трех переменных: f = x3y2z wf wx

3x 2 y 2 z ;

w2 f wxwy

wf wy

2 x 3 yz ;

wf wz

w2 f w2 f ; wxwy wywx

6 x 2 yz

x3 y 2 ; w2 f wzwx

wf wx

6 x 2 z;

3x 2 y 2 и т.д.

7) Дифференциалы высших порядков Дифференциал первого порядка: dz f xc ( x , y )dx f yc ( x , y )dy . Дифференциал второго порядка: d 2z

>

d (dz ) d f xc ( x , y )dx f yc ( x , y )dy

@

f xxcc (dx) 2 2 f xycc dxdy f yycc (dy ) 2 .

Дифференциал третьего порядка: d 3z

d (d 2 z )

>

cc (dy ) 2 @ d f xxcc (dx) 2 2 f xycc dxdy f yy

ccc (dx) 3 3 f xxy ccc (dx) 2 dy 3 f xyy ccc dx(dy ) f yyy ccc (dy ) 3 . f xxx

тогда

n Введем символическую запись: d z

§ w · w ¨¨ dx dy ¸¸ f ( x , y ); wy ¹ © wx

dz

2

2

d z 3

n

§ w · w ¨¨ dx dy ¸¸ f ( x , y ), w w x y © ¹

· § w w ¨¨ dx dy ¸¸ f ( x , y ); x y w w ¹ © 3

d z

· § w w ¨¨ dx dy ¸¸ f ( x , y ). wy ¹ © wx

2.2.3. Экстремум функции двух переменных 1) Пусть z = f (x, y) – функция двух переменных. Точка (x0, y0) называется точкой максимума, если для любой другой точки (x, y) выполняется неравенство f (x, y) < f (x0, y0). Аналогично точка (x0, y0) называется точкой минимума, если f (x, y) > f (x0, y0). Точки минимума и максимума функции называется ее точками экстремума.


Э.Ф. Казанцев

170

а) Необходимое условие экстремума Т е о р е м а 1. Если функция f (x, y) в точке (x0, y0) имеет экстремум, то в этой точке либо обе ее частные производные первого порядка равны нулю: f xc ( x0 , y0 ) f yc ( x0 , y0 ) 0, либо хотя бы одна из этих частных производных не существует. 2

2

П р и м е р 1: f ( x , y ) 1 ɯ ɭ (конус). В точке (0, 0): f (0, 0) = 1; в любой другой точке f (x, y) < 1. Частные производные: ɯ

f xc

2

ɯ ɭ

2

; f yc

ɭ

2

ɯ ɭ2

в точке (0, 0) не существуют.

П р и м е р 2: f (x, y) = x 2 + y 2 (параболоид). f (0, 0) = 0 – максимум. f xc

2x; f yc

2 y; f xc (0, 0)

f yc (0 , 0) 0.

П р и м е р 3: f (x, y) = xy; f xc (0, 0) f yc (0 , 0) 0. – но это не экстремум. Если равны нулю первые производные или они не существуют, то такие точки называют критическими, но не экстремальными. б) Достаточное условие экстремума Т е о р е м а 2. Пусть в окрестностях критической точки (x0, y0) функция f (x, y) имеет непрерывные частные производные до второго порядка. Рассмотрим выражение: D( x , y)

cc ( x , y ) f xycc ( x , y ) 2 . f xxcc ( x , y ) f yy

Тогда: 1) если D(x 0, y 0) > 0, то в этой точке (x 0, y 0) функция f (x, y) имеет экстремум: если f xxcc ( x0 , y0 ) 0 – максимум, если f xxcc ( x0 , y0 ) ! 0 – минимум; 2) если D(x0, y0) < 0, то функция экстремума не имеет; 3) если D(x0, y0) = 0, экстремум в точке (x0, y0) может быть, может и не быть. Пример: f (x, y) = xy(1 – x – y); f xc y (1 2x y); f yc x (1 x 2 y).


171

Математика

Определим критические точки f xc ­° ɭ (1 2 x y ) ® °¯ ɯ (1 x 2 y )

0 0

;

y x

0 ­°(1 2 x y ) ® 0 °¯(1 x 2 y )

f yc

0:

0 0

ɯ 1/ 3 y 1/ 3

.

M1(0, 0); M2(0, 1); M3(1, 0); M4(1/3, 1/3) f xxcc

2 y; f xycc

cc 1 2 x 2 y; f yy

2x;

D(x, y) = 4xy – (1 – 2x – 2y)2 D(0, 0) < 0; D(0, 1) < 0; D(1, 0) < 0 – экстремума нет. D(1/3, 1/3) = 1/9 > 0 – экстремум. Так как f xxcc (1 / 9 , 1 / 9) ! 0, то М4 – это максимум. zmax = f (1/3, 1/3) = 1/9(1 – 1/3 – 1/3) = 1/27. 2) Условный экстремум Пусть дана функция u = f (x, y, z) и на ее переменные наложены дополнительные условия: F1(x, y, z) = 0; F2(x, y, z) = 0. Эта формула называется уравнением связи. Говорят, что для такой функции может существовать условный экстремум. а) Необходимое условие условного экстремума Предположим, что все функции f, F1, F2 имеют непрерывные производные первого порядка и хотя бы один определитель типа w ( F1F2 ) w( y , z)

wF1 wy wF2 wy

wF1 wz wF2 wz

в точке M0(x0, y0, z0) отличен от нуля. Тогда условный экстремум находится по следующим правилам (метод Лагранжа): – составляем вспомогательную функцию: ϕ = f + λ1F1 + + λ2F2 – функция Лагранжа;


Э.Ф. Казанцев

172

ции:

– записываем необходимые условия экстремума этой функwM wɯ

wM wɭ

wM wO1

wM wz

wM wO 2

0;

– решаем полученную систему уравнений, находим критические точки экстремума для функции ϕ; – если (x0, y0, z0, λ1, λ2) – найденная критическая точка, то в точке(x0, y0, z0) функция u = f (x, y, z) может быть имеет условный экстремум. Исследование достаточных условий выходит за рамки курса. П р и м е р : найти прямоугольный параллелепипед наибольшего объема, если его полная поверхность имеет площадь 2а. Объем V = xyz. Площадь S = 2(xy + xz + yz) = 2a. То есть требуется найти максимум функции V = xyz при условии xy + xz + + yz – 2a = 0. Составим функцию: ϕ(x, y, z, λ) = xyz + λ (xy + xz + yz – a). Приравняем к нулю все ее частные производные первого порядка: ­ yz O ( y z ) 0 ° °° xz O( x z ) 0 . ® ° xy O ( x y ) 0 ° °¯ xy xz yz a 0

Из первого и второго уравнения получаем

yz y z

xz , то x z

есть yz(x + z) = xz(y + z); z(x – y) = 0; y = x. Аналогично из третьего уравнения получаем: y = z.

Подставляем в четвертое уравнение: x = y = z, то есть 3x2 = a; x

a 3

y

z; O

1 2

a . Точка x0 , y0 , z0

3

§ a a a· ¸ является ¨ , , ¨ 3 3 3¸ ¹ ©

критической точкой экстремума функции V. То есть максималь-


ный объем у параллелепипеда со сторонами равен V

173

Математика

a a . 3 3

a , и этот объем 3

Задания для самостоятельной работы 1) Вычислить частные производные функций: а) Z = x² + x·y + y² б) Z = x / y в) Z = (x – y) / (x + y) г) Z = exp (x + y) д) Z = ln (x·y) е) Z = x²y + exp (x²) / ln x ж) Z = exp (xy) / sin y 2) Найти экстремум функции двух переменных: а) среди всех треугольников с периметром 2р найти тот, площадь которого наибольшая; б) среди всех вписанных в круг радиуса R треугольников найти тот, площадь которого наибольшая.

2.3. Интегральное исчисление 2.3.1. Неопределенный интеграл 1) Первообразная функция Если задача дифференциального исчисления – отыскание производной от заданной функции, то обратная задача – восстановление функции по заданной производной – задача интегрального исчисления. Функция F(x) называется первообразной для функции f (x), если F ′(x) = f (x).


Э.Ф. Казанцев

174

Примеры: а) F(x) = sin x – первообразная для функции f (x) = cos x, так как (sin x)′ = cos x. б) F(x)=ln x – первообразная для функции f (x)=1/x. Очевидно, что если F(x) – первообразная для f (x), то функция F(x) + c также будет первообразной (c = const). Действительно: если F(x) – первообразная, то есть F ′(x) = = f (x), то [F(x) + c]′ = F ′(x) = f (x). П р и м е р : f (x) = 3x2; для этой функции первообразными будут: F(x) = x3 φ(x) = x3 – 1/3 \ ( x) x 3 2 и т.д. Л е м м а . Функция, производная которой тождественно равна нулю, постоянна. Т е о р е м а 1. Если F(x) – первообразная для f (x), то любая другая первообразная может быть записана в виде F(x)+c. Д о к а з а т е л ь с т в о . Пусть φ(x) – любая первообразная для f (x): φ′(x) = f (x). Тогда: [φ(x) – F(x)]′ = φ′(x) – F ′(x) = f (x) – f (x) = 0, значит, функция φ(x) – F(x) постоянна: φ(x) – F(x) = c. Отсюда: φ(x) = F(x) + c. Выражение F(x)+c называется неопределенным интегралом от функции f (x) и обозначается символом: f ( x ) dx F ( x) c . Читается «интеграл эф от икс по дэ икс». f (x) называется подынтегральной функцией; f (x) dx называется подынтегральным выражением; x – переменная интегрирования; символ ∫ – знак интеграла.

³

³

³

2

3

П р и м е р ы : а) 1 x dx ln x c; б) 3x dx x c. Отыскание первообразной, или отыскание неопределенного интеграла функции f (x) называется интегрированием этой функции. Это операция обратная дифференцированию. Проверка


Математика

175

интегрирования осуществляется дифференцированием результата.

³

2 x 2 x 2 x 2 x П р и м е р : e dx (1 / 2)e c; (( 1 / 2)e c)' e .

2) Свойства неопределенного интеграла а) производная неопределенного интеграла равна подынтегральной функции:

³ f ( x) dx) c

f ( x);

б) дифференциал неопределенного интеграла равен подынтегральному выражению: d

³ f ( x ) dx

f ( x) dx;

в) неопределенный интеграл от производной функции равен самой функции плюс произвольная постоянная:

³ F' ( x) dx

F ( x) c;

г) неопределенный интеграл от дифференциала функции равен дифференцируемой функции плюс произвольная постоян­ ная:

³ d F ( x)

F ( x) c;

д) постоянный множитель можно выносить за знак интеграла:

³ c f ( x) dx c ³ f ( x) dx;

е) неопределенный интеграл от суммы (разности) двух функций равен сумме (разности) интегралов от этих функций:

³ [ f ( x) r M( x)] dx ³ f ( x)dx r ³ M( x)dx. 3) Таблица основных интегралов

³

x a dx

x a 1 c , ɚ z 1 a 1


Đ­.Ф. ĐšаСанцов

176

Âł dx / x ln | x | c Âł e dx e c x

x

ax c; a ! 0, a z 0 ln a

Âł Âł cos x dx sin x c Âł sin x dx cos x c Âł sec dx tg x c Âł cosec dx ctg x c a x dx

2

2

Âłx

2

Âłx

2

Âł Âł Âł

dx a2

(1 / a) arctg ( x / a) c

dx a2

1 x a ln c 2a x a

dx 2

x a

2

dx a2 x2 dx 2

x a

Âł tg x dx Âł ctg x dx Âł sec x dx

2

ln x x 2 a 2 c arcsin ( x / a) c 2 2 ¡ § ln ¨ x x a ¸ c ; a z 0 Š š

ln cos x c ln sin x c ln sec x tg x c


177

Математика

Все формулы проверяются дифференцированием. Пример:

³x

dx 2

a

2

1 / a arctg ( x / a) c

ª1 º « a arctg ( x / a) c » ¬ ¼

1 1 1 a 1 (x2 / a2 ) a

1 2

a x

2

..

4) Некоторые приемы интегрирования a) метод подстановки Пусть F(x) первообразная для f (x): F '(x) = f (x). Пусть x = ϕ(t), тогда F[ϕ(t)] будет первообразной для функции f [ϕ(t)]. Действительно: [F(ϕ(t))]' = Fx' [ϕ(t)]ϕ'(t) = f [ϕ(t)]ϕ'(t). Отсюда следует:

³ f [M(t )]Mc(t ) dt

F [M(t )] c

F ( x) c

³ f ( x) dx.

Эта формула называется формулой замены переменной:

³ f ( x)dx ³ f [M(t )]Mc(t ) dt . Формально замена переменной сводится к замене дифференциала: dx = dϕ(t) = ϕ′(t)dt. После нахождения интеграла по t надо заменить результат на его значение через x. Примеры: а)

³

x3 dx ( x 1) 2

t 3 3t 2 3t 1 dt (t 3 3 / t 1 / t 2 )dt t2 1 1 1 1 2 2 t 3t 3 ln t c ( x 1) 3( x 1) 3 ln x 1 c. t x 1 2 2

³

(t 1) 3 dt t2

: обозначим x = t + 1; dx = dt

³

³

б) метод интегрирования по частям Пусть: u = ϕ(x); ν = ψ(x) [ϕ(x)ψ(x)]'=ϕ'(x)ψ(x)+ϕ(x)ψ'(x)


Э.Ф. Казанцев

178

стям.

³ [M( x)\( x)]cdx ³ Mc( x)\( x) dx ³ M( x)\c( x) dx, т.е. M( x)\ ( x) ³ M( x)\ ( x) dx ³ M( x)\( x) dx, т.е. ³ M( x)\ c( x) dx M( x)\( x) ³ \( x)Mc( x) dx, или ³ u dv uv ³ v du – это формула интегрирования по чаПримеры: x

а)

³

xe x dx

б)

³

x sin x dx

u ; e x dx

dx

2

x

u ; cos x dx

dx

du ; sin x

du ; e x

2

v

dv v

³

xe x e x dx

u ; sin x dx

2 x dx

dv

x

dv

du ; cos x

³

2

v 2

xe x e x c;

x cos x 2 x cos dx

³

2 x sin x x cos x 2 sin x dx

2

x cos x

2 x sin x 2 cos x c.

В отличие от дифференциального исчисления, которое конструктивно (есть определенные правила), интегральное исчисление – неконструктивно (вместо правил вводится ряд приемов). В этом плане, интегрирование более сложная задача, чем дифференцирование. Здесь нужны навыки и интуиция. Многие интегралы можно брать только приближенно или через специальные функции. Существуют многочисленные справочники, где приводятся уже взятые интегралы. 2.3.2. Определенный интеграл 1) При определении понятия производной мы решали задачу о мгновенной скорости:


179

Математика

V ɦɝɧ

's t o 0 't

lim Vɫɪ

s (t 't ) s (t ) . t o0 't

lim

t o0

lim

Теперь рассмотрим обратную задачу: пусть нам известен закон изменения мгновенной скорости V = V(t). Нас интересуют путь S, пройденный за промежуток времени ∆t = t2 – t1. Так как движение не является равномерным, то нельзя просто скорость V умножить на Δt. Разобьем весь промежуток времени на большое число малых интервалов времени, тогда приближенно: S ≈ V1∆t1 + V2∆t2 +…+ Vn∆tn или S |

n

¦V (t )'t . k

k

k

k 1

Для получения более точного пути надо перейти к пределу: S

lim

n

¦V (t )'t . k

k

k

k 1

Другая задача – о площади фигуры (криволинейной трапеции), ограниченной кривой y = f (x) на интервале [a, b]. Если разбить интервал [a, b] на малые промежутки ∆х и принять высоту каждого прямоугольника за f (ξk), то площадь приближенно равна: S|

n

¦ f ([ )'x ; в пределе, более точно: S k

k

k 1

n

¦

lim

n

¦ f ([

k ) 'xk .

k 1

f ([ k )'xk называется интегральной Выражение типа k 1 суммой. О п р е д е л е н и е . Предел, к которому стремится интегральная сумма при ∆x → 0, называется определенным интегралом от функции f(x) по интервалу интегрирования и обозначается: b

³ a

f ( x)dx

lim

n

¦ f ([ )'x . k

k 1

k


Э.Ф. Казанцев

180

Числа а и b называются соответственно нижним и верхним пределами интегрирования, отрезок [а, b] – промежутком интегрирования. Геометрический смысл определенного интеграла: он численно равен площади криволинейной трапеции с основанием [а, b], ограниченной сверху кривой y = f (x). 2) Свойства определенного интеграла а) значение определенного интеграла не зависит от обозначения переменной интегрирования: b

³

b

f ( x) dx

a

³

b

³ f (u) du ;

f (t ) dt

a

a

б) определенный интеграл меняет знак при перестановке пределов интегрирования: b

a

a

b

³ f ( x)dx ³ f ( x)dx ; b

в)

³ dx

b a;

a

г) постоянный множитель можно выносить за знак определенного интеграла: b

b

a

a

³ cf ( x)dx c³ f ( x)dx ; д) определенный интеграл от суммы (разности) двух функций f1(x) и f2(x) равен сумме (разности) определенных интегралов от слагаемых: b

b

b

³ > f ( x) r f ( x)@dx ³ f ( x)dx r ³ f ( x)dx; 1

a

2

1

a

2

a

е) если отрезок [а, b] разбит точкой c на две части [а, c] и [c, b], то:


181

Математика b

³

c

³

f ( x )dx

a

b

³ f ( x)dx;

f ( x)dx

a

c

ж) если всюду на отрезке [а, b] функция f (x) ≥ 0, то: b

³ f ( x)dx t 0; a

з) если всюду на отрезке [а, b] функция f1(x) ≤ f2(x), то: b

b

³ f ( x)dx d ³ f ( x)dx. 1

2

a

a

Т е о р е м а 1 (о среднем). Если функции f (x) и φ(x) непрерывны на отрезке [а, b] и функция φ(x) знакопостоянна на нем, то на этом отрезке существует точка ξ, такая, что: b

³ f ( x) M ( x) dx

b

³

f ([) M ( x) dx.

a

a

В частном случае, если φ(x) = 1, то Так как

b

³

dx b a , то

b

³ f ( x)dx

b

³ a

b

f ( x) dx

f ([) b a .

³

f ([) dx. a

a

a

Геометрически это означает, что площадь криволинейной трапеции численно равна площади прямоугольника с высотой f (ξ). 3) Определенный интеграл с переменным верхним пределом x

³ f (t ) dt

) ( x ).

a

Т е о р е м а 2. Производная определенного интеграла от непрерывной функции f (t) по его верхнему пределу равна подынтегральной функции с заменой переменной верхним пределом: d dx

x

³ f (t ) dt a

f ( x ).


Э.Ф. Казанцев

182

Д о к а з а т е л ь с т в о : Дадим приращение ∆х аргументу функции Ф точке х и рассмотрим разность: x 'x

')( x)

x

³ f (t ) dt ³ f (t ) dt .

)( x 'x) ) ( x)

a

x 'x

Так как

³

a

x

³

f (t ) dt

a

x 'x

f (t ) dt

a

³

f (t ) dt , то ')( x)

x

x 'x

³ f (t ) dt x

или, по теореме о среднем: ∆Ф(x) = f (ξ)∆x, где ξ – точка между x и x + ∆x. Разделим на ∆x и перейдем к пределу: ')( x) 'x o 0 'x lim

f ( x), то есть производная Ф′(x) = f (x),

lim f ([)

'x o 0

что и требовалось доказать. Аналогично: d dx

b

³ f (t ) dt

f ( x ).

x

Т е о р е м а 3. Для всякой функции f (x), непрерывной на отрезке [а, b], существует на этом отрезке первообразная, а значит, существует неопределенный интеграл. Д о к а з а т е л ь с т в о . Действительно, по теореме о существовании определенного интеграла существует функция: x

) ( x)

³ f (t )dt , a < x < b. a

Так как Ф′(x) = f (x), то эта функция является первообразной для функции f (x) и

³

x

f ( x)dx

³ f (t ) dt c. a

4) Формула Ньютона – Лейбница Пусть F(x) – первообразная для функции f (х) на отрезке [а, b]: x

³ f (t )dt a

F ( x) c.


183

Математика a

³ f (t ) dt

Пусть x = a, тогда c = –F(a). x

³ f (t ) dt

Таким образом:

F (a) c, то есть 0 = F(a) + c;

a

a

F ( x ) F ( a ).

b

³

В частности, для x b : f (t )dt F (b) F (a) – это формула a

Ньютона – Лейбница, выражающая определенный интеграл через неопределенный: b

³ f ( x)dx

F ( x)

a

b a

.

Определенный интеграл от непрерывной функции равен разности значений любой ее первообразной, вычисленной для верхнего и нижнего пределов интегрирования. Примеры: а)

1

³x

1 2

б)

³

dx 2

1

arctg x

1 2

1 3

(3x 1) dx ( x x)

0

arctg 1 arctg ( 1) 2

S ; 2

3

2 2 6.

0

5) Замена переменной в определенном интеграле Т е о р е м а 5. Если функция ϕ(t) непрерывна вместе со своей производной ϕ′(t) на отрезке [с, d] и ϕ(c) = a; ϕ(d) = b, то: b

³ a

d

f ( x) dx

³ f >M (t )@ Mc(t ) dt . c

Доказательство:

.

b

С одной стороны, d

с другой –

³ f ( x) dx a

³ f (M (t ))Mc (t ) dt c

F (b) F (a ), F (M (d )) F (M (c))

F (b) F (a),


Э.Ф. Казанцев

184 b

d

³

значит:

³ f (M (t ))Mc (t ) dt .

f ( x) dx

a

c

Пример: 1

³ 4e 0

e

2x

x

12e 34

2

1

e ; a

dt

dt

³ (2t 3)

x

t

x

e dx

25

0

x

e dx; b e 2t 3; t 1

u

5; du e; u

2dt 2e 3

e

1 1

u

t

u 2e 3 1 arctg 10 5 5

e

³ 4t

e 1 2

dt 2

1

2 e 3

³ 5

12t 34

du 2

u 25

1 2e 3 S arctg . 10 5 40

6) Интегрирование по частям в определенном интеграле Пусть функции u = ϕ(x) и ν = ψ(x) непрерывны вместе со своими производными на отрезке [а, b]: [ϕ(x)ψ(x)]′ = ϕ′(x)ψ(x) + ϕ(x)ψ′(x). Проинтегрируем это выражение в пределах от а до b: b

³ >M ( x)\ ( x)@ dx a

b

³

b

³

Mc( x)\ ( x) dx M ( x)c\ ( x) dx.

a

a

По формуле Ньютона – Лейбница: b

c ³ >M ( x)\ ( x)@ dx a

M ( x )\ ( x )

b a

a

, то есть b

³

Mc( x)\ ( x) dx M ( x)\c( x ) dx или

a

a

b

³

a

b

³

M ( x )\c( x) dx

b

M ( x )\ ( x )

M ( x )\ ( x )

b a

b

³

Mc( x)\( x) dx или a


185

Математика b

³ u dv

uv

a

b a

b

³

v du – формула интегрирования по частям. a

Пример: S/ 2

³ x sin x dx 0

x u ; sin x dx dx

du ; v

S/ 2

³

cos x dx

sin x

0

S/ 2 0

dv

cos x

x cos x

S/ 2 0

S/ 2

³ cos x dx 0

1.

Интегрирование в симметричных пределах: a

а)

³

a

f ( x) dx

a

³

2 f ( x) dx, если f (x) – четная функция; 0

a

б)

³ f ( x) dx

0, если f (x) – нечетная функция.

a

2.3.3. Геометрические приложения определенного интеграла 1) Площадь плоской фигуры Пусть Т – плоская фигура. Многоуголь­ ник Q, содержащий фигуру Т, называется описанным около фигуры Т. Многоугольник q, содержащийся в фигуре Т, называется вписанным в фигуру Т. Если существует последовательности описанных и вписанных в фигуру Т многоугольников (соответственно Q1, Q2,...,Qn и q1, q2,…qn) таких, что последовательности их площадей имеют общий предел: lim ɩɥ. Qn

n of

lim ɩɥ. q n

n of

S,


Э.Ф. Казанцев

186

то фигура Т называется квадрируемой, а этот общий предел называется площадью фигуры Т. Площадь криволинейной трапеции равна пределу площадей описанной и вписанной ступенчатых фигур, то есть квад­ рируема: b

S

³ f ( x) dx. a

Если функция f (x) знакопеременна на отрезке [a, b], то b

³ f ( x) dx. численно равен сумме площа-

определенный интеграл S

a

дей криволинейных трапеций лежащих над и под осью ОХ (со знаком «+» и «–»). Если фигура ограниченна кривыми y = ϕ(x) и y = ψ(x), то ее площадь можно вычислить как разность площадей криволинейных трапеций: b

S

³ a

b

b

³

\ ( x) dx M ( x) dx a

³ >\ ( x) M ( x)@ dx. a

Примеры: а) Вычислить площадь фигуры, ограниченной линиями: y

x ; x = 3; y = 0.

y

3

S

³ 0

0

3

x

x dx

3 2 x x 2 3. 3 0


187

Математика

б) Найти площадь фигуры, ограниченной линиями: y = x; y = x ; x = 2. 2

y

³ x x dx 2

S

2

1

0

§ x3 x 2 · 2 ¨ ¸ ¨ 3 2 ¸¹ 1 ©

5 . 6

x

2

2) Площадь криволинейного сектора Рассмотрим фигуру, ограниченную углами α и β и полярным радиусом ρ = f (ϕ), α ≤ ϕ ≤ β. Разобьем ее на ряд секторов с углами: ∆ϕ1 = ϕ1 – ϕ0; ∆ϕ2 = ϕ2 – ϕ0. Площадь каждого кругового сектора для наибольших и наименьших радиусов R i и r i:

Ri2 r2 'Mi и i 'Mi . 2 2

Площадь описанной фигуры: ɩɥ .Q

n

¦ i 1

Площадь вписанной фигуры: ɩɥ .q

n

Ri2 'Mi . 2 ri2

¦ 2 'M . i

i 1

Устремим ∆ϕ → 0, тогда в пределе: lim

n

¦ i 1

2

Ri 'Mi 2

lim

n

¦ i 1

2

ri 'Mi 2

1 2

E

³ D

2

f (M)dM

E

1 2 U dM . 2

³ D


Э.Ф. Казанцев

188

Пример. Площадь кардиоиды ρ = a(1 + cos ϕ)

y

2

x

S

a2 2

2S

³ 1 cos M dM 0

2

3S 2 a . 2

3) Объем тела Рассмотрим в пространстве тело V. Всякий многогранник К, содержащий внутри себя это тело, называется описанным, а всякий многогранник k, содержащийся внутри тела V, называется вписанный в это тело. О п р е д е л е н и е . Тело V называется кубируемым, если существуют последовательности описанных и вписанных в него многогранников, объемы которых имеют общий (конечный) предел: lim ɨɛ. K n

nof

lim ɨɛ. k n

nof

V.

Этот общий предел называется объемом тела V. Пусть площадь любого сечения Т тела V есть непрерывная функция х: S(x), a < x < b, а и b – крайние точки тела V. Разобьем отрезок [а, b] точками x1, x2,…, xn. Обозначим наибольшее значение сечения через Mi, а наименьшее через mi. Построим на соседних сечениях цилиндры описанный и вписанный. Их объемы: Mi∆xi и mi∆xi. Производя аналогичные построения для каждого отрезка ∆xi, получим описанное около тела V и вписанное в него тело, цилиндры.


189

Математика n

Их объемы:

¦ M 'x i

i

i 1

n

и

¦ m 'x . i

i

i 1

При стремлении шага

∆xi → 0, эти суммы имеют общий предел, который называется объемом этого тела: b

V

³

S S ( x)dx, так как тело V – кубируемо. a

4) Объем тела вращения Рассмотрим кривую y = f (x), непрерывную на отрезке [a, b]. Если соответствующую ей криволинейную трапецию вращать вокруг оси ОХ, то образуется тело вращения. Сечение: S(x) = πf 2(x), так как f  (x) – R – радиус круга. Значит: b

V

³

b

2

S f ( x) dx

³

2

S y dx.

a

a

П р и м е р : Найти объем тела, ограниченного поверхностью вращения y = x3, 0 < х < 1. y

1

x

1

V

³

S x 6 dx 0

S . 7

2.3.4. Несобственные интегралы До сих пор считали, что интервал интегрирования конечен и подынтегральная функция на нем не обращается в бесконечность. Такие интегралы называются интегралами в собственном смысле слова, или коротко, собственными. Если одно из этих


Э.Ф. Казанцев

190

условий нарушается, то интеграл называется несобственным. Несобственный интеграл может не иметь численного значения. 1) Интеграл с бесконечными пределами b

f

³

F ( x) dx

lim

b o f

a

³ F ( x) dx – если такой предел существует, то a

несобственный интеграл существует и сходится. Если такого предела нет, или этот предел бесконечен, то несобственный интеграл не существует или расходится. Аналогично определяется несобственный интеграл: b

³

b

f ( x) dx

lim

ao f

f f

³

³ f ( x) dx

c

³

f ( x) dx

f

a

и

f

f ( x) dx

³ f ( x) dx. c

f

О п р е д е л е н и е . Если функция f (x) непрерывна и неотрицательна на промежутке [а, +∞], то величина несобственного f

³ f ( x) dx равна площади бесконечной трапеции, огра-

интеграла

a

ниченной сверху линией y = f (x). Примеры: а)

f

b

dx

³ 1 x

bof

0

б) в)

1

³

e dx

³ e dx x

f

I1

lim

bof

b

³ 0

2

0

1

2x

f f

dx

³ 1 x

lim

2

lim

a o f

³

2x

e dx

a

b 0

lim arctg x

bof

1 2x e a o f 2 lim

1 a

arctg b b of

1 2 2a lim (e e ) 2 a o f

I1 I 2 . x

e dx

lim e

bof

x

b 0

b

lim (e 1)

bof

S ; 2

f.

2

e ; 2


191

Математика

Этот интеграл расходится, несмотря на то, что вторая часть сходится: 0

I2

lim

a of

³

x

e dx

lim e

a of

a

x

0 a

a

lim (1 e ) 1.

a o f

Несобственный интеграл можно вычислить по формуле Ньютона – Лейбница: N

f

а)

³

f ( x) dx

lim

N of

a

³ f ( x) dx a

lim [ F ( N ) F (a)]

N of

F (f) F (a), ес-

ли существует lim F(b) при b → ∞; f

б)

³ f ( x) dx

F ( f) F ( f), если существуют lim F(b) и

f

lim F(a) при b → ∞, a → ∞. 2) Несобственные интегралы от неограниченных функций Пусть функция f (x) перестает быть конечной на одном из пределов (например, а), тогда существует интеграл от бесконечной функции: b

³

b

f ( x ) dx

a

lim

Ho0

³ f ( x) dx, если этот предел существует.

a H

Точка, в которой функция перестает быть конечной, называется особенностью рассматриваемого интеграла. О п р е д е л е н и е . Если функция F(x) непрерывна и неотрицательна на интервале [a, b], не ограничена вблизи b и несобственный интеграл сходится, то его величина равна площади бесконечной трапеции, ограниченной кривой y = f (x) и прямыми x = a, x = b. Здесь также можно пользоваться формулой Ньютона – Лейбница: b

³ f ( x) dx a

F ( x)

существует предел.

b a

– если первообразная не имеет разрыва и


Э.Ф. Казанцев

192

Пример:

2

³

1

1 3

x

2

dx

³x

1 / 3

dx

1

2/3

x 2/3

2

1

3 2/3 (2 1) 2

Задания к самостоятельной работе 1. Вычислить неопределенные интегралы:

³ sin 2 x dx; б) ³ x arctg x dx; в) ³ x ln x dx; г) ³ x ln x dx; д) ³ x sin x dx; ª º е) ³ « 4 9 x » dx; ¬ ¼ ж) ³ > x 1 x 1 @ dx; а)

2

2

2

2

2

з)

2

³ >1 x @ dx.

2. Найти площадь фигуры: а) ограниченной линиями: y = ln x, x = e, y = 0; б) ограниченной параболой y = x2 и прямой y = a; в) ограниченной линиями: y² = 2px, x = a; г) ограниченной линиями: y = 4 – x², y = 0; д) ограниченной двумя параболами: y² = x, x² = y; е) ограниченной линиями: y = x³, y = 2x. 3. Найти объем тела вращения: а) y² = 2px, x = a. б) y = x³, y = 1, x = 0. x. в) y = x², y

0,881.


193

Математика

г) y = 4 – x², y = 0, x = 0. д) y = exp x, x = 0, y = 0. е) x² + y² = R².

2.4. Теория рядов 2.4.1. Числовые ряды 1) Если члены бесконечной числовой последовательности u 1, u2,…,u n… соединить знаком «+», то получится выражение u1 + u2 +…+ un +… или сокращенно:

f

¦ u , называемое числоn

n 1 вым рядом. Числа u1, u2,... называются членами ряда, un – общим членом ряда. n Конечные суммы S n u1 u 2 ... u n u k называют час­

¦ k 1

тичными суммами ряда: S 1 = u 1; S 2 = u 1 + u 2; S n = u 1 + u 2 +... + u n. Если существует конечный предел последовательности частичных сумм: S lim S n , то ряд называется сходящимся, а число n of

S – суммой ряда. Существует сумма только сходящегося ряда. Необходимый признак сходимости: lim u n Пример: S

f

1

¦ n(n 1) ;. n 1

nof

0.

1 1 1 1 , в виде: n(n 1) n(n 1) n (n 1) 1 1 1 1 1 1 1 1 1 1 . 1 тогда: S n 1 ... n 1 n n n 1 n 1 2 2 3 3 4 1 · § Следовательно: lim S n lim ¨1 ¸ 1, то есть заданный n of n o f© n 1¹

Представим дробь

ряд сходится, и его сумма равна 1.


Э.Ф. Казанцев

194

2) Свойства рядов а) Сходимость или расходимость ряда не изменится, если отбросить или добавить конечное число членов ряда. б) Если ряд Σun сходится и его сумма равна S, то и ряд Σcun тоже сходится, и его сумма равна сS. в) Если ряды Σu n и Σν n сходятся и их суммы равны соответственно S1 и S2, то и ряд Σ(un + νn) сходится и его сумма равна S1 + S2. г) Разность двух сходящихся рядов Σun и Σνn есть ряд сходящийся. д) Сумма сходящегося и расходящегося ряда – расходящийся ряд. е) Сумма двух расходящихся рядов может быть разная и сходящаяся и расходящаяся. 3) Признаки сходимости рядов а) Критерий Коши Для того чтобы ряд

f

¦u

n

был сходящимся, необходимо и

n 1

достаточно, чтобы для любого числа ε существовал такой номер N, что при n > N и любом целом p > 0 выполнилось бы неравенство: un + 1 + un + 2 +…+ un + p  < ε, или Sn + p – Sn  < ε, то есть чтобы все достаточно далеко лежащие отрезки этого ряда были по модулю как угодно малы. б) Признак Даламбера Если для ряда Σun существует такое число q, что для всех u достаточно больших n выполняется неравенство n 1 d q 1, то ряд Σun сходится, если же

un u n 1 t 1, то ряд Σun расходится. un

4) Знакопеременные или знакочередующиеся ряды: u1 – u2 + u3 – u4 +...+(–1)n+1un+ un +... Признак Лейбница: если у знакочередующегося ряда абсолютные величины членов ряда убывают |u1| > |u2| > |u3|>... и общий член стремится к нулю un → 0, то ряд сходится.


Математика

195

2.4.2. Функциональные ряды 1) Функциональная последовательность Рассмотрим бесконечную последовательность функций f1(x), f2(x), f3(x)...fn(x), непрерывных на некотором отрезке [a, b]. Если в этой последовательности положить x = x0, тогда мы получим числовую последовательность: f1(x0), f2(x0)...fn(x0). Если эта числовая последовательность сходится, то говорят, что и функциональная последовательность сходится в точке x0. Совокупность всех значений x, для которых функциональная последовательность сходится, называется областью сходимости этой последовательности. Так как для каждого значения x из [a, b] пределом числовой последовательности будет число, то на отрезке [a, b] для последовательности fn(x), будет существовать функция f (x) – называемая пределом функциональной последовательности. В этом случае говорят: функциональная последовательность {f n(x)} сходится к функции f (x). f ( x) lim f n ( x) или f (x) → f (x). n n of Примеры: а) Рассмотрим последовательность: 1, x, x2,...xn-1,... lim x n 1

nof

­0, | x |! 0 ® ¯1, x 1

при x = –1 и |x| > 1 последовательность расходится. Значит, областью сходимости является интервал (–1; 1). б) Рассмотрим последовательность: e–x, e–2x, e–3x... e–nx,... lim e nx

nof

­0, x ! 0 . ® ¯1, x 0

Областью сходимости является совокупность неотрицательных значений x: x > 0. О п р е д е л е н и е 1. Функциональная последовательность fn(x) сходится к f(x) на отрезке [a, b], если для любого числа ε


Э.Ф. Казанцев

196

и любой точки x из [a, b] существует номер N = N(ε, x) такой, что неравенство f(x) – fn(x) < ε выполняется при n > N. 2) Функциональным рядом называется ряд: u1 ( x) u 2 ( x ) ... u n ( x)

f

¦ u ( x) . n

n 1

Функции u(x) определены на некотором множестве M. un(x) называется общим членом ряда. Частичными суммами ряда называются функции S n ( x)

n

¦ u ( x ). k

k 1

Функциональный ряд

f

¦ u ( x) называется сходящимся при n

n 1

x = x0, если в этой точке сходится последовательность его частичных сумм: S1(x0), S2(x0),...,Sn(x0). Другими словами, функциональный ряд сходится при x = x0, если сходится числовой ряд

f

¦ u ( x ). n

0

n 1

Предел последовательности частичных сумм называется суммой функционального ряда в точке x0. Совокупность всех значений x для которых сходится функциональный ряд, называется областью сходимости этого ряда. 3) Критерий Коши сходимости ряда Для сходимости ряда

f

¦ u ( x) на отрезке [a, b] необходимо n

n 1

и достаточно, чтобы для любого ε > 0 существовал номер N(ε), такой, что при n > N и любом целом p > 0 неравенство |un+1(x) + + u n+2(x) +...+ u n+p(x)| < ε выполнялось бы для всех x отрезка [a, b]. Для практической работы используют не критерий Коши, а признак Вейерштрасса. Предварительно дадим определение мажорируемости ряда.


197

Математика

О п р е д е л е н и е 2. Говорят, что функциональный ряд

f

¦ u ( x) мажорируется на отрезке [a, b] числовым рядом ¦ a , n

n

n 1

n 1

если неравенство un(x) << an выполняется при любом n и для всех значений x отрезка [a, b]. 4) Признак сходимости Вейерштрасса f

Если ряд

¦ u ( x) на отрезке [a, b] мажорируется числовым n

n 1

сходящимся рядом, то он сходится на этом отрезке. 5) Признак сходимости Даламбера Если существует предел lim

u n 1 un

q, то функциональный

ряд сходится при q < 1 и расходится при q > 1. Т е о р е м а 1. Сходящийся ряд на отрезке [a, b] можно почленно интегрировать, то есть сумма интегралов сходится к интегралу сумм. Доказательство. Пусть f ( x) u1 ( x) u 2 ( x) u n ( x) b

b

³

³

S n ( x) o f ( x); lim S n ( x) dx nof

nof

f

¦u n 1

f ( x) dx

b f

³ ¦u

n ( x)

dx.

(1)

a n 1

a

a

n ( x ).

Но интеграл от суммы функций равен сумме интегралов слагаемых:

³

b

S n ( x) dx

³ > u ( x) u ( x) ... u ( x)@ dx 1

n

2

a

b

b

b

³ u ( x) dx ³ u ( x) dx ... ³ u ( x) dx . 1

a

n

2

a

a

При этом равенство (1) запишется так:


Э.Ф. Казанцев

198

b b ªb º lim « u1 ( x) dx u 2 ( x) dx ... u n ( x) dx » xof « » a a ¬a ¼

³

³

b

³

b

³

b

³

то есть

a

³

¦³u

n ( x)

dx

n 1 a

a

b f

³ ¦u

n ( x)

³ f ( x) dx a

b

или так: u1 ( x) dx u 2 ( x) dx ... u n ( x) dx a f b

b

³ f ( x) dx, a

dx.

a n 1

Т е о р е м а 2. Если члены функционального ряда непрерывно дифференцируемы на отрезке [a, b], а ряд u1'(x) + u2'(x) +... + un'(x) +... сходится на этом отрезке, то его сумма равна f '(x): f ' ( x)

f

c · § f ¸ ¨ u' n ( x) или u n ( x) ¸ ¨ 1 ¹ ©n 1

¦ n

f

¦

¦ u'

n

( x),

n 1

то есть функциональный ряд можно почленно дифференцировать. 2.4.3. Степенные ряды 1) Степенным рядом называется ряд: a0 a1 ( x b) a 2 ( x b) 2 ... a n ( x b) n ...

Если b = 0, то степенной ряд имеет вид:

f

¦ a x b . (1) n

n

n 0 f

¦a x n

n

.

(2)

n 0

Ряд (1) сводится к (2) подстановкой x – b = x′. Т е о р е м а 3. Степенной ряд можно почленно интегрировать по любому отрезку [a, b], принадлежащему интервалу сходимости ряда. П р и м е р . Рассмотрим функцию f (x) = ln (1 + x). Известно, что x

ln (1 x)

dx

1

³ 1 x , а 1 x 0

1 x x x ... 1 n x ...; x 1 . 2

3

n


199

Математика x

Тогда:

³ 0

dx 1 x

или ln (1 x) x

2

³ 1 x x x

0

3

2

3

x ... dx n

4

x x x x ... 1 n 1 ... 2 3 4 n

Т е о р е м а 4. Степенной ряд в интервале сходимости можно почленно дифференцировать. П р и м е р . Если f (x) = a0 + a1x + a2x2 + …+ anxn + …, то f ′(x) = a1 + 2a2x + 3a3x2 + …+ nanxn – 1 + …. С л е д с т в и е . Степенной ряд в интервале сходимости можно почленнно дифференцировать любое число раз. 2) Ряд Тейлора Пусть f (x) является суммой степенного ряда: f (x) = a0 + a1(x – b) + a2(x – b)2 + …+ an(x – b)n + … Почленно дифференцируем его несколько раз: f (x) = a0 + a1(x – b) + a2(x – b)2 + …+ an(x – b)n + … f ′(x) = 1a1 + 2a2(x – b) + 3a3(x – b)2 + 4a4(x – b)3 +…+ + nan(x – b)n – 1 + … f ′′(x) = 1⋅2a2 + 2⋅3a3(x – b) + 3⋅4a4(x – b)2 +… + (n – 1) × × nan(x – b)n – 2 + … f ′′′(x) = 1⋅2⋅3a3 + 2⋅3⋅4a4(x – b) +… + (n – 2)(n – 1)× × nan(x – b)n – 3 + … ....................................................................................... f(n)(x) = 1⋅2⋅3…nan + 2⋅3⋅4…(n + 1)an+1(x – b) + … Откуда находим, положив x = b: a0 = f (b); a1

f c b

; a2 1!

Таким образом: f ( x)

f (b)

f cc b

; a3 2!

f ccc b

; … an 3!

f

(n)

cc ccc f c(b) x b f (0) x b 2 f (0) x b 3 ... 1! 2! 3!

Данный ряд называется рядом Тейлора.

b ;…

n!


Э.Ф. Казанцев

200

При b = 0 ряд называется рядом Маклорена функции f (x): f ( x)

f (0)

f c(0) f cc(0) 2 f ccc(0) 3 x x x ... 1! 2! 3!

Т е о р е м а 5. Если функция f (x) в некоторой окрестности точки b является суммой степенного ряда по степеням (x – b), то этот ряд является рядом Тейлора функции f (x). Т е о р е м а 6. Если функция f (x) в некоторой окрестности точки b разлагается в степенной ряд по степеням (x – b), то такое разложение единственно. Разность между функцией f (x) и частной суммой Sn(x) ряда Тейлора функции f (x) называется остаточным членом ряда Тейлора и обозначается Rn(x): Rn(x) = f (x) – Sn(x); Rn ( x)

f ( n 1) (b) ( x b) n 1 . (n 1)!

То есть для того, чтобы ряд Тейлора функции f (x) сходился в некотором интервале, необходимо и достаточно, чтобы в рассмотренном интервале стремился к нулю остаточный член этого ряда. Таким образом, задача разложения функции f (x) в степенной ряд сведена по существу к определению значения x, при котором Rn(x) → 0. 3) Формула Тейлора для функции двух переменных Пусть функция z = f (x, y) имеет в окрестности точки (х0, у0) непрерывные частные производные до (n + 1). Дадим х0 и у0 приращение ∆х и ∆у и рассмотрим вспомогательную функцию: F(t) = f (x0 + t∆х, y0 + t∆у).

(3)

Разложим эту функцию в ряд Маклорена по переменной t: F (t )

F (0) F c(0)t

F cc(0) 2 F ( n ) (0) n t ... t . n! 2!

Используя (3), получим: F c(t )

f xc ( x0 t'x , y0 t'y )'x f yc ( x0 t'x , y0 t'y )'y

(4)


201

Математика

§ w · w ¨¨ 'x 'y ¸¸ f ( x0 t'x , y0 t'y ). wy ¹ © wx 2

§ w · w F cc(t ) ¨¨ 'x 'y ¸¸ f ( x0 t'x , y0 t'y ). wy ¹ © wx n

§ w · w F ( n ) (t ) ¨¨ 'x 'y ¸¸ f ( x0 t'x , y0 t'y ). wy ¹ © wx

Отсюда находим: F(0) = f (x0, y0) § w · w F c(0) ¨¨ 'x 'y ¸¸ f ( x0 , y0 ) wy ¹ © wx 2

§ w · w F cc 0 ¨¨ 'x 'y ¸¸ f ( x0 , y0 ) и т.д. wy ¹ © wx

Подставив эти значения в формулу (4) и положив t = 1, получим: § w · w f ( x0 , y0 ) ¨¨ 'x 'y ¸¸ f ( x0 , y0 ) wy ¹ © wx

f ( x0 'x , y0 'y )

n

2

· · w w 1§ w 1§ w ¨¨ 'x 'y ¸¸ f x0 , y0 ... ¨¨ 'x 'y ¸¸ f ( x0 , y0 ) – это форwy ¹ wy ¹ 2! © wx n! © wx

мула Тейлора для функции двух переменных. 4) Основные разложения функций в ряд Маклорена а) f (x) = ex; f ′(x) = f ′′(x) = … = f(n)(x) = … = ex При x = 0 f(0) = f ′(0) = f ′′(0) = … = f(n)(0) = … = 1, x 1!

следовательно: e x 1

x2 xn ... ... n! 2!

Теперь надо доказать, что Rn ( x) n Л е м м а . lim x nof

n!

0.

f

¦ n 0 x

xn . n!

e x n 1 o 0. (n 1)!


Э.Ф. Казанцев

202

Д о к а з а т е л ь с т в о : применим признак Даламбера к ряду 1

x x2 xn ... ... 1! 2! n!

Так как lim

n of

x

n 1

n!

(n 1)! x

n

x lim

n of

1 (n 1)

x 0

0 1, то рас-

сматриваемый ряд сходится и, следовательно, общий член ряда n

x o 0, что и требовалось доказать. n! ex Отсюда: Rn ( x) x n 1 o 0. (n 1)!

б) f (x) = sin x;

f ′(x) = cos x; f ′′(x) = –sin x; f ′′′(x) = –cos x; f(4)(x) = sin x; S· § sin¨ x n ¸. 2¹ ©

f ( n ) ( x)

При x = 0 f (0) = 0; f ′(0) = 1; f ′′(0) = 0; f ′′′(0) = –1; f(4)(0) = 0. То есть sin x x

x3 x5 ... 3! 5!

в) f (x) = cos x; cos x 1

x2 x4 x6 ... 2! 4! 6!

f

¦ n 0

f

¦ ( 1) n 0

г) гиперболический синус: sh x ex

1

( 1) n

x x2 xn ... ... ; 1! 2! n!

n

x 2 n 1 . (2n 1)!

x 2n . (2n)! e x e x ; 2

x x2 xn ... ( 1) n ... ; 1! 2! n!

e x

1

sh x

x

x3 x5 ... 3! 5!

f

x 2 n 1

¦ (2n 1)!. n 0

д) гиперболический косинус: ch x

e x e x ; 2


Математика

ch x 1

203

f

x2 x4 ... 2! 4!

x 2n . (2n)! 0

¦ n

5) Применение степенных рядов в вычислении интегралов Вычислить интеграл: e

t

1

e x 1/ 2

³e 0

2

x

2

³e

x

2

dx.

0

t t t ... ..., где t = –x2; 1! 2! n!

1 2

n

1/ 2

x2 t 4 x 2n ...( 1) n ... ; 1! 2! n! 1/ 2

dx

3 5 7 ª º x 1 x 1 x ...» «x 3 2! 5 3! 7 «¬ »¼ 0

1 1 1 1 1 1 1 ... | 0 ,46. 2 3 23 2! 255 3! 2 7 7

Задания для самостоятельной работы


Э.Ф. Казанцев

204

2.5. Обыкновенные дифференциальные уравнения 2.5.1. Основные понятия О п р е д е л е н и е 1. Обыкновенным дифференциальным уравнением n-го порядка называется уравнение вида: F(x, y, y′,… y(n)) = 0, где F – функция; x – независимая переменная; y – искомая функция; y′, y′′,…y(n) – ее производные. Если функция зависит от нескольких переменных, то уравнение называется уравнением в частных производных. Порядок старшей производной называется порядком дифференциального уравнения. Решением дифференциального уравнения называется такая функция y = ϕ(x), подстановка которой в уравнение преобразует его в тождество. Решение дифференциального уравнения, заданное неявно ϕ(x, y) = 0, называется интегралом этого уравнения. График решения дифференциального уравнения называется его интегральной кривой. 1) Дифференциальные уравнения первого порядка F(x, y, y′) = 0. Если дифференциальное уравнение можно записать в виде: y′ = f (x, y), то оно называется дифференциальным уравнением 1-го порядка разрешенным относительно производной. Его можно записать в дифференциальной форме: P(x, y)dx + Q(x, y)dy = 0, или обратно – разрешить относительно производной: dy dx

P( x , y ) , то есть y′ = f (x, y). Q( x , y)


Математика

205

2) Геометрический смысл дифференциального уравнения Пусть y = ϕ(x) – решение дифференциального уравнения. Графиком данного решения является кривая, в каждой точке которой есть касательная, угловой коэффициент которой равен y', то есть f (x ,y). Таким образом, уравнение y′ = f (x, y) дает связь между координатами точки и угловым коэффициентом касательной в этой точке. Построив в каждой точке эти касательные, мы получим так называемое «поле направлений». Значит, задать уравнение y′ = f (x, y) – это задать поле направлений. Решить это уравнение – значит найти кривую, касательная к которой в каждой точке совпала бы с направлением поля в этой точке. Таких кривых будет много. Пример: y′ = x + y. Построим изоклины поля. Изоклиной поля называется геометрическое место точек, в которых направление касательных одинаково. Пусть α – угол наклона касательной к оси ОХ: tg α = y′. Изоклина в точках, где α = 0, то есть y′ = tg 0 = 0, имеет уравнение x + y =0. Это прямая, проходящая через начало координат. Изоклине в точках, где D S / 6 x y

3 , и так далее. 3

3 соответствует уравнение 3

Чтобы выделить определенные решения, необходимо задать начальные условия – значения y0 при некотором значении x0, то есть пару чисел (x0, y0). О п р е д е л е н и е 2. Решение y = ϕ(x) уравнения y′ = f (x, y) удовлетворяет начальным условиям (x0, y0), если ϕ(x0) = y0, то есть график этого решения проходит через точку (x0, y0). Задача отыскания решения дифференциального уравнения y′ = f (x, y), удовлетворяющего его начальным условиям (x0, y0), называется задачей Коши. Существует ли решение задачи Коши и единственное ли это решение? На этот вопрос дает ответ теорема Коши.


206

Э.Ф. Казанцев

Т е о р е м а К о ш и . Если функция f (x, y) непрерывна в некоторой области D и имеет в этой области непрерывную частную производную по y – f ′(x, y), то какова бы ни была точка (x0, y0) области D, существует, и притом единственное, решение y = ϕ(x) уравнения y ′ = f (x, y), определенное в некотором интервале, содержащем точку x0 и принимающие при x = x0 значение ϕ(x0) = y0. Геометрически это означает, что через каждую внутреннюю точку (x0, y0) области D проходит единственная интегральная кривая уравнения y′ = f (x, y). Всего решений – бесчисленное множество. О п р е д е л е н и е 3. Функция y = ϕ(x, c), зависящая от произвольной постоянной с, называется общим решением уравнения y ′ = f (x, y) в области D, если она является решением этого уравнения для любого значения с. Равенство ϕ(x, y, c) = 0, неявно задающее общее решение, называется общим интегралом уравнения y = f (x, c). О п р е д е л е н и е 4. Если функция f (x, y) удовлетворяет условиям теоремы Коши, то через каждую точку (x, y) проходит одна кривая y = f (x, c). Подставив значения точки (x0, y0) в это уравнение мы найдем соответствующие значения с0. Если y = f (x0, c0), то интегральная кривая будет соответствовать уравнению y = f (x, c). Эта кривая изображает частное решение уравнения y ′ = f (x, y) соответствующее значению с0. 3) Основной задачей теории дифференциальных уравнений является отыскание всех решений данного уравнения. Нахождение решений дифференциальных уравнений называется интегрированием этих уравнений. П р и м е р : yc 2 y – дифференциальное уравнение, разрешающееся относительно производной. Функции f ( x , y ) 2 y и f yc ( x , y ) 1 / y определены и непрерывны для y > 0. То есть условия теоремы Коши выполнены в верхней полуплоскости –


207

Математика

y > 0. Проверим, что в этой области функция y = (x – c)2 является общим решением уравнения. Действительно: y c 2( x c); 2 y 2( x c), то есть yc 2 y . Задавая любые начальные условия x0, y0 > 0 можно подобрать 2 такое значение с 0, что y0 ( x0 c0 ) ; c0 x0 y0 . Из всей совокупности решений y = (x – c) 2 можно выделить решения y

( x x0 y 0 ) 2 .

Геометрически общее решение в верхней полуплоскости – это семейство кривых ветвей парабол y = (x – c)2 или y x c . Каждая из этих ветвей изображает частное решение, для начальных условий (x0, y0). Если мы к области D добавим ее границу y ≥ 0, то к общему решению добавляется решение y = 0, которое ни при каких значениях с не получается из соотношения y = (x – c)2, то есть в области y ≥ 0 функция y = (x – c)2 не является общим решением ее надо «склеить» с решением y = 0. Общее р е ш е н и е : y

0 , x C0 ­° ® 2 °¯( x C0 ) , x t C0

.

2.5.2. Некоторые интегрируемые дифференциальные уравнения 1-го порядка 1) Уравнения вида y′ = f (x) Эти уравнения легко интегрируются dy

f ( x) dx; y

³ f ( x) dx C,

³

f ( x) dx сдвигом то есть все кривые получаются из одной y параллельно оси OY. П р и м е р : y′ = 3x2; y = f (x, y) = 3x2 – непрерывна в промежутке –∞ < x < +∞. Общее р е ш е н и е : y = x3 + C. Частное р е ш е н и е при x0 = 1; y0 = 3. Найдем C0: 3 = 1 + C0; C0 = 2, то есть y = x3 + 2.


Э.Ф. Казанцев

208

2) Уравнение с разделяющимися переменными Дифференциальное уравнение y′ = f(x, y) называется уравнением с разделяющимися переменными, если его можно записать в виде: y′ = ϕ(x), ϕ(y) (1) Пусть ϕ(x) и ϕ(y) – непрерывны на интервале a < x < b; c < y < d и ϕ(y) ≠ 0. Умножая обе части (1) на dx и деля на φ(y), получим: dy ij( y )

M ( x) dx.

То есть переменные разделяются. Пусть < ( y )

dy

³ ij ( y) ; )( x) ³ M ( x) dx.

Если y есть решение уравнения (1), то dΨ(y) = 2dΦ(2x); а значит, Ψ(y) = Φ(x) + C. Таким образом,

dy

³ ij ( y) ³ M ( x) dx C .

(2)

Формула (2) – это общий интеграл уравнения (1). П р и м е р : y′ = x(y2 + 1); ϕ(x) = x; φ(y) = y2 + 1; y2 + 1 ≠ 0. Разделяем переменные:

dy

x dx , интегрируем:

y2 1

x2 C – общий интеграл. 2 2 x x tg C ; S / 2 C S / 2. 2 2

arctg y

y

Можно задать начальные условия x0, y0. Определим C0: arctg y0

2

x C0 ; C0 2

arctg y0

2

x0 . 2

Частное р е ш е н и е : arctg y

x2 x2 arctg y0 0 или y 2 2

§ x2 x2 · tg ¨ arctg y0 0 ¸. ¨ 2 2 ¸¹ ©


Математика

209

3) Однородные уравнения Функция f (x, y) называется однородной n-го измерения, если для любого t имеет место тождество: f (tx, ty) = tnf(x, y). П р и м е р : f (x, y) = x3 + 3x2y – однородная функция 3-го измерения: f (tx, ty) = (tx)3 + 3(tx)2(ty) = t3(x3 + 3x2y) = t3f (xy). Свойства однородных функций: а) сумма однородных функций одинакового измерения есть однородная функция того же измерения; б) произведение однородных функций есть однородная функция, измерение которой равно сумме измерений сомножителей; в) частное однородных функций есть однородная функция. Ее измерение равно разности измерений делимого и делителя. О п р е д е л е н и е 5. Дифференциальное уравнение называется однородным, если его правая часть f (x, y) есть однородная функция нулевого измерения. Однородным будет уравнение P(x, y)dx + Q(x, y)dy = 0, если P(x, y) и Q(x, y) – однородные функции одинакового измерения. Для однородной функции нулевого измерения, для любого t: f (tx, ty) = f (x, y). В частности, при t = 1/x; f (x, y) = f (1, y/x), то есть f ( x, y)

§ y· M ¨ ¸, x z 0. ©x¹

§ y· M ¨ ¸ и yc ©x¹

Вводя подстановку y = ux, получим уравнение: u cx u

M (u ) ɢɥɢ u c

M (u ) u x

– это уравнение с разделяющимися переменными относительно неизвестной функции u: du

dx

³ M (u) u ³ x

C.


Э.Ф. Казанцев

210

Пример: y§ y · ¨ ln 1¸ – однородное уравнение. x© x ¹ y u; y ux; y c u cx u – подставляем в уравнеПолагаем: x yc

ние.

u′x + u = u(ln u + 1); u′x = u ln u – это уравнение с разделяющимися переменными: du u ln u du

dx – интегрируем. x

³ u ln u ³

dx C ; ln | ln(u ) | ln | x | ln | C |, c z 0. x

ln u = cx; u = ecx, u = y/x; y/x = ecx; y = xecx При разделении переменных мы потеряли одно решение: u = 1, то есть y = x. Его можно получить из общего решения при C = 0, то есть C – любое число. Иногда выгодно воспользоваться подстановкой x = uy, которая также приводит к разделению переменных. Если ϕ(u) = u, то уравнение имеет вид y c

y, то есть является уравнением с x

разделяющимися переменными.

4) Линейные уравнения Дифференциальное уравнение y′ = f (x, y) называется линейным, если оно линейно относительно функции y и y': y′ + P(x)y = Q(x). (3) П р и м е р ы : y′ + x2y = x5; y′ + x +exy = 0; y′ = y. О п р е д е л е н и е 6. а) Если Q(x) ≠ 0, то дифференциальное уравнение называется линейным неоднородным уравнением или линейным уравнением с правой частью. б) Если Q(x) = 0, то уравнение называется линейным однородным или уравнением без правой части.


211

Математика

Итак, рассмотрим уравнение: y′ + P(x)y = Q(x): а) однородное уравнение, соответствующее заданному неоднородному: y′ + P(x)y = 0 (4) – это уравнение с разделяющимися переменными: dy y y

³

P ( x) dx; ln | y | P( x) dx ln | C | Ce

³ P ( x ) dx

; C z 0.

(5)

Поэтому утеряно решение y = 0. Его можно получить, счи­тая, что C = 0. То есть (5) – общее решение уравнения (4) при любом C. Для нахождения решения неоднородного уравнения (3) применим метод вариации произвольной постоянной, то есть будем искать решение уравнения (3) в том же виде, что и решение однородного уравнения. Но C считаем не постоянной, а функцией от x: C = C(x). Эта функция должна быть такой, чтобы при подстановке решения y C ( x)e ³ P ( x ) dx и функции yc C c( x)e ³ P ( x ) dx C ( x) P( x)e ³ P ( x ) dx в уравнение (3) оно обращалось в тождество. Подставляем и получаем для C(x) уравнение: C c( x)e ³ P ( x ) dx

C ( x)

³ Q ( x )e

Q( x) – интегрируем и находим: ³ P ( x ) dx

dx C .

Таким образом: y

e ³ P ( x ) dx

³ Q ( x )e

³ P ( x ) dx

dx C

– это общее решение неоднородного уравнения (3). Нетрудно видеть, что общее решение линейного неоднородного уравнения равно сумме общего решения соответствую­

щего однородного уравнения Ce ³ P ( x ) dx и частного решения дан-

ного неоднородного уравнения e

³ P ( x ) dx

³

( Q ( x )e ³

P ( x ) dx

dx) .


Э.Ф. Казанцев

212

2

П р и м е р : y′ – 2xy = (x + 1)ex – линейное неоднородное уравнение. 2 P(x) = –2x; Q(x) = (x + 1)ex ; Решаем однородное уравнение: y′ – 2xy = 0. dy y

2

2 x dx; ln | y | x ln | C |; y

x

2

Ce . 2

Общее решение ищем в виде: y = C(x)ex . 2 2 y′ = C′(x)ex + C(x)2xex – подставляем в неоднородное уравнение. Сокращаем подобные члены: 2

2

C′(x)ex = (x + 1)ex , откуда: C c( x) Общее решение: y

x 1; C ( x)

( x 1) 2 C. 2

ª ( x 1) 2 º x2 C» e . « »¼ ¬« 2

5) Уравнения, приводимые к линейным Если функция y = ϕ(x, C) является общим решением уравнения y′ = f (x, y), то выражение V(y) = ϕ(x, C) является общим решением уравнения: V′(y)y′ = f [x, V(y)]. Таким образом, решение любого уравнения V′(y)y′ + P(x) V(y) = Q(x) с помощью подстановки V(y) = z приводится к решению линейного уравнения. П р и м е р 1. Уравнение Бернулли: y′ + P(x)y = Q(x)y, подстановка. z = y1 – α; z′ = (1 – α)y–αy′ – подставляем в уравнение: y– αy′ + P(x)y1 – α = Q(x): 1 z c P( x) z 1 D

Q( x) или z′ + (1 – α)P(x)z = (1 – α) Q(x) – это

линейное уравнение. П р и м е р 2: Уравнение Бернулли: y′ + xy = x3y3 (α = 3). Подстановка: y–2 = z; z′ – 2xz = –2x3. Решение: z = x2 + 1 + Cex; потеряно решение y = 0 при делении на y.


Математика

213

Значит, общее решение: ­ y 2 x 2 1 Ce x ° . ® °¯ y 0

6) Уравнения в полных дифференциалах Рассмотрим уравнение: M(x, y)dx + N(x, y)dx = 0. Если левая часть этого уравнения представляет собой полный дифференциал M(x, y)dx + N(x, y)dx = du(x, y), то это уравнение называется уравнением в полных дифференциалах. Пусть M(x, y), N(x, y) и их частные производные wM ( x , y ) и

wy wN ( x , y ) непрерывны в некоторой области D. Тогда необходимым wx

и достаточным условием существования уравнения в полных дифференциалах является: wM ( x , y ) wy

wN ( x , y ) . wx

Итак, если du(x, y) = 0, то u(x, y) = c является общим интегралом. П р и м е р 1: [cos(x + y) + 2]dx + [cos(x + y) – 5]dy = 0. Это уравнение в полных дифференциалах, так как оно равно: d[sin(x + y) + 2x – 5y] = 0. Общий интеграл этого уравнения: sin(x + y) + 2x – 5y = 0. П р и м е р 2: (3x2 + 10xy)dx + (5x2 – 1)dy = 0. Обозначим: (3x2 + 10xy) = M; (5x2 – 1) = N. wM wy

10 x;

wN wx

10 x;

wM wy

wN . wx

d(x3 + 5x2y – y) = 0 – уравнение в полных дифференциалах. Общий интеграл: (x3 + 5x2y – y) = С.


Э.Ф. Казанцев

214

П р и м е р 3: x2ydx – (5xy + 1)dy = 0. wM wN x2; 5 y, wy wx wM wN z то есть – это уравнение не в полных дифференциалах. wy wx

2.5.3. Уравнения 1-го порядка, не разрешенные относительно производной Пусть в некоторой области D задано уравнение F(x, y, y') = 0, которое неявно задает множество значений y': y′ = f1(x, y); y′ = f2(x, y); …; y′ = fn(x, y). Их можно рассматривать как поле направлений уравнения F(x, y, y') = 0. Если ϕ1(x, y, C) = 0; ϕ2(x, y, C) = 0; ϕn(x, y, C) = 0 – общие интегралы в области D, то они называются общим интегралом уравнения F(x, y, y') = 0 в области D. П р и м е р : y′2 – 2xy′ = 0 – уравнение не разрешается относительно y'. Пусть: y' = 0; тогда: y' = 2x. Общее р е ш е н и е : y = C; y = x2 + С. Поле направлений: y' = 0; y' = 2x. Разрешать уравнения относительно y' удается лишь в простейших случаях. 1) Уравнения, не содержащие явно искомой функции F(x, y') = 0. Будем рассматривать y' как параметр: y' = t. Пусть y = ϕ(x) – решение уравнения: x = f (y′), то есть x = f (t).

dy , то dy = y′dx и y′ = t; dx = f ′(t)dt, значит, dx t f c(t ) dt C . dy = tf ′(t)dt, откуда y

Так как yc

­x ° Итак: ® °¯ y

x = f (y').

f (t )

³

³

t f c(t ) dt C

– параметрическая форма уравнения


Математика

215

Исключив из этой системы t, мы получим явное решение y = ϕ(x). П р и м е р : x = y′ + e y′, то есть x = f (y'). Примем y′ = t, тогда x = t + et; dx = (1 + et)dt; dy = y′dx, то есть dy = t(1 + et)dt. Интегрируем: y

³

t (1 et ) dt C

t2 tet et C . 2

­ x t et ° Таким образом: ® °¯ y t 2 2 e t (t 1) C .

2) Уравнения, не содержащие явно независимой переменной F(y, y') = 0. Разрешаем уравнение относительно y: y = f (y'). Пусть y = = ϕ(x) – решение. Выберем параметр t = y', тогда: y = f (t); dy = = f ′(t)dt; dx

dy t

f c(t ) dt , то есть x t

³

f c(t ) dt C . t

Таким образом, решение в параметрическом виде: ­ °x ® °¯ y

f c(t ) dt C . t f (t )

³

П р и м е р : y = y′ + ln y′; Обозначим y′ = t, тогда: y

t ln t ; dy

§ 1· ¨1 ¸dt ; dx © t¹

Таким образом: 1 ­ ° x ln t t C . ® ° y t ln t ¯

dy t

§1 1 · ¨¨ 2 ¸¸dt . ©t t ¹


Э.Ф. Казанцев

216

2.5.4. Особые решения О п р е д е л е н и е . Будем называть внутреннюю точку (x0, y0) области D обыкновенной точкой уравнения y′ = f(x, y), если существует окрестность этой точки, в которой выполняются условие теоремы Коши. Граничные точки области D, а также те внутренние точки, которые не являются обыкновенными, будем называть особыми точками данного уравнения. Будем называть решение уравнения y′ = f (x, y) особым, если в каждой его точке нарушено условие естественности, то есть если через каждую его точку проходит более одной интегральной кривой. 2 2 П р и м е р : yc 3 y ; f ( x , y ) 3 y – непрерывна в плоско-

сти XOY; f yc

2 y

– непрерывна всюду, кроме точек y = 0 – осо-

бые точки. В каждой особой точке (x0, 0) – нарушение единственности решения. Через эти точки проходит кубическая парабола: y = (x + C)3 и прямая y = 0. Для нахождения особых решений надо ввести понятие семейства кривых. Задания для самостоятельной работы 1) Решить дифференциальные уравнения первого порядка: а) x²y´ – y² = x²yy´ б) y´x = yn в) y´ = ky г) y´ = k(a – by)y 2) Решить дифференциальные уравнения второго порядка: а) y´´ = –2y(y´)³ б) y´´ = (y´)² + 1


217

Математика

в) y´´y – (y´)² – (3yy´) / x = (6x – 3x²)y² г) y´´ – 4y = 0 д) y´´ – 2 + y´ = 0

2.6. Элементы теории функций комплексного переменного 2.6.1. Комплексные числа 1) Комплексными числом называется выражение z = x + iy, где x и y – действительные числа, а i – мнимая единица, i

1.

Комплексные числа z 1 = x 1 +y 1i; z 2 = x 2 +y 2i называются равными, если x1 = x2; y1 = y2. Число z * = x = iy называется комплексно-сопряженным числу z = x + iy. Суммой комплексных чисел z1 и z2 называется число z1 + + z2 = (x1 + x2) + (y1 + y2)i. Разностью комплексных чисел z 1 и z 2 называется число z1 – z2 = (x1 – x2) + (y1 – y2)i. Умножение комплексных чисел: z1 ⋅ z2 = (x1x2 – y1y2) + (x1y2 + + x2y1)i, то есть i2 = (0 + 1i)(0 + 1i) = –1 + 0i = –1. Делением комплексных чисел z 1 и z 2 называется число z3 = x3 +y3i, такое, что z3z2 = z1; x1 + iy1 = (x3 + y3i)(x2 + iy2), т.е. x1 = x2x3 – y2y3; y1 = x2y3 + x3y2. Отсюда находим x3 и y3: x3

x1 x2 y1 y2 x22

y22

; y3

Таким образом:

x2 y1 x1 y2 x22 y22

x1 y1i x2 y 2 i

.

x1 x2 y1 y2 x22

y22

i

x2 y1 x1 y2 x22 y22

.


218

Э.Ф. Казанцев

Возведем в степень: zn = z ⋅ z ⋅ z ⋅…z. При этом: i2 = –1; i3 = i2 ⋅ i; i4 = i2 ⋅ i2 = 1…… Если мы умножаем, делим, складываем комплексные числа и получаем A + Bi, то делая то же с сопряженными числами, получим A – Bi. 2) Тригонометрическая форма комплексного числа Выберем полярную систему координат: x = ρ cos ϕ; y = ρ sin ϕ. Полярный радиус ρ называется модулем комплексного числа и обозначается через z = ρ; ϕ называется аргументом комплексного числа и обозначается Arg z. Если мы пишем Arg z, то берется главное значение угла (0 ≤ Arg |z|) (0 d Arg z % 2S) Arg z M 2Sk . Так как x = ρ cos ϕ; y = ρ sin ϕ, то z = x + iy = ρ cos ϕ + + i ρ sin ϕ = ρ(cos ϕ + i sin ϕ) – это тригонометрическая форма комплексного числа; U | z | П р и м е р : z 2 2 3i

y . x S S· § 4 ¨ cos i sin ¸ . 3 3¹ © 2

2

x y ; tg M

3) Геометрическая интерпретация сложения комплексных чисел Если даны два комплексных числа z1 и z2, то мы можем изобразить их векторами oz1 и oz2. Их сумма есть вектор z3 = oz3 = = z1 + z2 по правилу сложения векторов. 4) Действия над комплексными числами Пусть: z1 = ρ1(cos ϕ1 + i sin ϕ1); z2 = ρ2(cos ϕ2 + i sin ϕ2). а) Умножение z1z2 = ρ1ρ2(cos ϕ1 + i sin ϕ1)(cos ϕ2 + i sin ϕ2) = = ρ1ρ2(cos ϕ1cos ϕ2 + i sin ϕ1cos ϕ2 + i cos ϕ1sin ϕ2 – sin ϕ1sin ϕ2) = = ρ1ρ2[(cos ϕ1cos ϕ2 – sin ϕ1sin ϕ2) + i(sin ϕ1cos ϕ2 + cos ϕ1sin ϕ2)] = = ρ1ρ2[cos(ϕ1 + ϕ2) + i sin(ϕ1 + ϕ2)], то есть при умножении комп­ лексных чисел их модули перемножаются: |z1z2| = ρ1ρ2 = |z1| ⋅ |z2|, а аргументы складываются: Arg (z1z2) = Arg z1 + Arg z2.


Математика

219

Геометрический смысл умножения: вектор oz1 поворачивается против часовой стрелки на угол ϕ2 и его величина увеличивается в ρ2 раз, т.е. умножение на i – это поворот на угол S i 2

S S· § 1 ¨ cos i sin ¸ ; 2 2¹ ©

S : 2

б) Деление рассматриваем как действие, обратное умножению z1 z2

z1 z2

лятся

Arg

U1 >cos (M1 M2 ) i sin (M1 M2 )@ , то есть модули чисел деU2

z1

U1 U2 z1 z2

z2

, а аргументы вычитаются:

Arg z1 Arg z 2 .

Геометрический смысл деления – это поворот по часовой стрелке и уменьшение длины вектора в ρ2 раз. в) Возведение в степень z

n

z z ...z

ª º U U U...U «cos (M M ... M) i sin (M M ... M)» .

« » n n ¬ ¼

То есть zn = ρn(cos (nϕ) + i sin (nϕ)) или [ρ(cos ϕ + i sin ϕ)]n = = ρn(cos (ϕn) + i sin (nϕ)). Если ρ = 1, то (cos ϕ + i sin ϕ)n = cos (nϕ) + i sin (nϕ) – фор­ мула Муавра. П р и м е р : (cos ϕ + i sin ϕ)3 = cos (3ϕ) + i sin (3ϕ). cos3 ϕ + 3i cos2 ϕ sin ϕ – 3cos ϕ sin2 ϕ – i sin3 ϕ = cos 3ϕ + + i sin 3ϕ. Выпишем отдельно действительные и мнимые части: cos 3ϕ = cos3 ϕ – 3cos ϕ sin2 ϕ, sin 3ϕ = 3cos2 ϕ sin ϕ – sin3 ϕ.


Э.Ф. Казанцев

220

г) Извлечение корня из комплексного числа Корнем n-ой степени из комплексного числа w = r(cos θ + + i sin θ) называется комплексное число z = ρ(cos ϕ + i sin ϕ), для которого zn = w, то есть z n w . По определению: ρ n = r и nϕ = θ + 2πk, откуда U

M

T 2Sk , следовательно: n T 2Sk T 2Sk · § r cos T i sin T

r ¨ cos i sin ¸. n n ¹ ©

д) Формула Эйлера

r;

x 2 x3 ... 2! 3! yi ( yi) 2 ( yi)3 yi ... Для комплексного числа положим e 1 1! 2! 3! x 1!

Известно, что e x 1

или e yi

2 4 6 3 5 § · § · ¨1 y y y ...¸ ¨ y y y ...¸ , ¨ ¸ ¨ ¸ 2! 4! 6! 5! © ¹ © 1! 3! ¹

то есть eyi = cos y + i sin y. Заменим у на –у: e–yi = cos y – i sin y. Решим эти уравнения относительно cos y и sin y: cos y

e yi e yi ; sin y 2

e yi e yi . 2i

(1)

(2)

(1) и (2) – это формулы Эйлера. Используя формулу eyi = cos y + i sin y, мы можем написать показательную форму комплексного числа: ρ(cos ϕ + i sin ϕ) = ρei. Для комплексного показателя степени: ex + yi = exeiy = ex(cos y + i sin y), то есть ex – модуль, а у – аргумент. В общем случае комплексного числа: cos z

e z e z ; sin z 2

e z e z . 2


221

ĐœĐ°Ń‚оПаŃ‚ика

Đ›огкО пОкаСаŃ‚ŃŒ, чтО: sin2 z + cos2 z = 1; sin (z1 + z2) = sin z1 cos z2 + cos z1 sin z2; cos (z1 + z2) = cos z1 cos z2 + sin z1 sin z2; tg z ctg z

z

sin z cos z

z

2z

1 e e ˜ i e z e z

cos z sin z

i˜

z

z

z

z

e e e e

1 e 1 ; ˜ i e2z 1 2z

1 e 1 . ˜ i e2z 1

Đľ) Đ“ипоŃ€йОНиŃ‡ĐľŃ ĐşĐ¸Đľ Ń„Ńƒнкции sh z

sin iz i

th z

sh z ch z

z

e e 2

z

z

z

z

z

e e e e

; ch z e

2z

e

2z

1 1

z

cos iz

e e 2

; cth z

ch z sh z

z

; z

z

z

z

e e e e

e

2z

1

e

2z

1

Đ›огкО пОкаСаŃ‚ŃŒ, чтО: ch2 z â€“ sh2 x = 1; sh (z1 ¹ z2) = sh z1 ch z2 ¹ ch z1 sh z2; ch (z1 ¹ z2) = ch z1 ch z2 ¹ sh z1 sh z2; sh 2z = 2 sh z ch z ch 2z = ch2 z + sh2 z; th 2 z

2th z 2

1 th z

; cth 2 z

2

1 cth z . 2cth z

Đ&#x;Ń€и воŃ‰ĐľŃ Ń‚воннŃ‹Ń… пОкаСаŃ‚оНŃ?Ń…: sh x

e x e x ; ch x 2

e x e x ; th x 2

e2 x 1 e

2x

1

; cth x

e2 x 1 e2 x 1

.

.


Э.Ф. Казанцев

222

Задания для самостоятельной работы 1) Найти сумму комплексных чисел: а) z1 = 1 + i, z2 = 1 – i б) z1= 2 + 3i, z2 = 1 – 4i в) z1 = 1 + 4i, z2 = 2 + 5i, z3 = –4 – 8i 2) Найти произведение комплексных чисел: а) z1 = 1 + i, z2 = 1 – i, z3 = 2 + 3i б) z1 = i, z2 = 2 – 3i, z3 = 1 – i в) z1 = 2 – i, z2 = –3 – 2i 3) Найти тригонометрическую форму комплексного числа: а) z 1 i 3 б) z 3 i 3 в) z = 1 + i 4) Найти произведение комплексных чисел через показательную форму: а) z1

3 i 3 , z2

1 i 3

б) z1 1 i 3 , z2 = 1 + i в) z1 = 1 + i, z2 = 1 – i

2.6.2. Интеграл от комплексной функции 1) Рассмотрим путь zAB из точки А в точку В в комплексной плоскости (рис. 2.6.1).

Рис. 2.6.1


223

Математика

S

n

Разобьем путь z AB на отрезки. Составим сумму:

¦ f ( z )( z z 1

i

i 1 ).

i 1

Предел этой суммы при неограниченном

уменьшении отрезков называются интегралом комплексной zB

³ f ( z) dz. При изменении направления интегриро-

функции: I

zA

вания знак меняется на противоположный. Если функция f (z) – аналитическая (без особенностей), то интеграл не зависит от выбора пути, то есть интеграл, взятый по замкнутому контуру, равен нулю (теорема Коши):

³ f ( z) dz

0.

L

2) Рассмотрим случай, когда подынтегральная функция имеет особенности (обращается в бесконечность). dz

³ z;

Пусть I

f ( z)

1 ; то есть при z = 0; f (z) = ∞. z

Будем называть такую особенность полюсом. Вычислим интеграл по контуру (L) с центром в т. 0 в положительном направлении (рис. 2.6.2):

Рис. 2.6.2

z = rei; 0 < ϕ < 2π; dz = rei i dϕ.

³

dz z

³

i

re i dM re

i

2Si, то есть интеграл по замкнутому конту-

ру оказывается не равным нулю.


Э.Ф. Казанцев

224

Изменим контур интегрирования: то есть возьмем такой контур, который не содержит особую точку (рис. 2.6.3):

Рис. 2.6.3

dz

³ z.

I0

Этот путь состоит из пути ABA, двух близких прямых AC и CA и окружности OC. Очевидно, что I0 = 0, так как это интеграл по замкнутому контуру без особенностей. Интегралы по AC и CA взаимно уничтожаются. Таким образом, I0 = 0 = IABA – 2πi – знак «–» берется, так как обход происходит в обратном направлении. То есть IABA = 2πi. Таким образом, интеграл можно брать по окружности любого радиуса. 3) Полюс может быть любого порядка: второго: тьего:

1

z3

; …

1

z2

; тре-

Если функция f (z) имеет в некоторой точке z = a полюс порядка n, то вокруг этой точки она разлагается в ряд Лорана: f (z) = С–n(z – a)–n + C–n + 1 +…+ C–1(z – a)–1 + C0(z – a) + … Интеграл, взятый от этого ряда, не равен нулю только для слагаемого C–1(z – a)–1; интегралы от остальных слагаемых равны нулю. Таким образом: C 1

³ f ( z) dz ³ z a dz

2SiC 1 .


225

Математика

Коэффициент C–1 называют вычетом функции f (z) в точке a. Вычет обозначается Res(a). Таким образом:

³ f ( z) dz

2Si Res (a) .

4) Пусть функция f (z) является аналитической всюду на контуре (L) и внутри, за исключением нескольких точек, например, a1, a2, a3 (рис. 2.6.4).

Рис. 2.6.4

Разобьем область на три вспомогательные так, чтобы в каждой была одна особая точка. Тогда:

³

³ f ( z) dz ³ f ( z) dz ³ f ( z) dz ,

f ( z ) dz

( L)

( L1 )

L2

L3

так как внутренние интегралы взаимно уничтожаются, значит:

³ 2Si Res (a ) 2Si Res (a ) 2Si Res (a ) 1

2

3

( L)

2Si [ Res (a1 ) Res (a1 ) Res (a1 )] .

5) Вычисление вычетов Пусть есть полюс первого порядка. Такой полюс обычно получается, если подынтегральная функция f (z) представима в виде: f ( z)

g ( z) , h( z )

причем g(z) не имеет особенностей, а h(z) имеет особенность в точке z = a.


Э.Ф. Казанцев

226

Разложим числитель и знаменатель в ряд Тейлора: f ( z)

g' ' a 2 ( z a) ... 2 . h' ' a 2 h' (a )( z a ) ( z a ) ... 2

g (a) g' (a)( z a)

Вблизи точки z = a правую часть можно заменить на: g (a) . h' (a )( z a )

Поэтому вычет, равный коэффициенту при (z – a)–1, равен: Res (a)

g (a ) . h' (a)

П р и м е р : Вычислим интеграл I

z 1

³ ( z 1) sin z dz. L

L – окружность радиуса r с центром в z = 0. Особенности при z = 1 и z = kπ. Внутрь контура (L) попадают только две особенности: z = 0 и z = 1. I = 2πi [Res(0) + Res(1)]; g(z) = z + 1; h(z) = (z – 1)sin z; h′(z) = sin z + (z –1)cos z. Res (0) I

g (0) h' (0)

1 1

ª 2 º 2Si « 1 » sin 1 ¼ ¬

1; Res(1) 8,65i .

g (1) h' (1)

2 ; sin 1


Математика

227

Раздел 3 Теория вероятностей и математическая статистика

Теория вероятностей и математическая статистика изначально развивались в неразрывной связи друг с другом, так как вероятностные закономерности получают статистическое выражение в силу закона больших чисел (вероятности осуществляются приближенно в виде частот, а математические ожидания – в виде средних). Истоки математической статистики можно найти в сочинениях создателей теории вероятностей – Я. Бернулли (1654–1705), П. Лапласа (1749–1827), С. Пуассона (1781–1840). Решающее значение для дальнейшего развития математической статистики имели работы русской классической школы теории вероятностей – П.Л. Чебышева (1821–1894), А.А. Маркова (1856–1922), А.М. Ляпунова (1857–1918). Современная логическая схема построения основ теории вероятностей разработана А.Н. Колмогоровым (1903–1987). Аксиомы А.Н. Колмогорова: I. Каждому событию А поставлено в соответствие неотрицательное число Р(А), называемое вероятностью события А. II. Если события A1, A2, …An,… попарно несовместны, то P(A1 + A2 +…+ An…) = P(A1) + P(A2) +…+ P(An)+… III. Полная вероятность всех элементарных событий Ω P(Ω) = 1. Нетрудно видеть, что свойства вероятности, зафиксированные в аксиомах, напоминают свойства площадей и объемов. В общем случае неотрицательная функция Р(А) называется ме-


228

Э.Ф. Казанцев

рой, то есть Р(А) является мерой подмножества А. Понятие меры является обобщением понятия площади и объема. Таким образом, теорию вероятностей можно рассматривать как один из разделов общей теории меры. Язык современной теории вероятностей есть язык теории множеств, или, более точно, язык теории меры. Но прикладные задачи традиционно формулируются на другом, «практическом» языке. В частности, когда множество Ω (пространство элементарных событий) является конечным множеством, то применяется упрощенный метод подсчета вероятностей, который получил название классического. Здесь мы будем рассматривать только классический метод.

3.1. Вариационные ряды 3.1.1. Основные понятия 1) Почти все встречающиеся на практике величины (производительность труда, заработная плата, объем произведенной продукции, урожайность и т.д.) принимают неодинаковые численные значения в различных ситуациях. Поэтому возникает необходимость в изучении их изменяемости. Предположим, что мы, интересуясь размером проданной в магазине мужской обуви, получили следующие данные (в порядке продажи): 41, 39, 40, 38, 43,41, 42, 40, 38, 41, 42, 41, 40, 42, 39, 41, 41, 36, 43, 41, 42, 38, 41, 40, 42, 41, 42, 42, 42, 40, 41, 41, 39, 42, 40, 40, 39, 41, 39, 38, 40, 41, 41, 40, 40, 39, 42, 40, 43, 37, 40, 42, 43, 42, 38, 40, 40, 41, 41, 41, 40, 43, 42, 42, 39, 43, 41, 40, 43, 41, 42, 42, 39, 41, 43, 42, 41, 42, 40. Нетрудно видеть, что интересующий нас признак меняется от одного члена совокупности к другому, или, как мы будем говорить, варьирует.


229

Математика

Итак, варьирование есть изменяемость признака у отдельных членов совокупности. Значения признака у отдельных членов совокупности будем называть вариантами. В нашем примере имеется 79 вариантов (общее число покупок). Многие из них оказываются одинаковыми, поэтому варианты целесообразно упорядочить – расположить их в порядке возрастания (или убывания). В результате получим следующий ряд: 36, 37, 38, 38, 38, 38, 38, 39, 39, 39, 39, 39, 39, 39, 39, 40, 40, 40, 40, 40, 40, 40, 40, 40, 40, 40, 40, 40, 40, 40, 40, 40, 41, 41, 41, 41, 41, 41, 41, 41, 41, 41, 41, 41, 41, 41, 41, 41, 41, 41, 41, 41, 41, 42, 42, 42, 42, 42, 42, 42, 42, 42, 42, 42, 42, 42, 42, 42, 42, 42, 42, 43, 43, 43, 43, 43, 43, 43, 43. Операция упорядочения ряда, то есть расположение вариантов в порядке возрастания (или убывания), называется ранжированием ряда. Теперь легко подсчитать, что интересующий нас признак может принимать восемь различных значений (табл. 3.1). Таблица 3.1 Размер обуви (варианты)

1

36

1

0,013

1,3

2

37

1

0,013

1,3

3

38

5

0,063

6,3

4

39

8

0,101

10,1

5

40

17

0,215

21,5

6

41

21

0,266

26,6

7

42

18

0,228

22,8

8

43

8

0,101

10,1

79

1,000

100,0

Итого:

Число проданных пар (частоты)

Частости

Номер варианта

отн. вел.

%


230

Э.Ф. Казанцев

В третьем столбце таблицы 3.1 стоят числа, которые характеризуют, сколько раз повторяется каждое значение признака в данной совокупности. Эти числа называются частотами признака. Сумма частот – это объем совокупности (в нашем примере общее число проданных пар обуви – 79). Можно указывать не частоты, а доли каждого варианта во всей совокупности. Они получаются как отношения соответствующих частот к объему совокупности. Эти отношения называются частостями. Выражаются они в относительных числах или в процентах (см. табл. 3.1). В результате мы получили так называемый вариационный ряд. О п р е д е л е н и е 1. Вариационным рядом называется упорядоченные значения варьирующего признака (в порядке возрастания или убывания) и соответствующие им частоты (или частости). Частоту (или частость) варианта будем называть его весом. Таким образом, веса показывают, сколько раз встречаются отдельные варианты в данной совокупности, или какую долю объема совокупности составляет каждый из них. 2) В зависимости от того, какие значения может принимать признак, вариационные ряды делятся на дискретные и непрерывные (интервальные). В нашем примере признак (размер обуви) мог принимать только целые (дискретные) значения. Такого типа ряды называются дискретными. Кроме дискретных вариационных рядов широкое распространение имеют интервальные (непрерывные) вариационные ряды. В этом случае говорят, что значениями варьирующего признака могут быть любые значения в заданных пределах. Примерами такого типа вариационных рядов могут служить распределения людей по возрасту или по росту, распределение посевной площади по урожайности и т.д. При непрерывном варьировании возможные значения признака задаются интервалом «от … до …» (табл. 3.2).


231

Математика

Таблица 3.2 Распределение 1000 взрослых мужчин по росту Рост (в см)

Число мужчин

143–146

1

146–149

2

149–152

8

152–155

26

155–158

65

158–161

120

161–164

181

164–167

201

167–170

170

170–173

120

173–176

64

176–179

28

179–182

10

182–185

3

185–188

1

Итого:

1000

Интервалы не обязательно должны быть равными. Для непрерывных распределений вводится понятие плотности распределения. Так называется частота, приходящаяся на единицу величины интервала варьирования признака. Если в непрерывном вариационном ряду указаны не частоты, а частности для каждого интервала варьирования признака, то находят отношения частностей к соответствующим интервалам. Они называются относительными плотностями распределения. Особенно важно понятие плотности распределения для непрерывных распределений с неравными интервалами.


232

Э.Ф. Казанцев

Если нас интересует, например, вопрос, сколько было продано пар обуви размеров меньших некоторого, мы должны последовательно просуммировать частоты, начиная с частоты первого варианта. Полученные числа называются накопленными частотами. 3) Графическое изображение вариационных рядов Применяется несколько способов графического изображения рядов распределений в зависимости от вида их и от поставленной задачи: полигон, гистограмма, кумулятивная кривая, огива. Пусть дискретный вариационный ряд задан таблицей 3.1. В прямоугольной системе координат построим точки с координатами (x, n), где х – значения признака, а n – соответствующие им частоты. Эти точки соединим последовательно прямолинейными отрезками. К данным таблицы 3.1 добавляют нулевые значения частот для вариантов с размерами обуви 35 и 44. Получится ломаная замкнутая линия, называемая полигоном (рис. 3.1 по данным табл. 3.1).

Рис. 3.1. Полигон


233

Математика

Полигон можно использовать для графического изображения и интервальных вариационных рядов. Для этого следует частоты отнести к серединам интервалов. Но чаще всего для графического изображения интервальных распределений применяется гистограмма, которая строится также в прямоугольной системе координат. По оси абсцисс откладывают отрезки, изображающие интервалы значений варьирующего признака. На этих отрезках, как на основаниях, строят прямоугольники, высоты которых пропорциональны частотам (или частостям) соответствующих интервалов. В результате получаем ступенчатую фигуру в виде сдвинутых друг к другу прямоугольников, площади которых пропорциональны частотам (или частостями) (см. рис.3.2 по данным табл. 3.2). Следует помнить, что гистограмма изображает не фактическое изменение плотности распределения в зависимости от изменения признака, а лишь средние плотности распределения на каждом интервале. Если построена гистограмма интервального распределения, то, как нетрудно сообразить, полигон того же распределения получим, если соединим прямолинейными отрезками середины верхних оснований прямоугольников. 7 6 5 4 3 2 1 0

5

10 13

20 25 30

Рис. 3.2. Гистограмма

35

40


Э.Ф. Казанцев

234

Для построения кумулятивной кривой в прямоугольной системе координат строим точки с координатами (х, n1 + n2 + … + ni), то есть абсциссы их – значения признака, а ординаты – соответствующие им накопленные частоты. Точки соединяем прямолинейными отрезками. Получим ломаную линию – ее и называют кумулятивной кривой (или кривой нарастающих итогов). Если в прямоугольной системе координат в качестве ординаты отложить значения признака, а абсциссы – накопленные частоты и полученные точки соединить прямолинейными отрезками, то получим ломаную линию, которая называется огивой. Таким образом, по сравнению с кумулятивной кривой при построении огивы оси абсцисс и ординат меняются ролями. 3.1.2. Характеристики вариационного ряда 1) Средняя арифметическая О п р е д е л е н и е 2. Средней арифметической вариационного ряда называется сумма произведений всех вариантов на соответствующие им частоты (или частости), поделенная на сумму частот: m

x

x1n1 x2 n2 ... xm nm n1 n2 ... nm

¦x n

i i

i 1

n

.

(3.1)

Иначе можно сказать, что средняя арифметическая равна сумме произведений вариантов на их веса, разделенной на сумму весов. При вычислении средней арифметической интервального распределения в качестве вариантов берут середины соответствующих интервалов. П р и м е р 3.1. Вычислить среднее число жителей в поселках городского типа по следующим данным:


235

Математика

Число жителей в поселках (тыс. человек)

Число поселков

От 1 до 3

682

От 3 до 5

875

От 5 до 10

1367

От 10 до 20

443

От 20 до 50

50

От 50 до 80

1 Итого:

x

3418

2 682 4 875 7 ,5 1367 15 443 35 50 65 1 3418

6,9 ɬɵɫ. ɱɟɥ.

Здесь смысл среднего следующий – это такое число жителей, которое было бы в каждом поселке, если в каждом из них жителей было бы поровну. Рассмотрим основные теоремы, характеризующие свойства средней арифметической. Т е о р е м а 1. Если все варианты увеличить (уменьшить) в одно и то же число раз, то средняя арифметическая увеличится (уменьшится) во столько же раз. Действительно: m

__

kx

¦ i 1

kxi ni n

k

m

¦ i 1

m

xi ni

n

¦x n i

k

i 1

n

i

k x.

(3.2)

Аналогично доказывается, что уменьшение вариантов в k раз приводит к уменьшению средней арифметической также в k раз. Т е о р е м а 2. Если все варианты уменьшить (увеличить) на одно и то же число, то средняя арифметическая уменьшится (увеличится) на то же число.


Э.Ф. Казанцев

236

Действительно: m

¦

______

i 1

x c

n

xi ni

i 1

n

m

¦c n

i

i 1

m

¦n

i

i i

i 1

¦

n

m

¦x n

m

( xi c) ni

c

i 1

x c.

n

(3.3)

Аналогично доказывается, что увеличение вариантов на одно и то же число приводит к увеличению средней на то же число. Т е о р е м а 3. Сумма произведений отклонений вариантов от их средней арифметической на соответствующие им веса равна нулю. Действительно, используя предыдущую теорему, полагая c = x, получим: m

¦ (x x) i

i 1

n

x x

Откуда следует:

0. m

¦ (x x) n i

i

0.

(3.4)

i 1

Т е о р е м а 4. При увеличении и уменьшении весов в одно и то же число раз средняя арифметическая не изменяется. Действительно: m

¦

xi kni

i 1 m

¦ kn

m

k

xn ¦x n ¦ i i

kn

i i

i 1

n

x.

(3.5)

i

i 1

Введем понятие групповой средней. Предположим, что некоторая совокупность разбита на группы. Группы будем на-


Математика

237

зывать непересекающимися, если каждый вариант принадлежит только одной группе. О п р е д е л е н и е 3. Групповой средней называется средняя арифметическая вариантов, составляющих часть данной совокупности. Тогда среднюю арифметическую того же признака во всей совокупности называют общей средней. Т е о р е м а 5. Если совокупность разбита на непересекающиеся группы, то общая средняя равна средней арифметической групповых средних, когда весами являются объемы групп. l

x

x1 N1 x2 N 2 ... xl N l N1 N 2 ... N l

¦ xN i 1

n

i

(3.6)

Т е о р е м а 6. Если каждое значение признака z представляет сумму (разность) значений признаков x и y, то средняя арифметическая признака z равна сумме (разности) средних арифметических x и y: z = x + y 2) Медиана О п р е д е л е н и е 4. Медианой (Me) называется вариант, приходящийся на середину вариационного ряда. Иными словами, медианой является вариант, который делит совокупность на две равные по объему части. До медианы и после нее имеется одинаковое число членов совокупности. При нахождении медианы вариационного ряда следует различать два случая: а) объем совокупности нечетный; б) объем совокупности четный. а) Пусть объем совокупности нечетный и равен 2m – 1. Расположим все варианты x 1, x 2,…, x m – 1, x m, x m + 1,…, x 2m – 1 в возрастающем порядке. В этом ряду каждый вариант повторен столько раз, сколько он встречается в совокупности. Поэтому среди них могут быть и одинаковые. Медианой этого распре-


Э.Ф. Казанцев

238

деления является вариант с номером m, так как он находится в середине ряда: Ме = xm. б) Если объем совокупности четный и равен 2m, то в ряду x1, x2,…, xm – 1, xm, xm + 1,…, x2m нет варианта, который делил бы совокупность на две равные по объему группы. Поэтому за медиану условно принимают полусумму находящихся в середине ряда вариантов: Me

1 ( xm xm 1 ). 2

П р и м е р 3.2. Вычислить медиану распределения по размеру проданной обуви (см. табл. 3.4.1). Р е ш е н и е . Объем совокупности (79) нечетный. Здесь 2m – 1 = 79, откуда m = 40. Следовательно, медианой этого распределения будет вариант с номером 40 в ранжированном ряду, в котором каждый вариант повторен столько раз, какова его частота. Чтобы найти этот вариант, определим накопленные частоты данного распределения. Размер обуви

Число проданных пар

Накопленные частоты

36

1

1

37

1

1 + 1 = 2

38

5

2 + 5 = 7

39

8

7 + 8 = 15

40

17

15 + 17 = 32

41

21

32 + 21 = 53

42

18

53 + 18 = 71

43

8

71 + 8 = 79

Итого:

79

Теперь ищем последнюю накопленную частоту, которая меньше половины объема совокупности, и первую, которая больше ее. Они соответственно равны 32 и 53. Таким образом, первые 32 варианта по своей величине меньше 41, а следующие


Математика

239

21 вариант, имеющие номера с 33 по 53 включительно, принимают значение 41. Среди них находится и вариант с номером 40, следовательно, медиана этого распределения равна 41 размеру обуви. 3) Мода О п р е д е л е н и е 4. Модой (Мо) называется наиболее часто встречающийся вариант. Нахождение моды дискретного распределения не требует каких-либо вычислений – ею является вариант, которому соответствует наибольшая частота (или частость). Для примера с обувью, наибольшая частота распределения равна 21. Она соответствует варианту 41. Следовательно, мода распределения по размеру проданной мужской обуви (см. табл. 3.1) равна 41. Мода для непрерывного распределения вычисляется по формуле: Mo

x0 k

ni ni 1 , (ni ni 1 ) (ni ni 1 )

где x0 – начальное значение модального интервала, то есть интервала, содержащего моду; k – величина модального интервала; ni – частота модального интервала; ni – 1 – частота интервала, предшествующего модальному; ni + 1 – частота интервала, следующего за модальным. В непрерывном распределении с равными интервалами модальным будет интервал, которому соответствует наибольшая частота. Если интервалы неодинаковые, то модальным будет интервал, которому соответствует наибольшая плотность распределения. 3.1.3. Показатели вариации 1) Простейшим показателем вариации признака является размах вариации R – это разность между наибольшим и наименьшим вариантами в данном вариационном ряду: R = xmax – xmin.


Э.Ф. Казанцев

240

Так, размах вариации распределения по размеру проданной мужской обуви (см. табл. 3.1) равен: R = 43 – 36 = 7. Размах вариации – весьма приближенная характеристика рассеяния признака. Наибольший интерес представляет характер группировки значений признака около их средней: xi – x. Кроме того, должно быть учтено, как часто они имеют место в данном распределении. Это показывают веса вариантов. И, наконец, разности xi – x необходимо освободить от знака: взять или абсолютные величины, или их квадраты, или вообще четные степени. В соответствии с этим получают различные характеристики рассеяния признака: среднее линейное отклонение, дисперсию и др. О п р е д е л е н и е 5. Средним линейным отклонением называется средняя арифметическая абсолютных величин отклонений вариантов от их средней арифметической: m

¦ x x n i

i 1

d

i

n

.

(3.7)

Однако на практике и в теоретических исследованиях среднее линейное отклонение применяется сравнительно редко, так как оно не имеет таких свойств, какие желательно было иметь. Поэтому обычно рассеяние признака характеризуют дисперсией и непосредственно получаемым из нее средним квадратическим отклонением. О п р е д е л е н и е 6. Дисперсией вариационного ряда называется средняя арифметическая квадратов отклонений вариантов от их средней: m

V

2

¦ x x

2

i

i 1

n

ni

.

(3.8)

Для характеристики рассеяния часто бывает удобнее иметь величину, которая выражается в тех же единицах, что и значе-


241

Математика

ния признака. Ее мы получим, вычислив корень квадратный из дисперсии. О п р е д е л е н и е 7. Арифметическое значение корня квадратного из дисперсии называется средним квадратическим отклонением: m

¦ x x

2

i

i 1

V

ni .

n

(3.9)

2) Свойства дисперсий Т е о р е м а 7. Если все варианты увеличить (уменьшить) в одно и то же число k раз, то дисперсия увеличится (уменьшится) в k2 раз. Действительно: m

m

¦ kxi kx 2 ni i 1

¦ x x

2 i 1

2

i

2

i 1

n m

k

¦k ni

xi x 2 ni n

2

2

k V .

n

(3.10)

Т е о р е м а 8. Увеличение или уменьшение вариантов на одну и ту же постоянную величину не изменяет дисперсии. Действительно: m

¦ > xi c x c @2 ni i 1

n m

¦ x x

2

i

i 1

n

m

¦ x i 1

i

c x c 2 ni n

ni .

(3.11)


Э.Ф. Казанцев

242

Т е о р е м а 9. При увеличении и уменьшении весов в одно и то же число раз дисперсия не изменяется. Действительно: m

¦ x x

2

i

i 1

kni

k

m

¦ x x

i 1

m

2

i

¦ kn

k

i

i 1

m

¦ x x

ni

2

i

i 1

m

ni

n

¦n

.

i

i 1

(3.12) Т е о р е м а 10. Дисперсия относительно средней арифметической равна дисперсии относительно произвольной постоянной без квадрата разности между средней арифметической и этой постоянной: m

V

2

¦ x c

2

i

i 1

ni

n

x c 2 .

(3.13)

Действительно, так как

xi x 2 xi c c x 2 > xi c x c @ 2 xi c 2 2 xi c x c x c 2, то дисперсию относительно средней арифметической можно представить так: m

V

2

m

m

i 1

i 1

m

¦ xi x 2 ni

¦ xi c 2 ni 2¦ xi c x c ni ¦ x c 2 ni

n

n

i 1

i 1

.

За знак суммы можно вынести постоянный множитель x – c, поэтому: m

m

i 1

i 1

¦ x c 2ni x c 2 ¦ ni n

n

x c 2 n x c 2 , n


243

Математика

m

m

¦ xi c x c ni i 1

¦ x c n

x c i 1

n

i

n

i

x c x c x c 2 .

В результате мы получим: m

V2

¦ xi c 2ni i 1

n

m

2 x c 2 x c 2

¦ x c n 2

i

i 1

n

i

x c 2 ,

что и требовалось доказать. Т е о р е м а 11. Дисперсия равна средней арифметической квадратов вариантов без квадрата их средней арифметической: m

V

2

¦x

i

i 1

2

ni

n

x 2

(3.14)

Данное выражение мы получим, полагая в предыдущей формуле с = 0. Пользуясь свойствами дисперсии, можно вычисление дисперсии упростить с помощью следующей формулы: m

V2

¦ §¨© i 1

2

xi c · ¸ ni k ¹ n

k 2 x c 2 ,

(3.15)

где с и k – произвольные, специально подобранные постоянные. П р и м е р 3.3. Вычислить дисперсию распределения по росту взрослых мужчин (см. табл. 3.2). Р е ш е н и е : примем с = 165,5 – это середина интервала, которому соответствует наибольшая частота, и одновременно это приближенное значение средней арифметической. В качестве k возьмем величину интервалов (они все одинаковые), то есть 3. Результаты вычислений расположим в таблице.


Э.Ф. Казанцев

244

Рост (в см)

Число мужчин ni

Середина интервала xi

xi – c

xi c k

2 xi c § x c· ni ¨¨ i ¸ ni ¸ k © k ¹

143–146

1

144,5

–21

–7

–7

49

146–149

2

147,5

–18

–6

–12

72

149–152

8

150,5

–15

–5

–40

200

152–155

26

153,5

–12

–4

–104

416

155–158

65

156,5

–9

–3

–195

585

158–161

120

159,5

–6

–2

–240

480

161–164

181

162,5

–3

–1

–181

181

164–167

201

165,5

0

0

0

0

167–170

170

168,5

3

1

170

170

170–173

120

171,5

6

2

240

480

173–176

64

174,5

9

3

192

576

176–179

28

177,5

12

4

112

448

179–182

10

180,5

15

5

50

250

182–185

3

183,5

18

6

18

108

185–188

1

186,5

21

7

7

49

10

4064

Итого:

1000

Средний рост мужчин равен: 10 3 165,5 165,53 ɫɦ . 1000

x

Применяя формулу (3.15), найдем дисперсию: V

2

4064 2 3 165,53 165,5 2 1000

36 ,5751 .

3) Групповая дисперсия О п р е д е л е н и е 8. Групповой дисперсией называется дисперсия вариантов, составляющих часть данной совокупности, относительно их средней, то есть относительно групповой сред-


245

Математика

ней. Тогда дисперсия вариантов всей совокупности относительно общей средней называется общей дисперсией: m

Vj

2

¦ x x

2

i

i 1

mi ,

Nj

(3.16)

где xi – варианты, xj – групповая средняя, mi – частота вариантов в группе, N j

m

¦ m – объем группы. i

i 1

О п р е д е л е н и е 9. Средняя арифметическая групповых дисперсий, когда весами являются объемы групп, называется средней групповых дисперсий: m

V

2

¦V i 1

j

2

n

Nj .

(3.17)

Задания для самостоятельной работы 1) Задан дискретный вариационный ряд: 5, 4, 3, 5, 5, 6, 7, 6, 7, 7, 8, 8, 5, 2, 4, 5, 6, 6, 8, 9, 9, 6, 6, 4, 4, 3, 4, 2, 2, 2, 5, 5, 5, 6, 8, 4, 4, 8, 8, 6. а) ранжировать данный ряд; б) найти частоты вариантов; в) построить полигон данного ряда; г) построить кумулятивную кривую данного ряда; д) вычислить среднюю арифметическую; е) вычислить медиану и моду; ж) найти дисперсию. 2) Задан интервальный вариационный ряд: Объем валовой продукции (в млн руб.)

Число предприятий (в %)

101–5000

8,3

501–1000

18,8

1001–5000

16,4


Э.Ф. Казанцев

246

5001–10000

39,0

10001–50000

8,5

50001–55000

7,6

55001–60000

1,4 Итого:

100,0

а) найти плотности распределения по интервалам; б) построить гистограмму данного ряда; в) найти средний объем валовой продукции; г) найти медиану и моду; д) вычислить дисперсию.

3.2. Комбинаторный анализ Основная задача комбинаторики – пересчет и перечисление элементов в конечных множествах. Если нас интересует, сколько элементов, принадлежащих заданному конечному множеству, обладает некоторым свойством или заданным набором свойств, то это задача пересчета. Если для каких-либо целей необходимо выделить все элементы множества, удовлетворяющие заданным свойствам, то это задача перечисления. 3.2.1. Правила суммы и произведения Пусть Х – конечное множество, состоящее из n элементов. Тогда говорят, что объект x из X может быть выбран n способами, и пишут | x | = n. Пусть X 1,...,X k – попарно непересекающиеся множества, то есть Xi ∩ Xj = ∅ при i ≠ j. Тогда, очевидно, выполняется равенство: k

i 1

Xi

k

¦X i 1

i

.


Математика

247

В комбинаторике этот факт называется правилом суммы. Для k = 2 оно формулируется следующим образом: Если объект x может быть выбран m способами, а объект y – другими n способами, то выбор «либо x, либо y» может быть осуществлен (m + n) способами. Другим часто применяемым в комбинаторике правилом является правило произведения. Если объект x может быть выбран m способами и после каждого из таких выборов объект y в свою очередь может быть выбран n способами, то выбор упорядоченной пары <x, y> может быть осуществлен (m ⋅ n) способами. В общем случае правило произведения формулируется следующем образом. Если объект x1 может быть выбран n1 способами, после чего объект x2 может быть выбран n2 способами и для любого i, где 2 ≤ i ≤ m – 1, после выбора объектов x1,..., xi объект xi + 1 может быть выбран ni + 1 способами, то выбор упорядоченной последовательности из m объектов <x 1, x 2,..., x m> может быть осуществлен (n1n2...nm) способами. 3.2.2. Размещения, сочетания и перестановки Набор элементов x1, x2,..., xm из множества X = {x1,..., xn} называется выборкой объема m из n элементов или, иначе, (n, m)выборкой. Выборка называется упорядоченной, если порядок следования элементов в ней задан. Две упорядоченные выборки, различающиеся лишь порядком следования элементов, считаются различными. Если порядок следования элементов в выборке не является существенным, то такая выборка называется неупорядоченной. В выборках могут допускаться или не допускаться повторения элементов. Упорядоченная (n, m)-выборка, в которой элементы могут повторяться, называется (n, m)-размещением с повторениями. Если элементы упорядоченной (n, m)-выборки попарно различны, то она называется (n, m)-размещением без


Э.Ф. Казанцев

248

повторений или просто (n, m)-размещением. Будем, кроме того (n, n)-размещения без повторений называть перестановками множества X. Неупорядоченная (n, m)-выборка, в которой элементы могут повторяться, называется (n, m)-сочетанием с повторениями. Если элементы неупорядоченной (n, m)-выборки попарно различны, то она называется (n, m)-сочетанием без повторений или просто (n, m)-сочетанием. Заметим, что любое (n, m)-сочетание можно рассматривать как m-элементное подмножество n-элементного множества. П р и м е р : Пусть Х = {1, 2, 3}. Тогда: а) <1,1>, <1,2>, <1,3>, <2,1>, <2,2>, <2,3>, <3,1>, <3,2>, <3,3> – это (3,2)-размещения с повторениями; б) <1,2>, <1,3>, <2,1>, <2,3>, <3,1>, <3,2> – это <3,2>размещения; в) {1, 2}, {1, 3}, {2,3} – это (3,2)-сочетания. Число (n, m)-размещений с повторениями обозначаем m

через Anm , а без повторений – через An . Число перестановок n n-элементного множества обозначаем через Pn (то есть Pn An ). m Число (n, m)-сочетаний с повторениями обозначаем через Cn ,

m а без повторений – через Cn .

У т в е р ж д е н и е 1. Anm n m . Действительно, каждое (n, m)-размещение с повторениями является упорядоченной последовательностью длины m, причем каждый член этой последовательности может быть выбран любым из n способов, откуда по обобщенному правилу произведения и получаем требуемую формулу. В дальнейшем для большей общности формул будем считать, что 0! = 1. У т в е р ж д е н и е 2. m

An .= n(n – 1) ... (n – m + 1) = n! / (n – m)!, при n ≤ m; Anm

0 при m > n.


Математика

249

Рассмотрим случай, когда m ≤ n (случай m > n очевиден). Каждое (n, m)-размещение без повторений является упорядоченной последовательностью длины m, члены которой попарно различны и выбираются из множества с n элементами. Тогда первый член этой последовательности может быть выбран n способами, после каждого выбора первого члена последовательности второй член может быть выбран (n – 1) способами и т.д. Соответственно после каждого выбора первого и так далее. (m – 1)-го членов последовательности m-й член может быть выбран n – (m – 1) = n – m + 1 способами, откуда по обобщенному правилу произведения и получаем требуемую формулу. Следствие: Pn

Anm

n n 1 ...1 n!.

У т в е р ж д е н и е 3. m

m

Cn

An m! n!(( n m)! m), при m ≤ n;

Cn

0 , при m > n.

m

Рассмотрим нетривиальный случай, когда m ≤ n. Каждое (n, m)-сочетание можно упорядочить m! способами. Объединение получаемых таким образом попарно непересекающихся множеств (n, m)-размещений для всех возможных (n, m)-сочетаний очевидно, даст все (n, m)-размещения. Тогда по правилу сумm m мы имеем An Cn m! (здесь суммирование производится по всем (n, m)-сочетаниям без повторений), откуда: Cnm Anm m!. m

m

У т в е р ж д е н и е 4. Cn Cn m 1 . Каждому (n, m)-сочетанию B с повторениями, составленному из элементов множества X = x1,..., xn поставим в соответствие вектор α(B) длины n + m + 1 из m нулей и n – 1 единиц такой, что число нулей, находящихся между (i – 1)-й и i-й единицами, где 2 ≤ i ≤ n – 1, будет равно числу элементов хi, входящих в сочетание B, а число нулей, стоящих перед первой единицей (после (n – 1)-й единицы), равно числу элементов х1, (соответственно xn), входящих в сочетание B. Это соответствие между (n, m)-


Э.Ф. Казанцев

250

сочетаниями с повторениями и векторами с (n – 1) единицами и m нулями взаимно однозначно. С другой стороны, число векторов с (n – 1) единицами и m нулями равно числу m-элементных множеств (номеров нулевых компонентов в векторах), являющихся подмножествами (n + m + 1)-элементарного множества {1, 2,..., n + m – 1} (множества всех номеров компонент в векторах), то есть числу (n + m –1, m)-сочетаний без повторений. Таким образом, Cnm Cnm m 1 . У т в е р ж д е н и е 5. Обозначим через Yx множество всех отображений f: X→Y. Пусть | X | = m; | Y | = n. Тогда | Yx | = Anm , = = nm = | Y |x. У т в е р ж д е н и е 6. Пусть | X | = m; | Y | = n. Тогда число m всех инъективных отображений f: X → Y равно An . С л е д с т в и е . Для Sn – множества всех биективных отображений n-элементного множества в себя имеем: Sn Ann Pn n!. П р и м е р 1. Сколькими способами можно раскрасить квад­ рат, разделенный на четыре части, пятью цветами: а) допуская окрашивание разных частей в один цвет; б) если различные части окрашиваются разными цветами? Будем рассматривать каждое раскрашивание как функциональ­ ное отображение множества номеров частей квадрата X = {1, 2, 3, 4} в множество цветов Y, где | Y | = 5. Тогда, используя утверждение 5 и 6, имеем: а) 54 = 625; б) 5! / (5–4)! = 120.

П р и м е р 2. Сколькими способами можно выбрать 5 номеров из 36? Нас интересует количество неупорядоченных (36, 5) – выборок без повторений, то есть (36, 5) – сочетаний. Используя утверждение 3, получаем, что требуемое число способов равно 5 C36

376992.


Математика

251

П р и м е р 3. В скольких случаях при игре в «Спортлото» (угадывание 5 номеров из 36) будут правильно выбраны: а) ровно 3 номера; б) ровно 4 номера; в) ровно 5 номеров; г) не менее 3 номеров? Р е ш е н и е : а) 3 из 5 «правильных» номеров можно выбрать C53 способами, а 2 оставшихся «неправильных» номера – 2 C31 способами. Далее по правилу произведения получаем, что искомое число равно: 5! 31! 3! 2! 29! 2!

2 C53C31

4650.

В остальных случаях соответственно имеем: 1 б) C54C31 151; в) ≤ 1; г) 4650 + 153 + 1 = 4806. П р и м е р 4. В скольких случаях при выборе из колоды в 52 карты 10 карт среди них окажутся все 4 туза? Исключив из рассмотрения тузы, получим, что выбираются 6 карт из 48, а 6

такой выбор можно осуществить C48 способами: 6

C48

48! 12181512 . 42! 6!

П р и м е р 5. Имеется 30 монет достоинством 1, 2, 3 копейки. Сколько существует различных комбинаций монет (например, 3 монеты по 1 копейке, 17 – по 2 копейки, 10 – по 3 копейки)? По условиям задачи требуется определить количество неупорядоченных выборок с повторениями объема 30 из множества объема 3, то есть число (3, 30) – сочетаний с повторениями. Используя утверждение 4, получаем, что искомое число равно: 30

C3

30

C3 30 1

30

C32

496 .

3.2.3. Разбиения Подсчитаем число разбиений конечного множества X, где | X | = n, на k подмножеств X1, X2,..., Xk (k ≥ 1) таких, что каждое


252

Э.Ф. Казанцев

Xi содержит ni элементов, то есть | Xi | = | ni |, i = 1, 2,..., k. Очевидно, что при этом

k

X

k

i

X ; Xi X j

; при i ≠ j;

i 1

¦ n!

n. Отметим, что для неко-

i 1

торых номеров i возможно Xi = ∅. Число указанных разбиений n ...nk

при фиксированных ni обозначим через Cn1 n ...nk

У т в е р ж д е н и е 7. Cn1

.

n! . n1!...nk

Как отмечалось ранее, каждое из множеств Xi можно рассматривать как сочетание без повторений. Предварительно докажем справедливость формулы Cnn1 ...nk Cnn1 Cnn 2 n1 ...Cnn k n1 ... n( k 1) .

Действительно, для образования сочетания, соответствующего множеству X1, могут быть использованы все элементы множества X, то есть множество X 1 может быть выбрано Cnn1 способами. После выбора X1 множество X2 может быть выбрано n Cn 2 n способами (так как X 2 является подмножеством множе1 ства X\X1 и | X\X1 | = n – n1), и для любого i, где 2 ≤ i ≤k, после выбора множеств X1,..., Xi – 1 множество Xi может быть выбрано n C n i n1 ... n (i 1) способами. Но тогда по правилу произведения выбор упорядоченной последовательности множеств X1,..., Xk можно осуществить C nn1 C nn 2 n1 ...C nn k n1 ... n ( k 1) способами, то есть формула доказана. Используя теперь эту формулу, а также утверждение 3 и производя необходимые сокращения, получаем, что доказываемое утверждение справедливо. П р и м е р 1. В студенческой группе, состоящей из 25 человек, при выборе профорга за выдвинутую кандидатуру проголосовали 12 человек, против – 10, воздержались – 3. Сколькими способами могло быть проведено такое голосование? Р е ш е н и е . Пусть X – множество студентов в группе, X1 – множество студентов, проголосовавших за выдвинутую кандидатуру, X2 – множество студентов, воздержавшихся от голосования.


Математика

253

Тогда | X | = 25, | X1 | = 12, | X2 | = 10, | X2 | = 3, X = X1∪X2∪X3; Xi∩Xj = 12 ,10 ,3 = ∅ при i ≠ j, а следовательно, искомое число равно C25 . Используя утверждение 7, получаем: 12 ,10 ,3

C25

25! 1487285800 . 12! 10! 3!

У т в е р ж д е н и е 8. Число где ni ≥ 0, равно числу (k, n)размещений с повторениями, среди элементов которых содержится n1 элементов 1-го типа, n2 элементов 2-го типа и так далее, nk элементов k-го типа. П р и м е р 2. Сколькими способами можно раскрасить квадрат, разделенный на 9 частей, четырьмя цветами таким образом, чтобы в первый цвет были окрашены 3 части, во второй – 2, в третий – 3, в четвертый – 1? 1 6 7

2 5 8

3 4 9

Р е ш е н и е . Пусть X – множество цветов, где | X | = 4. Тогда каждое раскрашивание, рассматриваемое как последовательность цветов, в которые окрашиваются пронумерованные части квадрата, является упорядоченной выборкой с повторениями объема 9 из множества X, то есть (4,9) – размещение с повторениями. При этом нас интересуют размещения с заданной комбинацией элементов (3 элемента – первый цвет, 2 – второй, 3 – третий, 1 – четвертый). Но тогда, используя утверждение 8, получаем, что искомое число равно: C93,2 ,3,1

9! 3! 2! 3!!!

5040 .

3.2.4. Метод включения и исключения Нахождение числа элементов суммы множеств A и B Обозначим N(A) – количество элементов множества A, N(B) – количество элементов множества B, тогда очевидно:


254

Э.Ф. Казанцев

N(A∪B) = N(A) + N(B) – N(A∩B), так как общие элементы (A∩B) будут перечислены дважды. Для числа элементов суммы трех множеств: N(A∪B∪C) = N{A∪(B∪C)} = N(A) + N(B∪C) – – N{A∩B)∪(A∪C)} = N(A) + N(B) + N(C) – N(B∩C) – {N(A∩B) + + N(A∩C) – N[(A∩B)∩(A∩C)]} = N(A) + N(B) + N(C) – N(A∩B) – – N(A∩C) – N(B∩C) + N(A∩B∩C). П р и м е р . Каждый студент группы – либо девушка (А), либо блондин (В), либо любит математику (С). Пусть в группе – 20 девушек (А), из них 12 блондинок и одна любит математику. Всего в группе 24 блондина (В), математику из них любят 12, а всего студентов (девушек и юношей), которые любят математику (С) – 17, из них 6 девушек. Сколько студентов в данной группе? Р е ш е н и е : А – множество девушек, В – блондинов, С – любят математику. Тогда надо найти N(A∪B∪C). (A∩B) – множество блондинок; A∩C – множество девушек, которые любят математику; B∩C – множество всех блондинов, которые любят математику; A∩B∩C – множество блондинок, которые любят математику. Тогда: N(A∪B∪C) = 20 + 24 + 17 – – (12 + 6 + 12) + 1 = 32. Общая формула: N(A1∪…∪An) = N(A1) +…+ N(An) – {N(A1∩A2) + + N(A1∩A3) +… + N ( A n–1∩ A n) } + { N ( A 1∩ A 2∩ A 3) + N ( A 1∩ A 2∩ A 4) + … + N(A n–2∩A n–1∩A n) } –…+ (–1) n–1N(A 1∩…∩A n), N(A n∪…∪A n) = = (–1)n–1Sk(A1…An), где Sk(A1…An) есть сумма чисел N(Ai ∩…∩Ai ) 1 k по всем возможным пересечениям. Задания для самостоятельной работы 1) Сколькими способами можно раскрасить квадрат, разделенный на 4 части пятью цветами:


Математика

255

а) допуская окрашивание разных частей в один цвет (повторение); 1

2

4

3

б) если различные части окрашиваются разными цветами (без повторений); E = {1, 2, 3, 4, 5}; k = 4. а) A54

54

625;

5! 5! 120. (5 4)! 2) Сколькими способами можно выбрать 5 из 36? Это сочетание без повторений: 4

б) A5

5 C36

36 35 34 33 32 1 2 3 4 5

376962.

3) В скольких случаях при игре в «Спортлото» (5 из 36) будут правильно выбраны: а) 3 номера, б) 4 номера, в) 5 номеров; а) C53 – выбор трех правильных номеров, C32 – выбор двух правильных; 5! 31! 3 2 4650; Итого: C5 C31 3!2! 29!2! 1 б) C54 C31 155 . 0 в) C55 C30

1.

4) В скольких случаях при выборе из колоды в 52 карты 10 карт среди них окажутся все 4 туза? Исключив из рассмотренного туза, получим, что выбираются 6 карт из 48, то есть 6 C48

48! / 42! 6!

43 44 45 46 47 48 . 1 2 3 4 5 6

5) Имеется 30 монет достоинством 1, 2 и 3 копейки, Сколько существует различных комбинаций монет?


Э.Ф. Казанцев

256

То есть требуется определить количество подмножеств с повторениями из множества 3 по 30 – число сочетаний с повторениями: C330

C330 30 1

30 C32

496 .

3.3. Теория вероятностей 3.3.1. Случайные события Основные понятия Событие – это все то, что может произойти, а может и не произойти. Очень важно, чтобы события, которые мы сравниваем, принадлежали одному множеству. Элементы этого множества называются элементарными событиями. П р и м е р . Предложение: «выберите, пожалуйста: пойти направо, налево или прочитать новый детектив» звучит нелепо, так как последний вариант принадлежит другому множеству. К одному множеству принадлежат события: «пойти на лекцию, пойти в кино или поспать». События могут обладать совершенно разными качествами, или, как говорят, различной ценностью информации: например, «Маша любит сыр», или «Маша любит Колю». События имеют иерархическую структуру: например, каждый человек, родившись, сперва выбирает язык общения (это определяется окружением), затем человек выбирает специальность и так далее. Поэтому также нелепо звучит фраза: «Вы­ берите, пожалуйста, кем вы хотите стать: физиком, химиком или французом». Это события различных уровней. Будем рассматривать события одного множества, качества, уровня и обозначать их большими буквами A, B, C ... . Два события называются несовместимыми, если наступление одного из них исключает наступление другого. П р и м е р . Событие A – пойти налево, событие B – пойти направо.


Математика

257

Событие называется достоверным, если оно не может не произойти в условиях данного опыта. П р и м е р . Монета упадет или «орлом», или «решкой». Событие называется невозможным, если оно не может произойти при выполнении определенного комплекса условий. П р и м е р . Монета не может упасть на ребро. Два события, одно из которых исключает возможность наступления другого, называются противоположными. П р и м е р . «Орел» и «решка». Число, являющееся выражением меры объективной возможности наступления события, называется его вероятностью и обозначается символом P(A). Читается – «вероятность события A». Т е о р е м а 1. Вероятность события A равна отношению числа случаев m, благоприятствующих ему из общего числа n единственно возможных и несовместимых случаев, к числу n: P(A) = m/n (классическая вероятность). (3.3.1) П р и м е р . Имеется 100 одинаковых деталей, среди которых 3 бракованных. Найти событие A – появление хорошей детали. Этому событию благоприятствует 97 случаев, следовательно, вероятность события A: P(A) = 97/100 = 0,97. Вероятность появления бракованной детали (событие B): P(B) = 3/100 = 0,03. С л е д с т в и е 1. Вероятность любого события не может быть меньше нуля и больше единицы. Действительно: событие A удовлетворяет неравенству: 0 ≤ m ≤ n. Разделим это неравенство на n и получим: 0 ≤ m/n ≤ 1 или 0 ≤ P(A) ≤ 1. С л е д с т в и е 2. Вероятность достоверного события равна единице. Действительно: для достоверного события m = n, то есть P(A) = 1. С л е д с т в и е 3. Вероятность невозможного события равна нулю. Действительно: m = 0, то есть P(B) = 0. Сложение вероятностей Т е о р е м а 2. Если события A и B несовместимы, то вероятность того, что произойдет одно из этих событий равна сумме вероятностей наступления каждого события.


258

Э.Ф. Казанцев

Д о к а з а т е л ь с т в о . Пусть из общего числа n случаев, событию A благоприятствуют k случаев, а событию B – t случаев, тогда P(A) = k/n; P(B) = t/n. По условию события A и B несовместимые. Поэтому, событию «или A, или B» благоприятствует (k + t) случаев. P (или A, или B) = (k + t)/n = k/n + t/n , то есть P(или A, или B) = P(A) + P(B). С л е д с т в и е . Сумма вероятностей всех единственно возможных событий равна единице. P(A1) + P(A2) + P(A3) +...+ P(Ak) = 1. П р и м е р 1. Партия из 200 деталей содержит: (A1) I сорта – 150 деталей; (A2) II сорта – 30 деталей; (A3) III сорта – 16 деталей; (A4) брак – 4 детали. Вероятность выбрать наудачу детали I или II сорта: P(A1) = = 150/200 = 0,75; P(A2) = 30/200 = 0,15; P(A1 или A2) = 0,75 + + 0,15 = 0,90. Вероятность выбрать любую деталь: P(A1) + P(A2) + P(A3) + + P(A4) = 0,75 + 0,15 + 0,08 + 0,02 = 1. П р и м е р 2. Возле вашей остановки останавливаются троллейбусы № 5, 8, 1, 6. Вам нужны только № 5 и № 8. Вычислить вероятность того, что к вашей остановке первым подойдет нужный вам маршрут, если троллейбусы курсируют в количестве: № 5 – 15 шт; № 8 – 12 шт; № 1 – 10 шт; № 6 – 13 шт. Всего курсирует 15 + 12 + 10 + 13 = 50 троллейбусов. P5 = 15/50 = 0,3; P8 = 12/50 = 0,24; P(5 или 8) = P5 + P8 = 0,3 + 0,24 = 0,54, что и составляет вероятность появления студента на лекции. Умножение вероятностей Два события называются зависимыми, если вероятность каждого из них меняется, когда становится известным, что другое имеет место.


Математика

259

Вероятность события A, вычисленная в предположении, что событие В наступило, называется условной вероятностью события A. Обозначение: PВ(A) в отличие от безусловной вероятности P(A). П р и м е р . Есть два станка. На первом станке изготавливается 200 деталей, из них 180 годных; на втором станке изготавливается 300 деталей, из них 260 годных. Безусловная вероятность взять годную деталь – P(A): P(A) = (180 + 260) / (200 + 300) = 0,88. Если же стало известно, что деталь взяли с первого станка (то есть произошло событие B), то вероятность события A равна: P∩(A) = 180/200 = 0,9. Т е о р е м а 3. Вероятность того, что произойдут событие A и событие B, равна произведению вероятности одного из них на вероятность второго, вычисленную в предположении, что первое событие имело место: P(и A, и B) = P(A) PA(B). Д о к а з а т е л ь с т в о . Пусть всего из n случаев, m благоприятствуют событию A. Тогда P(A) = m/n. Пусть из m случаев, благоприятствующих A, k случаев благоприятствуют B. Тогда PA(B) = k/m. Событию «и A, и B» благоприятствуют только k случаев из n: P (и A, и B) = k/n. P (и A, и B) = k/n = (mk)/(nm) = (m/n)(k/m) = P(A) PA(B). События A и B играют одинаковую роль, поэтому P(и A, и B) = P(B) PB(A). Событие A называется независимым от события B, если вероятность события A не изменяется, когда становится известным, что событие В имеет место. P(A) = PB(A) и PA(B) = P(B), то есть события A и B независимы. Т е о р е м а 4. Если событие A и B независимые, то вероятность того, что произойдут и событие A, и событие B, равна произведению их вероятностей.


Э.Ф. Казанцев

260

Д о к а з а т е л ь с т в о . По теореме 3: P(и A, и B) = P(A) × × P(B). П р и м е р . Вероятность безотказной работы автомашины – 0,9. Найти вероятность безотказной работы двух автомашин. P(и A, и B) = 0,9 ⋅ 0,9 = 0,81. Обобщение на несколько независимых событий: Т е о р е м а 4а. Если события A, B,..., L независимы в совокупности, то вероятность того, что произойдут события и A, и B,..., и L, равна произведению их вероятностей: P(и A, и B,..., и L) = P(A) ⋅ P(B) ⋅ …⋅ P(L). П р и м е р . На десяти карточках стоят цифры 1, 2, 3, 4,..., 8, 9, 0. Какова вероятность выбрать наудачу цифры 1, 2, 5? Событие A: выбрать карточку «1»: PA = 1/10. Событие B: выбрать карточку «2»: PB = 1/9. Событие C: выбрать карточку «5»: PC = 1/8. P(и A, и B, и C) = 1/10⋅1/9⋅1/8 = 1/720. Полная вероятность П р и м е р . Три завода выпускают лампочки. На 100 лампочек: 1-й завод выпускает 10 бракованных лампочек и обеспечивает 50% лампочек города; 2-й завод выпускает 15 бракованных лампочек и обеспечивает 30% лампочек города; 3-й завод – 20 бракованных лампочек, 20% лампочек города. Надо найти вероятность купить хорошую лампочку P(F). Вероятность события – изготовление лампочек заводом: 1-м заводом: P(A1) = 0,5; 2-м заводом: P(A2) = 0,3; 3-м заводом: P(A3) = 0,2. Вероятность лампочки быть хорошей при условии изготовления на 1-м заводе: PA (F) = 0,90; 2-м заводе: PA (F) = 0,85; 1 2 3-м заводе: PA (F) = 0,80. 3 Искомое событие F будет иметь место если произойдут: – или событие K: лампочки изготовлены на 1-м заводе: P(K) = P(A1) ⋅ PA (F) = 0,5 ⋅ 0,9 = 0,45; 1


261

Математика

– или событие M: лампочки изготовлены на 2-м заводе: P(M) = P(A2) ⋅ PA (F) = 0,3 ⋅ 0,85 = 0,255; 2 – или событие L: лампочки изготовлены на 3-м заводе: P(L) = P(A3) ⋅ PA (F) = 0,2 ⋅ 0,8 = 0,16. 3 События K, L и M являются несовместимыми, поэтому полная вероятность купить хорошую лампочку: P(F) = P(или K, или M, или L) = P(K) + P(M) + P(L) = P(A1) × × PA (F) + P(A2) ⋅ PA (F) + P(A3) ⋅ PA (F) = 0,5 ⋅ 0,9 + 0,3 ⋅ 0,85 + 3 2 3 + 0,2 ⋅ 0,8 = 0,45 + 0,255 + 0,16 = 0,865. Т е о р е м а 5. В общем виде формула полной вероятности имеет вид: P(F) = P(A1) ⋅ PA (F) + P(A2) ⋅ PA (F) +...+ PAn(An) × n

× (F) =

3

¦ P( A ) P i

i 1

2

Ai ( F ).

Формула Байеса По примеру из предыдущего раздела поставим следующие вопросы: на каком заводе изготовлена купленная лампочка; или какова вероятность, что купленная лампочка (хорошая) изготовлена на 1-м заводе: PF(A1)? Вероятность, что лампочка изготовлена на 1-м заводе и хорошая: P(A1) ⋅ PA (F) = P(F) ⋅ PF(A1) – так как события одина3

ковы (теорема 3), то есть PF ( A1 )

P( A1 ) PA1 ( F ) P( F )

по формуле полной вероятности: PF ( A1 )

, а P(F) выразим

P ( A1 ) PA1 ( F )

P( A1 ) PA1 ( F ) P ( A2 ) PA2 ( F ) P ( A3 ) PA ( F )

= 0,5 ⋅ 0,9/

3

/(0,5 ⋅ 0,9 + 0,3 ⋅ 0,85 + 0,2 ⋅ 0,8) = 0,45/0,865 = 0,520. Вероятность того, что хорошая лампочка изготовлена на 2-м заводе: PF ( A2 )

P ( A2 ) PA2 ( F )

P ( A1 ) PA ( F ) P ( A2 ) PA ( F ) P ( A3 ) PA3 ( F ) 1

/0,865 = 0,295.

2

= 0,255/


Э.Ф. Казанцев

262

На третьем заводе: PF ( A3 )

P ( A3 ) PA ( F ) = 0,16/ P ( A1 ) PA1 ( F ) P ( A2 ) PA2 ( F ) P ( A3 ) PA3 ( F )

/0,865 = 0,185. Теперь сформулируем вопросы в самом общем виде. Пусть: а) некоторое событие F может иметь место только при наступлении одного из событий A1, A2,..., An, образующих полную систему. Вероятности P(A1), P(A2),..., P(An) – известны; б) известны также вероятности события F при условии наступления каждого из событий A1, A2,..., An. Они равны PA (F), PA (F),..., PA (F). 1 2 n Какова вероятность события Ai, если известно, что событие F наступило? Ответ дает формула Байеса: PF ( Ai )

P ( Ai ) PAi ( F )

N

¦ P( A ) P i

i 1

Ai

,

(3.3.2)

(F )

то есть это послеопытные вероятности при всех n возможных гипотезах: A1, A2,..., Аn. Поэтому формулу Байеса называют формулой гипотез. Она служит для оценки вероятностей гипотез A1, A2,..., An после того как событие F наступило. Формула Бернулли З а д а ч а . Пусть есть независимое испытание, которое может наступить с вероятностью p. Надо найти вероятность Pmn того, что из n опытов ровно m окажутся успешными. Р е ш е н и е : m испытаний составляют неупорядоченное подмножество множества n, следовательно, их число равно числу сочетаний по m из n. Вероятность каждого из m возможностей наступления нужного события по теореме умножения вероятностей равно произведению m вероятностей наступления события p на произведение (n – m) вероятностей не наступления события q = 1 – p, то есть равна pm ⋅ qn – m. Указанные вероятности являются несовместимыми событиями, поэтому по теореме


263

Математика

сложения вероятность искомого события равна сумме одинаковых слагаемых, каждое из которых равно pm ⋅ qn – m, а число слагаемых равно Cnm : n! m m n m m n m (3.3.3) Pn ,m Cn p q p q . m! (n m)!

Данная формула носит название формулы Бернулли. Вероятности Pmn называются биномиальными вероятностями, так как они совпадают с (m + 1) членом бинома Ньютона:

p q n

q n Cn1 q n 1 p Cn2 q n 2 p 2 ... Cnn 1 q p n 1 p n .

П р и м е р . Монета подбрасывается 10 раз. Какова вероятность того, что герб выпадет 3 раза? p = 1/2; q = 1/2; P10 ,3

3 (0,5)3 (0 ,5) 7 C10

10 9 8 1 1 2 3 210

15 . 128

Если вероятность p наступления события в каждом испытании постоянна и отлична от 0 и 1, а число испытаний достаточно велико, то вероятность Pm, n того, что в n независимых испытаниях событие наступает m раз, приближенно равна: f ( x)

Pm ,n |

где f ( x)

1

npq

2S

,

e X

2

(3.3.4) /2

, x

m nq npq

.

Данная формула носит название приближенной формулы Муавра – Лапласа. Если p близка к 0 и 1, то (np ) m np (3.3.5) P | e m ,n

m!

– это приближенная формула Пуассона. 3.3.2. Случайные величины Применение теории вероятностей к обработке результатов наблюдений (экспериментов) основано на понятии случайной величины.


Э.Ф. Казанцев

264

О п р е д е л е н и е 1. Величина x, принимающая в зависимости от некоторых случайных обстоятельств одно из значений x1, x2, x3,..., xn, имеющих определенные вероятности p1, p2, p3,..., pn, называется случайной величиной. Случайные величины бывают дискретными (с дискретным рядом возможных значений) и непрерывными (имеющими сколь угодно близкие возможные значения). Сначала рассмотрим дискретные величины. Дискретные величины Совокупность значений случайных величин и соответствующих вероятностей называется распределением случайной величины. Значение

x1

x2

x3

...

xn

Вероятность

p1

p2

p3

...

pn

События x являются несовместимыми и единственно возможными, то есть образуют полную систему событий, поэтому сумма вероятностей равна единице: n

p1 + p2 + p3 + ... + pn =

¦p

i

i 1

= 1.

Элементарные вероятности pi или задаются известным законом распределения p(x), или вычисляются по экспериментальным данным. Введем понятие математического ожидания. О п р е д е л е н и е 2. Математическим ожиданием случай­ ной величины (дискретной) называется число, равное сумме произведений всех ее значений на соответствующие им вероятности: n

E(x) = x1p1 + x2p2 + ... + xnpn =

¦x p . i i

i 1

(3.3.6)

Математическое ожидание показывает, какое значение случайной величины следует ожидать в среднем.


265

Математика

П р и м е р . Даны результаты стрельбы двух стрелков. Результат 1-го стрелка

Показатель

Результат 2-го стрелка

Число очков

3

4

5

1

2

3

4

5

Вероятность

0,3

0,4

0,3

0,1

0,1

0,1

0,2

0,5

Математическое ожидание результатов стрельбы (среднее значение): E(xI) = 3 ⋅ 0,3 + 4 ⋅ 0,4 + 5 ⋅ 0,3 = 4,0; E(xII) = 1 ⋅ 0,1 + 2 ⋅ 0,1 + 3 ⋅ 0,1 + 4 ⋅ 0,2 + 5 ⋅ 0,5 = 3,9. Свойства математического ожидания: а) математическое ожидание постоянной величины равно этой постоянной: E(a) = a; б) постоянный множитель можно выносить за символ математического ожидания E(ax) = aE(x); в) математическое ожидание суммы случайных величин равно сумме их математических ожиданий: E(x ± y ± z ±... ± w) = E(x) ± E(y) ±...± E(w); г) математическое ожидание произведения независимых случайных величин равно произведению их математических ожиданий: E(xy) = E(x) ⋅ E(y); д) если все значения случайной величины x уменьшить (увеличить) на одно и то же число c, то математическое ожидание ее уменьшится (увеличится) на то же число c: E(x – c) = E(x) – c. С л е д с т в и е . Математическое ожидание отклонения случайной величины x от ее математического ожидания равно нулю: E[x – E(x)] = 0. Введем понятие дисперсии. О п р е д е л е н и е 3. Дисперсией случайной величины называется математическое ожидание квадрата отклонения от ее математического ожидания:


Э.Ф. Казанцев

266

σ 2 = E[x – E(x)] 2 = [x 1 – E(x)] 2p 1 + [x 2 – E(x)] 2p 2 + ... + n

+ [xn – E(x)]2pn =

¦[ x E ( x)] i

i 1

2

pi .

(3.3.7)

Свойства дисперсии: а) дисперсия постоянной величины равна нулю: σ2(a) = 0; б) постоянный множитель можно выносить за знак дисперсии, возводя его в квадрат: σ2(kx) = k2σ2(x); в) дисперсия случайной величины равна математическому ожиданию квадрата ее без квадрата ее математического ожидания: σ2(x) = E(x2) – E2(x); г) дисперсия суммы конечного числа случайных величин равна сумме их дисперсий: σ2(x + y) = σ2 (x) + σ2(y); д) дисперсия разности случайных величин равна сумме их дисперсий: σ2(x – y) = σ2(x) + σ2(y). Действительно: x – y = x + (–1)y, тогда σ2(x – y) = σ2(x) + σ2[(–1)y] = σ2(x) + (–1)2σ2(y) = σ2(x) + + σ2(y); е) если есть несколько независимых случайных величин x1, x2,... xn, то можно вычислить дисперсию каждой из них: σ21 = E[x1 – E(x1)]2; σ22 = E[x2 – E(x2)]2 ... . В общем случае: σ2i = E[xi – E(xi)]2; ж) можно вычислить дисперсию средней величины: 2

E[ x E ( x )]

Vx

2

ª x x ... xn E ( x1 ) E ( x2 ) ... E ( xn ) º E« 1 2 » n n ¬ ¼

= 1/n2 ⋅ E{[x1 – E(x1)] + [x2 – E(x2)] + ... + [xn – E(xn)]}2 = =1 n

2

2

2

V1 V 2 V n . n

2


Математика

267

Если все дисперсии равны между собой, то V 2x V 2 / n, то есть дисперсия средней в n раз меньше дисперсии каждой случайной величины. Т е о р е м а 6. Математическое ожидание числа наступлений события A в n независимых испытаний, в каждом из которых оно может наступить с постоянной вероятностью p, равно np, а дисперсия равна npq, где q – вероятность ненаступления события A. Д о к а з а т е л ь с т в о . n – независимых испытаний – это распределение случайных величин x1, x2,..., xn, выражающих число наступлений события A соответственно в 1, 2,..., n-ом испытаниях – всего n. Рассмотрим одно из них – 1-е. У него есть два значения: 0 или 1; p = 1; q = 0. Математическое ожидание: E(x 1) = x 1p 1 + x 2p 2 = 0 ⋅ q + + 1 ⋅ p = p. Дисперсия: σ2(x)= E[x – E(x)]2 = [x1 – E(x)]2p1 + [x2 – E(x)]2p2 = = (0 – p)2q + (1 – p)2p = p2q – q2p = pq(1/(p + q)) = pq. A всего n испытаний, следовательно: E(x) = np; σ 2(x) = = npq. Непрерывные величины Введем понятие функции распределения. Закон распределения случайной величины кроме табличной формы можно задать аналитически в виде формулы или изобразить графически. О п р е д е л е н и е 4. Зависимость вероятности от текущей переменной называется функцией распределения F(x) или интегральной функцией распределения. Эта функция всегда неотрицательна F(x) ≥ 0 и она не может быть больше 1: 0 ≤ F(x) ≤ 1. В случае дискретной случайной переменной величины функция F(x) увеличивается скачками (рис. 3.3).


Э.Ф. Казанцев

268

Рис. 3.3

В случае непрерывной случайной переменной величина функции F(x) изображается плавной, монотонно возрастающей кривой. Эта функция всюду дифференцируема (рис. 3.4).

Рис. 3.4

Отношение

F ( x 'x) F ( x) характеризует плотность, с ко'x

торой распределяются случайные значения в данной точке. В пределе lim 'x 'x o 0

F ( x 'x) F ( x) 'x

F c( x)

f ( x) называется

плотностью распределения или плотностью вероятности, или дифференциальной функцией распределения. Кривая, изображающая плотность распределения случайной переменной, называется кривой распределения (рис. 3.5). Другими словами, кривой распределения непрерывной случайной величины называют график ее плотности вероятности.


269

Математика

Рис. 3.5. Кривая распределения непрерывной случайной величины

Т е о р е м а 7. Вероятность того, что непрерывная случайная величина x примет какое-нибудь значение в интервале (a, b), равна определенному интегралу от ее плотности вероятности в пределах от a до b (рис. 3.5): a

P ( a x b)

³ f ( x) dx b

Очевидно, что

F ( x).

f

³ f ( x) dx

1 – это полная вероятность.

f

Определим математическое ожидание и дисперсию непрерывной случайной величины. О п р е д е л е н и е 5. Математическим ожиданием E(x) непрерывной случайной величины x, плотностью вероятности которой является функция f (x), называется величина интеграла f

E ( x)

³ x f ( x) dx,

если он сходится абсолютно.

f

О п р е д е л е н и е 6. Дисперсией непрерывной случайной f

величины называется величина интеграла V 2 ( x)

³ ( x a)

f

2

f ( x) dx,

если он также сходится (a = E(x)). Свойства математических ожиданий и дисперсий для непрерывных случайных величин остаются те же, что и для дискретных.


Э.Ф. Казанцев

270

Рассмотрим некоторые типы распределений. а) Равномерное (прямоугольное) распределение: ­°0, ɟɫɥɢ x 0; x ! 1

плотность вероятности: f ( x) ®

°¯1, ɟɫɥɢ 0 x 1

функция распределения: F ( x)

;

­ 0, ɟɫɥɢ x 0 °° ® x, ɟɫɥɢ 0 x 1 . ° ¯° 1, ɟɫɥɢ x ! 1

Данное распределение позволяет вычислить в явном виде математическое ожидание и дисперсию. Математическое ожидание: f

x

³

x p x dx

f

1

³ x dx 0

1 . 2

Дисперсия: f

V2

2 ³ x x p x dx

f

1

2

1· § ¨ x ¸ dx 2¹ © 0

³

1 . 12

б) Экспоненциальное (показательное) распределение: плотность вероятности: p( x)

­Oe Ox , ɟɫɥɢ x ! 0 ° ; ® °¯0, ɟɫɥɢ x 0

­°0, ɟɫɥɢ x 0

функция распределения: F ( x) ®

°¯1 Oe

Ox

, ɟɫɥɢ x ! 0

.

Экспоненциальный закон распределения (и только он) обладает важным свойством того, что вероятность безотказной работы (например, прибора) в данном интервале времени не зависит от времени предшествующей работы, а зависит только от длины данного интервала времени.


271

Математика

в) Биноминальное распределение (формула Бернулли): Pmn

Cnm p m q n m

n! pm qn m . m! n m !

Данное распределение показывает, что при повторных независимых испытаниях, в каждом из которых может осуществиться некоторое событие с одной и той же вероятностью, вероятность любого числа его появлений соответствует членам разложения бинома Ньютона в степени равной числу испытаний. П р и м е р : монета подбрасывается 10 раз. Какова вероятность того, что герб выпадет 3 раза? 3 0 ,5 3 0,5 7 Р е ш е н и е : p = q = 1/2, P103 C10

15 . 128

При n → ∞, p → 0 биномиальное распределение превращается в распределение Пуассона (предельный случай формулы Бернулли): W ( m)

(np ) m np e . m!

П р и м е р : В коллективе численностью 500 человек m лиц родились 6 января. Построить распределение этих лиц от 1 до 6. Р е ш е н и е : n = 500; p = 1/365; np = 1,37. m

W(m)

pm, 500

0

0,2541

0,2537

1

0,3484

0,3484

2

0,2385

0,2388

3

0,0372

0,1089

4

0,0103

0,0372

5

0,0102

0,0101

6

0,0023

0,0023


Э.Ф. Казанцев

272

Рис. 3.6

Нетрудно видеть, что в данном случае (n → ∞, p → 0) оба распределения практически совпадают. г) В классической физике распределение молекул по скоростям описывается формулой Максвелла (см. рис. 3.7). Плотность распределения: f M (Q)

2/ S

Q 2 Q 2 / 2Į 2 e , Į3

где α – параметр распределения, больший нуля:

Рис. 3.7. Распределение Максвеллла

В квантовой физике частицы с полуцелым спином подчиняются распределению Ферми-Дирака: fɎ

1 e

E / kT

1

,

а частицы с целым спином – распределению Бозе – Эйнштейна: fȻ

1 e

E / kT

1

.


273

Математика

Эти распределения при условии Е >> кТ переходят классическое распределение Больцмана: n = n0e–E/kT. д) Особое значение имеет так называемое, нормальное распределение случайной величины (распределение Гаусса): – плотность нормального распределения (см. рис. 3.8): f n ( x)

1

e ( x a )

b 2S

2

/ 2b 2

;

(3.3.8)

Рис. 3.8

– интегральная функция нормального распределения (см. рис. 3.9): F ( x)

1 b 2S

f

³

e

2

( x a ) / 2b

2

dx .

(3.3.9)

f

Рис. 3.9


Э.Ф. Казанцев

274

Свойства нормального распределения Т е о р е м а 8. Параметры a и b в выражениях плотности вероятности и функции распределения случайной величины, распределенной по нормальному закону являются ее математическим ожиданием и дисперсией. Доказательство. f

³ x f ( x) dx,

а) Математическое ожидание: E ( x) где f ( x)

1

b 2S

e

( x a ) 2 / 2b 2

f

.

Таким образом: E ( x)

f

1

b 2S

³ x e

( x a ) 2 / 2b 2

dx.

f

Делаем замену переменной: t = (x – a) / b; x = tb + a; dx = = bdt (пределы интегрирования не изменяются): E ( x)

f

b b

2S ³

(a bt ) e t

2

/2

³t e

f

t 2 / 2

2S ³

f

f

dt

e t

2

/2

dt

f

Здесь первое слагаемое: Пуассона. Второе слагаемое: f

f

a

dt

³e

f

³e

t 2 / 2

f

b 2S

³

t e t

2

/2

dt .

f

2S – интеграл Эйлера –

dt

f

f t 2 / 2

2

d ( t / 2 ) e

t 2 / 2

Таким образом: E ( x) б) Дисперсия: V 2 ( x)

0. f

f

a 2S

a.

2S

1 b 2S

f

³ ( x a) e

2 ( x a ) 2 / 2b 2

dx.

f

Сделаем замену переменных: t = (x –a)/b; x –a = bt; dx = bdt (пределы интегрирования не изменяются):


275

Математика

V 2 ( x)

f

b2 2S

³t e

2 t 2 / 2

2b 2

f

t e 2S ³

dt

2 t 2 / 2

dt

0

f

(так как под интегралом – четная функция). f

³t e

2 t 2 / 2

dt

0

2S – интеграл Эйлера – Пуассона. 2 2b 2

Таким образом: V 2 ( x)

2S

доказать.

2S 2

b 2 . Что и требовалось

Т е о р е м а 9. Случайные величины, распределенные по нормальному закону, различаются только значениями математического ожидания и дисперсии. Доказательство. а) Пусть у двух распределений дисперсия σ2 – одинакова, но разные математические ожидания: E = 0; f1 ( x) E ≠ 0; f 2 ( x)

1 V 2S 1 V 2S

e x

2

e ( x

/ 2V 2

2

;

E ) / 2V 2

.

Если ввести новую переменную x1 = (x – E), тогда f 2 ( x)

1 V 2S

2

e x1

/ 2V 2

,

то есть кривые для f1(x) и f2(x) совпадут. Следовательно, E – это параллельный перенос (рис. 3.10). б) Пусть у трех распределений одинаковые математические ожидания E (E = 0), но дисперсии разные: σ1 = 1/2; σ2 = 1; σ3 = 2 (см. рис. 3.11). Нетрудно видеть, что дисперсия служит мерой рассеяния случайной величины.


276

Э.Ф. Казанцев

f (x)

Рис. 3.10

f (x) f1(x) f2(x)

f3(x)

Рис. 3.11

е) В математической статистике часто используют законы распределения случайных величин, являющихся функциями независимых нормальных случайных величин. Впервые астроном Ф. Хельмерт (1876) исследовал суммы квадратов нормально распределенных случайных величин и получил распределение, которое позже (1900) К. Пирсон назвал функцией распределения «хи квадрат» (χ2):


Математика

1

FF 2 ( k )

k 22

§k· Ƚ¨ ¸ ©2¹

x k t 1 t 2 e 2

³

dt .

0

277

(3.3.10)

Соответствующая плотность вероятности: 1

fF 2 ( x )

k

§k· 22 Ƚ¨ ¸ ©2¹

k x 1 2 2 x e ,

(3.3.11)

где Г(m) – гамма-функция Эйлера: f

Ƚ( m )

³x

m 1

e x dx;

(3.3.12)

0

k называется числом степеней свободы независимых нормальных случайных величин x1, x2,…xk. Распределение χ2 ищется для случайных величин: xk2

x12 x22 ... xk2 .

Оно табулировано (представлено в виде таблиц). Среднее: Eχ2 = k, дисперсия: σ2 = 2k. ж) Английский статистик В. Госсет (писавший под псевдонимом «Стьюдент») получил в 1908 г. для случайных нормально распределенных величин, так называемое, « t-распределение»: Ft

x0 1 k

k

¦

xi2

.

(3.3.13)

i 1

Соответствующая плотность вероятности: ft

§ k 1· k 1 Ƚ¨ ¸ 2 · 2 § x 2 ¹¨ ¸ © 1 . k ¸¹ § k · ¨© S k Ƚ¨ ¸ ©2¹ 1

(3.3.14)


Э.Ф. Казанцев

278

з) Анализируя поведение отношения выборочных дисперсий двух выборок извлеченных из одной и той же нормальной генеральной совокупности, английский статистик Р. Фишер (1924) нашел так называемое «F-распределение». Плотность распределения: k1

k2

k1 § k k2 · 2 1 Ƚ¨ 1 ¸ k1 k 22 x2 © 2 ¹ . k1 k 2 § k1 · § k 2 · Ƚ¨ ¸ Ƚ¨ ¸ k1 x k 2 2 ©2¹ © 2 ¹

fF

(3.3.15)

Метод моментов Основные параметры кривых распределения можно характеризовать с помощью так называемых моментов. а) Пусть имеется случайная величина Х. Моментом k-го порядка M k(a) по отношению к значению а называется математическое ожидание k-ой степени отклонения X от a: Mk(a) = M(X – a)k. Если a = 0, момент называется начальным (ν k), при a = M(x) его называют центральным (µk). Таким образом: νk = Mk(0) = M(xk); µk = Mk(M(x)) = M(X – M(x))k. Центральные моменты случайной величины X можно выразить через начальные моменты этой величины: § k n n k n k· M¨ (Ck ( 1) X M ( x)) ¸ ¨ ¸ ©n 0 ¹

¦

M X M ( x) k

Pk k

¦

n

n n

( 1) Ck Q1 M ( x

k n

n 0

)

k

¦ ( 1) C Q Q n

n n k 1 k n .

n 0

Отсюда:

2

2

P2

Q 2 2Q1Q1 Q1

Q 2 Q1 ,

P3

Q 3 3Q1Q 2 3Q1 Q1 Q1

P4

Q 4 4Q1Q 3 6Q1 Q 2 3Q1 .

2

2

3

2

Q 3 3Q 2 Q1 2Q1 , 4


Математика

279

б) Начальный момент k-го порядка: f

Qk

³x

k

f ( x) dx.

f

Центральный момент k-го порядка: f

Pk

³ ( x a)

k

E ( x a) k .

f ( x) dx

f

Моменты нулевого порядка, k = 0: f

Q0

³x

f

0

³ f ( x) dx

f ( x) dx

f f

P0

³

f

1,

f

³ f ( x) dx

( x a )0 f ( x ) dx

f

1.

f

Моменты 1-го порядка, k = 1: f

Q1

³ x f ( x) dx

E ( x) – математическое ожидание;

f f

P1

³ ( x a) f ( x) dx

0 – следствие 5-го свойства матема-

f

тического ожидания. Центральный момент 2-го порядка: f

P2

³ ( x a)

2

f ( x) dx E ( x a) 2

V 2 – дисперсия.

f

в) Вычислим центральные моменты случайной величины, распределенной по нормальному закону: Pk

f

1

V 2S

³ ( x a) e

2

k ( x a ) / 2V

2

dx ,

f

сделаем замену переменной t = (x – a)/σ; x – a = σt; (пределы интегрирования не изменяются) dx = σ dt, Pk

Vk 2S

f

³t e

f

k t 2 / 2

dt .


Э.Ф. Казанцев

280

Пусть k – нечетные: k = 2l + 1; докажем, что при этом все интегралы равны нулю: P 2l 1

V 2l 1 2S

f

³

t 2l 1e t

2

/2

f

dt

0 f · 2 V 2l 1 §¨ 2l 1 t 2 / 2 dt t 2l 1e t / 2 dt ¸. t e ¸ 2S ¨© f 0 ¹

³

³

Делаем замену переменной: z = t2: P 2l 1

V

f § 1 0 l z / 2 1 l z / 2 ·¸ ¨ ze dz ze dz ¸ 2 2S ¨© 2 f 0 ¹

2l 1

³

³

0,

так как перестановка пределов дает перед интегралом знак «–». Пусть k – четные; k = 2 ⋅ l P 2l

V 2l 2S

f

³

t 2l e t f

2

/2

dt

2V 2 l 2S

f

³

t 2l e t

2

/2

dt ,

0

так как подынтегральная функция четная, используя формулу Эйлера – Пуассона, получим: µ2l = (2l – 1)!! ⋅ σ2l; (2l – 1)!! = 1⋅3⋅5⋅ ... ⋅(2l – 1). В частности: µ4 = 1 ⋅ 3 ⋅ σ4 = 3σ4. г) Центральный момент µ3 характеризует отклонение распределения случайной величины x от симметричного. За меру этого отклонения берут отношение µ3 к среднему квадратичному в кубе (σ3), которое называется коэффициентом асимметрии: α = µ3/σ3. Четвертый центральный момент служит для характеристики крутости распределения случайной величины x по сравнению с крутостью распределения нормальной случайной величины с математическим ожиданием и дисперсией такими же, как и у x. За меру крутости берут относительную величину, которая называется эксцессом и определяется по формуле: F

P4 3. V4

Нетрудно видеть, что для нормального распределения (µ4 = 3σ4) эксцесс равен нулю (χ = 0), и коэффициент асиммет­ рии α = 0 (µ3 = 0).


Математика

281

3.3.3. Закон больших чисел Опыт, накопленный человечеством за многовековую историю, дает основание принять в качестве руководящего в любой деятельности следующий принцип практической уверенности: если при выполнении определенных условий вероятность события очень мала, то при однократном осуществлении их можно быть уверенным в том, что это событие не произойдет, и в практической деятельности поступать так, как будто оно является невозможным. О п р е д е л е н и е 7. Вероятность, которой решено пренебрегать в данном исследовании называется уровнем значимости. Под законом больших чисел понимается совокупность предложений, в которых утверждается, что с вероятностью, как угодно близкой к единице, отклонение средней арифметической достаточно большого числа случайных величин от постоянной величины – средней арифметической их математических ожиданий не превзойдет заданного как угодно малого числа. Давно было замечено, что средняя арифметическая числовых характеристик некоторых признаков (частоты события, результатов измерений и т.д.) в большом числе таких однородных случайных явлений подвержена очень незначительным колебаниям. В средней как бы проявляется закономерность, присущая существу явлений, взаимно погашается влияние отдельных факторов, которые делали случайными результаты единичных наблюдений. Теоретическое объяснение такого поведения средней и является содержанием закона больших чисел. Общая современная постановка задачи, формулировка закона больших чисел, развитие методов исследования и доказательства теорем, относящихся к этому закону, принадлежит русским ученым П.Л. Чебышеву, А.А. Маркову и А.М. Ляпунову. Приведем основные результаты, полученные этими учеными, не останавливаясь на доказательстве теорем.


Э.Ф. Казанцев

282

Л е м м а Ч е б ы ш е в а . Если среди значений случайной величины х нет отрицательных, то вероятность того, что она примет какое-нибудь значение, превосходящее положительное число А, будет не больше дроби, числитель которой есть ее математическое ожидание, а знаменатель – число А: P x ! A d

E ( x) . A

Случайные величины могут иметь различные распределения при одинаковых математических ожиданиях. Однако лемма Чебышева для них даст одинаковую оценку вероятности того или иного результата испытания. Этот недостаток леммы связан с ее общностью: добиться лучшей оценки сразу для всех случайных величин невозможно. Н е р а в е н с т в о Ч е б ы ш е в а . Вероятность того, что отклонение случайной величины от ее математического ожидания превзойдет по абсолютной величине положительное число ε, не больше дроби, числитель которой есть ее дисперсия, а знаменатель – ε²: P x E ! H d

V H

2

2

.

Неравенство Чебышева дает нетривиальную оценку вероятности события лишь в случае, если дисперсия случайной величины достаточно мала: меньше ε². Обобщением неравенства Чебышева является теорема Чебышева, выражающая закон больших чисел: Т е о р е м а Ч е б ы ш е в а . Если дисперсии независимых случайных величин x1, x2,…, xn ограничены одной и той же постоянной величиной, и число их достаточно велико, то как угодно близка к единице вероятность того, что отклонение средней арифметической этих случайных величин от средней арифметической их математических ожиданий не превзойдет по абсолютной величине положительного числа ε, как бы мало оно не было:


Математика

283

§ x x2 ... xn E1 E2 ... En · d H ¸¸ ! 1 G. P¨¨ 1 n n © ¹

Ни одно из рассмотренных здесь утверждений не дает точного, ни даже приближенного значения искомой вероятности, а указывается лишь нижняя или верхняя граница ее. Приближенное значение вероятностей при больших значениях n можно получить только с помощью предельных теорем. С помощью таких теорем можно доказать, что сумма любого конечного числа независимых нормально распределенных случайных величин также распределена по нормальному закону: Т е о р е м а Л я п у н о в а . Если независимые случайные величины x1, x2,…, xn имеют конечные математические ожидания и конечные дисперсии, и число их достаточно велико, а предел lim

nof

P 3 (1) P 3 (2) ... P 3 (n)

V12

V 22

3 ... V n2 2

0,

где µ3(1), µ3(2),…, µ3(n) – центральные моменты третьего порядка случайных величин, то сумма их с достаточной степенью точности распределена по нормальному закону с параметрами E = E1 + E2 +…+ En; V2

V12 V 22 ... V 2n .

Таким образом, случайная величина, являющаяся суммой достаточно большого числа независимых слагаемых, согласно теореме Ляпунова распределена по нормальному закону, если действие каждого слагаемого невелико по сравнению с суммарным действием их всех. Данный вывод известен как центральная предельная теорема. Впервые эту теорему доказал Марков (1898), затем – в более общей форме – Ляпунов (1900). Многие случайные явления, встречающиеся в природе и в общественной жизни, протекают именно по такой схеме. В связи с этим теорема Ляпунова имеет исключительно большое значе-


Э.Ф. Казанцев

284

ние, а нормальный закон распределения – один из основных в теории вероятностей. Для обоснования выборочного метода, рассматриваемого в следующем разделе, нам понадобится еще одно заключение, которое можно получить, как следствие теоремы Ляпунова: если случайная величина является суммой достаточно большого числа одинаково распределенных независимых случайных величин, имеющих центральные моменты третьего порядка, то она распределена по нормальному закону. Задания для самостоятельной работы 1. Подбрасывают игральную кость. Какова вероятность того, что на верхней грани выпадет четное число очков? 2. Подбрасывают 2 игральные кости. Какова вероятность выпадения суммы 4 очков? 3. Среди 50 деталей три нестандартные. Найти вероятность того, что из взятых наудачу двух деталей обе окажутся нестандартными? 4. Вероятность продать обувь 40 размера равна 0,12; 43 размера – 0,04; 46 размера – 0,01. Найти вероятность продажи обуви не менее 40 размера. 5. Производится 4 выстрела по цели с вероятностью попадания 0,2 при каждом выстреле. Попадания считаются независимыми. Какова вероятность попадания в цель 3 раза? 6. Имеется 6 ящиков с одинаковыми по внешнему виду деталями, но с разным качеством деталей 1-го сорта: Номер ящика

1 2 3 4 5 6

Количество деталей Всего

1-го сорта

10 10 10 10 10 10

8 8 8 6 6 5


Математика

285

Определить полную вероятность того, что при взятии одной детали она окажется 1-го сорта. 7. Найти математическое ожидание и дисперсию случайной величины х в интервале (0, π), с плотностью распределения: 1 f ( x) sin x. 2 8. Найти математическое ожидание и дисперсию случайной величины х, распределенной по показательному закону: P(x) = λe–λx; x ≥ 0. 9. Найти математическое ожидание и дисперсию случайной величины х, распределенной по закону: f (x) = 1 – e–xa.

3.4. Математическая статистика 3.4.1. Выборочный метод 1) В огромном числе случаев предприятие не может контролировать качество своей продукции без полного ее уничтожения. В качестве примера рассмотрим завод производящий электрические лампочки. Лампочка считается стандартной, если способна гореть не менее 1200 часов. Если проконтролировать каждую лампочку, то все лампочки будут выведены из строя и не дойдут до потребителя. Как же судить о качестве лампочек? Практика показывает, что о качестве всех электрических лампочек можно судить по качеству небольшой их части, отобранной случайно. Аналогично обстоит дело и с консервами, тканями, строительными материалами, машинами и т.д. Метод анализа небольших партий называется выборочным методом. О п р е д е л е н и е 1. Вся подлежащая изучению совокупность объектов называется генеральной совокупностью. Та часть объектов, которая попала на проверку, называется выборочной


Э.Ф. Казанцев

286

совокупностью, или просто выборкой. Число элементов в генеральной совокупности и в выборке будем называть их объемами. 2) Характеристики генеральной и выборочной совокупностей Пусть дана генеральная совокупность xK с соответствующими частотами NK:

¦N K

K

N

N1 N 2 N K – объем генеральной совокуп-

ности. Определение 2 k

¦x N i

Генеральная средняя: x0

i 1

N

i

.

(3.4.1)

k

Генеральная дисперсия: V02

¦ x x N i

i 1

0

2

N

i

.

(3.4.2)

Пусть генеральная совокупность разбита на группы и объем отдельной группы равен n (n < N): О п р е д е л е н и е 3. n

¦ x n

i i

Выборочная (групповая) средняя: x

i 1

n

.

n

Выборочная (групповая) дисперсия: V 2

(3.4.3)

¦ x x n 2

i

i 1

n

i

. (3.4.4)

3) Ошибки выборочного наблюдения Для того чтобы по данным выборки можно было достаточно уверенно судить об интересующем нас признаке генеральной совокупности необходимо, чтобы выборка была репрезентативна.


287

Математика

О п р е д е л е н и е 4. Ошибками репрезентативности называются расхождения между сводными характеристиками признака в выборочной и генеральной совокупностях, возникающие только в результате того, что исследуется не вся совокупность, а лишь ее часть. П р и м е р . Пусть из партии в 10 000 электрических лампочек образована выборочная совокупность из 200 лампочек. Качество лампочек в генеральной и выборочной совокупностях характеризуется следующими данными. Генеральная совокупность Срок службы, час

Количество лампочек

Выборочная совокупность Срок службы, час

Количество лампочек

900–1100

1000

900–1100

10

1100–1300

6000

1100–1300

120

1300–1500

3000

1300–1500

70

Вычислить генеральные и выборочные средние и дисперсии. Решение. Генеральная средняя: x0

1000 1000 1200 6000 1400 3000 1240 ɱɚɫ. 10000

Генеральная дисперсия: V

2

2

2

14400.

Выборочная средняя: x

2

(1000 1240) 1000 (1200 1240) 6000 (1400 1240) 3000 10000

1000 10 1200 120 1400 70 1260 ɱɚɫ. 200


Э.Ф. Казанцев

288

Выборочная дисперсия: V

2

2

2

2

(1000 1260) 10 (1200 1260) 120 (1400 1260) 70 200

12400.

Нетрудно видеть, что генеральные и групповые характеристики различаются. Систематическая ошибка репрезентативности возникает при неправильном образовании выборочной совокупности. Разность между выборочной и генеральной средней и есть ошибка репрезентативности. Математическая теория выборочного метода состоит в определении средней величины случайных ошибок репрезентативности и возможных границ их при различных способах образований выборочной совокупности. Существуют следующие виды выборок: а) типический отбор – генеральную совокупность предварительно разбивают на непересекающиеся группы определенного типа. Затем из каждой группы отбирают неодинаковое число элементов – они и образуют выборочную совокупность. б) механический отбор – генеральную совокупность механически делят на несколько групп через определенные интервалы не различая типа. в) серийный отбор – объекты отбираются не по одному, а сериями. Если отобранный объект возвращается в генеральную совокупность, то выборку называют повторной. Если отобранный объект не возвращается в генеральную выборку, то выборку называют бесповторной. Практика показывает, если объем выборки большой (не менее 30–40), то выборочная и генеральная дисперсии практически совпадают и вместо неизвестной генеральной дисперсии можно использовать выборочную дисперсию.


Математика

289

Если же объем выборки небольшой (меньше 30–40), то вместо генеральной дисперсии можно пользоваться исправленной формулой: n

V12

¦ x x

2

i

i 1

n 1

.

(3.4.5)

О п р е д е л е н и е 5. Вероятность, с которой гарантируются результаты выборки, называется доверительной вероятностью β. О п р е д е л е н и е 6. Наибольшее отклонение выборочной средней от генеральной, которое может иметь место с заданной доверительной вероятностью невыхода за эти границы, называется предельной ошибкой выборки ∆. О п р е д е л е н и е 7. Вероятность того, что отклонение случайной величины х, распределенной по нормальному закону, от ее математического ожидания Е не превзойдет по абсолютной величине ∆, равна: P( x E d ')

§'· Ɏ¨ ¸, ©V¹

(3.4.6)

где через σ обозначена средняя квадратическая ошибка выборки, а функция Ф(х) называется интегралом вероятности: x

Ɏ( ɯ)

t2

2 e 2 dt . 2S

³

(3.4.7)

0

Данная функция нечетна и при x → ∞ очень быстро приближается к своему пределу, который равен 1. Поэтому уже при х = 5 она практически не отличается от 1: Ф(5) = 0,99999994. Интеграл вероятности табулирован, и любые его значения можно найти в таблицах. О п р е д е л е н и е 8. Предельная ошибка выборки равна t-кратной величине средней квадратической ошибки, причем t есть то значение аргумента, при котором функция Ф(х) равна заданной доверительной вероятности β:


Э.Ф. Казанцев

290

§'· Ɏ¨ ¸ E. ©V¹

(3.4.8)

По таблице значений функции Ф(х) найдем значение аргумента t, при котором она равна β. Тогда последнее равенство приводит нас к соотношению: ' V

t , откуда ' t V .

(3.4.9)

Таким образом, предельная ошибка выборки вычисляется по следующим формулам: а) для повторной выборки ' t

V2 . n

(3.4.10)

б) для бесповторной выборки '

§ V2 § n ·· t ¨¨ ¨1 ¸ ¸¸ . N ¹¹ © n ©

(3.4.11)

П р и м е р . Требуется определить урожайность на большом массиве. Выборочное обследование урожайности дало следующие результаты. Обследованная территория, га

Урожайность, ц/га

100

11–13

250

13–15

450

15–17

200

17–19

1000

Р е ш е н и е . Примем доверительную вероятность β = 0,9973. Из таблицы для интеграла вероятности находим: Ф(t) = 0,9973, t = 3. Вычисляем дисперсию: σ2 = 3,15, n = 1000, N = 10 000.


Математика

'

291

§ 3,15 § 1000 · · 3 ¨¨ ¨1 ¸ ¸¸ | 0 ,16. 1000 10000 © ¹¹ ©

Таким образом, ошибка определения урожайности по выборочному обследованию составляет не более 16%. Из формулы (3.3.5) можно определить объем репрезентативной выборки: n

2

2

t V0 2

'

,

(3.4.12)

где генеральная дисперсия заменена на выборочную. Для того же примера: n

9 3,15 0,16 2

| 1000.

3.4.2. Законы распределения В разделе 3.1 мы узнали, какую информацию можно извлечь при первичном анализе вариационных рядов, – это среднее значение признака и дисперсия, как мера его рассеяния. Однако задачей всякого научно поставленного эксперимента или наблюдения является предвидение хода развития того или иного явления или процесса. Данную задачу позволяют решать сведения, полученные с помощью теории вероятностей. Итак, если есть вариационный ряд, то, во-первых, мы должны найти вид распределения интересующего нас признака в генеральной совокупности, а, во-вторых, проверить правильность нашего выбора, то есть проверить согласованность имеющегося эмпирического материала с предполагаемым теоретическим распределением признака в генеральной совокупности (поиск критериев согласия). Чтобы найти закон распределения случайного признака, необходимо:


Э.Ф. Казанцев

292

а) вычислить среднюю арифметическую и дисперсию вариационного ряда, б) найденную среднюю арифметическую принять за математическое ожидание, а дисперсию вариационного ряда – за дисперсию искомой случайной величины, в) составить выражения плотности вероятности и функции распределения с параметрами, установленными в соответствии с указаниями в предыдущем пункте. П р и м е р . Рассмотрим данные таблицы 3.1 о распределении по росту взрослых рабочих. Требуется найти закон распределения данной случайной величины (роста). Р е ш е н и е . По теореме Ляпунова мы вправе предположить, что искомая величина распределена по нормальному закону. Основные параметры вариационного ряда 3.1 были вычислены ранее: x 165,53 ɫɦ, V 2

36,5751, V

6,048.

Принимая эти величины соответственно за математическое ожидание, дисперсию и среднее квадратическое отклонение искомой случайной величины, мы получим выражения плотности вероятности и функции распределения искомой случайной величины: f ɧ ( x) Fɧ ( x)

1 6 ,048 2S 0,5

e

x 165 ,53 2 2 36 ,5751

;

1 § x 165,53 · Ɏ¨ ¸. 2 © 6,048 ¹

Критерий согласия В рассмотренном выше примере из 1000 мужчин 173 должны иметь рост от 161 до 164 см, между тем как в действительности их оказалось 181. Объяснения этих расхождений могут быть такие: а) несовпадение между опытными и теоретическими данными объясняются случайностью отбора отдельных элементов или результатов единичных наблюдений, а выбранный закон


Математика

293

нормального распределения случайной величины соответствует опытным данным; б) различия между теоретическими данными и наблюденными объяснить случайностью нельзя, значит опытное и теоретическое распределения противоречат друг другу. Сделать правильный выбор между первым и вторым выводом, один из которых исключает другой, нам поможет критерий согласия. Критерий согласия и является тем правилом, которое дает возможность, опираясь на установленный закон распределения, установить, когда полученное в действительности указанное отклонение следует признать несущественным, случайным, а когда существенным, неслучайным. Предположим, что известен закон распределения случайной величины Х, которая характеризует функцию расхождений между теоретическим и опытным распределениями. С другой стороны, имея опытное распределение признака и вычисленную на основе его эмпирическую функцию распределения, мы можем найти значение α, которое в рассматриваемом случае приняла случайная величина X. Закон распределения случайной величины Х определяет вероятность того, что она примет какое-нибудь значение, не меньше α. Пусть эта вероятность равна β: P(X ≥ α) = β. Если вероятность β очень мала, то это будет означать, что наступило маловероятное событие. Но согласно принципу практической уверенности при однократном наблюдении маловероятное событие не должно было наступить, то есть расхождение между предполагаемым теоретическим и опытным распределениями не случайно и теоретический закон следует отвергнуть. Этот вывод базируется на том, что если бы в действительности изучаемый признак был распределен по предположительному закону, то такого значения случайная величина Х не должна была принять.


Э.Ф. Казанцев

294

Если же вероятность β велика (≈ 1), то расхождение между эмпирическим и теоретическим распределениями следует признать несущественным, случайным, а потому должны считать, что опытное и теоретическое распределения согласуются друг с другом. Обычно вероятности, не превосходящие 0,01, считают уже «достаточно малыми» и принимают за границу маловероятных событий. Существует много критериев согласия. Рассмотрим наиболее распространенный критерий χ-квадрат (Пирсона). Критерий согласия χ-квадрат. Пусть в результате наблюдений получен вариационный ряд с опытными частотами, сумма которых дает объем совокупности: n = n1 + n2 +…+ nm. Пусть мы выбрали некоторый теоретический закон распределения для рассматриваемого признака и сумма теоретических частот также равна объему совокупности: n

n10 n20 ... nm0 .

В качестве меры расхождения теоретического и эмпирического рядов частот выберем величину: F2

m

¦ i 1

(ni ni0 ) 2 ni0

.

(3.4.13)

Из этого выражения видно, что χ2 равна нулю лишь в том случае, когда все соответствующие эмпирические и теоретические частоты совпадают. В остальных случаях χ2 отлично от нуля и тем больше, чем больше расхождение между указанными частотами. Величина χ2 имеет χ2-распределение. Число степеней свободы данного распределения равно: k = m – s, (3.4.14) где m – число групп эмпирического распределения, а s – число параметров теоретического закона, найденных с помощью эмпи-


Математика

295

рического распределения, вместе с числом дополнительных соотношений, которым подчинены эмпирические частоты. Крите­ рий χ2 требует, чтобы наблюденные частоты были не малы. Общая схема применения критерия χ2 выглядит так: а) на основе опытных данных выбрать в качестве предполагаемого закон распределения изучаемого признака и найти его параметры; б) определить теоретические частоты на основе полученного закона распределения. Если среди опытных частот имеются малочисленные, их необходимо объединить с соседними; в) вычислить по формуле (3.4.13) величину χ2. Пусть она 2 оказалась равной F 0 ; г) определить число степеней свободы по формуле (3.4.14); д) по таблице для χ2-распределения по полученным значениям χ2 и k найти вероятность того, что случайная величина, имеющая χ2-распределение, примет какое-нибудь значение, не 2

меньше F 0.; Пусть она равна β:

2

2

P F t F0

E;

е) сформулировать вывод, руководствуясь общим принципом применения критерия согласия, а именно: если вероятность β окажется больше 0,01, то следует считать несущественными имеющиеся расхождения между теоретическими и опытными частотами, а опытное распределение – согласующимся с теоретическим. В противном случае (β << 1) указанные расхождения признаются неслучайными, а закон распределения, избранный в качестве предполагаемого теоретического, отвергается. П р и м е р . Проверить, согласуются ли данные таблицы 4.1, с предположением о том, что рост мужчин является случайной величиной, распределенной по нормальному закону. Р е ш е н и е . Все основные данные были получены ранее. Число групп частот m = 11, s = 3. Значит, k = 11 – 3 = 8.


Э.Ф. Казанцев

296

При F 02 1,3427 и k = 8 находим по таблице вероятность того, что случайная величина, имеющая χ2-распределение, примет значение не меньшее 1,3427:

2

2

P F t F0

0,99.

Полученная вероятность значительно больше 0,01, следовательно, имеющиеся расхождения между теоретическими и опытными частотами случайны, а предположение о том, что рост мужчин следует нормальному закону, хорошо согласуется с наблюдениями. Дисперсионный анализ Пусть генеральная совокупность разбита на K групп. Среднюю арифметическую из выборочных (групповых) дисперсией будем называть внутригрупповой дисперсией (остаточной): 2 V ɜɧ .ɝɪ .

¦V K

2 K

NK .

N

Средняя каждой группы может варьировать вокруг общей генеральной средней. В этой связи можно ввести межгрупповую дисперсию. V 2ɦɟɠ .ɝɪ .

¦(X K

K

X 0 )NK N

.

Так как разбиение на группы обусловлено действием какого-то фактора, то межгрупповая дисперсия как бы отражает действие этого фактора. По теореме сложения дисперсий: V 02

2 2 V ɜɧ .ɝɪ . V ɦɟɠ .ɝɪ . .


297

Математика

Разделим полученные дисперсии на соответствующие им степени свободы К: 2 V ɜɧ .ɝɪ .

V 02 2 ; S ɜɧ .ɝɪ . K0

S 02

K ɜɧ .ɝɪ .

; S ɦ2 .ɝɪ .

2

S ɦɟɠ .ɝɪ .

Отношение Fɮ

2

S ɜɧ .ɝɪ .

V 2ɦɟɠ .ɝɪ . K ɦɟɠ .ɝɪ

.

служит критерием оценки влия-

ния на признак регулируемых факторов (критерий Фишера). Нулевая гипотеза предполагает, что обе дисперсии равны друг другу, то есть нет никакого действия внешнего фактора. Если дисперсии отличаются друг от друга, тогда сравнивают получаемое отношение с табличным значением Fst для принятого уровня значимости и для известных чисел степеней свободы. Если FФ ≥ Fst для принятого уровня значимости, то нулевая гипотеза отвергается. П р и м е р . Урожай кукурузы в трех повторностях при четырех уровнях фактора А: Градация фактора А (удобрений)

Урожай по повторности

А1

Xn n

А2

А3

А4

21,2

23,6

24,0

29,2

4

28,0

22,6

30,0

28,0

4

31,2

28,0

29,2

27,0

4

03,0

03,0

03,0

03,0

N = 12

2

2

2

Дисперсия V0 112 ,55; V A 20,23; Vɜɧ .ɝɪ . 92,32 . K0 = N – 1 = 12 – 1 = 11; KA = a – 1 = 4 – 1 = 3; Kвн.гр. = N – a = 12 – 4 = 8. 2

2 SA

VA KA

11,54 6 ,74

а

20 ,23 3

1,71.

6,743;

2 S ɜɧ .ɝɪ .

2

V ɜɧ .ɝɪ . K ɜɧ .ɝɪ .

92 ,32 8

11,54 .


Э.Ф. Казанцев

298

Табличное значение F st = 8,8 при K вн.гр. = 8 и KA = 3 для 5% уровня значимости, то есть FФ < Fst, таким образом нулевая гипотеза остается: фактор не влияет на урожай. 3.4.3. Корреляционный анализ Математика изучает функциональные связи, например, между радиусом круга R и его площадью S: S = πR2. Функциональная связь имеет место по отношению к каждому отдельному наблюдению. В то же время существуют связи, которые проявляются только в среднем для большой совокупности наблюдений. Еще Гиппократ заметил, что между телосложением и темпераментом людей существует определенная связь. Можно привести несколько примеров из сельского хозяйства: связь между телосложением животного и его продуктивностью; связь между размером семян и их урожайностью и так далее. Такие связи называются статистическими или корреляционными (correlatio – связь). Корреляционная связь между признаками может быть линейной и нелинейной (криволинейной). Ограничимся рассмотрением двух признаков x и y. В статистике обычно имеют дело с варьирующими признаками. О п р е д е л е н и е 9. Степень сопряженности между двумя варьирующими признаками x и y характеризуется показателем, который называют ковариацией (cov): cov

1 n

¦ ( x x )( y y ) . i

i

Недостатком ковариации является то, что она не учитывает случаи, когда признаки x и y выражаются в разных единицах. Этот недостаток легко устранить, если взять отношение между откло-


299

Математика

нением ( xi x ) и среднеквадратическим отклонением σx. В результате мы приходим к понятию коэффициента корреляции. Корреляционные связи между признаками могут быть линейными и нелинейными. Линейные корреляционные связи Пусть получено следующее распределение 100 га пахотной земли по количеству внесенных удобрений х и урожайности у: Таблица 3.3 Урожайность, ц/га Удобрения, ц/га

9– 11

11– 13

13– 15

15– 17

17– 19

19– 21

Итого, га

0–20

9

4

1

14

20–40

1

10

9

3

23

40–60

2

6

14

6

28

60–80

1

10

18

6

35

10

16

17

27

24

6

100

И т о г о (га):

Например, число 4 в этой таблице показывает, что если на каждый гектар было внесено от 0 до 20 ц удобрений, то на 4 га урожайность оказалась от 11 до 13 ц/га. Переходя к дискретному распределению, получим корреляционную таблицу: Таблица 3.4 Урожайность, ц/га

10

12

14

16

18

20

Итого, га

10

9

4

1

14

30

1

10

9

3

23

50

2

6

14

6

28

70

1

10

18

6

35

10

16

17

27

24

6

100

Удобрения, ц/га

И т о г о (га):


Э.Ф. Казанцев

300

Совокупность значений х разбивается на четыре группы: I – 14 га, II – 23 га, III – 28 га, IV – 35 га. На каждую группу внесено одно и то же количество удоб­ рений. Средняя урожайность в каждой группе: y1 y2 y3 y4

10 9 12 4 14 1 | 10,86 ɰ/ɝɚ; 14 10 1 12 10 14 9 16 3 | 13,22 ɰ/ɝɚ; 23 12 2 14 6 16 14 18 6 | 15,71 ɰ/ɝɚ; 28 14 1 16 10 18 18 20 6 | 17,66 ɰ/ɝɚ. 35

Таким образом, увеличение количества удобрений ведет к увеличению урожайности. Таблица 3.5

Количество удобрений х

Средняя урожайность yi

Изменение yi по сравнению с предшествующим периодом

10

10,86

30

13,22

+2,36

50

15,71

+2,49

70

17,66

+1,95

График зависимости урожайности (y) от количества внесенных удобрений (x) на рис. 3.12 соответствует прямой АВ. Нетрудно видеть, что зависимость урожайности от количества удобрений близка к линейной: y = ax + b (3.4.15) Поменяем местами х и у. Совокупность данных разобьем на группы с одной и той же урожайностью. Таких групп шесть: I – 10 ц /га, II – 12 ц/га, III – 14 ц/га, IV – 16 ц/га, V – 18 ц/га, VI – 20 ц/га.


301

Математика

Y

D

20

B

16 12

A

8

C

4 10

20

30

40

50

60

70

X

Рис. 3.12

Каждому значению урожайности соответствует среднее количество внесенных удобрений: x1 x2 x3 x4 x5 x6

10 9 30 1 12 ɰ; 10 10 4 30 10 50 2 27,5 ɰ; 16 10 1 30 9 50 6 70 1 38,2 ɰ; 17 30 3 50 14 70 10 55,2 ɰ; 27 50 6 70 18 65,0 ɰ; 24 70 6 70,0 ɰ. 6

На рис. 3.12 полученная зависимость изображена прямой CD.


Э.Ф. Казанцев

302

Нетрудно видеть, что и здесь наблюдается линейная зависимость: x = cy + d, (3.4.16) но прямая CD отличается от прямой AB. Таким образом, мы установили, что связь между признаками линейная, но значений коэффициентов a, b, c, d мы пока не знаем. Уравнения (3.4.15) и (3.4.16) называются уравнениями регрессии. В общем случае: s

x

¦ i 1 s

xi nxi

¦n i 1

n xi

¦ j 1 t

¦n

ny j

i xi

n

;

s

t

(3.4.17) t

¦n

t

¦y n j 1

ij ;

i 1

(3.4.18)

j yj

n

;

(3.4.19)

yj

n1 j n2 j ni j ns j

¦¦ i 1 j 1

на х.

i 1

xi

y j ny j

j 1

n

¦x n

ni1 ni2 ni j nit t

y

s

ni j

s

¦ i 1

n xi

t

¦n j 1

yj

.

s

¦n

ij ;

i 1

(3.4.20) (3.4.21)

Метод наименьших квадратов Рассмотрим линейную корреляционную зависимость у

Наша задача – по данным корреляционной таблицы, по соответствующим частотам и групповым средним найти уравнение прямой регрессии у на х и отыскать параметры a и b.


303

Математика

Построим в прямоугольной системе координат точки A 1(x 1, y 1); A 2(x 2; y 2);...A s(x s; y s) и произвольную прямую CD: y = ax + b. Y D

As0 A2

A20

A10 C

As

A1

X1

X2

……………………………………………..

XS

X

Рис. 3.13

Искомой прямой будем считать ту, которая ближе всего расположена к точкам A1, A2,…As. Критерием близости является сумма наименьших квадратов. Рассмотрим сумму квадратов отклонений по ординате точек A1, A2,…As от точек A10, A20,…As0, лежащих на прямой CD. Обозначим эту сумму S: S

nx1 ( A1 A10 ) 2 nx2 ( A2 A20 ) 2 nx s ( As As 0 ) 2 .

(3.4.22)

Из уравнения y = ax + b получаем ординаты точек Ai0: A1 A ax1 b y1; A2 A20

и т.д.

ax2 b y2


Э.Ф. Казанцев

304

Тогда (3.4.22) можно представить так: nx1 (ax1 b y ) 2 nx 2 (ax2 b y2 ) 2 nx s (axs b ys ) 2 . (3.4.23)

S

Таким образом, хорошо видно, что S – функция двух независимых переменных a и b. Для искомой прямой сумма S минимальна. Необходимым условием экстремума функции является обращение в нуль ее частных производных первого порядка по всем переменным: wS wb

n x1 2(ax1 b y1 ) n x2 2(ax2 b y 2 ) n xs 2(ax s b y s )

wS wa

n x1 2(ax1 b y1 ) x1 n x2 2(ax2 b y 2 ) x2

n xs 2(axs b y s ) x s

0;

0.

Сокращая на 2 и группируя члены с a и b, получим: (n x1 x1 n x 2 x2 n x s x s ) a (n x1 n x 2 n x s ) b n x1 y1 n x 2 y 2 n x s y s ; (n x1 x12 n x 2 x2 2 n x s x s 2 ) a (n x1 x1 n x 2 x2 n x s x s ) b n x1 x1 y1 n x 2 x2 y 2 n x s xs y s

или s

a

¦ i 1

xi nxi n

s

¦x

i

a

i 1

2

n xi

n

s

b

¦ i 1

n xi

n

s

¦yn i 1

1 xi

n s

s

¦x n ¦x y n i i

b

i 1

n

i 1

i i xi

n

.

(3.4.24)

Используя равенства (3.4.16) – (3.4.20) и свойство среднего: s

¦y n i 1

i xi

n

y.


305

Математика

Из первого уравнения (3.4.24) получим: ax + b = y, откуда: b = y – ax.

(3.4.25)

Подставим полученное значение b в (3.4.15): y – y = a(x – x). Полученное уравнение показывает, что прямая CD проходит через точку с координатами (x, y) – то есть это средняя точка корреляционного графика. Осталось найти коэффициент а. Коэффициент а называется коэффициентом регрессии у на х и обозначается ρy/x. Из второго уравнения (3.4.24) найдем а: для этого заменим b на (3.4.25), а коэффициент при нем – на x: s

¦x

i

ȡy / x

i 1

2

n xi

1 n

( y ȡ y / x x)x

n

¦n

xi xi yi .

(3.4.27)

В правой части (3.4.27) заменим yi на (3.4.18): t

1 n

s

¦ i 1

xi n xi

¦

yi nij

j 1

n xi

s

1 n

s

t

¦ ¦ xi

i 1

t

¦¦ x y n i

y j nij

j 1

i 1 j 1

n

j ij

x y , (3.4.28)

и уравнение (3.4.27) приобретает вид: 2

2

U y / x (x x )

xy x y,

(3.4.29)

но 2

2

2

(x x ) ı x ,

(3.4.30)

.

(3.4.31)

поэтому ȡy / x

xy x y 2

ıx


Э.Ф. Казанцев

306

Обозначим

x y x y ,

P

тогда

P

ȡy / x

2

ıx

.

(3.4.32)

(3.4.33)

Таким образом, задача о нахождении прямой регрессии у на х решена. Аналогично можно получить уравнение прямой регрессии х на у: (x x)

где ȡx / y 2

ıy

U x / y ( y y ),

xy x y

ȝ

2 ıy

ıy

2 2 y y .

2

;

(3.4.34) (3.4.35) (3.4.36)

Итак, для получения прямых регрессии необходимо вы2 2 числить средние x и y, дисперсии V x и V y и коэффициент регрессии ρy/x и ρx/y. П р и м е р 1. По данным табл. 3.4 составить уравнения регрессии между количеством удобрений х и урожайностью у. Порядок вычислений: – находим x 46,8 ɰ/ɝɚ; ı ɱ2 445676; – находим y 15,14 ɰ/ɝɚ; ı 2y 8,02; – определяем µ = 50,448; – вычисляем коэффициенты регрессии ρy/x = 0,113; ρx/y = 6,290; – составляем уравнения регрессии: y = 0,113x + 9,852; x = 6,290y – 48,431. После установления прямой и обратной регрессионной связи между х и у, возникает проблема выяснения силы (тесноты) этой связи, то есть оценки рассеяния случайной величины относительно линии регрессии. Мерой такой оценки может служить коэффициент корреляции.


307

Математика

О п р е д е л е н и е . Коэффициентом корреляции r переменных х и у, между которыми предполагается линейная корреляционная связь, называется среднее геометрическое их коэффициентов регрессии: r

r ȡ y / x ȡx / y ,

причем знак «+» берется, когда оба коэффициента положительны, и знак «–», когда они отрицательны. У коэффициентов регрессии всегда знаки одинаковы. Используя формулы (3.4.33) и (3.4.35) можно получить следующую формулу для коэффициента корреляции: r

P . V xV y

Теперь уравнения регрессии примут вид: y y

r

x x

r

Vy Vx

( x x );

Vx ( y y ). Vy

П р и м е р 2. По данным табл. 3.4 вычислить коэффициент корреляции между количеством удобрений и урожайностью. Решение. Uy/ x

0,113; U x / y

6,290; r

0,113 6,290

0,843.

Свойства коэффициента корреляции: 1. Абсолютная величина коэффициента корреляции не превосходит 1: –1 ≤ r ≤ 1. 2. Необходимым и достаточным условием того, что х и у связаны линейной функциональной связью у = ах + b является равенство r = ±1 (см. рис. 3.14). 3. Если регрессия у на х точно линейная и коэффициент корреляции равен нулю, то между у и х нет линейной корреляционной связи (см. рис. 3.15).


Э.Ф. Казанцев

308

4. Если между переменными х и у отсутствует хотя бы одна из корреляционных связей, то коэффициент корреляции r равен нулю. 5. Выполнение условия r = ±1 является необходимым и достаточным для того, чтобы прямые регрессии у на х и х на у совпадали. 6. Коэффициент корреляции является мерой тесноты линейной корреляционной связи между х и у. Когда он равен нулю, х и у не могут находиться в линейной корреляционной зависимости. Степень их корреляционной связности растет при приближении r к ±1, причем линейная связь будет функциональной, когда коэффициент корреляции равен ±1 (см. рис. 3.16). Графическое изображение коэффициента корреляции Ɏɭɧɤɰɢɨɧɚɥɶɧɚɹ ɫɜɹɡɶ r = 1

Ɏɭɧɤɰɢɨɧɚɥɶɧɚɹ ɫɜɹɡɶ r = –1

Рис. 3.14 Ɏɭɧɤɰɢɨɧɚɥɶɧɚɹ ɫɜɹɡɶ r = 0

Рис. 3.15


309

Математика

Степень сгущения говорит о величине корреляции r = +0,5

r = +0,8

Рис. 3.16

Нелинейные корреляционные связи а) Пусть связь между х и у выражается примерно в виде параболы: (3.4.38) Y = a0 + a1x + a2x2. Таблица 3.7 xi

yi

nx

x1

y1

nx

1

x2

y2

nx

2

xi

yi

nx

xs

ys

nx

i

i

s

Искомой параболой будет та, для которой будет минимальной сумма квадратов отклонений по ординате точек A1, A2,…As от соответствующих точек A 10, A 20,…A s0 (с одинаковыми абс­ циссами).


Э.Ф. Казанцев

310

То есть следует найти минимум функции S: S

n x1 ( A1 A10 ) 2 n x2 ( A2 A20 ) 2 n xs ( As As 0 ) 2 .

Yi

a0 a1 xi a2 xi .

(3.4.39) Полагая в уравнении (3.4.38) x = x1; x2;…xs, получим ординаты точек A10, A20,…As0: 2

Следовательно: a0 a1 xi a 2 xi2 yi .

Ai Ai 0

Подставив данные выражения в (3.4.39) получим: n x1 ( a0 a1 x1 a 2 x2 2 y1 ) 2 n x2 ( a0 a1 x1 a 2 x2 2 y 2 ) 2

S

n xs ( a0 a1 x1 a 2 x2 2 y s ) 2 .

Теперь мы получили S как функцию трех независимых переменных a0; a1; a2. Условия экстремума данной функции: wS wa0

0;

wS wa1

0;

wS wa2

0.

Нахождение частных производных аналогично случаю линейных корреляционных связей. Приведем окончательный вид системы уравнений: a0

s

¦ i 1

a0

s

¦x n i 1

a0

nxi a1

i xi

¦x

i

2

s

¦x n i 1

a1

i xi

¦x

nxi a1

i

2

¦x

i

a2

¦x

n x i a2 3

i

2

¦x

n x i a2

¦yn

n xi

i

3

¦x

i

i xi ;

n xi 4

n xi

¦x y n

i i xi ;

¦x

i

2

yi nxi .

(3.4.40)

П р и м е р 1. Найти уравнение зависимости урожайности у от глубины орошения х.


311

Математика

Таблица 3.8 Урожайность (yi)

Итого nx

10

12

14

16

0

4

1

5

10

2

3

2

7

20

1

4

4

9

30

2

2

3

7

40

2

3

1

6

50

2

2

2

6

6

10

14

10

40

Глубина

И т о г о ny : i

i

Вычислим групповые средние у при различных значениях х: y1

10,4; y2

14; y3

14,7; y 4

14,3; y5

13,7; y6

12 .

Нетрудно заметить, что групповые средние сначала возрастают, а затем начинают убывать. Это дает основание предполагать, что между переменными х и у существует параболическая связь вида (3.4.38). Вычисляя коэффициенты в системе (3.4.40) получим следующую систему уравнений: 40a0 1000 a1 35200 a 2

536;

1000a0 35200 a1 1402000 a 2

13500;

35200 a0 1402000 a1 60040000 a 2

463800.

Решая данную систему (например, методом Гаусса), получим: a2

0,0055; a1

0,2913; a0

10,9575.

Искомое уравнение параболической регрессии у на х имеет вид: yx

0 ,9575 0 ,2913 x 0 ,0055 x 2 .

(3.4.41)


Э.Ф. Казанцев

312

Для обратной регрессии х на у: b0 b1 y b2 y 2 ;

xy

коэффициенты b 0; b 1; b 2 находим аналогично предыдущему случаю. б) Пусть связь между х и у выражается в виде гиперболы: c d. y

a b или x y x

yx

(3.4.42)

Такая связь называется гиперболической. Рассмотрим сначала гиперболическую связь у на х. Введем 1 , тогда уравнение (3.4.42) будет иметь x

новую переменную z вид: yx

az b,

то есть между y и z существует линейная корреляционная связь. Параметры a и b такие же, как и в случае линейной корреляционной связи. Возвращаясь к переменной х, получаем систему уравнений: a

s

1

¦ xn i 1

a

s

1

¦x i 1

2

xi

b

s

¦n ¦ y n i 1

n xi b

i xi ;

xi

1

1

¦x n ¦x yn i

xi

i

i xi

для определения параметров a и b. Аналогично получаем гиперболическую связь х на у. П р и м е р 2. Даны распределение 30 предприятий по объему выпускаемой продукции за 1 день (х) и себестоимость единицы продукции (у)


313

Математика

Таблица 3.9 Себестоимость (у)

110

120

130

50

1

3

4

100

3

3

6

150

6

2

1

9

200

1

4

1

6

250

4

1

5

5

14

6

5

30

И т о г о n y:

х и у.

Итого nx

100

Объем

i

Требуется найти уравнение регрессионной зависимости Найдем групповые средние: y1 y3

120 1 130 3 110 3 120 3 127 ,5; y 2 4 6 114 ,4; y 4 111,7; y5 102.

115;

Нетрудно заметить, что между х и у наблюдается гиперболическая зависимость. Вычисляя необходимые параметры, получим систему уравнений: 0,25a + 30b =3410 0,00283a +0,25b = 29,36. Решаем данную систему: a = 112,8; b = 103,2. В итоге уравнение гиперболической регрессии у на х: yx

112 ,8 103,2 . x

в) Пусть связь между х и у выражается показательной функцией: (3.4.43) yx = bax или xy = dcy.


Э.Ф. Казанцев

314

Логарифмируем данное выражение: lg yx = x lg a + lg b. То есть lg yx и х связаны линейной корреляционной связью с параметрами lg a и lg b. Следовательно, система уравнений имеет вид: lg a

s

¦ i 1

lg a

s

¦ i 1

nxi xi lg b

s

¦ n ¦ lg y n xi

i

¦n

¦n

i 1

nxi xi 2 lg b

s

i 1

xi xi

xi ;

xi xi

lg yi .

(3.4.44)

Решая данную систему, находим lg a и lg b, по которым можно найти параметры a и b. Множественная корреляция Известно, что урожайность зависит не только от количества внесенных удобрений, но и от сроков уборки, количества осадков и т.д. Пусть параметр z зависит от двух переменных х и у. Произведено n наблюдений с результатами: Таблица 3.10 xj

yk

zl

ni

x1

y1

z1

n1

x2

y2

z2

n2

xm

ym

zm

nm

n

Пусть наблюдается простейшая связь – линейная: z = ax + by + с, (3.4.45) a, b, c – постоянные коэффициенты.


315

Математика

Требуется найти такое уравнение, чтобы вычисленные значения z наилучшим образом, в смысле метода наименьших квадратов, воспроизводили опытные данные. Подставляя в (3.4.45) значения xi и yi, получим величину Zi, отличную от значения zi из табл. 3.10. Разность Zi – zi характеризует расхождение между наблюденными и вычисленными значениями. Сумма квадратов таких отклонений: m

¦ (ax by c z ) n .

S

i

i

i

2

(3.4.46)

i

i 1

Условие минимума S: wS wc

2

wS wb

2

wS wa

2

m

¦ (ax by c z )n i

i

i

0;

i

i 1 m

¦ (ax by c z ) y n

0;

¦ (ax by c z ) x n

0.

i

i

i

i i

i 1 m

i

i

i

i i

i 1

Относительно коэффициентов a, b, c система уравнений примет вид: m

c

¦ i 1

c

a

n

m

¦ i 1

m

ni

¦ i 1

a

n

m

¦x n i 1

n

¦ i 1

¦x i 1

i 1

n

2

¦z n

i i

i 1

n m

b

n i

a

¦

m

yi n

xi yi ni

m

i i

c

b

n m

yi n

m

xi ni

¦ i 1

yi 2 ni n

m

ni

n m

¦y zn

i i i

i 1

n

m

¦x y n ¦x z n i i i

b

;

i 1

n

i i i

i 1

n

;


Э.Ф. Казанцев

316

или

c ax by

z;

cy ax y by 2 2

cx ax bx y

yz ; xz .

Выразим с из первого уравнения: c

z ax b y

и подставим во второе и третье: a ( x y x y ) b( y 2 y 2 )

yz y z ;

a ( x 2 x 2 ) b( x y x y )

xz x z .

Воспользуемся выражением для дисперсии: a( x y x y ) bV y 2

yz y z ;

aV x 2 b( x y x y )

xz x z .

(3.4.47)

Используем ранее выведенные соотношения: rxy

xy x y ; rxz V xV y

xz x z ; ryz V xV z

получим: xy x y

rxy V x V y ,

xz x z

rxz V x V z ,

yz y z

ryz V y V z .

Подставляя в (3.4.47): arxy V x bV y

ryz V z ,

aV x brxy V y

rxz V z ,

находим a и b: a

rxz rxy ryz V z ; Vx 1 rxy 2

b

ryz rxz rxy V z . Vy 1 rxy 2

yz y z , V yVz


317

Математика

Таким образом, уравнение регрессии определено. Степень, или теснота множественной линейной корреляционной связи определяется совокупным коэффициентом корреляции: R

rxy 2 ryz 2 2rxz ryz rxy 1 rxy 2

.

Свойства совокупного коэффициента корреляции: 1) Совокупный коэффициент корреляции изменяется от 0 до 1. 2) Если R равен нулю, то z не может быть линейно связан с х и у. 3) Если R равен 1, то z связан с х и у функциональной связью. 4) Если R отличен от 0 и 1, то при приближении R к 1 теснота линейной связи z с х и у увеличивается. Задания для самостоятельной работы 1. Выборочное обследование партии деталей объемом в 2000 штук дало следующий результат: Брак

1

1

2

3

1

1

Обследованный объем

10

10

30

30

10

10

а) найти предельную ошибку выборки для доверительной вероятности β = 0,7017; б) определить объем репрезентативной выборки. 2. Из партии в 10 000 изделий проверено 2000. Среди них оказалось 400 изделий 2-го сорта. Какова предельная ошибка выборки деталей 2-го сорта для доверительной вероятности β = 0,99. 3. При изучении расщепления признаков у растений томата по окраске плодов получено 310 красных плодов и 90 желтых. Теорети­ чески ожидалось отношение 3 : 1.


Э.Ф. Казанцев

318

Определить, подтверждается ли принятая гипотеза на уровне значимости β = 0,05. 4. В 7 случаях из 10 фирма В действовала на рынке так, как будто ей заранее были известны решения, принимаемые фирмой-конку­ рентом А. На уровне значимости β = 0,05 определить, случайно ли это, или на фирме А работал осведомитель фирмы-конкурента. 5. Связь между х и у задана корреляционной таблицей: x/y

10

20

30

40

1

1

2

2

2

2

3

1

1

4

2

1

Найти уравнение регрессии у на х. 6. Связь между х и у задана корреляционной таблицей: x/y

2

4

6

8

1

3

2

3

2

3

5

1

3

7

2

1

Найти уравнение регрессии у на х.

3.5. Случайные процессы 3.5.1. Основные понятия 1) Случайным процессом будем называть множество случайных величин X(t), изменяющихся в зависимости от времени или какого-либо другого параметра.


319

Математика

Параметр t может быть дискретным или непрерывным. Случайные величины X(t) тоже могут принимать дискретные или непрерывные значения. Так как речь идет о множестве случайных величин, то их взаимозависимость может быть охарактеризована только многомерными распределениями. Случайный процесс считается заданным, если для набора 〈t1, t2,…tn〉 указано многомерное распределение: F〈t , t ,…t 〉(X1; X2…Xn) = P{X1(t1), X2(t2)…Xn(tn)}. 1 2

n

Случайные процессы X(t) называются процессами с независимыми значениями, если для любого набора 〈t1, t2,…tn〉 случайные величины X1(t1), X2(t2)…Xn(tn) независимы, то есть многомерное распределение случайного процесса с независимыми значениями определяется одномерными распределениями: F〈t , t ,…t 〉(X1; X2…Xn) = Ft (X1)Ft (X2)… Ft (Xn). 1 2

n

1

2

n

Математическим ожиданием (средним) случайного процесса X(t) называется неслучайная функция E[X(t)], значение которой при фиксированном значении t = t0 равно математическому ожиданию случайной величины X(t0). Дисперсией случайного процесса X(t) называется неслучайная функция σ2(t) = E[(X(t)– E[X(t)]]2, значение которой при фиксированном значении t = t0 равно дисперсии случайной величины X(t0). Таким образом, и математическое ожидание и дисперсия случайного процесса определяются по его одномерным распределениям, поэтому не дают никакого представления о взаимозависимости случайных величин, образующих случайный процесс. Более эффективными характеристиками случайного процесса могут служить понятия ковариации и корреляции. 2) Ковариацией двух случайных величин Xi и Xj называется число σij, равное математическому ожиданию произведения отклонений случайных величин Xi и Xj от своих математических ожиданий:


Э.Ф. Казанцев

320

σij = cov(Xi, Xj) = E[(Xi – E(Xi))(Xj – E(Xj))]. Ковариацию иногда называют вторым смешанным центральным моментом случайных величин Xi и Xj. Нетрудно показать, что: σij = E[(Xi – E(Xi))(Xj – E(Xj))] = E[XiXj – XjE(Xi) – XiE(Xj) + + E(X i)E(X j)] = E(X iX j) – E(X j)E(X i) –E(X i)E(X j) + E(X i)E(X j) = = E(XiXj) – E(Xi)E(Xj). Отсюда легко получить: если Xi и Xj независимы, то cov(X1; X2) = 0, так как в этом случае E(XiXj) = E(Xi)E(Xj). Ковариационной матрицей случайного вектора & X X 1; X 2 ...X n называется матрица Σ, элементами которой являются ковариации σ ij = cov(XiXj): 6

§ V11 V12 ¨ ¨ V 21 V 22 ¨ ¨ ¨V © n1 V n 2

V1n · ¸ V 2n ¸ . ¸ ¸ V nn ¸¹

Ковариационная матрица является симметричной (σij = σji) и ее диагональные элементы равны дисперсиям случайных величин X1; X2…Xn: σii = σ2(Xi). Определитель ковариационной матрицы Σ называется обобщенной дисперсией. Обобщенную дисперсию можно использовать как меру рассеяния n – мерой случайной величины. Если случайные величины X1; X2…Xn независимы, то матрица Σ является диагональной: cov(X1; X2) = 0. 3) В качестве количественной характеристики зависимости случайных величин используют коэффициент корреляции ρ, равный ковариации нормированных случайных величин. Например, для двух случайных величин X1 и X2: Y1

X1 E( X1) ; Y2 V( X 1 )

X 2 E( X 2 ) ; V( X 2 )


321

Математика

ª X E( X1) X 2 E( X 2 ) º ; cov « 1 » V( X 2 ) ¼ ¬ V( X 1 ) cov( X 1; X 2 ) ; cov( X 1; X 2 ) U X 1 X 2 V( X 1 )V( X 2 ). V ( X 1 ) V( X 2 )

U X1 X 2

или U X 1 X 2

Для независимых случайных величин: ρ X X = 0, так как 1 2 cov(X1; X2) = 0. ρX X ≤ 1. Обратное утверждение неверно. 1 2 4) Ковариационной функцией случайного процесса X(t) называется неслучайная функция: B(t, s) = cov[X(t), X(s)] = E[X(t) – E(X(t))(X(s) – E(X(s))], значение которой при фиксированных значениях t = t0, s = s 0 равно коэффициенту ковариации двух случайных величин X(t0) и X(s0); при t = s B(t, s) = σ2(t). Корреляционной функцией случайного процесса X(t) называется нормированная ковариационная функция: U(V , s )

B (t , s ) . V(t )V( s)

Для независимых процессов B(t, s) = 0, ρ(t, s) = 0. 5) Важным классом процессов, для которого E [X(t)] и B(t, s) полностью определяют многомерные распределения, является гауссовский процесс, многомерное распределение случайных значений которого в моменты 〈t1, t2,…tn〉 задается следующей функцией распределения: Ft

1 , t 2, ..., t n

X1

u

Xn

1 (2S)

n 2

B

u

& &½ ­ 1 & &2 exp® X a B 1 X a ¾dx1 ...dxn , ¯ 2 ¿ f

³ ³ ...

f

( X 1 , X 2 ,..., X n )


Э.Ф. Казанцев

322

& ɝɞɟ X

§ X1 · ¨ ¸ ¨ X2 ¸ & ¨ ¸; a ¨ ¸ ¨X ¸ © n¹

§ E ( X 1 (t1 )) · ¨ ¸ ¨ E ( X 2 (t 2 )) ¸ ¨ ¸ B ¨ ¸ ¨ E ( X (t )) ¸ 1 n ¹ ©

B (ti ; t j ) ;

B – определитель матрицы B. Корреляционной матрицей случайного вектора & X X 1; X 2 ...X n называется матрица R: R

§ 1 U12 U13 ...U1n · ¨ ¸ ¨ U 21 1 U 23 ...U 2 n ¸ ¨ ..... ...... ............. ¸. ¨ ¸ ¨U ¸ © n1 U n 2 U n3 ...1 ¹

Диагональные элементы R равны 1, поскольку ρii = ρX X = 1. i i Так как Uij

cov( X i ; X j )

cov( X j ; X i )

VXi VX j

VX j VXi

U ji ,

то R является симметричной матрицей. ρX X = 1 только тогда, когда X1 и X2 связаны линейной 1 2 зависимостью, то есть X2 = aX1 + b; причем ρX X = 1, если a > 0, 1 2 и ρX X = –1, если a < 0. 1 Случайный процесс X(t) называется стационарным, если: E(X(t)) = const; σ2 = const; B(t, s) = B(s – t), s ≥ t. 3.5.2. Цепи Маркова 1) Рассмотрим случайный процесс с дискретным временем и дискретным конечным множеством значений (состояний s1, s2,…sm), в которых находится элемент (частица) процесса.


Математика

323

П р и м е р 1. Каждый сотрудник предприятия в рабочий день может находиться в одном из следующих состояний: s1 – работает, s2 – в командировке, s3 – в отпуске, s4 – болен (то есть состояния не обязательно числовые). Здесь будут рассматриваться случайные процессы X(t), в которых X(t) принимает значение того состояния, в котором процесс (то есть его элемент) находится в момент времени t. Рассмотрим моменты 〈t1, t2,…tn〉: Xi = X(ti) и Xi принимает значения s1, s2,…sm. Процесс называется марковским, если вероятность попасть в состояние Xi = sj в момент ti зависит не от всего прошлого, а лишь от состояния Xi–1 = si, в котором процесс был в предыдущий момент времени ti–1: P[X(ti)] = sj[ti–1] = si = pij, то есть это матрица с элементами pij. & Матрица P называется матрицей вероятностей перехода, поскольку ее элементы – вероятности переходов из состояния i в состояние j. П р и м е р 2. Множество состояний студента: s1 – первый курс; s2 – второй курс; s3 – третий курс; s4 – четвертый курс; s5 – выпуск; s6 – специалист, окончивший вуз; s7 – отчисление. Составим матрицу переходов студента: p1 – вероятность выбыть на 1-м курсе и так далее; r1 – вероятность перехода на 2-й курс и так далее; q1 – вероятность остаться на 1-м курсе и так далее. Все остальные вероятности равны нулю.

& P

§ q1 ¨ ¨0 ¨0 ¨ ¨0 ¨ ¨0 ¨0 ¨¨ ©0 s1

r1 q2 0 0 0 0 0 s2

0 r2 q3 0 0 0 0 s3

0 0 r3 q4 0 0 0 s4

0 0 0 r4 q5

0 0 0 0 r5

0 1 0 0 s5 s6

p1 · ¸ p2 ¸ p3 ¸ ¸ p4 ¸ ¸ p5 ¸ 0¸ ¸ 1 ¸¹ s7 .


Э.Ф. Казанцев

324

Например, для второкурсника (состояние s 2) возможны переходы: в состояние s7 – выбыл (p2); s2 – остался (q2); s3 – перешел на третий курс (r2); p2 + q2 + r2 = 1 и так далее. 2) Будем рассматривать марковские процессы, для которых разности смежных моментов наблюдения ti – ti–1 равны постоянному числу (шаг = 1) и все возможные состояния перечислены. Такие процессы называются цепями Маркова. Если вероятности переходов не зависят от t, то цепь Марко­ ва называется однородной. Это такие цепи, где вероятности перехода стационарны во времени (это не значит, что стационарным должен быть и случайный процесс). То есть если задано текущее состояние, то вероятности различных состояний через n шагов зависят только от этих n шагов и не зависят от текущего времени. 3) Вычислим вероятность перехода между состояниями за n шагов. Пусть pij(t) – вероятности переходов за n шагов из состояния si &в sj; P (t ) – матрица перехода с элементами pij(t); t = 1, 2, 3,… Для t = 1 вероятность pij(1) = pij и матрица P(1) = P – переход за 1 шаг. Рассмотрим момент времени l (1 < l < t) и состояние sl. Вероятность перехода из состояния si в состояние sj за время t отлична от 0, если возможен переход из s i в s l за время l (то есть pils ! 0 ) и возможен переход из sl в sj за оставшееся время (t – l > 0), то есть pljt l ! 0 для какого-либо l. Таким образом, вероятность перехода из состояния si в состояние sj через состояние sl равна pil( s ) ( s) plj(t s ) . Для получения вероятности перехода из si в sj в соответствии с формулой полной вероятности следует пересуммировать также произведения вероятностей по всем промежуточным состояниям l. Имеем: pij (t )

m

¦p l 1

s (t s ) l 1 ( s ) plj

(3.5.1)


325

Математика

или это можно записать как произведение матрицы: & P (t )

& & P ( s ) P (t s ).

Таким образом, можно видеть, что: & P( z )

& & P(1) P (1)

&2 & P , P(3)

& & P (2) P(1)

& & P (1) P(2)

&3 P

и так далее. & & & & & & Итак, P(t ) P(1) P(t 1) P(t 1) P(1) P t , что дает возможность найти вероятности перехода между состояниями за любое число шагов, зная матрицу переходов за один шаг. Нетрудно видеть, что: ­ ° pij ® ° pij ¯

1 , ɟɫɥɢ i j 1 , 2 0 ɞɥɹ ɨɫɬɚɥɶɧɵɯ ɩɟɪɟɯɨɞɨɜ 1

pi 1 pi 1 . Такие то есть мы получаем ситуацию с дамой: pi .1 соотношения называются рекуррентными. 2 Цепь Маркова называется неприводимой, если каждое ее состояние может быть достигнуто из любого другого состояния; то есть для каждой пары состояний si и sj существует pij > 0. Пусть {S} − множество всех возможных состояний цепи Маркова. Подмножество {S1} состояний называется замкнутым, если нельзя за один шаг перейти из произвольного состояния подмножества {S1} в произвольное состояние подмножества Si1 (дополнено множеством {S1}). Если {S1} состоит из единственного состояния Si, то оно называется поглощающим. Необходимым и достаточным условием того, чтобы состояние S i было поглощающим, является условие pii = 1. Если само множество {S} замкнуто и не содержит никакого другого замкнутого подмножества, то оно является неприводимой цепью Маркова. Если же множество содержит замкнутые подмножества, то цепь называется приводимой.

^ `


Э.Ф. Казанцев

326

Предположим, что дама не захочет возвращаться в какойлибо магазин, в котором уже побывала. Обозначим вероятность такого события − возвращения в j магазин – через fj – через t шагов (успела убежать). Полная вероятность возвращения когда-либо в j магазин: P

шагов.

f

¦f

f j – это возвращение в состояние sj; t – число

j

t 1

3.5.3. Уравнение Чепмена – Колмогорова До сих пор мы рассматривали однородные марковские процессы, то есть процессы, для которых переходные вероятности не зависят от времени. Перейдем к более общему случаю, когда вероятности перехода зависят от времени. По-прежнему будем рассматривать дискретные цепи Маркова. Обозначим вероятность перехода системы из состояния si на m-м шаге в состояние sj на n-м шаге (n ≥ m) через pij(m, n). Если система из si переходит sj, то в некоторый промежуточный момент q она находилась в некотором промежуточном состоянии sK. Все траектории могут проходить через различные промежуточные состояния, но некоторые промежуточные состояния могут и совпадать. Но обязательно траектория в момент q пройдет через одно промежуточное состояние. Таким образом, вероятность pij(m, n) равна: (3.5.2) pij (m, n) piK (m, q) p Kj (q, n).

¦ K

Эти уравнения называются уравнениями Чепмена – Колмо­ горова для дискретных цепей Маркова. ( n m) Если цепь Маркова однородна, то pij (m , n) p ij , и уравнения (3.5.2) переходят в уравнения (3.5.1).


327

Математика

Уравнения (3.5.2) означают, что (n – m) шагов могут быть произвольным образом разбиты на (q – m) и (n – q) шагов и при этом для вычисления pij(m, n) надо взять все возможные произведения вероятностей из множества переходных вероятностей за (q – m) шагов на вероятности из множества переходных вероятностей за остальные (n – q) шагов, а затем просуммировать эти произведения по всем промежуточным состояниям, возможным в момент q. При этом допускаются произвольные разбиения временного интервала, что дает многочисленные преимущества в дальнейшем. Запишем уравнение (3.5.2) в матричном виде. В однород& ной цепи Маркова матрица P состояла из вероятностей pij, не зависящих от времени. Теперь эти вероятности зависят от времени, поэтому обозначим матрицу вероятностей перехода за один шаг через & P (n)

pij (n, n 1).

&

&

Для однородной цепи P(n) P. Обозначим матрицу вероятностей перехода за несколько & шагов через H (m, n) & pij (m, n) . & Заметим, что H (m, n 1) P(n) . Теперь уравнение (3.5.2) мож­ но записать в виде: & H ( m, n)

& & H (m, q ) H (q, n) & при m ≤ q ≤ n. Обозначим H (m, n)

(3.5.3)

& J – единичная матрица. Все

рассматриваемые матрицы являются квадратными, и их размерность равна числу состояний цепи Маркова. Решение уравнения (3.5.3) сводится к тому, чтобы выра& & P (n ). H ( m , n ) через зить Так как выбор промежуточного состояния q произволен, положим сначала q = n – 1, тогда уравнение (3.5.2) перепишем в виде: pij (m, n)

¦p

iK ( m, n 1) p Kj ( n 1, n)

K

(3.5.4)


Э.Ф. Казанцев

328

или в матричной форме: & H (m, n)

& & H (m, n 1) P (n 1).

(3.5.5)

Уравнения (3.5.4) и (3.5.5) называются прямыми уравнениями Чепмена – Колмогорова для дискретных цепей Маркова, так как они относятся к «переднему» (самому близкому) концу рассматриваемого промежутка времени. С другой стороны, полагая q = m + 1, получим: pij (m, n)

¦p

iK ( m, m 1) p Kj ( n 1, n)

K

(3.5.6)

или в материальной форме: & H (m, n)

& & P ( m) H (m 1, n) .

(3.5.7)

Уравнения (3.5.6) и (3.5.7) называются обратными уравнениями Чепмена – Колмогорова, так как они относятся к «зад­ нему» (самому отдаленному) концу рассматриваемого промежутка времени. Так как прямые и обратные уравнения описывают одну и ту же цепь Маркова, то естественно ожидать, что решения этих уравнений совпадают. Это действительно так, и общее решение имеет вид: & H (m, n)

& & & P ( m) P(m 1) P(n 1),

(3.5.8)

где m ≤ n – 1. В этом можно убедиться непосредственной подстановкой (3.5.8) в (3.5.7) и (3.5.6). Из (3.5.8) также видно, что для однородной цепи: & H (m, n)

& n m P .

Аналогичные рассуждения приводят также к обобщению на случай зависимости от времени вероятности пребывания си& & & стемы на n-ом шаге в состоянии Sj: S( n 1) S n P(n), решением ко& ( n 1)

& ( 0) &

&

&

S P(0) P (1) P (n). торого является S Все марковские процессы описываются уравнениями Чеп­ мена – Колмогорова, но не всегда наоборот.


Математика

329

Процесс размножения и гибели (дискретные процессы) Рассмотрим популяцию особей. Пусть в состоянии Sk объем популяции равен k числам. Предположим, что объем популяции может изменяться не более чем на 1, так что рождение приводит к увеличению объема на 1, а гибель к уменьшению на 1. При этом не допускаются многократные одновременные рождения и гибели – то есть рассмотрим марковский процесс. Рассмотрим однородную цепь Маркова, то есть Pij не зависит от времени, но допускается зависимость от состояния системы. Таким образом, дискретный процесс размножения и гибели можно представить в следующем виде:

Pij

j i 1 ­d i , ° °°1 bi d i , j i . ® j i 1 °bi , ° °¯0, ɜ ɨɫɬɚɥɶɧɨɦ ɫɥɭɱɚɟ

Здесь di – вероятность того, что на следующем шаге произойдет одна гибель, уменьшится объем популяции до i – 1, если на данном шаге объем был равен i; bi – вероятность рождения на следующем шаге, приводящему к увеличению объема популяции до i + 1; 1 – di – bi – вероятность того, что ни одно из этих событий не произойдет и на следующем шаге объем популяции не изменится. Ясно, что d0 = 0, так как гибель не может наступить, если некому погибать. Но в противовес интуиции допустим, что b0 > 0, то есть возможно рождение, когда в популяции нет ни одной особи. Здесь это выглядит как божественное творение, но в теории массового обслуживания (ТМО) такое предположение разумно. А именно: пусть популяция есть поток требований, поступающих в систему, гибель означает уход требований из системы, а рождение соот-


Э.Ф. Казанцев

330

ветствует поступлению в систему нового требования. Матрица стационарных вероятностей для общего процесса размножения и гибели имеет следующий вид:

& P

b0 0 §1 b0 ¨ ¨ d b1 1 b1 d1 ¨ 1 ¨ 0 dz 1 b2 d 2 ¨ ¨ . . ¨ . ¨ . ¨ 0 ¨¨ . . © .

0

0

0

0

0

0

b2

0

0

.

.

.

d i 1 bi d i .

.

.

bi .

0 · ¸ 0 ¸ ¸ 0 ¸¸ ¸. . ¸ ¸ 0 ¸ ¸ . ¸¹

Если цепь является конечной, то последняя строка матрицы записывается в виде: (0 0…0 dN 1–dN). Это соответствует тому, что не допускаются никакие размножения после того, как популяция достигает максимального объема N.


Л ит ер а тур а 1. Горбатов В.А. Фундаментальные основы дискретной математики. М.: Наука; Физматлит, 2000. 2. Кузнецов О.П., Адельсон-Вельский Г.М. Дискретная математика для инженера. М.: Энергоатомиздат, 1989. 3. Москинова Г.И. Дискретная математика (математика для менеджера в примерах и упражнениях). М.: Логос, 2000. 4. Нефедов Н.В., Осипова В.А. Курс дискретной математики. М.: МАИ, 1992. 5. Солодовников А.С., Бабайцев В.А., Браилов А.В., Шандра И.Г. Математика в экономике. Ч. 1. М.: Финансы и статистика, 2003. 6. Воеводин В.В. Линейная алгебра. М.: Наука, 1980. 7. Смирнов В.И. Курс высшей математики. Т. 3. Ч. 1. М.: Гос. изд. техникотеоретической литературы, 1957. 8. Анго А. Математика. М.: Наука, 1967. 9. Шевцов Г.С. Линейная алгебра: Теория и прикладные аспекты. Учеб­ное пособие. М.: Финансы и статистика, 2003. 10. Григорьев С.Г. Линейная алгебра. Учебное пособие. М., 1999. 11. Канатиков А.Н. Линейная алгебра. Учебник для вузов М.: МГТУ им. Баумана, 1999. 12. Рублев А.Н. Линейная алгебра. Учебное пособие для вузов. М.: Высшая школа, 1968. 13. Красс М.С. Математика для экономических специальностей. М.: ИНФРА-М, 2008. 14. Колемаев В.А. Теория вероятностей и математическая статистика. Учебник. М.: ИНФРА-М, 2000. 15. Гмурман В.Е. Теория вероятностей и математическая статистика. Учебное пособие. М.: Высшая школа, 2004. 16. Гмурман В.Е. Руководство к решению задач по теории вероятностей и математической статистики. Учебное пособие. М.: Высшая школа, 2000. 17. Новорожкина Л.И., Морозова З.А. Основы статистики с элементами теории вероятностей для экономистов. Руководство для решения задач. Р-н/Д: Феникс, 1999. 18. Карасев А.И. Теория вероятностей и математическая статистика. Учебник. М.: Статистика, 1970. 19. Архипов Г.И., Садовничий В.А., Чубариков В.Н. Лекции по математическому анализу. М.: Высшая школа, 1999. 20. Фихтенгольц Г.М. Основы математического анализа. М.: Физматгиз, 1960. 21. Берс Л. Математический анализ. М.: Высшая школа. 1994. 22. Щипачев В.С. Основы высшей математики. М.: Высшая школа, 1994. 23. Ильин В.А., Позняк Э.Г. Основы математического анализа. М.: Наука, 1998.


Эдуард Федорович Казанцев

МАТЕМАТИКА Учебно-методическое пособие

Корректор Компьютерная верстка В.Е. Иванов Подписано в печать 25.05.2011 Формат 60×90/16. Усл.-печ. л. 20,75 Тираж 100 экз. Издательский №

Автономная некоммерческая организация высшего профессионального образования академия «МЕЖДУНАРОДНЫЙ УНИВЕРСИТЕТ В МОСКВЕ» 125040, Москва, Ленинградский просп., 17 Телефоны: (495) 946-00-83, 946-03-29 http://www.interun.ru e-mail: rio@interun.ru


Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.