ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ
Государственное образовательное учреждение высшего профессионального образования
"УФИМСКИЙ ГОСУДАРСТВЕННЫЙ НЕФТЯНОЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ" (УГНТУ)
Кафедра математики
УЧЕБНО – МЕТОДИЧЕСКИЙ КОМПЛЕКС дисциплины «Математика» ________________________________________________________________________________
РАЗДЕЛ 14 «МАТЕМАТИЧЕСКАЯ СТАТИСТИКА
Теоретические основы Методические указания для студентов Материалы для самостоятельной работы студентов
Уфа • 2007
Ответственный редактор д. ф.-м. наук, проф. Р.Н. Бахтизин Редколлегия: АкмадиеваТ.Р., Аносова Е.П., Байрамгулова Р.С., Галиуллин М.М., Галиева Л.М., Галиакбарова Э.В., Гимаев Р.Г., Гудкова Е.В., Егорова Р.А., Жданова Т.Г., Зарипов Э.М., Зарипов Р.М., Исламгулова Г.Ф., Ковалева Э.А., Майский Р.А., Мухаметзянов И.З., Нагаева З.М., Савлучинская Н.М., Сахарова Л.А., Степанова М.Ф., Сокова И.А., Сулейманов И.Н., Умергалина Т.В., Фаткуллин Н.Ю., Хайбуллин Р.Я., Хакимов Д.К., Хакимова З.Р., Чернятьева М.Р., Юлдыбаев Л.Х., Шамшович В.Ф., Якубова Д.Ф., Якупов В.М., Янчушка А.П., Яфаров Ш.А.
Рецензенты: Кафедра программирования и вычислительной математики Башкирского государственного педагогического университета. Заведующий кафедрой д. ф.-м. наук, профессор Р.М. Асадуллин. Кафедра вычислительной математики Башкирского государственного университета. Заведующий кафедрой д. ф.-м. наук, профессор Н.Д. Морозкин.
Учебно-методический комплекс дисциплины «Математика». Раздел 14 «Математическая статистика». Теоретические основы. Методические указания для студентов. Материалы для самостоятельной работы студентов. – Уфа: Издательство УГНТУ, 2007. – 82 с. Содержит теоретические материалы, способы и методы решения практических задач, задания для самостоятельной работы студентов, контрольные вопросы для самопроверки, список рекомендуемой литературы. Разработан для студентов, обучающихся по всем формам обучения по направлениям подготовки и специальностям, реализуемым в УГНТУ.
© Уфимский государственный нефтяной технический университет, 2007
СОДЕРЖАНИЕ
1. Теоретические основы 1.1. Предварительные сведения 1.2. Предмет математической статистики и ее основные задачи. Выборка. Статистический ряд. Эмпирический закон распределения. Полигон и гистограмма 1.3. Статистические оценки генеральных параметров. Точечные и интервальные оценки для математического ожидания и дисперсии 1.4. Проверка статистической гипотезы о законе распределения генеральной совокупности 1.5. Статистическая и корреляционная зависимости. Эмпирическая и теоретическая линии регрессии 2. Методические указания для студентов 2.1. Лабораторная работа 1. «Первичная обработка статистических данных» 2.2. Лабораторная работа 2. «Расчет точечных и интервальных оценок генерального математического ожидания и дисперсии» 2.3. Лабораторная работа 3. « Проверка гипотезы о законе распределения генеральной совокупности» 2.4. Лабораторная работа 4. «Расчет параметров корреляционной зависимости» 3. Материалы для самостоятельной работы студентов 3.1. Контрольные вопросы 3.2. Лабораторные работы 3.3. Приложения 3.4. Литература
50 51 81 89
УЧЕБНО - МЕТОДИЧЕСКИЙ КОМПЛЕКС
РАЗДЕЛ: «МАТЕМАТИЧЕСКАЯ СТАТИСТИКА»
1. Теоретические основы
1
1.1 ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ Математическая статистика возникла (XVIII в.) и создавалась параллельно с теорией вероятностей. Дальнейшее развитие этой дисциплины (начало 20в.) обязано, в первую очередь, П.Л. Чебышеву, А.А. Маркову, А.М. Ляпунову. Основные результаты, ставшие в настоящее время классическими, были получены учеными англо – американской школы – К. Пирсон, Р.Фишер, Ю.Нейман, А.Вальд, В.Феллер и др. и российскими математиками – В.И.Романовский, Е.Е.Слуцкий, А.Н. Колмогоров, Н.В. Смирнов. Годом рождения современной математической статистики следует считать 1933 г. – год опубликования работы академика А.Н.Колмогорова «Основные понятия теории вероятностей». Именно в это время математическую статистику выделили из теории вероятностей в отдельную дисциплину. 1.2 ПРЕДМЕТ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ И ЕЕ ОСНОВНЫЕ ЗАДАЧИ. ВЫБОРКА. СТАТИСТИЧЕСКИЙ РЯД. ЭМПИРИЧЕСКИЙ ЗАКОН РАСПРЕДЕЛЕНИЯ. ПОЛИГОН И ГИСТОГРАММА В теории вероятностей, если мы изучаем случайную величину X , ее закон распределения считается заданным, и мы можем достоверно ответить на любой вопрос, касающийся данной случайной величины. В математической статистике ситуация прямо противоположная – мы ничего не знаем о законе распределения изучаемой случайной величины X . У нас имеются только некоторые ее наблюдения или измерения. Понятно, что по конечному числу наблюдений невозможно достоверно сделать какие-либо выводы об изучаемой случайной величине. Ясно также, что чем больше таких наблюдений, тем более надежными будут наши приближенные выводы. В этом состоит основная особенность математической статистики – она не определяет достоверно закономерности поведения изучаемых случайной явлений, а оценивает их с той или иной степенью достоверности. Но при неограниченном увеличении числа наблюдений выводы математической статистики становятся практически достоверными. Поэтому содержание этой дисциплины – как и сколько сделать наблюдений и как их обработать, чтобы ответить на интересующий нас вопрос о случайном явлении с требуемой степенью достоверности. Итак, установление закономерностей, которым подчинены массовые случайные явления основано на изучении статистических данных - результатах наблюдений. Математическая статистика решает две главные задачи: указать способы сбора и группировки (если данных очень много) статистических сведений (результатов наблюдений) и разработать методы анализа собранных статистических данных в зависимости от целей исследования. Пусть требуется изучить совокупность однородных объектов относительно качественного или количественного признака, характеризующего эти объекты. ПРИМЕР 1.1. Некоторое предприятие выпускает партию одинаковых деталей. Если контролируют детали по размеру – это количественный признак. 2
Можно производить этот контроль сплошным обследованием, то есть измерять каждый из объектов совокупности. Но на практике сплошное обследование применяется редко: а) из-за очень большого числа объектов; б) из-за того, что иногда обследование заключается в физическом уничтожении, например, проверяем взрываемость гранат или проверяем на крепость произведенную посуду и т.д. В таких случаях производится случайный отбор ограниченного (небольшого) числа объектов, которые и подвергают изучению. Выборочной совокупностью (выборкой) называется совокупность случайно отобранных однородных объектов. Генеральной совокупностью называется совокупность всех однородных объектов, из которых производится выборка. Объемом совокупности (выборочной или генеральной) называется число объектов этой совокупности. При наборе выборки можно поступать двояко: после того, как объект отобран и над ним произведено наблюдение, он может быть возвращен либо не возвращен в генеральную совокупность. В связи с этим выборки подразделяются на повторные и бесповторные. Для того, чтобы по данным выборки можно было достаточно уверенно судить об интересующем нас признаке генеральной совокупности, необходимо, чтобы объекты выборки правильно его представляли. Это требование коротко формулируется так: выборка должна быть репрезентативной (представительной). Способы отбора выборки: 1. Отбор, не требующий расчленения генеральной совокупности на части: а) простой случайный бесповторный; б) простой случайный повторный. 2. Отбор, при котором генеральная совокупность разбивается на части (если объем генеральной совокупности слишком большой): а) типический отбор. Объекты отбираются не из всей генеральной совокупности, а из ее «типичных» частей. Например, цех из тридцати станков производит одну и ту же деталь. Тогда отбор делается по одной или по две детали с каждого станка в случайные моменты времени; б) механический отбор. Например, если нужно выбрать 5% деталей, то выбирают не случайно, а каждую двадцатую деталь; в) серийный отбор. Объекты выбирают не по одному, а сериями. Итак, пусть из генеральной совокупности значений некоторого количественного признака произведена выборка объема N:
X = {x 1 , x 2 , x 3 , ... , x N }. Таблица вида
3
Таблица 1.1 №
1
2
3
x
x1
x2
x3
… …
N
xN
называется простым статистическим рядом, являющимся первичной формой представления статистического материала. Из данных табл. 1.1 находят x min и x max , соответственно наименьшее и наибольшее значения выборки. Затем данные табл. 1.1 называемые вариантами, располагают в порядке возрастания. Тогда выборка X = {x 1 , x 2 , x 3 , ... , x N }, записанная в порядке возрастания, называется вариационным рядом. Размах выборки – это длина основного интервала [x min ; x max ], в который попадают все значения выборки. Вычисляется размах выборки следующим образом: d = x max − x min . Затем по формуле
k = 1 + 4 ⋅ [lg N ],
(1.1)
где [lg N ] - целая часть числа lg N , определяется число k . Данное число задает количество подынтервалов (классов), на которые разбиваем основной интервал. Длины h подынтервалов и их границы a i i = 0, k вычисляются по формулам
(
h=
)
d , k
(1.2)
a 0 = x min ; a 1 = a 0 + h ; … ; a i = a i −1 + h ; … ; a k = a max . Далее
μj =
mj N
находятся
частоты
(
m j j = 1, k
)
и
(j = 1, k ) попадания значений выборки X в
(1.3)
относительные
частоты
j -й подынтервал. Причем
k
для частот должно выполняться равенство ∑ m j = N , а для относительных j=1
k
частот соответственно ∑ μ j = 1 . j=1
Результаты проведенных расчетов сводятся в таблицы: Таблица 1.2
x m
[a 0 ; a 1 ) [a 1 ; a 2 ) m1 m2
4
…
[a k −1 ; a k ]
…
mk
Таблица 1.3
x μ
[a 0 ; a 1 ) [a 1 ; a 2 ) μ2 μ1
…
[a k−1 ; a k ]
…
μk
Далее находятся середины подынтервалов:
x1 =
a1 + a 0 ; 2
x2 =
a 2 + a1 ; … ; 2
xk =
a k + a k −1 2
и после этого составляется еще одна таблица (табл. 1.4), которая называется статистическим рядом распределения. Статистический ряд распределения является оценкой теоретического ряда распределения и сходится к нему по вероятности. Поскольку ряд распределения является одной из форм задания закона распределения дискретной случайной величины, то мы получили эмпирический закон распределения исследуемой дискретной случайной величины. Таблица 1.4 … x x1 x2 xk
μ
μ1
μ2
…
μk
Сгруппированные данные табл. 1.4 несут в себе меньше информации, чем выборочные, так как в них теряется информация о порядке следования выборочных значений. При группировке также фактически происходит округление наблюдаемых значений выборки внутри j -го класса (подынтервала) до значения x j , что приводит к потере информации о распределении исследуемой случайной величины внутри каждого класса. Это распределение в дальнейшем предполагается равномерным. Преимуществом же сгруппированных данных является их компактность и большая наглядность. В целях визуального изучения полученных в табл. 1.2, 1.3, 1.4 данных пользуются различными способами их графического изображения. К ним относятся гистограмма и полигон. Для построения гистограммы относительных частот используются данные табл. 1.3. В декартовой системе координат на оси OX откладываются μj h границы подынтервалов. По оси OY откладываются величины
(
)
(плотности вероятностей) j = 1, k . Гистограммой относительных частот называется ступенчатая фигура, состоящая из прямоугольников, основаниями которых служат частичные подынтервалы длины h , а высоты равны числам μ j h (плотности
(
)
вероятностей) j = 1, k . Площадь гистограммы относительных частот равна единице. Аналогичным образом, по данным табл. 1.2 строится гистограмма частот. Площадь гистограммы частот равна объему выборки. Для построения полигона относительных частот используются данные табл. 1.4. В декартовой системе координат на оси OX находятся x min и x max , то есть изображаются границы основного интервала. Затем наносятся значения 5
(
)
середин подынтервалов x j j = 1, k . По оси OY откладываются значения,
(
)
соответствующие относительным частотам μ j j = 1, k . Полигоном относительных частот называется ломаная, отрезки которой соединяют точки (x 1 ; μ1 ) ; (x 2 ; μ 2 ) ; … ; (x k ; μ k ) . Полигон относительных частот есть визуальное представление эмпирического закона распределения выборки. ϕ = ϕ(x 1 , x 2 , ... , x N ) Любая функция выборки называется статистикой. Статистика является случайной величиной, так как на различных реализациях выборки она получает различные наблюдаемые значения. Статистиками являются: частоты m j , границы классов a j и их середины x j , размах. Статистический ряд распределения также является статистикой. Из определения статистики следует, что любая функция от статистик также является статистикой, поэтому статистикой является любая функция от сгруппированных данных (табл.1.4). Статистики служат для оценки любых характеристик изучаемой случайной величины: вероятностей случайных событий, связанных с изучаемой величиной, ее числовых характеристик, параметров закона распределения и так далее. Изучение статистик на основе теории вероятностей есть теоретическое ядро математической статистики. 1.3 СТАТИСТИЧЕСКИЕ ОЦЕНКИ ГЕНЕРАЛЬНЫХ ПАРАМЕТРОВ. ТОЧЕЧНЫЕ И ИНТЕРВАЛЬНЫЕ ОЦЕНКИ ДЛЯ МАТЕМАТИЧЕСКОГО ОЖИДАНИЯ И ДИСПЕРСИИ Пусть θ г - некоторый параметр генеральной совокупности, который невозможно вычислить. Но знать его значение (хотя бы приближенное, оценочное) надо! Поэтому по выборочным данным производят расчет статистических оценок данного генерального параметра. Оценки параметров подразделяются на точечные и интервальные. Точечной называется статистическая оценка генерального параметра θ г ,
~
которая определяется одним числом θв .
Интервальной называется оценка генерального параметра θ г , которая
определяется двумя числами
~ θв и
~ ~ θв - концами интервала, покрывающего
оцениваемый генеральный параметр θ г . Для того, чтобы точечная оценка давала «хорошие» приближения оцениваемого параметра, она должна быть: несмещенной, эффективной, состоятельной. Несмещенной называют такую точечную оценку θ в , математическое ожидание которой равно оцениваемому генеральному параметру при любом объеме выборки, то есть 6
M[θ в ] = θ г .
(1.4) Если равенство (1.4) нарушается, то в этом случае оценки θ в называется смещенной. Эффективной называется точечная оценка θ в , которая (при заданном объеме выборки) имеет наименьшую возможную дисперсию, то есть
[
]
M (θ в − θ г )2 ⇒ min .
(1.4а)
θ в , которая (с Состоятельной называется точечная оценка увеличением объема выборки) стремится по вероятности к оцениваемому параметру θ г , то есть для любого достаточно малого δ > 0
lim P ( θг − θв < δ ) = 1 .
(1.4б)
N →∞
Несмещенной оценкой генеральной средней (генерального математического ожидания M г [x ]) служит выборочная средняя (выборочное математическое ожидание): k
M в [x ] = ∑ x j ⋅ μ j ,
(1.5)
j=1
(
)
где x j , μ j j = 1, k - данные из табл. 1.4. Кроме того, M в [x ] является состоятельной оценкой. Если случайная величина X подчинена нормальному закону распределения, то M в [x ] является и эффективной оценкой.
Смещенной оценкой генеральной дисперсии D г [x ] служит выборочная дисперсия:
D в [x ] = ∑ (x j − M в [x ]) ⋅ μ j , k
2
j=1
(1.6)
где M в [x ] - рассчитывается по формуле (1.5), x j , μ j - данные из табл. 1.4. Иногда удобнее пользоваться другой формулой для вычисления выборочной дисперсии: k
D в [x ] = ∑ x 2j ⋅ μ j − (M в [x ])2 . j=1
(1.6a)
Замечание. Поскольку D в [x ] является смещенной оценкой, то ее «исправляют» следующим образом: 7
σ в2 =
N ⋅ D в [x ] . N −1
(1.7)
Полученная оценка σ в2 - это состоятельная несмещенная выборочная дисперсия, а σ в - выборочное среднее квадратичное отклонение. При выборке малого объема (N < 30) точечная оценка может значительно отличаться от оцениваемого генерального параметра, то есть приводить к грубым ошибкам. Поэтому при небольшом объеме выборки следует пользоваться интервальными оценками. Пусть найденная (по данным выборки) статистическая оценка θ в является оценкой неизвестного генерального параметра θ г . Ясно, что θ в тем точнее определяет θ г , чем меньше значение разности θ г − θ в . То есть при
(δ > 0)
чем меньше δ , тем оценка θ г точнее. Значит, положительное число δ характеризует точность оценки. Надежностью (доверительной вероятностью) оценки θ в называется
θг − θв < δ
вероятность γ , с которой осуществляется событие θ г − θ в < δ , то есть
γ = P( θ г − θ в < δ ) .
(1.8)
Обычно надежность оценки (доверительная вероятность γ ) задается. Причем в качестве γ берут число, близкое к единице (0,95; 0,99; 0,999). Доверительным называется интервал, который с заданной надежностью γ покрывает оцениваемый генеральный параметр. В соотношении (1.8), если раскрыть
модуль,
получается
P(θ в − δ < θ г < θ в + δ ) = γ . Тогда интервал (θ в − δ; θ в + δ )
P(− δ < θ г − θ в < δ ) = γ
или
и есть доверительный интервал. Из общих соображений ясно, что длина доверительного интервала будет зависеть от объема выборки N и доверительной вероятности γ . Для
оценки
математического
ожидания
M г [x ]
нормально
распределенной генеральной совокупности X по выборочной средней M в [x ] при известном среднем квадратическом отклонении σ г = доверительный интервал:
M в [x ] − t ⋅
σ σг < M г [x ] < M в [x ] + t ⋅ г , N N
8
D г [x ] служит
(1.9)
σг = δ - точность оценки; N - объем выборки; t - такое значение N γ аргумента функции Лапласа Ф(t ) (приложение 1), при котором Ф(t ) = . 2 Для оценки математического ожидания M г [x ] нормально распределенной генеральной совокупности X по выборочной средней M в [x ] при неизвестном среднем квадратическом отклонении σ г = D г [x ] (при объеме выборки N > 30 ) служит доверительный интервал: где t ⋅
M в [x ] − t γ ⋅
σ σв < M г [x ] < M в [x ] + t γ ⋅ в , N N
(1.10)
где t γ находим по таблице (приложение 2) по заданным N и γ . Для оценки среднего квадратического отклонения σ г нормально распределенной генеральной совокупности X с доверительной вероятностью γ служат доверительные интервалы:
σ в (1 − q ) < σ г < σ в (1 + q ) (при q < 1); 0 < σ г < σ в (1 + q ) (при q > 1 ),
(1.11)
где q – находим по таблице (приложение 3) при заданных N и γ . Замечание 1.1. Оценку θ г − θ в < t ⋅ формулы δ = t ⋅
σг N
называют классической. Из
σг , определяющей точность классической оценки, можно N
сделать выводы: 1) при возрастании объема выборки N число δ убывает, значит, точность оценки увеличивается; 2) увеличение надежности оценки γ приводит к увеличению значения
t (так как γ = 2Ф(t ) и функция Ф(t ) - возрастающая), значит, к возрастанию δ , то есть к уменьшению точности оценки.
Замечание 1.2. В связи со второй частью замечания 1.1 обычно предлагается строить доверительные интервалы для двух значений вероятности γ = 0,95 и γ = 0,99 . Затем провести анализ, как меняются границы интервалов с увеличением доверительной вероятности.
9
1.4 ПРОВЕРКА СТАТИСТИЧЕСКОЙ ГИПОТЕЗЫ О ЗАКОНЕ РАСПРЕДЕЛЕНИЯ ГЕНЕРАЛЬНОЙ СОВОКУПНОСТИ называется любое предположение Статистической гипотезой H 0 относительно закона распределения исследуемой случайной величины X . Гипотезы бывают простые и сложные. Простая гипотеза полностью определяет закон распределения величины X в отличии от сложной. Гипотезы бывают параметрическими и непараметрическими. В первом случае мы имеем предположение о параметрах распределения при известном законе, а во втором – о самом виде закона распределения. ПРИМЕР 1.2. Гипотеза H 0 о том, что математическое ожидание нормальной случайной величины равно M в [x ] при условии, что дисперсия
D г [x ] известна, является простой параметрической. Если же дисперсия D г [x ]
неизвестна, то гипотеза будет сложной параметрической. ПРИМЕР 1.3. Гипотеза H 0 о том, что случайная величина распределена по нормальному (или по какому-то другому) закону, является сложной непараметрической. Наряду с выдвинутой гипотезой H 0 рассматривают противоречащую ей гипотезу H1 . Если выдвинутая гипотеза H 0 будет отвергнута, то имеет место противоречащая ей гипотеза H1 . Критерием проверки статистической гипотезы называется некоторое правило, позволяющее принять ее или отвергнуть. Причем критерии строятся с помощью случайной величины K (часто именно ее называют критерием), для которой известно распределение. Наблюдаемым значением критерия K набл. называют значение критерия, вычисленное по данным выборки. В случае проверки гипотез возможны ошибки: Ошибка 1-го рода состоит в том, что будет отвергнута правильная гипотеза. Вероятность ошибки первого рода α называется уровнем значимости критерия, по которому производится проверка. Ошибка 2-го рода состоит в том, что будет принята неправильная гипотеза. Если β - вероятность ошибки второго рода, то величина 1 − β называется мощностью критерия. Параметрические гипотезы проверяются с помощью критериев значимости, а непараметрические – с помощью критериев согласия. Критической областью называется совокупность значений критерия, при которых нулевую гипотезу отвергают. Если уровень значимости α уже выбран и задан объем выборки, то критическую область следует строить так, чтобы мощность критерия была максимальной. Выполнение этого требования должно обеспечить минимальную ошибку второго рода, что более желательно. Основной принцип проверки статистических гипотез: если K набл. принадлежит критической области – гипотезу H 0 отвергают, если же K набл. принадлежит области принятия гипотезы, то гипотезу H 0 принимают. 10
Остановимся только на гипотезе о законе распределения генеральной совокупности. В 1.2 при группировке данных выборочной совокупности получена табл. 1.4 – эмпирический закон распределения выборки X и по данным этой таблицы построен полигон относительных частот. Относительные частоты иногда называют эмпирическими вероятностями. Из визуального наблюдения полигона делается вывод (выдвигается гипотеза H 0 ) о законе распределения:
H 0 : генеральная совокупность распределена по нормальному закону. И выдвигается гипотеза, противоречащая гипотезе H 0 или ее отвергающая. Проверка гипотезы о предполагаемом законе неизвестного распределения производится при помощи специально подобранной случайной величины – 2 критерия согласия. Разработано несколько таких критериев: χ - Пирсона, 2
Колмогорова, Смирнова и др. Рассмотрим критерий χ - Пирсона, как классический пример применительно к проверке гипотезы о нормальном законе распределения генеральной совокупности. Будем сравнивать эмпирические и теоретические вероятности. Обычно они различаются. Случайно ли это расхождение? Возможно, что расхождение случайно (незначимо) и объясняется либо малым числом исходных данных, либо способом их группировки или другими причинами. Возможно, что данное расхождение неслучайно (значимо) и объясняется тем, что теоретические вероятности вычислены исходя из неверной гипотезы о нормальном распределении генеральной совокупности. Пусть нам задан уровень значимости α ( γ - доверительная вероятность, то есть вероятность принять верную гипотезу; α - это вероятность отвергнуть верную гипотезу, причем α + γ = 1). Для того, чтобы при заданном α проверить гипотезу о нормальном распределении генеральной совокупности, надо вычислить теоретические вероятности. Плотность распределения для нормального закона есть функция:
f (x ) =
2 1 ⋅ e −(x − M [x ]) (2⋅D[x ]) . 2π ⋅ σ
Тогда, пользуясь формулой случайной величины в интервал:
нахождения
(1.12) вероятности
b
p(a < x < b ) = ∫ f (x )dx , a
имеем для всех j = 1, k :
p j = p(a j−1 < x < a j ) =
aj 2 1 ⋅ ∫ e −( x − M в [x ]) (2⋅Dв [x ])dx = 2π ⋅ σ в a j−1
11
попадания
=
a 1 (x j − M в [x ])2 (2⋅Dв [x ]) j ⋅e ⋅ ∫ dx = 2π ⋅ σ в a j−1
(
1 − (x − M [x ])2 ( 2⋅D в [x ]) ⋅e j в ⋅ h , (1.13) 2π ⋅ σ в
)
где a j j = 0; k - границы частичных подынтервалов (см. 1.2);
x j - середина j − го частичного подынтервала; h - длина частичного подынтервала (см. формулу (1.2)). Составляется сводная таблица на основе данных табл.1.4 и рассчитанных теоретических вероятностей: Таблица 1.5 … … x x1 xk
μ p
x2
xj
μ1
μ2
…
μj
…
μk
эмпирические вероят.
p1
p2
…
pj
…
pk
теоретические вероят.
Оценка отклонения эмпирических вероятностей
(
теоретических вероятностей p j j = 1, k
)
(
μ j j = 1, k
)
от
производится с помощью критерия
2
Пирсона χ : 2 χ набл .
k
(μ j − p j )2 ⋅ N
j=1
pj
=∑
(1.14)
. 2
По таблице критических точек распределения χ (приложения 4) по заданному уровню значимости α и числу степеней свободы r = k − 3 ( k 2 количество подынтервалов) находим критическое значение χ кр (α, r ) правосторонней критической области. 2 2 Правило 1.1. Если χ набл. < χ кр. , тогда нет оснований отвергать гипотезу
H 0 о нормальном законе распределения генеральной совокупности (то есть эмпирические и теоретические частоты различаются незначимо (случайно)). 2 2 Правило 1.2. Если χ набл. > χ кр. , тогда гипотеза H 0 отвергается. 1.5 СТАТИСТИЧЕСКАЯ И КОРРЕЛЯЦИОННАЯ ЗАВИСИМОСТИ. ЭМПИРИЧЕСКАЯ И ТЕОРЕТИЧЕСКАЯ ЛИНИИ РЕГРЕССИИ Две случайные величины могут быть связаны между собой функциональной зависимостью, либо зависимостью другого рода, называемой статистической, либо быть независимыми. Строгая функциональная зависимость для случайных величин реализуется редко, так как обе величины (или одна из них) подвержены различным случайным факторам. 12
ПРИМЕР 1.4. Рассмотрим две таблицы значений, которые принимают случайные величины X и Y .
X 1 Y 15
7 3
Таблица 1.6 13 19 25 31 37 25 2 10 16 8
Таблица 1.7 X 1 7 13 19 25 31 37 Y 20 12 15 9 9 3 0
Изобразим эти данные в декартовой системе координат, откладывая значения случайной величины X по оси OX , а значения случайной величины Y по оси OY . y
y 30
30
25
25
20
20
15
15
10
10
5
5
x
0 0
5
10
15
20
25
30
35
x
0
40
0
5
10
Рис.1.1
15
20
25
30
35
40
Рис.1.2
Данные табл.1.6 представлены на рис.1.1, данные табл. 1.7 – на рис.1.2. Из рис.1.1 видно, что данные табл.1.6 не связаны между собой. А вот из рис.1.2 просматривается какая-то зависимость между X и Y , причем выражена обратная зависимость: с увеличением значений случайной величины X , значения случайной величины Y уменьшаются. Статистической называют зависимость, при которой изменение одной из величин влечет изменение распределения другой. Если при изменении одной из величин изменяется среднее значение другой, то в этом случае статистическую зависимость называют корреляционной. Значит, корреляционная зависимость есть частный случай статистической зависимости. Чтобы установить наличие и характер связи между двумя случайными величинами X и Y , нужно привести к удобному виду исходный цифровой материал. Наглядной (удобной) формой представления данных является корреляционная таблица. Таблица 1.8
Y X
y1
y2
…
yj
…
yl
mx
x1
m11
m1 2
…
m1 j
…
m1 l
mx 1
x2
m 21
m22
…
m2 j
…
m2l
mx 2
…
…
…
…
…
…
…
…
13
xi
m i1
mi 2
…
mi j
…
mi l
m xi
…
…
…
…
…
m k1
mk 2
… …
…
xk
… …
mk l
my
m y1
m y2
m xk m
mk j
…
…
m yj
m yl
y1 , y 2 , ... , y l - середины подынтервалов сгруппированных выборок X и Y (см. 1.2); m i j - частота, с которой Здесь
x 1 , x 2 , ... , x k ;
(
)
встречается пара x i ; y j . В последнем столбце и в последней строке таблицы помещены суммарные частоты, соответствующие значению соответственно Y = y i , то есть
X = xi , и
m x i = m i1 + m i 2 + ... + m il ;
m y j = m1 j + m 2 j + ... + m kj , тогда должно быть k
m x1 + m x 2 + ... + m x k = ∑ m x i = m и i =1 l
m y1 + m y 2 + ... + m yl = ∑ m y j = m . i =1
m - общее количество пар значений (x i ; y j ). Каждая i − я строка табл. 1.8 представляет собой (совместно с первой строкой) некоторое распределение случайной величины Y , соответствующее данному значению случайной величины X = x i . Такое распределение называется условным распределением. Последняя строка табл.1.8 совместно с первой строкой образует безусловное распределение случайной величины Y (ее эмпирический закон распределения): Таблица 1.9
Y
y1
y2
…
yj
…
yl
my
m y1
m y2
…
m yj
…
m yl
Каждый j − й столбец табл.1.8 представляет собой совместно с первым столбцом некоторое распределение случайной величины X , соответствующее данному значению случайной величины Y = y j (то есть условное распределение). Последний столбец табл. 1.8 совместно с первым столбцом образует безусловное распределение случайной величины X (ее эмпирический закон распределения): Таблица 1.10 … … X x1 x2 xi xk
mx
m x1
m x2
… 14
m xi
…
m xk
По данным табл. 1.9 и 1.10 вычисляем средние значения:
⎛l ⎞ Y = ⎜ ∑ y j ⋅ m yj ⎟ m ; ⎝ j=1 ⎠
k ⎛ X = ⎜ ∑ x i ⋅ m x i ⎞⎟ m ⎝ i =1 ⎠
(1.15)
и средние квадратические отклонения: k ⎛l ⎞ 2 2 ⎛ 2 σ = ⎜ ∑ (y j − Y ) ⋅ m y j ⎟ m σ X = ⎜ ∑ (x i − X ) ⋅ m x i ⎞⎟ m . ⎝ i =1 ⎠ ⎝ j=1 ⎠ 2 Y
(1.16)
Замечание 1.3. Рекомендуется сделать два рисунка – это графические изображения эмпирических законов распределения случайных величин X и Y в виде распределения частот. На рисунках нанести средние значения X и Y . Уточним определение корреляционной зависимости. Для этого введем понятие условной средней. Для каждой i -й строки табл.1.8 (совместно с первой строкой) можно вычислить среднее значение случайной величины Y (по формуле 1.15), которое называется условным средним: Yx i = Y (X = x i ) (i = 1, 2, ... , k ). Так как каждому значению x i соответствует одно значение условной средней, то, очевидно, условная средняя Yx i есть функция от X . В этом случае
говорят, что случайная величина Y зависит от X корреляционно. Корреляционной зависимостью Y от X называют функциональную зависимость условной средней Yx от X :
Yx = f (X ) .
(1.17)
Уравнение (1.17) называется уравнением регрессии Y на X ; функция f (X ) называется регрессией Y на X ; график функции f (X ) - линией регрессии Y на X . Аналогично для каждого j − го столбца табл.1.8 (совместно с первым столбцом) можно вычислить среднее значение случайной величины X по формуле (1.15), которое называется условным средним: X y j = X Y = y j ( j = 1, 2, ... , l ) .
(
)
Тогда корреляционной зависимостью функциональная зависимость X y от Y :
X y = ϕ(Y ). 15
X
от
Y
называется
(1.18)
Уравнение (1.18) называется уравнением регрессии X на Y ; функция ϕ(Y ) называется регрессией X на Y ; график функции ϕ(Y ) - линией регрессии X на Y . Замечание 1.4. Рассматриваемые два уравнения регрессии существенно различны и не могут быть получены одно из другого. Изучение корреляционной связи будем проводить при решении двух основных задач: - определение формы корреляционной связи, то есть вида теоретической функции регрессии (она может быть линейной и нелинейной); - определение тесноты (силы) корреляционной связи. Наиболее простой и важный случай корреляционной зависимости линейная регрессия. В этом случае теоретическое уравнение линейной регрессии Y на X (формула 1.17) имеет вид
Yx = aX + b .
(1.19)
Коэффициент a в уравнении (1.19) называют коэффициентом регрессии Y на X и обозначают ρ YX (a = ρ YX ) . Оценки неизвестных параметров ρ YX и
b рассчитаем, применяя данные табл.1.8: ⎞ ⎛k l ⎜ ∑ ∑ m ij ⋅ x i ⋅ y j ⎟ m − X ⋅ Y i =1 j=1 ⎠ a = ρ YX = ⎝ . ⎛ k x 2 ⋅ m ⎞ m − (X )2 ⎜∑ i xi ⎟ ⎝ i =1 ⎠
b = Y − ρ YX ⋅ X ,
(1.20)
(1.21)
где X и Y - средние значения случайных величин X и Y , вычисленные по формулам (1.15). Сделаем графическое изображение так называемой эмпирической линии регрессии Y на X и теоретической линии регрессии Y на X . Для этого в декартовой системе координат по оси OX откладываем значения x 1 , x 2 , ... , x k из табл. 1.8, по оси OY откладываем значения условных средних Yx i . Тогда
(
) (x
ломаная, соединяющая точки x 1 , Yx1 ;
2
, Yx 2 ); … ; (x k , Yx k ), и будет
эмпирической линией регрессии Y на X . Здесь же на данном графике строим теоретическую линию регрессии, то есть прямую Yx = ρ YX X + b с вычисленными коэффициентами. Замечание 1.5. Поскольку формулы (1.20) и (1.21) получены по методу наименьших квадратов, то по сути этого метода, теоретическая линия регрессии должна на графике быть в «середине» ломаной.
16
Аналогично можно поставить вопрос о нахождении теоретического уравнения линейной регрессии X на Y (формула 1.18), которое в этом случае имеет вид
X y = a 1 Y + b1 .
(1.22)
a 1 в уравнении (1.22) называют коэффициентом регрессии X на Y и обозначают ρ XY (a 1 = ρ XY ) . Оценки неизвестных параметров ρ XY и b1 рассчитываются по данным табл.1.8: ⎛k l ⎞ ⎜ ∑ ∑ m ij ⋅ x i ⋅ y j ⎟ m − X ⋅ Y i =1 j=1 ⎠ a 1 = ρ XY = ⎝ . (1.23) ⎛l 2 ⎞ 2 ⎜ ∑ y j ⋅ m y j ⎟ m − (Y ) ⎝ j=1 ⎠ Коэффициент
b1 = X − ρ XY ⋅ Y ,
(1.24)
где X и Y средние значения случайных величин X и Y , вычисленные по формулам (1.15). Далее целесообразно сделать графическое изображение эмпирической и теоретической линий регрессии X на Y аналогично вышеизложенному. В случае линейной регрессии задача определения тесноты связи сводится к вычислению эмпирического (выборочного) коэффициента корреляции, который можно вычислить по одной из формул:
rВ = ρ YX ⋅
σX σY
rВ = ρ XY ⋅
или
σY , σX
(1.25)
где σ X , σ Y - значения средних квадратических отклонений, вычисленных по формуле (1.16). Приведем свойства выборочного коэффициента корреляции: 1. rВ < 1 или − 1 ≤ rВ ≤ 1 . 2. Если rВ = 0 , тогда X и Y не связаны линейной корреляционной зависимостью (но могут быть связаны нелинейной корреляционной или даже функциональной зависимостью). 3. С возрастанием абсолютной величины выборочного коэффициента корреляции линейная корреляционная зависимость становится более тесной и при rВ = 1 переходит в линейную функциональную зависимость. 4. Если rВ = 1 (rВ = −1) , тогда X и Y связаны прямой (обратной) линейной функциональной зависимостью. 17
Замечание 1.6. Однако эмпирический коэффициент корреляции является весьма условным показателем даже линейной связи, так как он является средней пропорциональной величиной между коэффициентами регрессии. В теории корреляции существует понятие корреляционного отношения, которое является более естественным и общим показателем степени тесноты связи, так как не связано с формой зависимости.
18
УЧЕБНО - МЕТОДИЧЕСКИЙ КОМПЛЕКС
РАЗДЕЛ 14 «МАТЕМАТИЧЕСКАЯ СТАТИСТИКА»
2. Методические указания для студентов
2.1 ЛАБОРАТОРНАЯ РАБОТА № 1 «Первичная обработка статистических данных» Из данных, входящих в выборку X (табл.1.1) находим x min и x max , соответственно наименьшее и наибольшее значения выборки, и вычисляем число d = x max − x min , называемое размахом выборки. Размах выборки – это длина основного интервала, в который попадают все значения выборки. Далее значения x i i = 1, N , называемые вариантами можно упорядочить, то есть
(
)
расположить в порядке возрастания. Тогда выборка X = {x 1 , x 2 , K , x N }, записанная по возрастанию, называется вариационным рядом. По формуле (2.1) k = 1 + 4 ⋅ [lg N ] ,
где [lg N ] − целая часть числа lg N , определим число k . Данное число k задает количество подынтервалов, на которые разбиваем основной интервал [x max ; x min ]. Вычисляем длину подынтервалов по формуле (2.2) d
h=
k
и затем – границы подынтервалов:
a 0 = x min ; a 1 = a 0 + h;K; a j = a j−1 + h;K; a k = x max .
Находим m j
(j = 1, k ) −
⎛
mj
⎝
N
частоты ⎜⎜ μ j =
(j =1, k ) −
(2.3) относительные
⎞
частоты ⎟⎟ попадания значений выборки X в j − й подынтервал. Причем
⎠
k
должно быть ∑ m j = m1 + m 2 + K + m k = N j=1
k ⎛ ⎞ ⎜⎜ для относительных частот : ∑ μ j = 1⎟⎟ . j=1 ⎝ ⎠
В результате проведенных расчетов, получаем две таблицы:
X m X μ
[a 0 ; a 1 ) [a 1 ; a 2 ) m1
m2
[a 0 ; a 1 ) [a 1 ; a 2 ) μ1
μ2
…
[a k −1 ; a k ]
…
mk
…
[a k −1 ; a k ]
…
μk
Далее, если найти середины подынтервалов: 20
Таблица 2.1
Таблица 2.2
b1 = таблицу.
a1 + a 0 a + a1 a + a k −1 , то получим еще одну ; b2 = 2 ;K; b k = k 2 2 2 Таблица 2.3
b1 μ1
X μ
b2 μ2
…
bk μk
… В целях наглядности полученных в табл. 2.1, 2.2, 2.3 данных пользуются различными способами их графического изображения. К ним относятся гистограмма и полигон. Для построения гистограммы относительных частот используем данные табл.2.2. В декартовой системе координат на оси 0X находим значения x min и
x max и тем самым находим границы основного интервала, в который попадают все значения выборки. Затем на этом интервале откладываем границы подынтервалов. По оси 0Y откладываем величины μ j h (плотности
(
)
вероятностей) j = 1, k . Тогда гистограммой относительных частот назовем ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные подынтервалы длины h , а высоты равны числам μ j h
(
)
(плотности вероятностей) j = 1, k . Аналогично, по данным табл. 2.1, строится гистограмма частот. Для построения полигона относительных частот используем данные табл. 2.3. В декартовой системе координат на оси 0X находим x min и x max , то есть изображаем границы основного интервала. Затем наносим значения середин подынтервалов b j . По оси 0Y откладываем значения, соответствующие относительным частотам μ j . Полигоном относительных частот называют ломаную, отрезки которой соединяют точки (b1 , μ1 ); (b 2 , μ 2 );K; (b k , μ k ) . Данные табл. 2.3 представляют эмпирический закон распределения выборки, а полигон относительных частот есть его визуальное представление. Эмпирической функцией распределения (функцией распределения выборки) называют функцию F* (x ) , определяющую для каждого значения x относительную частоту события X < x . Таким образом, F* (x ) =
N − объем выборки.
nx , где n x − число вариант, меньших x , N
Для каждой реализации выборки эмпирическая функция распределения однозначно определена и обладает всеми свойствами теоретической функции распределения: 1) значения эмпирической функции принадлежат отрезку [0;1]; 2) F* (x ) − не убывающая функция;
21
3) если x 1 − наименьшая варианта, то F* (x ) = 0 при x ≤ x 1 ; если
x k − наибольшая варианта, то F* (x ) = 1 при x > x k .
Эмпирическая функция распределения выборки является оценкой теоретической функции распределения генеральной совокупности. ПРИМЕР 2.1. Дана выборка X из генеральной совокупности объема N=100. Таблица 2.4 254 1158 522 524 972 736 401 347 208 368 1485 812 1032 226 428 368 676 671 587 701 701 1171 443 683 786 895 267 597 51 941 659 400 484 876 570 241 678 127 728 903 424 245 531 986 1017 429 732 1021 430 153 513 520 221 1074 826 65 389 1180 504 325 294 447 1459 589 307 461 1434 559 837 743 382 387 967 446 763 767 349 853 578 652 285 628 688 517 380 375 878 409 109 621 712 476 432 721 1300 577 580 909 690 757 1) Находим из выборки x min и x max , рассчитываем размах выборки d :
x max = 1485 ; x min = 51; d = x max − x min = 1485 − 51 = 1434 .
2) Составим вариационный ряд, для чего всю последовательность выборки расположим в порядке возрастания 51 65 109 127 153 208 221 226 241 245 254 267 285 294 307 325 347 349 368 368 375 380 382 387 389 400 401 409 424 428 429 430 432 443 446 447 461 476 484 504 513 517 520 522 524 531 559 570 577 578 580 587 589 597 621 628 652 659 671 676 678 683 688 690 701 701 712 721 728 732 736 743 757 763 767 786 812 826 837 853 876 878 895 903 909 941 967 972 986 1017 1021 1032 1074 1158 1171 1180 1300 1434 1459 1485 3) Задаем число k − количество частичных подынтервалов, на которое разбиваем нашу выборку X : k = 1 + 4 ⋅ lg 100 = 9 . Исходя из этого вычисляем
1434 ≈ 159,333 и границы подынтервалов 9 (a j−1 , a j ), j = 1,9 , a 0 = x min = 51. a 1 = a 0 + h = 51 + 159,333 = 210,333 ; a 2 = a 1 + h = 210,333 + 159,333 = 369,666 ; a 3 = a 2 + h = 369,666 + 159,333 = 528,999 ;
длину
подынтервалов
h=
22
a4 a5 a6 a7 a8 a9
= a 3 + h = 528,999 + 159,333 = 688,332 ; = a 4 + h = 688,332 + 159,333 = 847,665 ; = a 5 + h = 847,665 + 159,333 = 1006,998 ; = a 6 + h = 1006,998 + 159,333 = 1166,331; = a 7 + h = 1166,331 + 159,333 = 1325,664 ; = a 8 + h = x max = 1485 .
4) Рассчитываем частоты – число попаданий в подынтервалы значений из выборки, то есть m1 , m 2 , K , m 9 .
[51; 210, 333) m1 = 5 [210, 333; 369,666) m 2 = 14 [369,666; 528,999) m 3 = 25 [528,999; 688,332) m 4 = 18 [688,332; 847,665) m 5 = 16 [847,665; 1006,998) m 6 = 10 [1006,998; 1166,331) m 7 = 5 [1166,331; 1325,664) m 8 = 3 [1325,664;1485] m 9 = 3 .
Контроль:
9
∑ mj = N
5 + 14 + 25 + 18 + 16 + 10 + 5 + 3 = 100 .
j=1
На основе полученных данных, заполняем таблицу
X m X m
[51; 210,333)
[210,333; 369,666)
[369,666; 528,999)
[528,999; 688,332)
[688,332; 847,665)
6
14
25
18
16
[847,665; 006,998)
[1006,998; 1166,331)
[1166,331; 1325,664)
[1325,664; 1485]
10
5
3
3
5) Считаем середины подынтервалов b1 , b 2 , L , b 9 и относительные частоты μ1 , μ 2 , K , μ 9 .
bj =
a j−1 + a j
μj =
mj
, j = 1,9 ; N 2 a + a 1 51 + 210,333 b1 = 0 = = 130,666; 2 2 a + a 2 210,333 + 369,666 b2 = 1 = = 290; 2 2 ;
23
a 2 + a 3 369,666 + 528,999 = = 449,3; 2 2 a + a 4 528,999 + 688,332 = 3 = = 608,6; 2 2 a + a 5 688,332 + 847,665 = 4 = = 768; 2 2 a + a 6 847,665 + 1006,998 = 5 = = 927,3; 2 2 a + a 7 1006,998 + 1166,331 = 6 = = 1086,66; 2 2 a + a 8 1166,331 + 1325,664 = 7 = = 1246; 2 2 a + a 9 1325,664 + 1485 = 8 = = 1405,3 . 2 2
b3 = b4 b5 b6 b7 b8 b9
Относительные частоты:
m 6 10 = = 0,1; n 100 m 5 μ7 = 7 = = 0,05; n 100 m 3 μ8 = 8 = = 0,03; n 100 m 3 μ9 = 9 = = 0,03. n 100
m1 6 = = 0,06; n 100 m 14 = 2 = = 0,14; n 100 m 25 = 3 = = 0,25; n 100 m 18 = 4 = = 0,18; n 100 m 16 = 5 = = 0,16; n 100
μ1 = μ2 μ3 μ4 μ5
μ6 =
Контроль: 9
∑μj = 1 j=1
0,06 + 0,14 + 0,25 + 0,18 + 0,16 + 0,1 + 0,05 + 0,03 + 0,03 = 1 . В результате имеем таблицу: Таблица 2.5
X μi
130,6 0,06
290 0,14
449,3 0,25
608,6 0,18
768 0,16
927,3 0,1
1086,6 0,05
1246 0,03
1405 0,03
6) Из данных табл. 2.5, получим эмпирический закон распределения относительных частот и визуальное его представление, то есть строим гистограмму и полигон распределения относительных частот.
24
μj h 0,0016
0,0011 0,001 0,0008 0,0006
0,0003 0,0002
a 0 = 51 a 1 a 2 a 3 a 4 a 5
a 6 a 7 a 8 a 9 = 1485
x
0,3 0,25 0,2 0,15 0,1 0,05 0 b1
b2
b3
b4
b5
b6
b7
b8
b9
x
7) Составим эмпирическую функцию распределения. По определению, для группированного статистического ряда F* (x ), имеет вид
25
x ≤ 51 ⎧0 ⎪0,06 при 51 < x ≤ 210,333 ⎪ ⎪0,2 при 210,333 < x ≤ 369,666 ⎪ ⎪0,45 при 369,666 < x ≤ 528,999 ⎪0,63 при 528,999 < x ≤ 688,332 ⎪ F* (x ) = ⎨0,79 при 688,332 < x ≤ 847,665 ⎪0,89 при 847,665 < x ≤ 1006,998 ⎪ ⎪0,94 при 1006,998 < x ≤ 1166,331 ⎪0,97 при 1166,331 < x ≤ 1325,664 ⎪ ⎪0,99 при 1325,664 < x ≤ 1485 ⎪ при x > 1485 ⎩1 Построим график F* (x ).
F * (x ) 1
0 a =51 0
a1
a2
a3
a4
a5
26
a6
a7
a8
a 9 = 1485 x
2.2 ЛАБОРАТОРНАЯ РАБОТА № 2 «Расчет точечных и интервальных оценок генерального математического ожидания и дисперсии» Пусть θ г − некоторый параметр генеральной совокупности, который невозможно вычислить. Но знать его значение (хотя бы приближенное, оценочное) надо! Поэтому по выборочным данным производят расчет статистических оценок данного генерального параметра. Точечной называют статистическую оценку генерального параметра θ г , которая определяется одним числом θ в . Точечная оценка θ в может быть несмещенной и смещенной. Несмещенной называют такую точечную оценку θ в , математическое ожидание которой равно оцениваемому генеральному параметру при любом объеме выборки, то есть (2.4) M [θ в ] = θ г . Если равенство (2.4) нарушается, то в этом случае точечная оценка θ в называется смещенной. Несмещенной оценкой генеральной средней (математического ожидания M г [x ]) служит выборочная средняя: (2.5) k mj k = ∑bj ⋅μj , M в [x ] = ∑ b j ⋅
N
j=1
j=1
которую считаем по данным таблицы 2.3. Смещенной оценкой генеральной дисперсии D г [x ] служит выборочная дисперсия: (2.6) k k 2 mj 2 = ∑ b j − M в [x ] ⋅ μ j , D в [x ] = ∑ b j − M в [x ] ⋅ j=1
(
)
N
j=1
(
)
где b j ; μ j − из таблицы 2.3. Иногда более удобно пользоваться другой формулой для вычисления выборочной дисперсии: k
D в [x ] = ∑ b 2j ⋅ μ j − (M B [x ])2 .
(2.6а)
j=1
Замечание. Поскольку D в [x ]является смещенной оценкой, то ее «исправляют» следующим образом: (2.7) N ⋅ D в [x ] σ в2 = .
N −1
− это несмещенная дисперсия, а σ в − Полученная оценка выборочное среднее квадратическое отклонение. При выборке малого объема точечная оценка может значительно отличаться от оцениваемого генерального параметра, то есть приводит к σ в2
27
грубым ошибкам, поэтому при небольшом объеме выборки следует пользоваться интервальными оценками. Интервальной называют оценку, которая определяется двумя числами – концами интервала, покрывающего оцениваемый генеральный параметр θ г . Доверительным называют интервал, который с заданной надежностью (доверительной вероятностью) γ покрывает оцениваемый генеральный параметр, то есть с которой осуществляется неравенство θ г − θ в < δ .
Обычно надежность оценки (доверительная вероятность γ ) задается. Причем в качестве γ берут число, близкое к единице (0,95; 0,99; 0,999). Итак, пусть вероятность того, что θ г − θ в < δ равна γ , то есть
P( θ г − θ в < δ ) = γ ,
(2.8)
или
P(θ в − δ < θ г < θ в + δ ) = γ , тогда интервал (θ в − δ; θ в + δ ) и есть доверительный интервал.
Для
оценки
математического
ожидания
M г [x ]
(2.8а)
нормально
распределенной генеральной совокупности X по выборочной средней M в [x ] при известном среднем квадратическом отклонении σ г = доверительный интервал.
M в [x ] − t где t
D г [x ]
σ σг < M г [x ] < M в [x ] + t ⋅ г , N N
служит (2.9)
σг = δ − точность оценки; N − объем выборки; t − это такое N
значение аргумента функции Лапласа Φ(t ) (приложение 1), при котором Φ (t ) = Для
оценки
математического
ожидания
M г [x ]
γ . 2
нормально
распределенной генеральной совокупности X по выборочной средней M в [x ] при неизвестном среднем квадратическом отклонении σ г = объеме выборки N > 30 ) служит доверительный интервал
M в [x ] − t γ ⋅
σв σ < M г [x ] < M в [x ] + t γ ⋅ в , N N
D г [x ] и (при
(2.10)
где t γ находим по таблице (приложение 2) по заданным N и γ . Для оценки среднего квадратического отклонения σ г нормально распределенной генеральной совокупности X с доверительной вероятностью служат доверительные интервалы:
28
σ в (1 − q ) < σ г < σ в (1 + q ) 0 < σг
(при < σ в (1 + q ) (при
q < 1)
(2.11)
q > 1),
где q − находим по таблице (приложение 3) при заданных N и γ .
Замечание. Для M г [x ] предлагается построить доверительные интервалы для двух значений вероятности γ = 0,95 и 0,99 . Провести анализ, как меняются границы интервалов с увеличением доверительной вероятности. ПРИМЕР 2.2. Найти точечные и интервальные оценки генерального математического ожидания и генеральной дисперсии, исходя из данных примера 2.1. 1) По данным таблицы 2.5 рассчитываем выборочное математическое ожидание и выборочную дисперсию, среднее квадратическое отклонение.
M B [x ] = 0,06 ⋅ 130,666 + 0,14 ⋅ 290 + 0,25 ⋅ 449,333 + 0,18 ⋅ 608,666 + + 0,16 ⋅ 768 + 0,1 ⋅ 927,332 + 0,05 ⋅ 1086,66 + 0,03 ⋅ 1246 +
+ 0,03 ⋅ 1405,332 = 619,81.
D B [x ] = (130,666 − 619,81)2 ⋅ 0,06 + (290,0 − 619,81)2 ⋅ 0,14 +
+ (449,333 − 619,81)2 ⋅ 0,25 + (608,666 − 619,81)2 ⋅ 0,18 +
+ (768 − 619,81) ⋅ 0,16 + (927,332 − 619,81) ⋅ 0,1 + 2
2
+ (1086,66 − 619,81) ⋅ 0,05 + (1246 − 619,81) ⋅ 0,03 + 2
2
+ (1405,332 − 619,81)2 ⋅ 0,03 = 91015 . σ B = D B [x ] = 91015 ≈ 301,69 .
По данным табл. 2.4 вычисляем еще одну точечную характеристику N
среднее арифметическое значение нашей выборки X = ∑ x i N : X = 615,80 . i =1
2) Делаем расчет интервальных оценок, то есть будем строить доверительные интервалы с доверительной вероятностью γ . а) γ = 0,95; σ В = 301,69; M B [x ] = 619,81. Ищем соответствующее значение t γ по таблице в приложении 2
t γ = 1,984 . 1,984 ⋅ 301,69 ≈ 59 . Тогда 100 p(619,81 − 59 < M Г [x ] < 619,81 + 59) = 0,95 ; p(560,81 < M Г [x ] < 678,81) = 0,95 . б) γ = 0,99; t γ = 2,627. 2,627 ⋅ 301,69 = 77,83 . δ= 100
Точность оценки δ =
29
p(619,81 − 77,83 < M Г [x ] < 619,81 + 77,83) = 0,99 ; p(531,98 < M Г [x ] < 697,64 ) = 0,99 . Строим полученные относительных частот.
интервалы
на
полигоне
распределения
μ
0,3 0,25 0,2 0,15 0,1 0,05 0
(( b1
b2
b3
M в [x ] = 619,81
b4
))
b5
b6
b7
b8
b9
x
2.3 ЛАБОРАТОРНАЯ РАБОТА № 3 «Проверка гипотезы о законе распределения генеральной совокупности» В лабораторной работе №1 в результате первичной обработки исходных данных получено эмпирическое распределение (табл. 2.3) и по данным этой таблицы построен полигон относительных частот. Относительные частоты иногда называют эмпирическими вероятностями. Из визуального наблюдения полигона можно сделать один из следующих выводов: Гипотеза А о : Генеральная совокупность распределена по нормальному закону; Гипотеза В о : Генеральная совокупность распределена по показательному закону; Гипотеза С о : Генеральная совокупность распределена по равномерному закону. Гипотеза А о . Для того, чтобы при заданном уровне значимости α ( γ − доверительная вероятность, то есть вероятность принять верную гипотезу; α − это
30
вероятность отвергнуть верную гипотезу (α + γ = 1) ), проверить гипотезу о нормальном распределении генеральной совокупности надо: 1. Вычислить М в [х ], σ в (лабораторная работа № 2). 2. Вычислить теоретические вероятности p j плотность распределения для нормального закона есть
f (x ) =
(j = 1, k ).
2 1 ⋅ e −( x − M [x ]) (2 D[x ]) . 2π σ
Поскольку (2.12)
Тогда aj 2 1 ⋅ ∫ e −( x − M В [x ]) (2 D в [x ])dx = 2π σ в a j−1
p j = p (a j−1 < x < a j ) =
=
aj 1 − (b j − M В [x ])2 ( 2 D В [x ]) ⋅e ⋅ ∫ dx = 2π σ В a j−1
1 − (b − M [x ])2 ( 2 D В [x ]) ⋅e j В ⋅ h , (2.13) 2π σ В j = 1, k
где a j − границы частичных интервалов;
b j − середина j − го частичного интервала;
h − длина частичного интервала (см. формулу (2.2)). 3. Составим сводную таблицу на основе данных табл. 2.3 и рассчитанных теоретических вероятностей: Таблица 2.6 … b1 b2 b j … bk X
μ p
μ1
μ2
…
p1
p2
…
μj pj
…
μk
…
pk
← эмпирические вероятности ← теоретические вероятности
4. Оценку отклонения эмпирических вероятностей μ j теоретических вероятностей p j
(j = 1, k )
(j = 1, k )
от
производим с помощью критерия
2
Пирсона χ : 2 χ набл .
k
(μ j − p j )2 ⋅ N
j=1
pj
=∑
(2.14)
. 2
5. По таблице критических точек распределения χ (приложение 4) по заданному уровню значимости α и числу степеней свободы r = k − 3 ( k − 2 количество подынтервалов) находим критическое значение χ кр. (α, r ) правосторонней критической области.
31
2
2
Правило 2.1. Если χ набл. < χ кр. , тогда нет оснований отвергать гипотезу
A 0 о нормальном распределении генеральной совокупности (то есть эмпирические и теоретические частоты различаются незначимо (случайно). 2 2 Правило 2.2. Если χ набл. > χ кр. , тогда гипотезу A 0 отвергаем. Гипотеза B 0 . Для того, чтобы при заданном уровне значимости α , проверить гипотезу о показательном распределении генеральной совокупности надо: 1. Вычислить M В [x ] (лабораторная работа № 1). Принять в качестве оценки параметра λ показательного распределения величину, обратную выборочной средней:
λ=
1
M В [x ]
.
(2.15)
(
)
2. Вычислить теоретические вероятности p j j = 1, k . Поскольку плотность распределения для показательного (экспоненциального) закона есть
при x < 0, ⎧0, f (x ) = ⎨ −λ x ⎩λ ⋅ e , при x ≥ 0,
(2.16)
тогда aj
p j = p (a j−1 < x < a j ) = λ ∫ e −λ⋅x dx =
= − e − λ⋅x
(
)
aj a j−1
(
=−e
a j−1
− λ⋅a j
−e
− λ⋅a j−1
)= e
− λ⋅a j−1
−e
− λ⋅a j
,
где a j j = 1, k − границы частичных интервалов;
λ − вычисляем по формуле (2.15).
3. Составим сводную таблицу на основе данных табл. 2.3 и рассчитанных теоретических вероятностей (см. табл. 2.6). от 4. Оценку отклонения эмпирических вероятностей μ j j = 1, k
(
теоретических вероятностей p j j = 1, k
)
(
)
производим с помощью критерия
2
Пирсона χ (формула (2.14)). 2
5. По таблице критических точек распределения χ по заданному уровню значимости α и по числу степеней свободы r = k − 2 ( k − количество 2 подынтервалов) находим критическое значение χ кр. (α, r ) правосторонней критической области (см. Приложение 4). Далее анализируем в соответствии с правилами 2.1 и 2.2 (для предыдущей гипотезы). 32
Гипотеза С 0 . Для того, чтобы при заданном уровне значимости α , проверить гипотезу о равномерном распределении генеральной совокупности надо: 1. Оценить параметры a и c − концы интервала, в котором наблюдались * * возможные значения x , по формулам (через a и c обозначены оценки параметров): (2.17) a * = M В [x ] − 3 ⋅ σ В , с * = M В [x ] + 3 ⋅ σ В .
(
)
2. Вычислить теоретические частоты p j j = 1, k . Поскольку плотность распределения для равномерного закона есть
f (x ) =
1 , * * c −a
(2.18)
тогда aj
p j = p (a j−1 < x < a j ) = ∫
1
* * a j−1 c − a
= где
1 c* − a *
aj
1
a j−1
c* − a *
⋅ ∫ dx =
dx = (2.19)
⋅ h,
a j ( j = 1, k ) − границы частичных интервалов;
h − длина частичных интервалов.
(
)
Получили, что все p j j = 1, k равны одному числу
h *
c −a
*
.
3. Составим сводную таблицу на основе эмпирических вероятностей и рассчитанных теоретических вероятностей (см. табл. 2.6). 4. Оценку отклонения эмпирических вероятностей μ j j = 1, k от
(
теоретических вероятностей p j j = 1, k
)
(
)
производим с помощью критерия
Пирсона χ 2 (формула (2.14)). 5. По таблице критических точек распределения χ 2 по заданному уровню значимости α и по числу степеней свободы r = k − 3 ( k − количество 2 подынтервалов) находим критические значения χ кр. (α, r ) правосторонней критической области. Далее анализируем в соответствии с правилами 2.1 и 2.2 (см. Гипотезу А). Замечание 2.1. После составления таблицы 5 необходимо сделать на одном рисунке два графика: ломаную эмпирических вероятностей и кривую теоретических вероятностей. Замечание 2.2. Здесь же на этом рисунке рекомендуется нанести: а) M В [x ]; б) доверительный интервал, построенный для одной из доверительных вероятностей γ (например, для λ = 0,95 ); в) интервал, построенный по правилу «3-х сигм». 33
Замечание 2.3. Данный рисунок является наглядным результатом работы, проделанной в Л.Р. 1,2,3. ПРИМЕР 2.3. Используя критерий согласия Пирсона при уровне значимости α = 0,01, проверить гипотезу о нормальном распределении генеральной совокупности. 1) Переносим из лабораторной работы № 1 полигон распределения относительных частот и табл. 2.5.
X
130,6 0,06
μ
290 0,14
449,3 0,25
608,6 0,18
768 0,16
927,3 0,1
1086,6 0,05
1246 0,03
1405 0,03
μ 0,3 0,25 0,2 0,15 0,1 0,05
M в [x ]
0 b1
b2
b3
b4
b5
b6
b7
b8
x
2) Из визуального наблюдения ломаной делаем предположение (ставим гипотезу) о законе распределения генеральной совокупности, то есть ставим гипотезу H 0 : выборка распределена по нормальному закону. 3) Вычислим теоретические вероятности p j . Для этого записываем
функцию плотности f (x ) для нормального закона:
f (x ) = Соответственно f (x ) =
f (x ) = 0,001 ⋅ e
−
( x −619,81)2 2⋅(301, 69 )2
1 ⋅e 2π ⋅ σ B
−
( x − M B [x ])2
1 ⋅e 2 ⋅ 3,14 ⋅ 301,69 . 34
2 σ 2B
−
.
( x − 619,81)2 2⋅(301, 69 )2
или
1 ⋅e 2π ⋅ 301,69
Тогда p j =
1
p1 = 0,003 ⋅
= 0,478 ⋅
1 ⋅e 2π
2π −
p 2 = 0,478 ⋅ p 3 = 0,478 ⋅
⋅e
−
(b j −619,81)2 2⋅(301, 69 )2
(130, 666− 619,81)2 2⋅(301, 69 )2
−
⋅ 159,333 .
⋅ 159,333 =
(1, 62 )2 2
= 0,478 ⋅ 0,1109 = 0,05 ;
1 ⋅e 2π
−
1 ⋅e 2π
(290 − 619,81)2 2 ⋅ (301, 69 ) 2
−
= 0,478 ⋅ 0,2203 = 0,105 ;
(449,333−619,819 )2 2⋅301, 69
2
= 0,478 ⋅
1 e 2π
−
= 0,478 ⋅
1 e 2π
−
(0,565 )2 2
=
= 0,478 ⋅ 0,3391 = 0,162;
p 4 = 0,478 ⋅
1 ⋅e 2π
−
(608,666− 619,819 )2 2⋅301, 69 2
(0, 037 )2 2
=
= 0,478 ⋅ 0,3986 = 0,19;
p 5 = 0,478 ⋅ p 6 = 0,478 ⋅ p 7 = 0,478 ⋅ p 8 = 0,478 ⋅ p 9 = 0,478 ⋅
1 ⋅e 2π
−
1 ⋅e 2π
−
1 ⋅e 2π
−
1 ⋅e 2π
−
1 ⋅e 2π
−
(768−619,819 )2 2⋅301, 69 2
= 0,169;
(927 ,332−619,819 )2 2⋅301, 69 2
= 0,11;
(1086, 66− 619,819 )2 2⋅301, 69 2
= 0,06;
(1246 −619,819 )2 2⋅301, 69 2
= 0,02;
(1405,332− 619,819 )2 2⋅301, 69 2
= 0,007.
4) Составляем табл. 2.7 распределения теоретических вероятностей.
35
X μ p
130,6 0,06 0,05
290 0,14 0,105
449,3 0,25 0,162
608,6 0,18 0,19
768 0,16 0,17
927,3 0,1 0,11
1086,6 0,05 0,06
Таблица 2.7 1246 1405 0,03 0,03 0,02 0,007
Отметим теоретические вероятности на полигоне относительных частот. 2 5) Рассчитаем значение критерия χ выб. .
χ
2 выб.
2 2 2 ( ( ( 0,06 − 0,05) 0,14 − 0,11) 0,25 − 0,16) = ⋅ 100 + ⋅ 100 + ⋅ 100 +
0,05
0,11
0,16
2 2 2 ( ( ( 0,18 − 0,19 ) 0,16 − 0,17 ) 0,1 − 0,11) + ⋅ 100 + ⋅ 100 + ⋅ 100 +
0,19 0,17 0,11 2 2 ( ( 0,03 − 0,03) 0,03 − 0,007 ) + ⋅ 100 + ⋅ 100 = 0,2 + 0,8 + 5,06 + 0,05 + 0,02 0,007 + 0,06 + 0,09 + 0,17 + 0,5 + 7,56 = 14,48 . 2 6) Из таблицы «Критические точки распределения χ » находим 2 соответствующее нашим значениям χ кр. (α, r ) . α = 0,01; r = k − 3 2 k = 9 ⇒ r = 6 . χ кр . (0,01; 6 ) = 16,8 . Сравниваем χ выб. и χ кр. . Так как χ выб. < χ кр. 2
2
2
2
(14,48 < 16,8) ,
то
гипотеза А 0 (выборка распределена по нормальному закону) принимается, по правилу 2.1. 2.4 ЛАБОРАТОРНАЯ РАБОТА № 4 «Расчет параметров корреляционной зависимости» Две случайные величины могут быть связаны функциональной зависимостью, либо зависимостью другого рода, называемой статистической, либо быть независимыми. Строгая функциональная зависимость для случайных величин реализуется редко, так как обе величины (или одна из них) подвержены различным случайным факторам (даже если среди этих факторов есть общие). Статистической называют зависимость, при которой изменение одной из величин влечет изменение распределения другой. Если при изменении одной из величин изменяется среднее значение другой, то в этом случае статистическую зависимость называют корреляционной. Значит, корреляционная зависимость есть частный случай статистической зависимости. Чтобы установить наличие и характер статистической связи между двумя случайными величинами X и Y , нужно привести к удобному виду исходный 36
цифровой материал. Наглядной (удобной) формой представления данных является корреляционная таблица: Таблица 2.8
y1
y2
…
yj
…
yl
mx
x1
m11
m12
…
m1 j
…
m1l
m x1
x2
m 21
m 22
…
m2j
…
m 2l
m x2
…
…
…
…
…
m i1
mi2
… …
…
xi
… …
m il
m xi
…
…
…
…
…
xk
m k1
m kl
m xk
my
m y1
m yl
m
X
Y
m ij
mk2
… …
…
m kj
… …
m y2
…
m yj
…
Здесь x 1 , x 2 , K , x k ; y1 , y 2 , K , y l – середины подынтервалов сгруппированных выборок X и Y (см. лабораторную работу №1); m ij − частота, с которой встречается пара ( x i ; y j ). В последнем столбце и в последней строке таблицы помещены суммарные частоты, соответствующие значению X = x i и, соответственно, Y = y j , то есть
m xi = m i1 + m i 2 + K + m il ;
m yj = m1 j + m 2 j + K + m kj , тогда должно быть k
m x1 + m x 2 + K + m x k = ∑ m x i = m и i =1
l
m y1 + m y 2 + K + m y j + K + m yl = ∑ m y j = m . j=1
m − общее количество пар значений (x i ; y j ). Каждая i − я строка табл. 2.8 представляет собой совместно с первой строкой некоторое распределение случайной величины Y , соответствующая данному значению случайной величины X = x i . Такое распределение называется условным распределением. Последняя строка табл. 2.8 совместно с первой строкой образует безусловное распределение случайной величины Y (ее эмпирический закон распределения): Таблица 2.9 … … Y y1 y2 yj yl
my
m y1
m y2
…
37
m yj
…
m yl
Каждый j − ый столбец табл. 2.8 представляет собой совместно с первым столбцом некоторое распределение случайной величины X , соответствующее данному значению случайной величины Y = y j (то есть условное распределение). Последний столбец табл. 2.8 совместно с первым столбцом образует безусловное распределение случайной величины X (ее эмпирический закон распределения): Таблица 2.10 … … X x1 x2 xi xk
mx
m x1
…
m x2
m xi
…
m xk
По данным табл. 2.9 и табл. 2.10 вычисляем средние значения: k ⎞ ⎛l Y = ⎜ ∑ y j ⋅ m yj ⎟ m ; X = ⎛⎜ ∑ x i ⋅ m xi ⎞⎟ m ⎝ i =1 ⎠ ⎠ ⎝ j=1
(2.20)
и средние квадратические отклонения:
(
)
2 ⎞ ⎛l σ = ⎜ ∑ y j − Y ⋅ m yj ⎟ m ; ⎠ ⎝ j=1 2 Y
(
)
⎛ ⎞ σ 2X = ⎜ ∑ x i − X ⋅ m xi ⎟ m ⎝ i =1 ⎠ k
(2.21)
2
Замечание 2.4. Рекомендуется сделать два рисунка – это графические изображения эмпирических законов распределения случайных величин X и Y в виде полигонов распределения частот. На рисунках нанести средние значения X и Y. Уточним определение корреляционной зависимости. Для этого введем понятие условной средней. Для каждой i − ой строки табл. 2.8 (совместно с первой строкой) можно вычислить среднее значение случайной величины Y (по формуле 2.20), которое называется условным средним Y x i = Y (X = x i ) (i = 1,2, K , k ) . Так как каждому значению очевидно, условная средняя величина
Yxi
xi
соответствует одно значение условной средней, то
есть функция от
X.
В этом случае говорят, что случайная
Y зависит от X корреляционно.
Корреляционной зависимостью Y от X называют функциональную зависимость условной средней Y x от X ;
Y x = f (X ) .
(2.22)
Уравнение (2.22) называется уравнением регрессии Y на X ; функция f (x ) называется регрессией Y на X ; график функции f (x ) - линией регрессии Y на X . 38
Аналогично, для каждого j − го столбца табл. 2.8 (совместно с первым столбцом) можно вычислить среднее значение случайной величины X по формуле (2.20), которое называется условным средним X y j = X Y = y j ( j = 1,2, K , l ) . X от Y называется Тогда корреляционной зависимостью функциональная зависимость средней X y i от Y :
(
)
X y = ϕ(Y ) ,
X на Y ; функция ϕ(Y ) − Y.
уравнение (2.23) называется уравнением регрессии
Y ; график функции ϕ(Y ) − линией регрессии X на
(2.23) регрессией
X на
Замечание 2.5. Рассматриваемые два уравнения регрессии существенно различны и не могут быть получены одно из другого. Изучение корреляционной связи будем проводить при решении двух основных задач: - определение формы корреляционной связи, то есть вида теоретической функции регрессии (она может быть линейной и нелинейной); - определение тесноты (силы) корреляционной связи. Наиболее простой и важный случай корреляционной зависимости – линейная регрессия. В этом случае теоретическое уравнение линейной регрессии Y на X (формула 2.22) имеет вид Y x = a X + b . (2.24) Коэффициент a в уравнении (2.24) называют коэффициентом регрессии X на Y и обозначают ρ YX (a = ρ YX ). Оценки неизвестных параметров ρ YX и b рассчитаем применяя данные табл. 2.8:
a = ρ YX b = Y − ρ YX ⋅ X ,
⎛k l ⎞ ⎜⎜ ∑ ∑ m ij ⋅ x i ⋅ y j ⎟⎟ m − X ⋅ Y i =1 j =1 ⎠ =⎝ . 2 ⎛ k 2 ⎞ ⎜ ∑ xi ⋅ mxi ⎟ m − X ⎝ i =1 ⎠
(2.25)
( )
(2.26)
где X и Y - средние значения случайных величин X и Y , вычисленные по формулам (2.20). Сделаем графическое изображение так называемой эмпирической линии регрессии Y на X и теоретической линии регрессии Y на X . Для этого в декартовой системе координат по оси 0X откладываем значения x 1 , x 2 , K , x k из табл. 2.8, по оси 0Y откладываем значения условных
(
)(
)
средних Yx i . Тогда ломаная, соединяющая точки x 1 , Y x1 ; x 2 , Y x 2 ;K
(x
k , Y xk
) и будет эмпирической линией регрессии Y 39
на X . Здесь же на
данном графике строим теоретическую линию регрессии, то есть прямую Y x = ρ YX ⋅ X + b с вычисленными коэффициентами. Замечание 2.6. Поскольку формулы (2.25) и (2.26) получены по методу наименьших квадратов, то по сути этого метода, теоретическая линия регрессии должна на графике быть в «середине» ломаной линии. Аналогично, можно поставить вопрос о нахождении теоретического уравнения линейной регрессии X на Y (формула 2.23), которое имеет вид X y = a 1 Y + b1 . (2.27) Коэффициент a 1 в уравнении (2.27) называется коэффициентом
(
)
X на Y и обозначается ρ XY a 1 = ρ XY . Оценки неизвестных параметров ρ XY и b1 рассчитываются по данным табл. 2.7:
регрессии
a 1 = ρ XY
⎛k l ⎞ ⎜ ∑ ∑ m ij x i ⋅ y j ⎟ m − X Y i =1 j=1 ⎠ =⎝ . 2 ⎛l 2 ⎞ ⎜ ∑ y j ⋅ m yj ⎟ m − Y ⎝ j=1 ⎠
( )
b1 = X − ρ YX ⋅ Y ,
(2.28)
(2.29)
где X и Y − средние значения случайных величин X и Y , вычисленные по формулам (2.20). Далее целесообразно сделать графическое изображение эмпирической и теоретической линий регрессии X на Y аналогично вышеизложенному. В случае линейной регрессии задача определения тесноты связи сводится к вычислению эмпирического (выборочного) коэффициента корреляции, который можно вычислить по одной из формул:
rB = ρ YX ⋅
σx σ или rB = ρ XY ⋅ Y . σY σx
где σ X , σ Y − значения средних квадратических отклонений, вычисленных по формуле (2.21). Приведем свойства выборочного коэффициента корреляции: 1. rB ≤ 1 или − 1 ≤ rB ≤ 1 ; 2. Если rB = 0 , тогда X и Y не связаны линейной корреляционной зависимостью (но могут быть связаны нелинейной корреляционной или даже функциональной зависимостью); 3. С возрастанием абсолютной величины выборочного коэффициента корреляции линейная корреляционная зависимость становится более тесной и при rB = 1 переходит в функциональную зависимость;
40
4. Если rB = +1 (rB = −1) , тогда X и Y связаны прямой (обратной) линейной зависимостью. Замечание 2.7. Однако эмпирический коэффициент корреляции является весьма условным показателем даже линейной связи, так как он является средней пропорциональной величиной между коэффициентами регрессии. В теории корреляции существует понятие корреляционного отношения, которое является более естественным и общим показателем степени тесноты связи, так как не связано с формой зависимости. Но в тему данного практикума корреляционные отношения не входят. ПРИМЕР 2.4. Дана таблица распределения заводов по объему основных производственных фондов X (млн. руб.) и по суточной выработке продукции Y (тонны). mx 6 12 18 24 30 10 4 4 15 2 6 8 20 2 5 2 9 25 40 8 4 52 30 5 7 7 19 35 8 8 my 6 8 50 17 19 m = 100 Находим эмпирические распределения каждой из компонент, их графические изображения, средние значения и средние квадратические отклонения (2.20) – (2.21). 10 15 20 25 30 35 X
mx m
4 100
8 100
9 100
52 100
19 100
Y my
6
12
18
24
30
6 100
8 100
50 100
17 100
19 100
m
41
8 100
my
mx m
m 0,6
0,6
0,5
0,5 0,4
0,4
0,3
0,3
0,2
0,2
0,1
0,1
0 10
15
20
25
30
X
x
35
0 6
12
18
24
30
Рис. 2.2
Рис. 2.1
9 52 19 8 4 8 + 15 ⋅ + 20 ⋅ + 25 ⋅ + 30 ⋅ + 35 ⋅ = 100 100 100 100 100 100 = (10 ⋅ 4 + 15 ⋅ 8 + 20 ⋅ 9 + 25 ⋅ 52 + 30 ⋅ 19 + 35 ⋅ 8) 100 = 24,9 ; 6 8 50 17 19 Y = 6⋅ + 12 ⋅ + 18 ⋅ + 24 ⋅ + 30 ⋅ = 100 100 100 100 100 = (6 ⋅ 6 + 12 ⋅ 8 + 18 ⋅ 50 + 24 ⋅ 17 + 30 ⋅ 19 ) 100 = 20,1 . X = 10 ⋅
(
σ 2X = (10 − 24,9 ) ⋅ 4 + (15 − 24,9) ⋅ 8 + (20 − 24,9 ) ⋅ 9 + 2
2
2
)
+ (25 − 24,9 ) ⋅ 52 + (30 − 24,9 ) ⋅ 19 + (35 − 24,9) ⋅ 8 100 = 31,99 2
(
2
2
σ 2Y = (6 − 20,1) ⋅ 6 + (12 − 20,1) ⋅ 8 + (18 − 20,1) ⋅ 5 + 2
2
2
)
+ (24 − 20,1) ⋅ 17 + (30 − 20,1) ⋅ 19 100 = 40,6; σ X = 31,99 = 5,66; σ Y = 40,6 = 6,37. 2
2
Перейдем к расчету данных для построения эмпирических линий регрессии Y на X и X на Y , то есть к расчету условных средних
⎛l ⎞ Y (X = x i ) = ⎜ ∑ y i m i j ⎟ m x i . ⎝ j=1 ⎠ Y (X = 10 ) = 6 ⋅ 4 4 = 6; Y (X = 15) = (6 ⋅ 2 + 12 ⋅ 6 ) 8 = 10,5 ; Y (X = 20 ) = (12 ⋅ 2 + 18 ⋅ 5 + 24 ⋅ 2 ) 9 = 18 ; Y (X = 25) = (18 ⋅ 40 + 24 ⋅ 8 + 30 ⋅ 4) 52 = 19,846 ; Y (X = 30 ) = (18 ⋅ 5 + 24 ⋅ 7 + 30 ⋅ 7 ) 19 = 24,632 ; Y (X = 35) = 30 ⋅ 8 8 = 30 , 42
Y
y
k ⎛ ⎞ и условных средних X (Y = y j ) = ⎜ ∑ x i m i j ⎟ m y j ⎝ i =1 ⎠
X (Y = 6 ) = (10 ⋅ 4 + 15 ⋅ 2) 6 = 11,7 ; X (Y = 12 ) = (15 ⋅ 6 + 20 ⋅ 2) 8 = 16,25 ; X (Y = 18) = (20 ⋅ 5 + 25 ⋅ 40 + 30 ⋅ 5) 50 = 25 ; X (Y = 24 ) = (20 ⋅ 2 + 25 ⋅ 8 + 30 ⋅ 7 ) 17 = 26,5 ; X (Y = 30 ) = (25 ⋅ 4 + 30 ⋅ 7 + 35 ⋅ 8) 19 = 31,1 .
Сделаем графическое изображение эмпирических линий регрессии:
X
Y 35
35
30
30
25
25
20
20
15
15
5 0 10
15
20
25
30
35
X y = ϕ(Y )
10
Y x = f (X )
10
5 0
X
6
Рис. 2.3
12
18
24
30
Y
Рис. 2.4
Перейдем к расчету параметров для теоретических линий регрессии Y x = a X + b и X y = a 1 Y + b1 . Прежде чем воспользоваться формулами (2.25) и (2.28), подготовим их общее значение выражения:
С = ∑ ∑ (x i y i m i j ) m = k
l
i =1
j=1
= (10 ⋅ 6 ⋅ 4 + (15 ⋅ 6 ⋅ 2 + 15 ⋅ 12 ⋅ 6 ) + (20 ⋅ 12 ⋅ 2 + 20 ⋅ 18 ⋅ 5 + 20 ⋅ 24 ⋅ 2) + + (25 ⋅ 18 ⋅ 40 + 25 ⋅ 24 ⋅ 8 + 25 ⋅ 30 ⋅ 4 ) + (30 ⋅ 18 ⋅ 5 + 30 ⋅ 24 ⋅ 7 + 30 ⋅ 30 ⋅ 7 ) + + 35 ⋅ 30 ⋅ 8) 100 = (240 + 1260 + 3240 + 25800 + 14040 + + 8400) 100 = 529,8 . 2 2 Знаменатели формул (2.25) и (2.28) есть, соответственно σ X и σ Y , которые у нас уже рассчитаны, поэтому:
a = ρ YX =
529,8 − 24,9 ⋅ 20,1 529,8 − 500,49 29,31 = = = 0,916 ; 31,99 31,99 31,99
b = 20,1 − 0,916 ⋅ 24,9 = 20,1 − 22,81 = −2,71; a 1 = ρ XY =
529,8 − 24,9 ⋅ 20,1 529,8 − 500,49 29,31 = = = 0,722; 40,6 40,6 40,6 43
b1 = 24,9 − 0,722 ⋅ 20,1 = 24,9 − 14,51 = 10,39 . Тогда Y = 0,916 X − 2,71 и X = 0,722 Y + 10,39 . Для графического изображения полученных прямых линий вновь вернемся к рисункам 2.3 и 2.4, чтобы совместить на одном графике эмпирическую и соответствующую ей теоретическую линии регрессии
X
Y
35
35 30
30
25
25
20
20
15
15
10
10
Y = 0,916X − 2,71
5
5
0 10
15
20
25
30
35
X = 0,7224Y + 10,39
0
X
6
12
18
24
30
Y
Рис. 2.4а
Рис. 2.3а
Перейдем к вычислению эмпирического (выборочного) коэффициента корреляции по формуле (2.30):
rB = ρ YX ⋅
σ x 0,916 ⋅ 5,66 = ≈ 0,81 . σy 6,37
Итак. 1. Поскольку rB достаточно близок к единице, то можно утверждать, что между случайными величинами X и Y существует линейная зависимость, причем достаточно тесная. 2. Поскольку rB > 0 , то эта линейная зависимость прямая. Данные выводы можно сделать и из рис. 2.3а, 2.4а.
44
УЧЕБНО - МЕТОДИЧЕСКИЙ КОМПЛЕКС
РАЗДЕЛ: «МАТЕМАТИЧЕСКАЯ СТАТИСТИКА»
3. Материалы для самостоятельной работы студентов
3.1 КОНТРОЛЬНЫЕ ВОПРОСЫ 1. Объяснить, пользуясь теоремой Бернулли, свойство устойчивости относительных частот. 2. Перечислить основные задачи математической статистики. 3. Нахождение статистических числовых характеристик случайной величины из опыта. 4. Задача точечной оценки параметра, различные методы решения. Рассказать сущность метода моментов. 5. Метод максимального правдоподобия. Оценить параметр m x для нормального распределения при известном σ x этим методом. 6. x 1 , x 2 , K , x n являются n − неизвестными наблюдениями над нормально распределенной случайной величиной с неизвестными параметрами. Построить доверительный интервал для m x заданной доверительной вероятности. 7. Сформулировать задачу статистической проверки гипотез. 8. Привести примеры задач на проверку гипотез. 9. Критерии согласия. Применение критерия Пирсона при решении задачи о согласованности теоретического и статистического распределений. 10. Метод наименьших квадратов и его применение для обработки результатов испытаний. 11. Нахождение закона распределения функции случайного аргумента по известному закону распределения аргументов. 12. Дать определение и доказать свойства корреляционного отношения. 13. Сформулировать правило проверки гипотезы о значимости выборочного коэффициента корреляции.
46
3.2 ЛАБОРАТОРНЫЕ РАБОТЫ ЗАДАЧА 1. Дана выборка из генеральной совокупности объема N . По выборке необходимо выполнить следующие три лабораторные работы. Лабораторная работа №1. Первичная обработка статистических данных 1. Построить вариационный ряд. 2. Построить группированную выборку с числом интервалов k = 5 ÷ 9 . 3. Построить гистограмму и полигон частот и (или) относительных частот. 4. Найти эмпирическую функцию распределения и построить ее график. Лабораторная работа №2. Расчет точечных и интервальных оценок генерального математического ожидания и дисперсии. 1. По сгруппированной выборке вычислить точечные оценки математического ожидания и среднеквадратического отклонения. 2. Построить доверительные интервалы для генерального математического ожидания с доверительными вероятностями γ 1 = 0,95 и γ 2 = 0,99 . Лабораторная работа №3. Проверка гипотезы о законе распределения генеральной совокупности. 1. Перенести из Л.Р. №1 график полигона относительных частот. 2. Из визуального наблюдения полигона выбрать один из законов распределения (равномерный, нормальный, показательный) в качестве предполагаемого (теоретического) распределения. 3. Найти параметры теоретического распределения. 4. Построить на одном графике полигон относительных частот (выборочное распределение) и кривую теоретического распределения генеральной выборки. 5. Проверить гипотезу о том, что выборка имеет выбранное теоретическое распределение. Принять уровень значимости α = 0,01. Вариант 1. N = 100; k 1.70 1.51 1.35 1.11 1.52 1.97 1.27 1.43 1.29 1.29 1.59 1.32 1.58 1.32 1.70 1.17 1.25 1.41 1.33 1.87 1.03 1.91 1.74 1.56 1.94 1.69 1.78 1.65 1.39 1.45 1.10 1.40 1.82 1.78 1.24 1.78 1.59 1.47 1.29 1.04
=9 1.45 1.10 1.00 1.89 1.13 1.66 1.00 1.90 1.11 1.20
1.94 1.38 1.33 1.97 1.35 1.11 1.37 1.61 1.86 1.90
47
1.15 1.90 1.29 1.40 1.57 1.56 1.08 1.42 1.73 1.40
1.79 1.07 1.17 1.19 1.48 1.73 1.79 1.63 1.70 1.71
1.35 1.29 1.09 1.24 1.94 1.54 1.72 1.51 1.36 1.04
1.49 1.61 1.50 1.06 1.54 1.10 1.68 1.51 1.92 1.32
Вариант 2. 0.64 0.39 0.06 0.02 0.54 1.13 0.31 0.36 0.63 0.12 0.17 0.07 0.06 0.24 0.22 0.26 0.03 0.43 0.30 0.27
N = 100; k = 7 0.00 0.35 0.47 0.28 0.45 0.04 0.43 0.09 0.08 0.05
0.56 0.13 0.20 0.36 0.07 0.31 0.32 0.18 0.96 0.24
Вариант 3. N = 96; k 12.57 5.83 7.82 10.25 12.86 6.27 12.29 6.56 14.16 8.60 10.32 8.66 6.44 11.20 9.03 9.32 13.57 6.73 8.32 9.11 7.18 8.59 5.58 14.20 13.98 11.54 13.76 12.98 12.14 5.40 6.69 14.85 12.98 10.70 13.66 14.72 Вариант 4. N 1.37 0.42 1.61 0.02 -1.71 1.60 0.98 -0.14 1.19 1.21 2.30 -1.24 -3.12 -3.14 3.11 1.72 1.25 1.68 1.92 -1.60 1.11 -2.95 1.12 2.19
0.05 0.14 0.09 0.91 0.43 0.40 0.16 0.24 0.40 0.03
1.07 0.04 0.25 0.17 0.51 0.12 0.31 0.17 0.22 0.15
0.02 0.42 0.14 0.49 0.84 0.20 0.29 0.10 0.01 0.52
0.01 0.22 0.20 0.08 0.83 0.21 0.60 0.33 0.03 0.16
0.00 0.44 0.01 0.46 0.28 0.60 0.77 0.24 0.94 0.48
=5 14.30 11.14 14.28 7.04 9.02 5.98 8.02 12.03 6.19 5.10 11.71 10.71
14.12 7.90 6.66 11.74 8.14 13.19 11.97 14.69 8.93 10.45 8.89 6.43
8.73 7.46 10.91 7.98 12.70 14.63 14.91 8.57 7.73 11.28 10.48 8.53
6.91 6.99 14.12 12.30 11.05 5.80 10.16 6.39 13.20 7.76 8.02 7.14
10.79 9.69 12.60 7.21 8.56 5.03 12.41 13.10 14.75 8.49 5.83 9.88
1.47 1.48 -2.06 3.12 2.71 -1.98 -0.74 -0.05 -1.46 0.64 -2.29 2.65
3.14 -3.00 -2.67 2.42 0.09 -0.86 -1.04 -0.20 2.29 -2.51 2.61 -2.63
-1.76 2.54 2.50 -2.09 -3.05 3.12 -1.48 2.41 2.65 -2.61 -2.34 1.06
-1.35 1.51 3.14 -2.44 -0.12 -2.47 -0.65 2.95 -0.59 -1.14 2.95 3.12
= 96; k = 7 -0.96 -2.91 3.00 1.93 -3.09 2.74 -2.91 2.92 3.08 -1.72 0.54 2.36
-0.88 -2.59 -0.73 -1.09 1.50 -3.07 -1.47 0.06 1.11 1.05 0.12 0.79
48
0.31 0.08 0.60 0.29 0.37 0.09 0.76 0.44 0.14 0.38
Вариант 5. N = 88; k -3.55 -1.52 -6.23 -2.61 -5.33 -2.73 2.25 5.40 1.10 -4.75 -5.42 -6.19 -6.28 -6.02 -0.16 -1.83 3.03 4.98 -1.65 -5.46 1.72 4.96 -6.25 6.07 5.52 -5.85 1.62 -6.23 -6.23 -3.57 5.22 4.23 -4.62
=5
Вариант 6. N = 99; k 2.17 2.39 2.80 2.53 1.92 2.82 2.23 2.12 1.70 1.97 3.10 2.54 2.72 3.41 2.47 2.36 3.45 2.66 2.53 2.09 2.45 2.58 2.75 2.77 1.93 1.59 1.91 3.23 3.32 2.17 2.87 2.18 3.25
=7
5.94 -5.90 4.60 5.85 -4.45 3.98 -1.57 2.62 2.89 3.59 -4.62
2.54 2.10 2.61 2.61 2.53 2.56 2.11 2.41 2.84 3.35 2.01
Вариант 7. N = 100; k = 9 3.32 5.41 9.86 5.64 11.78 3.69 5.97 5.02 6.67 3.51 7.72 4.44 5.58 7.48 4.20 1.74 2.81 7.54 3.27 1.80 4.16 2.83 8.91 7.96 7.36 4.83 9.56 7.18 2.99 3.71 6.17 5.97 5.42 7.79 8.13 3.32 2.84 3.61 3.78 8.56
5.26 -3.11 -0.31 3.78 -5.15 0.88 -5.36 5.81 -6.17 2.02 6.04
-5.79 2.26 -4.69 -6.04 -5.86 0.14 5.93 -0.63 -0.38 3.13 1.80
-4.96 3.87 4.94 5.69 -3.87 2.82 -4.86 3.77 5.44 1.71 3.11 6.28 6.07 0.12 4.37 4.64 -6.21 -4.71 1.65 -6.16 -6.28 3.80
1.79 2.90 2.38 1.60 3.31 3.43 1.98 2.08 3.12 1.88 1.93
1.77 1.64 1.88 2.61 2.74 1.80 2.19 2.98 2.29 3.30 3.35
2.09 2.93 2.21 1.88 1.67 3.48 2.59 2.08 1.65 3.06 1.78
5.97 4.74 3.25 2.57 3.26 8.03 2.33 10.88 2.21 3.91 7.69 1.42 10.13 1.13 1.72 4.58 6.04 6.04 4.35 5.74
49
6.15 4.94 4.15 5.02 4.74 6.12 6.79 1.02 6.58 4.96
1.65 2.58 2.13 3.15 2.97 2.45 3.20 3.26 2.31 2.07 3.37
2.91 1.72 2.09 2.42 2.46 2.65 2.33 2.64 3.32 2.16 2.32
3.60 4.86 3.57 5.39 12.32 2.97 3.98 4.65 8.23 5.01
2.20 7.82 2.83 1.54 6.06 0.80 4.63 1.03 3.46 2.10
9.09 6.72 3.01 9.13 5.92 2.35 1.34 9.55 3.22 5.67
Вариант 8. N = 96; k -0.99 1.38 0.18 -0.82 1.74 -1.41 0.42 1.62 0.83 1.02 -0.98 0.24 -0.96 -0.57 -0.66 1.66 -1.13 -1.10 1.02 0.31 -0.20 -1.34 0.20 -0.09 -1.42 -0.51 -0.48 0.24 -0.83 -0.05 0.34 0.58 0.50 -0.13 -0.27 -1.68
=7 0.47 1.65 -0.25 1.03 -0.39 1.21 -0.31 -1.16 -0.58 0.21 0.28 -0.46
Вариант 9. N = 100; k = 9 0.79 0.03 0.18 2.51 0.54 1.06 0.12 0.17 0.28 0.54 0.74 1.28 0.26 1.02 0.43 0.37 0.52 0.86 2.53 0.59 1.84 1.12 1.32 1.65 1.37 0.35 1.11 1.17 0.05 1.03 0.51 1.36 2.02 0.95 0.55 0.24 0.09 1.49 0.52 1.63 Вариант 10. N -1.00 0.92 0.65 -0.33 0.28 0.24 -0.83 -0.17 1.00 0.48 -0.95 0.61 0.78 0.17 0.08 -1.00 0.88 -0.74 0.36 0.01 -0.16 -0.27
-0.72 0.84 -0.37 -0.14 0.50 0.05 0.83 1.50 -1.10 0.75 -0.38 1.01
-0.21 1.28 -0.54 0.21 -1.14 -0.20 -1.26 2.95 -0.05 0.61 0.92 -0.29
1.43 0.32 0.76 2.16 -1.32 -2.02 -0.15 -1.09 -0.29 0.10 -1.63 0.39
-1.62 -1.43 1.55 -1.50 -1.44 1.47 -0.11 1.50 -0.66 0.38 -0.09 0.34
2.88 1.42 0.23 0.90 0.76 0.34 0.04 0.23 2.16 3.33
0.59 3.27 1.01 0.16 0.01 1.14 0.15 0.05 0.20 0.52
0.40 0.29 0.41 2.21 1.36 0.61 0.83 0.40 0.12 0.12
0.08 1.57 0.93 0.69 3.20 0.18 2.75 0.87 1.21 0.14
0.02 1.89 0.66 1.06 2.59 0.36 0.20 0.31 1.49 3.19
0.21 -0.77 0.14 -0.21 -0.46 -0.03 0.21 0.32 0.46 -0.29 0.69
0.44 0.15 -0.09 -0.23 -0.81 0.39 -0.48 -0.24 0.64 -0.77 0.40
-0.14 0.67 0.79 -0.92 -0.07 -0.85 -0.29 0.42 0.90 0.40 -0.08
-0.67 -0.99 -0.64 -0.57 -0.59 0.45 0.07 -1.00 0.01 -1.00 -0.81
0.44 0.59 0.30 0.27 1.00 0.29 -0.36 0.24 -0.24 0.15 0.17
= 99; k = 7 0.06 0.19 0.13 -1.00 -0.97 -0.29 0.87 0.98 -0.28 -0.45 -0.27
-0.21 -0.12 -0.37 0.10 -0.42 -1.00 -0.96 0.85 0.36 -0.22 -0.10
50
0.37 0.70 0.05 3.13 1.12 1.88 0.32 0.40 0.97 0.42
Вариант 11. N 0.10 0.11 0.23 0.17 0.08 0.07 0.17 0.04 0.04 0.02 0.03 0.16 0.58 0.01 0.11 0.48 0.37 0.36 0.25 0.05
= 1009; k = 7
Вариант 12. N 0.52 0.08 0.03 0.22 0.12 0.00 0.10 0.03 0.29 0.07 0.19 0.45 0.12 0.04 0.22 0.11 0.13 0.21 0.45 0.15
= 100; k = 7
Вариант 13. N 22.39 13.89 5.87 7.09 2.87 8.75 10.57 12.11 5.96 7.39 16.27 3.75 6.58 8.69 5.63 11.75 7.40 6.22 10.97 9.11 10.22 12.53
= 99; k = 5
Вариант 14. N 3.05 3.20 2.93 2.12 3.86 2.39 2.97 2.03 2.62 3.09
= 100; k = 9
0.78 0.10 0.05 0.07 0.21 0.01 0.10 1.82 0.70 0.29
0.00 0.06 0.03 0.33 0.11 0.15 0.55 0.43 0.16 0.35
8.89 4.31 7.23 19.54 3.35 6.70 6.19 5.16 8.68 3.25 16.18
3.57 3.37 3.08 2.11 2.01
0.06 0.27 0.53 0.13 1.05 0.09 0.79 0.11 0.04 0.17
0.03 0.04 0.24 0.09 0.06 0.22 0.01 0.19 0.06 0.03
0.42 0.46 0.07 0.02 0.37 0.10 0.34 0.02 0.14 0.30
0.22 1.13 1.16 0.00 0.17 0.02 0.50 0.06 0.02 0.03
0.03 0.34 0.04 0.27 0.05 0.00 0.16 0.01 0.20 0.01
0.20 0.96 0.15 0.18 0.05 0.22 0.44 0.36 0.02 0.14
0.01 0.36 0.27 1.14 0.37 0.23 0.39 0.78 0.19 0.30
0.07 0.46 0.15 0.13 0.12 0.24 0.01 0.00 0.02 0.50
0.42 0.22 0.30 0.27 0.02 0.38 0.01 0.05 0.11 0.08
0.00 0.57 0.04 0.02 0.07 0.54 0.01 0.08 0.11 0.04
0.29 0.18 0.13 0.29 0.06 0.04 0.02 0.56 0.27 0.36
0.13 0.11 0.35 0.25 0.05 0.03 0.49 0.10 0.18 0.01
0.31 0.21 0.32 0.09 0.21 0.03 0.59 0.25 0.13 0.12
0.63 0.54 0.02 0.15 0.10 0.32 0.11 0.91 0.21 0.08
3.14 0.14 11.11 12.01 15.16 10.23 10.83 7.02 12.24 11.35 6.16 11.42 8.91 3.73 14.96 14.46 19.13 11.22 2.64 9.00 8.48 12.44 9.60 7.99 14.25 10.29 13.13 15.60 6.20 14.93 17.96 8.92 19.95 14.72 7.36 5.87 10.82 5.68 12.08 16.21 13.01 7.74 14.70 8.37 18.13 9.97 24.35 19.94 8.68 8.96 9.96 3.39 7.89 11.91 12.53 19.96 13.72 6.06 15.21 4.66 10.51 5.20 6.85 7.80 8.86 10.57
3.78 3.32 3.41 3.63 3.05
2.23 3.14 3.82 3.25 3.04 51
3.86 2.13 3.16 3.42 2.54
2.08 3.67 2.77 2.99 3.97
3.06 3.47 2.18 3.99 2.84
3.75 3.60 2.84 2.53 3.53
2.76 3.62 2.74 2.08 3.32
2.23 3.78 2.75 3.19 2.68
3.42 4.00 3.60 2.16 3.31
2.13 3.00 3.32 3.81 2.11
3.35 3.86 3.95 3.29 2.19
Вариант 15. N 1.94 0.93 2.50 0.77 0.35 1.27 1.04 1.09 1.14 0.50 1.68 0.23 0.38 2.61 1.39 1.81 0.59 1.27 1.61 1.42
= 100; k = 7
Вариант 16. N 0.57 0.15 0.12 0.25 0.70 0.61 1.00 0.11 0.89 0.02 0.11 0.58 0.13 0.24 3.25 0.13 1.19 0.21 2.22 0.51
= 100; k = 5
Вариант 17. N -2.50 -1.21 -2.24 -1.49 -2.46 -2.45 -2.26 -1.19 -1.73 -2.68 -1.74 -1.40 -2.13 -1.52 -1.81 -2.66 -2.43 -1.82 -2.69 -1.94 -1.98 -2.03
= 99; k = 7
0.21 0.71 0.88 0.26 2.06 0.53 0.67 2.11 0.43 1.37 0.05 1.62 0.24 0.25 0.66 0.89 0.02 0.95 0.45 0.69
-1.28 -1.78 -1.49 -1.53 -2.87 -2.36 -2.93 -2.12 -2.59 -1.81 -2.64
0.63 1.85 1.21 1.37 0.83 0.16 1.10 1.34 1.67 1.78 2.58 0.60 0.28 0.05 0.90 1.22 1.45 0.39 0.23 1.11
-2.86 -2.58 -1.37 -1.01 -1.23 -1.91 -2.79 -2.21 -2.06 -2.35 -2.06
3.62 2.02 3.68 2.36 3.33
2.50 3.58 2.55 2.84 2.18
3.26 2.55 3.80 2.30 2.22
2.60 3.26 3.70 3.87 2.60
3.31 2.26 2.90 2.25 3.04
2.67 3.61 2.75 2.79 2.80
1.08 0.35 0.48 0.32 0.39 1.39 0.56 2.63 0.99 1.02
2.16 0.77 1.22 0.51 0.62 0.36 2.09 1.11 3.27 0.93
1.47 1.73 0.34 1.98 1.51 0.93 0.90 0.48 0.63 0.24
2.44 2.75 0.97 2.39 0.55 0.54 1.06 1.40 1.79 1.99
0.52 0.92 1.92 0.45 1.18 1.89 0.55 3.00 0.81 0.86
0.70 1.63 1.59 1.07 0.84 1.19 1.63 0.79 1.06 1.58
0.08 0.62 0.15 0.05 0.66 0.46 0.45 0.31 1.84 0.37
0.71 1.12 1.00 0.17 2.44 0.43 0.56 0.83 0.72 0.24
0.17 0.39 1.01 0.38 0.24 0.03 0.19 0.02 0.48 0.34
0.16 0.01 0.53 1.25 0.04 0.50 0.76 2.21 0.51 0.51
0.46 1.08 0.66 0.57 0.18 0.82 0.33 0.15 0.71 0.07
0.12 0.10 0.18 0.10 0.42 0.18 2.29 0.34 0.17 0.51
-1.41 -2.70 -2.71 -1.05 -1.11 -1.76 -2.04 -1.42 -1.17 -1.86 -1.67
-1.80 -2.68 -1.30 -2.05 -2.82 -2.45 -2.64 -1.12 -2.16 -1.49 -2.85
-1.44 -2.54 -2.27 -2.44 -2.24 -2.67 -2.35 -1.59 -2.32 -1.82 -1.44
-2.80 -2.46 -2.47 -2.89 -1.10 -1.09 -2.69 -2.72 -1.41 -2.54 -2.43
-2.75 -2.66 -2.27 -1.58 -2.47 -2.05 -2.72 -2.55 -1.64 -1.52 -1.58
52
Вариант 18. N -2.61 -1.43 -1.57 -2.86 -1.63 -1.52 -1.92 -3.25 -2.08 -3.86 -1.92 -1.01 -1.16 -3.45 -3.26 -2.09 -3.24 -3.92 -3.62 -2.52 -3.92 -1.01
= 99; k = 7
Вариант 19. N -3.98 0.94 -2.27 -3.27 4.26 -4.40 2.05 6.97 0.80 -0.81 -3.86 -1.93 -3.34 3.32 0.71 -0.20 4.06 1.89 -5.62 4.13 -6.13 -4.51 2.65 -1.48
= 96; k = 5
Вариант 20. N 0.59 0.33 0.61 0.82 0.46 0.09 0.31 0.93 1.12 0.69 0.51 0.20 0.97 0.56 0.42 0.17 0.63 0.42 0.85 0.55
= 100; k = 9
-3.37 -3.55 -1.02 -1.70 -2.59 -2.24 -1.43 -1.84 -3.86 -1.45 -2.32
1.99 6.58 1.66 -0.98 3.30 -1.56 4.82 -0.59 -2.31 0.85 5.53 4.04
0.41 0.74 0.82 0.92 0.51 0.55 0.81 0.65 0.52 0.37
-1.26 -3.10 -1.83 -2.19 -1.43 -1.33 -2.89 -1.38 -1.61 -3.20 -2.83
-3.97 3.34 -0.56 4.09 1.13 6.00 6.02 -4.42 -0.36 3.00 -0.34 -2.89
0.73 0.57 0.74 1.25 0.29 0.76 0.38 1.15 0.34 0.53
-1.83 -3.48 -3.09 -3.03 -1.98 -1.66 -2.89 -3.51 -3.71 -2.34 -3.39
-2.76 -3.62 -2.68 -2.16 -1.72 -3.24 -2.15 -2.27 -2.87 -3.94 -2.32
-3.31 -2.33 -2.52 -2.04 -3.15 -1.08 -3.73 -2.36 -2.92 -2.87 -3.88
-3.47 -1.99 -3.26 -3.52 -2.42 -2.26 -1.80 -3.36 -3.90 -1.93 -1.30
5.97 -1.15 -1.23 -5.70 3.17 -0.53 -1.02 -2.17 0.84 8.63 -0.81 1.55
-5.04 0.21 -5.62 -0.42 -4.36 11.80 -2.04 2.42 6.12 1.28 6.48 -5.77
-4.70 3.05 -8.08 -5.25 1.35 0.41 0.97 -2.46 5.13 -5.99 -0.19 1.38
5.87 -2.66 -5.68 1.53 -6.72 -2.32 2.01 -4.65 -1.90 -1.17 -1.09 3.69
0.62 0.68 0.57 0.39 0.23 1.30 0.49 0.11 0.56 0.85
0.14 0.60 0.68 0.32 0.83 0.69 1.07 0.91 0.23 0.40
1.32 0.73 0.69 0.24 0.41 0.67 0.37 0.91 0.81 0.29
0.13 0.79 0.73 0.64 0.86 0.20 0.16 0.46 0.75 0.21
53
-2.69 -3.43 -3.62 -2.45 -1.80 -1.67 -1.99 -3.66 -2.80 -2.36 -3.05
0.24 0.30 0.79 0.47 0.53 0.40 0.78 0.41 0.28 0.82
0.77 0.45 0.35 0.75 0.38 0.67 0.51 0.32 0.72 0.35
Вариант 21. N 1.39 3.56 2.91 0.75 0.61 0.01 2.88 1.28 0.38 0.37 1.32 5.09 1.81 9.96 1.87 1.41 3.88 4.27
= 90; k = 5
Вариант 22. N –1.57 –1.39 –1.55 –0.10 –1.34 1.56 –0.71 –1.57 –1.56 –1.32 0.30 1.70 –1.18 –0.79 –1.55 –1.32 –0.39 –0.15 –1.11 –1.52 0.64 –1.51
= 88; k = 5
Вариант 23. N -1.21 1.31 -3.25 1.06 1.22 3.24 -0.87 1.80 2.25 3.10 -1.79 -0.77 -1.21 -2.30 0.95 1.35 4.47 3.81 0.52 -0.01 -1.62 3.89 0.16 -1.46
= 96; k = 7
1.42 0.81 0.87 1.82 1.61 1.33 5.80 4.14 2.03
–1.57 –0.40 –1.53 –0.33 –0.58 1.05 0.85 –0.71 –0.82 –1.30 0.90
-1.60 -2.04 1.13 1.65 0.56 0.75 0.84 2.49 0.27 -0.24 -0.85 -0.19
2.81 1.90 0.49 0.02 3.06 0.24 0.69 3.61 1.12
–0.90 –1.35 –1.57 1.37 –0.33 –0.92 –1.05 –0.73 –0.49 0.35 –0.47
1.29 0.10 0.87 2.20 0.75 -1.89 -5.61 -0.56 0.82 -1.87 -1.59 1.99
2.27 2.26 0.65 1.00 3.17 4.68 1.43 4.15 4.40
0.67 0.03 0.76 2.52 4.40 0.69 6.17 0.27 3.66
1.90 5.54 0.65 1.00 0.33 4.93 1.69 0.02 2.94
0.07 0.75 6.89 2.19 0.58 1.91 0.10 0.06 0.13
0.15 1.06 –1.56 –1.00 0.05 –1.05 –0.97 –1.41 –0.39 –1.32 –1.56
0.62 1.23 –1.47 1.52 –1.44 –1.30 –1.50 –0.07 0.10 1.38 –0.22
–1.51 –1.48 1.29 1.35 –0.93 –0.45 –1.40 1.56 1.36 –1.56 –1.45
–1.22 –1.28 –0.38 –0.21 0.40 –1.40 0.40 1.17 –0.78 –1.49 –0.66
-2.59 -2.05 -1.73 -3.19 -1.36 -1.16 2.64 0.05 1.24 -0.09 1.49 0.82
2.76 2.82 3.40 -1.96 -0.24 -0.18 -3.94 3.17 -0.23 2.81 1.66 -0.52
-0.85 -0.47 0.87 0.59 1.50 0.60 1.73 1.59 -0.32 3.35 -2.50 -2.62
-0.18 1.88 0.97 -0.98 -0.77 2.61 -1.33 -4.59 -1.33 1.68 -2.53 0.27
54
0.59 2.66 2.19 3.78 0.35 2.20 3.17 0.06 4.90
2.35 0.07 1.37 2.02 4.09 0.27 0.45 0.32 0.94
Вариант 24. N = 100; 2.67 2.41 2.54 3.85 1.91 2.23 2.48 1.99 2.94 1.47 3.05 1.13 1.05 2.47 1.04 2.68 3.55 2.23 2.63 3.59 2.46 3.85 2.38 3.72 1.57 1.17 1.02 3.50 1.49 3.29
k=9 3.12 3.33 2.90 1.74 2.46 3.17 3.42 1.01 1.20 2.24
2.02 2.66 3.58 2.67 3.16 2.60 2.62 1.98 3.00 1.88
2.68 1.49 1.13 2.43 2.16 2.18 3.51 3.54 2.93 3.43
2.57 2.75 3.36 1.98 1.74 1.72 3.53 1.64 2.76 3.43
1.47 3.87 3.70 3.14 1.26 3.08 2.72 2.71 3.38 3.20
1.38 2.36 2.71 3.39 1.54 2.46 1.11 1.33 1.71 2.07
0.06 -0.17 0.51 -0.77 -1.20 0.51 0.23 0.51 -0.30 0.11 0.65
-1.04 1.88 -0.46 -0.09 0.88 -0.34 -0.21 0.03 -0.06 -0.09 0.31
-0.12 0.19 0.60 -0.31 0.13 0.62 -0.40 0.69 0.28 1.28 0.35
-0.62 1.29 0.09 -0.46 0.39 0.84 0.37 0.20 0.07 0.43 0.46
0.63 -0.18 -0.01 -0.10 -0.58 0.10 0.10 -0.60 -0.18 0.74 -0.04
5.22 5.24 9.72 10.32 2.26 4.28 4.43 6.83 7.86 4.84 8.76 5.70 5.31 9.86 10.17 4.32 10.74 8.26 2.21 5.89 3.07 14.59 4.46 7.63 9.67 5.17 3.80 6.88 7.21 13.00
7.36 3.68 8.95 2.41 4.29 0.65 4.61 7.67 3.75 5.77
4.01 3.47 6.76 6.71 2.67 5.97 6.78 1.27 7.32 10.21 3.89 15.80 5.80 9.09 14.34 5.59 3.49 8.53 8.78 4.09
2.08 5.87 0.51 7.28 4.30 6.90 5.04 8.37 5.78 1.09
2.29 -4.95 2.79 -0.83 -3.17
-0.55 -0.36 6.24 1.17 0.45
-6.28 -2.77 1.83 -0.39 2.90
Вариант 25. N 0.51 -0.93 -0.92 -0.24 1.14 0.32 1.06 0.25 -0.06 0.13 -0.17 -0.37 -0.14 -0.40 0.47 -0.41 -0.07 -0.01 0.47 -0.44 -0.25 -0.39
= 99; k = 7
Вариант 26. N 2.54 11.58 14.85 8.12 7.01 11.71 6.59 4.00 4.24 2.45 5.13 5.20 2.94 4.47 3.82 3.87 2.85 6.28 7.12 4.76
= 100; k = 7
Вариант 27. N 2.38 1.58 -2.02 2.75 0.11 -1.45 0.53 -0.26 -2.56 3.45
= 99 k = 5
-0.68 -0.34 -0.07 -0.67 0.60 -0.14 -0.84 0.52 -0.57 0.42 0.31
0.02 -2.70 6.27 1.09 -2.19
-0.03 -0.21 -0.18 -0.32 -0.39 -0.06 0.05 0.02 -0.76 -0.72 0.43
-0.18 1.61 -2.70 6.20 -4.16
-0.51 -0.49 -0.29 -0.28 -0.16 55
2.61 1.22 -3.26 -1.92 -0.13
2.72 3.26 1.42 2.71 1.12 2.57 3.45 2.28 3.65 2.79
3.68 7.01 9.41 9.03 1.53 7.57 3.25 7.43 6.52 6.21
-2.03 -0.53 0.02 -2.66 -1.34 -4.32
0.42 -3.59 -0.19 3.32 1.46 0.41
-3.94 -2.52 -3.92 4.37 0.55 1.85
-0.75 3.86 -2.10 -0.01 -0.86 -1.50
Вариант 28. N 7.24 2.47 3.40 2.15 5.95 0.67 7.08 3.27 5.24 2.54 1.77 0.42 2.34 6.08 4.18 0.60 4.23 5.72 1.25 3.95
= 100; k = 9
Вариант 29. N 36.36 0.21 9.02 34.47 4.24 3.37 8.81 9.63 1.93 2.67 9.15 11.83 11.84 3.07 0.88 1.96 23.86 10.04 11.46 7.28 16.67 2.34
= 99; k = 7
Вариант 30. N 1.46 1.77 5.23 2.92 1.89 4.24 3.90 6.57 4.38 3.39 0.09 2.76 3.79 1.23 4.83 0.63 4.91 0.44 1.08 3.24
= 100; k = 9
3.99 1.56 1.83 3.18 2.46 3.17 5.44 4.15 4.38 2.20
26.80 4.81 11.78 5.02 4.55 0.02 8.06 14.26 7.10 7.45 8.67
6.06 0.04 5.81 2.29 6.97 8.32 0.16 2.70 0.33 0.55
0.83 8.00 4.63 2.63 1.43 7.02 5.37 6.11 1.58 5.11
15.85 4.49 4.64 11.30 4.75 1.20 7.92 4.69 12.10 11.49 23.75
2.25 1.78 3.78 4.76 0.60 0.35 1.49 5.93 0.24 10.24
2.98 -3.30 -1.74 4.84 -0.85 2.58
-3.88 4.52 2.16 -2.32 -2.69 4.02
5.02 -2.86 -0.99 2.29 -1.26 4.00
1.02 -0.16 -2.74 1.18 -0.69 3.20
-4.76 -1.49 3.78 -5.19 -1.33 4.09
5.20 3.01 4.17 1.37 5.70 5.74 4.60 2.24 0.64 1.69
1.93 6.85 2.94 2.29 3.14 4.30 7.58 2.62 2.88 4.19
2.44 4.67 3.84 4.57 5.18 2.84 2.98 5.31 4.83 3.23
3.62 3.10 2.02 0.91 2.37 4.69 8.24 2.21 5.14 2.75
2.97 5.66 1.81 2.08 4.59 3.42 0.73 5.34 1.83 2.95
2.92 7.93 0.79 11.49 8.89 13.16 0.36 25.77 2.85 6.72 11.50
20.63 5.01 3.12 12.19 17.43 7.98 9.09 15.46 11.21 3.94 13.65 9.51 33.06 25.32 6.63 11.69 7.99 0.87 23.55 15.03 3.35 3.20 9.24 10.06 14.30 20.67 3.95 2.39 13.70 33.80 9.51 22.20 3.12 3.65 2.92 15.77 22.15 2.57 8.08 18.04 2.70 5.27 20.93 2.58
0.42 0.57 3.18 1.17 0.56 0.86 0.14 6.25 3.94 2.09
8.41 3.75 0.86 2.95 0.73 2.53 0.31 6.60 3.99 0.74
56
2.04 1.05 6.66 1.45 1.79 2.25 0.77 1.30 4.42 1.05
2.23 7.19 1.05 1.82 9.44 1.29 0.65 4.60 3.00 0.71
4.00 1.88 0.46 2.60 3.96 0.68 2.74 2.56 2.85 0.08
4.24 3.47 4.83 5.18 3.55 1.32 3.58 4.33 5.90 1.99
3.11 0.26 2.18 4.56 0.77 0.02 5.89 0.08 2.01 0.32
Вариант 31. N = 55 17 19 23 20 14 20 15 22 21 13 19 18 21 17 19
18 16 12 20 17
21 14 10 24 13
15 20 21 16 17
16 19 18 20 11
13 15 14 19 18
20 19 14 17 19
18 16 17 18 19
15 19 16 18 17
Вариант 32. N = 55 14 16 20 17 11 17 12 19 18 10 16 15 18 14 16
15 13 9 17 14
18 11 7 21 10
12 17 18 13 14
13 16 15 17 8
10 12 11 16 15
17 16 11 14 16
15 13 14 15 16
12 16 13 15 13
Вариант 33. N = 55 15 17 21 18 12 18 13 20 19 19 15 17 11 17 16
16 14 10 15 18
19 12 8 11 22
13 18 19 15 14
14 17 16 9 18
11 13 12 16 17
18 17 12 17 15
16 14 15 17 16
13 17 14 15 16
Вариант 34. N = 55 16 18 22 19 13 19 14 21 20 12 18 17 20 16 18
17 15 11 19 16
20 13 9 23 12
14 19 20 15 16
15 18 17 19 10
12 14 13 18 17
19 18 13 16 18
17 15 16 17 19
14 18 15 17 16
Вариант 35. N = 55 18 20 24 21 15 21 16 23 22 14 20 19 22 18 20
19 17 13 21 18
22 15 11 25 14
16 21 22 17 18
17 20 19 21 12
14 16 15 20 19
21 20 15 18 20
19 17 18 19 20
16 20 17 19 18
Вариант 36. N = 55 20 22 26 23 17 23 18 25 24 16 22 21 24 20 22
21 19 15 23 20
24 17 13 27 16
18 23 24 19 20
19 18 21 23 14
16 22 17 22 21
23 19 17 20 22
21 22 20 21 22
18 18 19 21 20
57
Вариант 37. N = 55 27 19 33 30 24 30 25 32 31 23 29 28 31 27 29
28 26 22 30 27
31 24 20 34 23
25 30 31 26 27
26 29 28 30 21
23 25 24 29 28
30 29 24 27 29
28 26 27 28 29
25 29 26 28 27
Вариант 38. N = 55 19 21 25 22 16 22 17 24 23 15 21 20 23 19 21
20 18 14 22 19
23 16 12 26 15
17 22 23 18 19
18 21 20 22 13
15 17 16 21 20
22 21 16 19 21
20 18 19 20 21
17 21 18 20 19
Вариант 39. N = 55 26 28 32 29 23 29 24 31 30 22 28 27 30 26 28
27 25 21 29 26
30 23 19 33 22
24 29 30 25 26
25 28 27 29 20
22 24 23 28 27
29 28 23 26 28
27 25 26 27 28
24 28 25 27 26
Вариант 40. N = 55 21 23 27 24 18 24 19 26 25 17 23 22 25 21 23
22 20 16 24 21
25 18 14 28 17
19 24 25 20 21
20 23 22 24 15
17 19 18 23 22
24 23 18 21 23
22 20 21 22 23
19 23 20 22 21
Вариант 41. N = 55 22 24 28 25 19 25 20 27 26 18 24 23 26 21 24
23 21 17 25 22
26 19 15 29 18
20 25 26 21 22
21 24 23 25 16
18 20 19 24 23
25 24 19 22 24
23 21 22 23 24
20 24 21 23 22
Вариант 42. N = 55 25 27 31 28 22 28 23 30 29 21 27 26 29 25 27
26 24 20 28 25
27 22 18 32 21
23 28 29 24 25
24 27 26 28 19
21 23 22 27 26
28 27 22 25 27
26 24 25 26 27
23 27 24 26 25
58
Вариант 43. N = 55 23 25 29 26 20 26 21 28 27 19 25 24 27 23 25
24 22 18 26 23
27 20 16 30 19
21 26 27 22 23
22 25 24 26 17
19 21 20 25 24
26 25 20 23 25
24 22 23 24 25
21 25 22 24 23
Вариант 44. N = 55 24 26 30 27 21 27 22 29 28 20 26 25 28 24 26
25 23 19 27 24
28 21 17 31 20
22 27 28 23 24
23 26 25 27 18
20 22 21 26 25
27 26 21 24 26
25 23 24 25 26
22 26 23 25 24
Вариант 45. N = 55 28 30 34 31 25 31 26 33 32 24 30 29 32 28 30
29 27 23 31 28
32 25 21 35 24
26 31 32 27 28
27 30 29 31 22
24 26 25 30 29
31 30 25 28 30
29 27 28 29 30
26 30 27 29 28
Вариант 46. N = 100; k = 9 113 50 52 62 6 64 202 188 70 65 25 75 60 152 27 98 23 100 119 7 9 18 294 101 105 26 203 48 172 72 3 137 72 17 36 25 11 217 469 49
41 26 38 3 83 33 211 92 119 197
104 116 265 108 38 142 40 95 99 1
135 175 323 77 19 48 317 18 88 23
268 267 164 106 176 57 116 167 2 136
29 193 144 205 69 38 566 147 12 77
113 257 63 8 138 14 102 141 125 72
Вариант 47. N = 100; k = 9 91 99 106 93 100 94 99 114 97 109 95 101 98 112 100 106 111 116 108 94 102 101 97 88 82 111 101 127 98 118 110 85 112 97 109 100 112 102 89 99
96 101 91 89 90 86 103 85 100 113
91 91 93 103 80 80 94 89 98 89
96 106 98 114 94 83 102 95 96 80
111 101 101 99 98 116 100 107 85 94
86 114 99 108 92 100 86 117 99 93
99 97 115 101 103 103 88 91 101 93
59
Вариант 48. N = 100; k = 9 365 282 10 218 52 80 384 233 139 274 239 187 181 22 57 89 42 112 228 245 200 299 279 262 392 37 355 253 380 310 246 66 43 393 295 243 58 317 73 353
126 37 301 43 153 227 221 234 148 166
341 18 66 203 139 367 136 236 376 113
340 211 128 314 342 107 232 148 324 42
140 369 87 137 197 384 206 242 318 143
58 96 43 272 290 358 152 156 309 248
378 87 266 50 234 140 296 387 391 45
Вариант 49. N = 100; k = 9 69 11 39 86 149 10 68 46 34 7 79 38 4 79 55 80 4 10 27 236 123 96 117 16 83 135 92 67 27 51 58 53 28 29 213 96 130 37 15 44
74 70 144 136 70 10 87 8 100 68
46 56 54 12 171 76 20 54 47 82
132 275 28 13 324 40 3 12 114 18
106 25 11 45 75 253 8 59 193 50
13 34 50 25 20 86 167 30 82 112
49 47 7 11 70 3 53 38 5 2
Вариант 50. N = 100; k = 9 204 218 212 146 177 202 260 235 170 168 199 156 222 196 227 149 177 174 200 142 168 217 139 228 194 216 233 187 212 230 207 179 224 242 194 166 131 227 163 221
209 196 218 244 196 226 172 220 180 211
241 170 174 231 219 240 205 191 142 198
188 154 242 187 224 213 181 203 130 219
241 190 218 193 152 206 156 207 284 236
248 198 177 231 153 173 147 159 189 146
264 137 185 136 214 273 151 213 213ё 189
Вариант 51. N = 100; k = 9 22 4 164 205 199 83 70 54 140 63 51 31 67 250 455 1 69 274 1 540 235 361 62 115 356 77 128 256
188 308 81 141 83 84 36
27 176 2 19 199 519 75
26 36 15 104 9 182 55
11 159 32 78 143 98 520
351 355 114 309 74 105 307
376 58 24 75 88 277 147
60
42 765 67
23 84 126
431 284 198
5 157 15
1 105 301
105 50 26
133 92 1
122 263 216
273 154 185
272 139 194
Вариант 52. N = 100; k = 9 78 75 80 107 112 81 102 85 95 82 98 66 78 93 83 74 61 66 84 84 116 79 79 82 106 84 119 86 87 103 63 86 83 91 103 100 92 93 103 80
92 68 81 75 102 67 105 84 42 87
114 100 81 124 93 119 106 89 96 62
49 78 92 57 95 114 78 100 104 86
79 88 82 78 102 74 104 113 94 110
57 76 107 104 92 88 81 70 145 109
99 60 140 80 93 66 95 87 80 66
Вариант 53. N = 100; k = 9 59 299 101 80 346 34 227 131 268 8 174 105 137 57 64 276 228 24 42 14 34 179 102 29 29 31 55 2 51 324 71 17 161 4 137 117 153 2 41 241
93 38 331 76 81 277 18 25 161 429
576 215 70 33 337 74 79 9 121 142
78 29 347 196 179 50 48 112 539 152
314 394 433 80 32 11 244 106 25 55
56 159 67 36 50 51 36 529 279 525
122 509 100 466 95 114 9 17 1 201
Вариант 54. N = 100; k = 9 123 117 152 95 152 85 88 162 127 168 164 187 81 110 122 132 60 90 110 157 101 155 140 139 73 130 155 91 107 125 112 102 107 118 167 161 146 73 70 121
152 152 99 104 112 119 134 154 135 106
128 81 107 148 162 156 121 99 114 61
107 84 116 144 92 115 112 119 131 127
97 169 160 112 113 148 129 136 144 115
170 151 117 138 179 162 117 90 143 176
81 138 113 116 156 197 160 133 133 70
61
Вариант 55. N = 100; k = 9 154 191 196 125 134 99 7 9 257 332 27 135 104 91 217 77 112 58 214 147 24 72 104 78 253 6 3 15 178 318 18 75 52 429 466 233 92 210 142 310
219 34 204 152 163 170 14 75 278 89
22 136 192 12 158 97 60 24 237 59
27 261 68 250 36 101 122 19 84 21
98 216 55 196 164 59 40 312 112 182
84 6 51 12 59 20 84 57 97 284
157 168 11 90 31 140 66 32 915 20
Вариант 56. N = 100; k = 9 89 128 87 109 139 92 89 107 109 100 72 87 97 111 100 113 75 113 113 100 65 89 99 96 103 129 119 139 92 97 82 78 89 128 113 75 102 86 105 80
138 112 108 80 72 98 145 110 83 103
110 106 82 88 106 111 86 66 80 105
119 101 109 102 112 39 136 87 107 102
129 82 134 62 95 92 64 93 133 106
120 121 74 124 68 114 80 136 123 95
137 121 106 74 101 91 122 122 91 59
Вариант 57. N = 100; k = 9 142 372 274 336 414 272 58 343 442 475 217 318 74 332 170 138 105 199 67 212 305 396 71 272 383 316 126 272 399 142 415 161 310 152 80 338 343 308 475 215
252 192 90 77 385 277 62 209 198 358
172 85 66 476 267 431 423 152 484 234
148 142 100 290 405 225 237 378 106 453
307 283 313 484 385 497 106 406 449 227
325 360 387 182 473 354 173 88 305 150
111 176 244 444 95 308 473 137 304 138
Вариант 58. N = 100; k = 9 103 153 308 10 188 115 4 42 22 52 152 50 10 556 34 89 63 65 196 479 3 233 26 119 170 104 58 156
180 317 111 26 220 174 180
30 27 81 28 33 78 66
480 25 94 92 197 45 342
18 227 213 65 57 592 124
148 187 523 250 12 54 15
191 136 129 201 190 122 476
62
87 23 41
6 382 251
38 56 9
45 48 170
169 10 144
34 17 35
115 0 193
10 275 118
176 563 82
13 48 58
Вариант 59. N = 100; k = 9 92 135 67 85 89 196 110 117 102 169 153 109 43 139 120 156 55 138 96 127 90 117 147 158 120 148 152 122 136 115 112 55 113 166 86 149 119 153 114 58
140 140 162 143 105 128 101 177 144 125
136 233 129 34 146 120 86 195 125 172
79 116 61 139 106 120 153 123 74 105
164 165 53 153 184 160 120 84 162 205
91 100 113 52 139 158 160 111 101 168
96 82 148 107 176 210 149 95 31 97
Вариант 60. N = 100; k = 9 485 98 116 102 420 105 356 38 82 150 171 12 53 44 233 9 40 42 517 42 25 2 270 38 433 45 69 22 131 90 34 32 130 61 64 40 30 0 28 4
109 266 0 125 96 258 505 133 35 1
357 201 119 202 35 59 108 157 139 48
73 3 84 314 94 17 59 154 20 353
208 94 17 215 9 26 131 42 772 52
49 52 221 27 101 342 22 171 10 25
7 49 3 59 292 73 157 61 8 13
Вариант 61. N = 100; k = 9 254 284 148 262 265 160 266 200 291 254 317 288 154 307 239 283 302 239 345 270 263 296 129 210 241 204 209 246 269 266 187 247 259 214 287 258 200 257 215 307
267 224 236 105 261 262 193 221 286 259
303 218 269 277 193 245 239 262 274 168
181 301 249 245 232 286 357 176 250 267
303 201 223 306 217 298 223 242 283 203
288 284 286 278 270 302 242 285 205 253
288 165 308 219 229 249 216 197 185 202
Вариант 62. N = 100; k = 9 102 159 175 168 18 72 22 0 10 293 84 143
274 185 39
47 13 33
61 20 35
87 48 12
54 65 50
40 103 57
63
62 44 189 39 9 178 47
69 151 52 72 51 89 30
42 508 17 99 204 43 156
3 62 120 157 30 79 130
15 2 75 10 67 193 15
215 76 27 191 18 33 156
123 32 188 52 40 138 68
11 136 186 182 42 111 69
10 87 18 86 100 28 350
14 48 170 37 40 79 104
Вариант 63. N = 100; k = 9 310 276 378 328 351 337 379 410 406 271 264 402 339 357 335 421 350 369 332 320 431 474 324 405 250 333 299 415 346 361 334 304 394 345 183 299 461 349 352 361
296 302 365 446 304 447 280 321 401 327
333 311 298 372 283 236 410 296 262 286
281 325 363 195 378 300 223 266 278 323
333 308 337 395 252 431 350 299 243 302
224 268 247 279 340 318 313 282 333 369
398 343 329 350 315 227 300 426 287 261
Вариант 64. N = 100; k = 9 5 133 81 22 109 7 9 19 51 74 84 97 3 57 123 80 134 28 23 115 35 40 16 18 36 183 58 57 177 147 54 4 99 56 31 166 58 56 48 323
59 15 28 205 40 173 18 110 73 22
58 0 38 18 3 14 27 18 31 90
102 118 44 40 56 92 51 28 20 137
10 86 214 101 63 9 2 129 3 406
29 156 185 98 4 78 47 80 63 90
135 25 88 37 172 36 11 68 14 78
Вариант 65. N = 100; k = 9 352 506 594 565 571 573 330 636 501 593 531 496 552 517 557 663 556 709 447 450 666 594 562 389 365 455 503 433 446 538 732 584 494 509 592 627 593 354 555 397
588 474 507 613 590 648 504 560 635 692
556 651 555 635 503 628 541 723 446 654
663 599 457 372 532 541 419 503 462 555
454 575 530 447 504 659 471 540 615 678
573 619 459 526 495 631 440 646 499 553
465 506 323 614 502 515 599 663 484 612
64
Вариант 66. N = 100; k = 9 129 246 11 191 147 67 103 36 89 27 19 34 12 119 5 135 14 35 119 46 11 41 4 150 100 20 89 146 204 61 19 106 410 20 21 271 79 10 1 102
374 142 61 24 1 194 38 15 122 62
75 109 63 131 18 37 70 58 55 54
249 57 117 110 35 22 31 84 355 94
20 128 184 64 117 202 81 23 152 258
55 208 28 1 63 104 32 5 38 10
113 255 71 9 36 71 54 162 203 155
Вариант 67. N = 100; k = 9 329 255 99 178 260 306 367 253 333 227 250 288 175 150 294 255 166 181 360 217 181 278 280 214 189 315 281 195 352 317 206 267 287 105 287 208 182 254 315 312
316 261 199 335 128 268 283 273 250 381
290 248 322 320 147 278 203 227 328 218
216 309 176 221 221 168 385 212 100 236
217 209 294 242 273 283 201 230 186 220
389 308 267 387 286 272 209 235 279 248
284 207 86 248 393 255 322 156 252 240
65
ЗАДАЧА 2 Дана корреляционная таблица. По данным таблицы необходимо выполнить следующие две лабораторные работы. Лабораторная работа №4. Расчет параметров корреляционной зависимости (прямая или обратная линейная зависимость). 1. Найти эмпирические распределения каждой из компонент, сделать их графическое изображение. 2. Вычислить средние значения X и Y и средние квадратические отклонения σ x ; σ Y . 3. Вычислить эмпирические линии регрессии Y = Y (X ) и X = X (Y ) , сделать отдельные графики этих линий. 4. Рассчитать параметры теоретических линий регрессии Yx = a X + b и X y = a 1 X + b1 . Сделать графики этих линий, располагая каждую на графике соответствующей эмпирической линии. Лабораторная работа №5. (на усмотрение преподавателя). Расчет параметров корреляционной зависимости (квадратичная зависимость). Пункты 1 – 3 – те же, что и в лабораторной работе №4. 5. Используя метод наименьших квадратов (см. литературу [5]), вычислить параметры квадратичной зависимости Y(X ) = a 1 X 2 + b1 X + C1 и
X(Y ) = a 2 Y 2 + b 2 Y + C 2 (можно только одну зависимость).
6.На графике соответствующей эмпирической зависимости построить график полученной теоретической квадратической зависимости. Вариант 1. В табл. 2.1. дано распределение 55 однотипных предприятий по количеству выпускаемых изделий X (тыс. шт.) и полным затратам на их производство Y (млн. руб.): Таблица 2.1
Y
X
50 – 80 80 – 110 110 – 140 140 – 170 170 – 200 200 – 230 Итого 25 - 35 5 5 35 – 45 4 12 16 45 – 55 8 5 4 17 55 – 65 1 5 7 2 15 65 – 75 1 1 2 Итого 9 21 10 11 3 1 55 Используя соответствующее уравнение регрессии, оценить среднее значение полных затрат на производство 53 тыс. деталей. Вариант 2. В табл. 2.2 дано распределение 100 заводов по объему основных производственных фондов X (млн. руб.) и по суточной выработке продукции Y (т): 66
Таблица 2.2
X 4–8 8 – 12 12 – 16 16 – 20 20 – 24 Итого
5 – 15 1 2 3
15 – 25 3 6 1 1 11
Y
25 – 35 7 9 16
35 – 45 1 16 8 25
45 – 55 21 4 5 30
55 - 65 10 3 2 15
Итого 4 16 57 16 7 100
Используя соответствующее уравнение регрессии, оценить среднюю суточную выработку продукции на заводах с объемом основных фондов 18 млн. руб. Вариант 3. В табл. 2.3 дано распределение 60 предприятий по величине основных промышленно-производственных фондов X (млн. руб.) и себестоимости продукции Y (руб.)
X 15 – 30 30 – 45 45 – 60 60 – 75 75 – 90 Итого
16 – 24 1 4 1 6
24 – 32 7 7 2 16
Y
32 – 40 4 12 2 18
40 – 48 8 6 14
48 – 56 2 4 6
Итого 2 16 26 13 3 60
Используя соответствующее уравнение регрессии, определить среднюю себестоимость продукции для предприятий с основными промышленнопроизводственными фондами 65 млн. руб. Вариант 4. В табл. 2.4 дано распределение 50 магазинов по уровню издержек обращения X (%) и по годовому объему товарооборота Y (млн. руб.) Таблица 2.4
X 4–6 6–8 8 – 10 10 – 12 12 – 14 Итого
0,5 – 2 ,0 2 3 1 6
2,0 – 3,5 4 5 1 10
Y
3,5 – 5,0 8 5 5 18
67
5,0 – 6,5 3 8 2 13
6,5 – 8,0 2 1 3
Итого 5 21 14 9 1 50
Используя соответствующее уравнение регрессии, определить среднее значение уровня издержек обращения в магазинах с годовым объемом товарооборота 4,2 млн. руб. Вариант 5. В табл. 2.5 дано распределение 200 совхозов по затратам труда X (чел.-дн. на 1 ц зерна) и себестоимости Y (руб. за 1 ц зерна) Таблица 2.5
Y
X
7,25 – 9,25 – 11,25 – 13,25 – 15,25 – Итого 9,25 11,25 13,25 15,25 17,25 0,4- 0,8 14 14 0,8 -1,2 22 10 32 1,2-1,6 38 30 10 78 1,6-2,0 6 30 12 2 50 2,0-2,4 4 8 8 20 2,4-2,8 6 6 Итого 36 54 64 30 16 200 Используя соответствующее уравнение регрессии, оценить средние затраты труда на получение 1 ц. зерна себестоимостью 15 р. за 1 ц. Вариант 6. В табл. 2.6 дано распределение 100 магазинов по величине 2 товарооборота X (млн. руб.) и размеру торговой площади магазина Y ( м ). Таблица 2.6
X 1,0-1,5 1,5-2,0 2,0-2,5 2,5-3,0 3,0-3,5 Итого
100 – 150 4 4
Y
180 – 200 12 4 2 18
200 – 250 2 9 10 4 25
250 – 300 9 18 9 3 39
300 – 350 11 3 14
Итого 18 22 30 24 6 100
Используя соответствующее уравнение регрессии, найти среднюю 2 величину товарооборота магазинов, имеющих торговую площадь 220 м . Вариант 7. В табл. 2.7 дано распределение 100 проб руды, добытой на руднике, по содержанию окиси X (%) и закиси железа Y (%): Таблица 2.7
X
50 – 80
80 – 110
110 – 140
40 – 50 50 – 60 60 – 70
-
6
1 2 14
Y
140 – 170 6 18 2 68
170 – 200 4 10 2
200 – 230 Итого 6 2 -
17 32 24
60 – 70 6 14 2 2 24 70 – 80 6 3 9 80 – 90 4 8 12 90-100 6 6 Итого 10 20 20 26 16 8 100 Используя соответствующее уравнение регрессии, оценить среднее количество окиси железа в руде, содержащей 25% закиси железа. Таблица 8. Данные о живом весе X (кг) и молочной продуктивности Y (кг) 80 коров приведены в табл. 2.8. Таблица 2.8
X
1250-1750
17502250 2
Y
22502750 -
27503250 -
32503750 -
Итого
3253 5 375 3758 7 1 16 425 4252 5 10 17 475 47513 10 7 30 525 5257 5 12 575 Итого 3 12 25 28 12 80 Используя соответствующее уравнение регрессии, оценить среднюю молочную продуктивность коров весом 450 кг. Вариант 9. В табл. 2.9 дано распределение детей четырехлетнего возраста по росту X (см) и весу Y (кг): Таблица 2.9
Y
X
15,5-16,5 16,5-17,5 17,5-18,5 18,5-19,5 19,5-20,5 Итого 98-100 2 3 5 100-102 3 6 4 13 102-104 1 4 13 5 23 104-106 1 14 10 2 27 106-108 10 8 5 23 108-110 6 3 9 Итого 6 14 41 29 10 100 Используя соответствующее уравнение регрессии, определить средний вес детей ростом 107 см.
69
Вариант 10. В табл. 2.10 дано распределение 80 совхозов по числу рабочих X (чел.) на 100 га сельскохозяйственных угодий и объему валовой продукции Y (тыс. руб.). Таблица 2.10
Y
X
30 – 70 70 – 110 110 – 150 150 – 190 190 – 230 Итого 8 – 16 2 3 1 6 16 – 24 3 4 5 12 24 – 32 8 16 12 1 37 32 – 40 1 8 3 4 16 40 – 48 1 2 6 9 Итого 5 16 31 17 11 80 Используя соответствующее уравнение регрессии, оценить средний объем валовой продукции на 100 га сельскохозяйственных угодий в совхозе с 35 рабочими. Вариант 11. В табл. 2.11 дано распределение заводов по объему основных производственных фондов X (млн. руб.) и по суточной выработке продукции Y (т). Таблица 2.11
Y
X
10 – 20 20 – 30 30 – 40 40 – 50 50 – 60 Итого 15 –25 7 20 27 25 – 35 5 23 30 10 68 35 – 45 47 11 9 67 45 – 55 2 20 7 29 55 – 65 6 3 9 Итого 12 43 79 47 19 200 Используя соответствующее уравнение регрессии, оценить среднюю суточную выработку продукции на заводах с объемом основных фондов 52 млн. руб. Вариант 12. Дана корреляционная табл. 2.12 результатов измерения 3 перепада давления X (атм.) и расход нефти Y ( м ч ) в трубопроводе. Таблица 2.12
X
3000-3200
24 – 28 28 – 32 32 – 36 36 – 40 40 – 44 Итого
2 2 4
32003400 1 1 2 4
Y
34003600 8 2 11 4 25 70
36003800 6 2 3 11
38004000 15 27 14 56
Итого 11 5 34 33 17 100
Используя соответствующее уравнение регрессии, оценить средний расход нефти при перепаде давления в 34 атм. Вариант 13. Распределение растений по весу X каждого из них и по весу семян Y (гс) заданы корреляционной табл. 2.13. 3
X 35 – 45 45 – 55 55 – 65 65 – 75 75 – 85 Итого
10 – 20 5 5
20 – 30 7 4 8 19
Y
30 – 40 16 20 11 47
40 – 50 23 32 29 9 93
50 – 60 27 2 7 36
Итого 12 43 87 42 16 200
Используя соответствующее уравнение регрессии, оценить средний вес семян при весе растения 62 гс. Вариант 14. В табл. 2.14 дано распределение прямоугольных плиток по длине Y (см) и по весу X (кгс). 4
X 27,5-32,5 32,5-37,5 37,5-42,5 42,5-47,5 47,5-52,5 Итого
5–7 2 2
7–9 17 10 3 30
9 –11 9 17 24 6 2 58
Y
11 – 13 3 9 16 24 11 63
13 – 15 13 12 22 47
Используя соответствующее уравнение регрессии, оценить длину плитки весом 43 кгс.
Итого 31 36 56 42 35 200 среднюю
Вариант 15. В табл. 2.15 дано распределение 60 однотипных предприятий по количеству выпускаемых изделий X (тыс. шт.) и полным затратам на их производство Y (млн. руб.). Таблица 2.15
X 20 –30 30 – 40 40 – 50 50 – 60 60 – 70 Итого
40 – 70 6 4 10
70 – 100 12 8 2 22
Y
100 – 130 6 6 12 71
130 – 160 4 7 11
160 – 190 3 2 5
Итого 6 16 18 18 2 60
Используя соответствующее уравнение регрессии, оценить среднее значение полных затрат на производство 34 тыс. деталей. Вариант 16. В табл. 2.16 дано распределение 100 заводов по объему основных производственных фондов X (млн. руб.) и по суточной выработке продукции Y (т): Таблица 2.16
Y 30 40 50 60 70
10 2 -
15 6 4 -
20 4 7 2 -
X
25 35 10 5
30 8 8 6
35 3
Используя соответствующее уравнение регрессии, оценить среднюю суточную выработку продукции на заводах с объемом основных фондов 33 млн. руб. Вариант 17. В табл. 2.17 дано распределение 100 заводов по объему основных производственных фондов X (млн. руб.) и по суточной выработке продукции Y (т): Таблица 2.17
Y 5 10 15 20 25
15 4 -
20 2 6 -
25 4 6 2 -
X
30 45 8 4
35 2 6 7
40 4
Используя соответствующее уравнение регрессии, оценить среднюю суточную выработку продукции на заводах с объемом основных фондов 28 млн. руб. Вариант 18. В табл. 2.18 дано распределение 100 заводов по объему основных производственных фондов X (млн. руб.) и по суточной выработке продукции Y (т): Таблица 2.18
Y 20 30 40
5 1 -
10 5 5 -
15 3 9 72
X
20 40
25 2
30 -
50 60
-
-
4 -
11 4
6 7
3
Используя соответствующее уравнение регрессии, оценить среднюю суточную выработку продукции на заводах с объемом основных фондов 18 млн. руб. Вариант 19. В табл. 2.19 дано распределение 100 заводов по объему основных производственных фондов X (млн. руб.) и по суточной выработке продукции Y (т): Таблица 2.19
X
Y
10 15 20 25 30 35 6 4 2 12 6 2 18 5 40 5 24 2 8 7 30 4 7 8 Используя соответствующее уравнение регрессии, оценить среднюю суточную выработку продукции на заводах с объемом основных фондов 21 млн. руб. Вариант 20. В табл. 2.20 дано распределение 100 заводов по объему основных производственных фондов X (млн. руб.) и по суточной выработке продукции Y (т): Таблица 2.20
Y 8 12 16 20 24
5 2 -
10 4 3 -
15 7 5 7 -
X
20 30 10 5
25 10 8 6
30 3
Используя соответствующее уравнение регрессии, оценить среднюю суточную выработку продукции на заводах с объемом основных фондов 33 млн. руб. Вариант 21. В табл. 2.21 дано распределение прямоугольных плиток по длине Y (см) и по весу X (кгс). Таблица 2.21
Y 10 20
2 2 -
7 4 6
12 2 73
X
17 -
22 -
27 -
30 40 50
3 50 1 10 6 4 7 Используя соответствующее уравнение регрессии, оценить длину плитки весом 18 (кгс).
3 среднюю
Вариант 22. В табл. 2.22 дано распределение 100 заводов по объему основных производственных фондов X (млн. руб.) и по суточной выработке продукции Y (т): Таблица 2.22
X
Y
11 16 21 26 31 36 25 2 4 35 6 3 45 6 45 4 55 2 8 6 65 4 7 3 Используя соответствующее уравнение регрессии, оценить среднюю суточную выработку продукции на заводах с объемом основных фондов 33 млн. руб. Вариант 23. В табл. 2.23 дано распределение 80 однотипных предприятий по количеству выпускаемых изделий X (тыс. шт.) и полным затратам на их производство Y (млн. руб.). Таблица 2.23
X
Y
4 9 14 19 24 29 8 3 3 18 5 4 28 20 2 8 38 5 10 6 48 4 7 3 Используя соответствующее уравнение регрессии, оценить среднее значение полных затрат на производство 34 тыс. деталей. Вариант 24. В табл. 2.24 дано распределение 103 однотипных предприятий по количеству выпускаемых изделий X (тыс. шт.) и полным затратам на их производство Y (млн. руб.). Таблица 2.24
Y 11 21 31 41 51
5 4 -
10 2 5 -
15 3 5 2 74
X
20 48 8 4
25 5 7 7
30 3
Используя соответствующее уравнение регрессии, оценить среднее значение полных затрат на производство 34 тыс. деталей. Вариант 25. В табл. 2.25 дано распределение между объемом выполненных работ Y (млн. руб.) и накладными расходами X (млн. руб.). Таблица 2.25
X
Y
1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 100 1 1 2 2 110 1 3 3 5 2 120 2 6 9 2 1 130 1 8 14 4 1 140 1 6 15 5 2 150 9 10 7 1 160 1 6 5 2 Используя соответствующее уравнение регрессии, оценить средние накладные расходы для объема выполненных работ в 145 млн. руб. Вариант 26. В табл. 2.26 дана зависимость между относительным уравнением издержек обращения Y (%) и объемом сбыта товаров X (млн. руб.). Таблица 2.26
X
Y
1.22 1.23 1.24 1.25 1.26 1.27 1.28 4.1 1 3 1 4.2 1 2 3 3 4.3 1 6 7 1 4.4 1 3 10 2 1 4.5 1 6 5 1 4.6 1 3 4 3 1 4.7 1 2 1 1 Используя соответствующее уравнение регрессии, оценить среднее значение сбыта товаров при уровне издержек 4 %. Вариант 27. В табл. 2.27 дана зависимость между относительным уравнением издержек обращения Y (%) и объемом сбыта товаров X (млн. руб.). Таблица 2.27
Y 3.9 4.0 4.1 4.2
4.3 1 -
4.4 3 1 1 -
4.5 2 5 3 1
4.6 1 2 8 2 75
X
4.7 1 4 10
4.8 1 3
4.9 -
5.0 -
4.3 4.4 4.5 4.6
1 3 6 4 1 1 3 1 1 2 1 Используя соответствующее уравнение регрессии, оценить среднее значение сбыта товаров при уровне издержек 4 %. Вариант 28. В табл. 2.28 дана зависимость между относительным уровнем издержек обращения Y (%) и объемом сбыта товаров X (млн. руб.). Таблица 2.28
Y
X
11.1 11.2 11.3 11.4 11.5 11.6 11.7 1.2 1 2 3 2 1 1.3 1 2 4 4 2 1 1.4 1 2 6 7 4 3 1 1.5 1 3 6 9 7 2 1 1.6 1 3 6 6 3 1 1.7 1 2 4 5 3 1 1.8 1 2 5 3 1 Используя соответствующее уравнение регрессии, оценить среднее значение сбыта товаров при уровне издержек 4 %. Вариант 29. В табл. 2.29 дана зависимость между относительным уровнем издержек обращения Y (%) и объемом сбыта товаров X (млн. руб.). Таблица 2.29
Y
X
1 2 3 4 5 6 7 0.12 1 0.13 3 1 0.14 6 1 0.15 1 6 2 0.16 1 9 1 0.17 2 7 1 0.18 1 1 5 2 Используя соответствующее уравнение регрессии, оценить среднее значение сбыта товаров при уровне издержек 4 %. Вариант 30. В табл. 2.30 дано распределение совхозов по числу рабочих X (чел.) на 100 га сельскохозяйственных угодий и объему валовой продукции Y (тыс. руб.). Таблица 2.30
Y 11 12
125 2 2
135 2 5
145 1 4
X
155 2
165 1 76
175 -
185 -
195 -
205 -
13 14 15 16 17 18 19
1 -
3 1 -
8 5 1 -
6 13 9 3 1 -
5 10 20 9 4 2 -
2 5 8 14 7 3 1
1 3 5 9 4 1
1 1 3 6 2
1 1 3
Используя соответствующее уравнение регрессии, оценить средний объем валовой продукции на 100 га сельскохозяйственных угодий в совхозе с 35 рабочими.
77
3.3. ПРИЛОЖЕНИЯ ПРИЛОЖЕНИЕ 1 Таблица значений функции Ф(x ) =
x
1 ∫e 2π 0
−
z2 2 dz
x
Ф (x )
x
Ф (x )
x
Ф (x )
x
Ф (x )
1 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,10 0,11 0,12 0,13 0,14 0,15 0,16 0,17 0,18 0,19 0,20 0,21 0,22 0,23 0,24 0,25 0,26 0,27 0,28 0,29 0,30 0,31
2 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141 0,1179 0,1217
3 0,32 0,33 0,34 0,35 0,36 0,37 0,38 0,39 0,40 0,41 0,42 0,43 0,44 0,45 0,46 0,47 0,48 0,49 0,50 0,51 0,52 0,53 0,54 0,55 0,56 0,57 0,58 0,59 0,60 0,61 0,62 0,63
4 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224 0,2257 0,2291 0,2324 0,2357
5 0,64 0,65 0,66 0,67 0,68 0,69 0,70 0,71 0,72 0,73 0,74 0,75 0,76 0,77 0,78 0,79 0,80 0,81 0,82 0,83 0,84 0,85 0,86 0,87 0,88 0,89 0,90 0,91 0,92 0,93 0,94 0,95
6 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549 0,2580 0,2611 0,2642 0,2673 0,2703 0,2784 0,2764 0,2794 0,2823 0,2852 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289
7 0,96 0,97 0,98 0,99 1,00 1,01 1,02 1,03 1,04 1,05 1,06 1,07 1,08 1,09 1,10 1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,18 1,19 1,20 1,21 1,22 1,23 1,24 1,25
8 0,3315 0,3340 0,3365 0,3389 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621 0,3643 0,3665 0,3686 0,3708 0,3729 0,3949 0,3770 0,3790 0,3810 0,3830 0,3849 0,3869 0,3883 0,3907 0,3925 0,3944
78
1 1,26 1,27 1,28 1,29 1,30 1,31 1,32 1,33 1,34 1,35 1,36 1,37 1,38 1,39 1,40 1,41 1,42 1,43 1,44 1,45 1,46 1,47 1,48 1,49 1,50 1,51 1,52 1,53 1,54 1,55 1,56 1,57 1,58
2 0,3962 0,3980 0,3997 0,4015 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429
3 1,59 1,60 1,61 1,62 1,63 1,64 1,65 1,66 1,67 1,68 1,69 1,70 1,71 1,72 1,73 1,74 1,75 1,76 1,77 1,78 1,79 1,80 1,81 1,82 1,83 1,84 1,85 1,86 1,87 1,88 1,89 1,90 1,91
4 0,4441 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706 0,4713 0,4719
5 1,92 1,93 1,94 1,95 1,96 1,97 1,98 1,99 2,00 2,02 2,04 2,06 2,08 2,10 2,12 2,14 2,16 2,18 2,20 2,22 2,24 2,26 2,28 2,30 2,32 2,34 2,36 2,38 2,40 2,42 2,44 2,46 2,48
79
Продолжение приложения 1 6 7 8 0,4726 2,50 0,4938 0,4732 2,52 0,4941 0,438 2,54 0,4945 0,4744 2,56 0,4948 0,4750 2,58 0,4951 0,4756 2,60 0,4953 0,4761 2,62 0,4956 0,4767 2,64 0,4959 0,4772 2,66 0,4961 0,4783 2,68 0,4963 0,4793 2,70 0,4965 0,4803 2,72 0,4967 0,4812 2,74 0,4969 0,4821 2,76 0,4971 0,4830 2,78 0,4973 0,4838 2,80 0,4974 0,4846 2,82 0,4976 0,4854 2,84 0,4977 0,4861 2,86 0,4979 0,4868 2,88 0,4980 0,4875 2,90 0,4981 0,4881 2,92 0,4982 0,4887 2,94 0,4984 0,4893 2,96 0,4985 0,4898 2,98 0,4986 0,4904 3,00 0,49865 0,4909 3,20 0,49931 0,4913 3,40 0,49966 0,4918 3,60 0,499841 0,4922 3,80 0,499928 0,4927 4,00 0,499968 0,4931 4,50 0,499997 0,4934 5,00 0,499999
Таблица значений t γ = t (γ , N )
γ
0,95
0,99
0,999
N 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
2,78 2,57 2,45 2,37 2,31 2,26 2,23 2,20 2,18 2,16 2,15 2,13 2,12 2,11 2,10
4,60 4,03 3,71 3,50 3,36 3,25 3,17 3,11 3,06 3,01 2,98 2,95 2,92 2,90 2,88
8,61 6,86 5,96 5,41 5,04 4,78 4,59 4,44 4,32 4,22 4,14 4,07 4,02 3,97 3,92
n
ν 20 25 30 35 40 45 50 60 70 80 90 100 120
∞
0,95
0,99
0,999
2,093 2,064 2,045 2,032 2,023 2,016 2,009 2,001 1,996 1,991 1,987 1,984 1,980 1,960
2,861 2,797 2,756 2,720 2,708 2,692 2,679 2,662 2,649 2,640 2,633 2,627 2,617 2,576
3,883 3,745 3,659 3,600 3,558 3,527 3,502 3,464 3,439 3,418 3,403 3,392 3,374 3,291
Таблица значений q = q(γ, N )
γ
0,95
0,99
0,999
1,37 1,09 0,92 0,80 0,71 0,65 0,59 0,55 0,52 0,48 0,46 0,44 0,42 0,40 0,39
2,67 2,01 1,62 1,38 1,20 1,08 0,98 0,90 0,83 0,78 0,73 0,70 0,66 0,63 0,60
5,64 3,88 2,98 2,42 2,06 1,80 1,60 1,45 1,33 1,23 1,15 1,07 1,01 0,96 0,92
N 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
n
80
ν 20 25 30 35 40 45 50 60 70 80 90 100 150 200 250
ПРИЛОЖЕНИЕ 2
ПРИЛОЖЕНИЕ 3
0,95
0,99
0,999
0,37 0,32 0,28 0,26 0,24 0,22 0,21 0,188 0,174 0,161 0,151 0,143 0,115 0,099 0,089
0,58 0,49 0,43 0,38 0,35 0,32 0,30 0,269 0,245 0,226 0,211 0,198 0,160 0,136 0,120
0,88 0,73 0,63 0,56 0,50 0,46 0,43 0,38 0,34 0,31 0,29 0,27 0,211 0,185 0,162
ПРИЛОЖЕНИЕ 4 Критические точки распределения χ Число степеней свободы
k
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
2
Уровень значимости α 0,01
0,025
0,05
0,95
0,975
0,89
6,6 9,2 11,3 13,3 15,1 16,8 18,5 20,1 21,7 23,2 24,7 26,2 27,7 29,1 30,6 32,0 33,4 34,8 36,2 37,6 38,9 40,3 41,6 43,0 44,3 45,6 47,0 48,3 49,6 50,9
5,0 7,4 9,4 11,1 12,8 14,4 16,0 17,5 19,0 20,5 21,9 23,3 24,7 26,1 27,5 28,8 30,2 31,5 32,9 34,2 35,5 36,8 38,1 39,4 40,6 41,9 43,2 44,5 45,7 47,0
3,8 6,0 7,8 9,5 11,1 12,6 14,1 15,5 16,9 18,3 19,7 21,0 22,4 23,7 25,0 26,3 27,6 28,9 30,1 31,4 32,7 33,9 35,2 36,4 37,7 38,9 40,1 41,3 42,6 43,8
0,0039 0,103 0,352 0,711 1,15 1,64 2,17 2,73 3,33 3,94 4,57 5,23 5,89 6,57 7,26 7,96 7,67 9,39 10,1 10,9 11,6 12,3 13,1 13,8 14,6 15,4 16,2 16,9 17,7 18,5
0,00098 0,051 0,216 0,484 0,831 1,24 1,69 2,18 2,70 3,25 3,82 4,40 5,01 5,63 6,26 6,91 7,56 8,23 8,91 9,59 10,3 11,0 11,7 12,4 13,1 13,8 14,6 15,3 16,0 16,8
0,00016 0,020 0,115 0,297 0,554 0,872 1,24 1,65 2,09 2,56 3,05 3,57 4,11 4,66 5,23 5,81 6,41 7,01 7,63 8,26 8,90 9,54 10,2 10,9 11,5 12,2 12,9 13,6 14,3 15,0
81
ЛИТЕРАТУРА Основная литература: 1. Гмурман В.Е. Теория вероятностей и математическая статистика. –М.: Высшая школа, 1997. 2. Гмурман В.Е. Руководство к решению задач по теории вероятностей и математической статистике. –М.: Высшая школа, 1975. 3. Данко П.Е., Попов А.Г., Кожевникова Т.Я. Высшая математика в упражнениях и задачах. –М.: Высшая школа, 2000. Т.2. 4. Феллер В. Введение в теорию вероятностей и ее приложения. – М.: Мир, 1084. – т.1,2.
Дополнительная литература: 1. Вентцель Е.С., Овчаров Л.А. Теория вероятностей и ее инженерные приложения. – М.: Высшая школа, 2000. 2. Виленкин Н.Я. Популярная комбинаторика. – М.: Наука, 1975. 3. Бахтизин Р.Н., Московский Б.А., Буренин В.А. Теория вероятностей (конспект лекций и практикум). – Уфа: УГНТУ, 1995. 4. Кремер Н.Ш. Теория вероятностей и математическая статистика. – М.: ЮНИТИ- ДАНА, 2002.
Учебные пособия кафедры: 1. Учебно-методическое пособие по математической статистике. – Умергалина Т.В., Хакимова З.Р. – Уфа.: УГНТУ, 2004. 2. Практикум по математической статистике. – Умергалина Т.В., Хакимова З.Р. – Уфа: УГНТУ, 2003. 3. Лабораторная практикум по математике. – Юлдыбаев Л.Х., Зарипов Р.М. – Уфа: УГНТУ, 2003. 4. Расчетные задания по математической статистике. – Умергалина Т.В., Хакимова З.Р. – Уфа: УГНТУ, 2007. 5. Функции нескольких переменных. Учебно-методическое пособие. – Гимаев Р.Г., Умергалина Т.В., Уфа, УГНТУ, 2005 г. (Раздел «Метод наименьших квадратов»).
82