Математическая статистика обозначения. Математическая статистика

Математическая статистика

Предмет и методы

Математическая статистика - раздел математики, разрабатывающий методы регистрации, описания и анализа данных наблюдений и экспериментов с целью построения вероятностных моделей массовых случайных явлений . В зависимости от математической природы конкретных результатов наблюдений статистика математическая делится на статистику чисел, многомерный статистический анализ, анализ функций (процессов) и временных рядов, статистику объектов нечисловой природы.

В настоящее время компьютеры играют большую роль в математической статистике. Они используются как для расчётов, так и для имитационного моделирования (в частности, в методах размножения выборок и при изучении пригодности асимптотических результатов).

Примечания

Литература

  • Вероятность и математическая статистика. Энциклопедия / Гл. ред. Ю. В. Прохоров. - М.: Изд-во «Большая Российская Энциклопедия», 1999.
  • Вальд А. Последовательный анализ, пер. с англ.- М.: Физматгиз, 1960.
  • Ширяев А. Н. Статистический последовательный анализ. Оптимальные правила остановки - М.: Наука, 1976

См. также

Ссылки


Wikimedia Foundation . 2010 .

  • Линейная алгебра
  • Математическая физика

Смотреть что такое "Математическая статистика" в других словарях:

    МАТЕМАТИЧЕСКАЯ СТАТИСТИКА Современная энциклопедия

    МАТЕМАТИЧЕСКАЯ СТАТИСТИКА - наука о математических методах систематизации и использования статистических данных для научных и практических выводов. Во многих своих разделах математическая статистика опирается на теорию вероятностей, позволяющую оценить надежность и точность … Большой Энциклопедический словарь

    Математическая статистика - МАТЕМАТИЧЕСКАЯ СТАТИСТИКА, наука о математических методах систематизации и использования статистических данных для научных и практических выводов. Истоки математической статистики можно найти в сочинениях ученых конца 17 начала 19 вв. Во многих… … Иллюстрированный энциклопедический словарь

    МАТЕМАТИЧЕСКАЯ СТАТИСТИКА - наука, занимающаяся описанием и анализом результатов наблюдений массовых явлений методами теории вероятностей. Типичные задачи М. с. определение типов распределений случайной величины, проверка статистических гипотез, оценивание параметров и т. п … Геологическая энциклопедия

    МАТЕМАТИЧЕСКАЯ СТАТИСТИКА - (от лат. status – состояние). Смежная для методики обучения языкам наука о математических методах систематизации и использования статистических данных для научных и практических выводов. Законы М. с. широко используются в организации… … Новый словарь методических терминов и понятий (теория и практика обучения языкам)

    Математическая статистика - раздел математики, посвященный методам и правилам обработки и анализа статистических данных (т.е. сведений о числе объектов, обладающих определенными признаками, в какой либо более или менее обширной совокупности). Сами… … Экономико-математический словарь

    математическая статистика - Раздел математики, посвященный методам и правилам обработки и анализа статистических данных (т.е. сведений о числе объектов, обладающих определенными признаками, в какой либо более или менее обширной совокупности). Сами методы и правила строятся… … Справочник технического переводчика

    Математическая статистика - раздел математики, посвященный математическим методам систематизации, обработки и использования статистических данных для научных и практических выводов. При этом статистическими данными называются сведения о числе объектов в какой либо… … Большая советская энциклопедия

    математическая статистика - наука о математических методах систематизации и использования статистических данных для научных и практических выводов. Во многих своих разделах математическая статистика опирается на теорию вероятностей, позволяющую оценить надёжность и точность … Энциклопедический словарь

Каждое исследование в области случайных явлений своими корнями всегда уходит в эксперимент, в опытные данные. Числовые данные, которые собирают при изучении какого-либо признака некоторого объекта, называются статистическими . Статистические данные являются первоначальным материалом исследования. Для того, чтобы они представляли научную или практическую ценность, их надо обработать методами математической статистики.

Математическая статистика - это научная дисциплина, предметом изучения которой является разработка методов регистрации, описания и анализа статистических экспериментальных данных, полученных в результате наблюдений массовых случайных явлений.

Основными задачами математической статистики являются:

    определение закона распределения случайной величины или системы случайных величин;

    проверка правдоподобия гипотез;

    определение неизвестных параметров распределения.

Все методы математической статистики основаны на теории вероятностей. Однако в силу специфичности решаемых задач математическая статистика выделяется из теории вероятностей в самостоятельную область. Если в теории вероятностей считается заданной модель явления и производится расчет возможного реального течения этого явления (рис.1), то в математической статистике подбирается подходящая теоретико-вероятностная модель, исходя из статистических данных (рис.2).

Рис.1. Общая задача теории вероятностей

Рис.2. Общая задача математической статистики

Как научная дисциплина математическая статистика развивалась вместе с теорией вероятностей. Математический аппарат этой науки построен во второй половине XIX века.

2. Генеральная совокупность и выборка.

Для изучения статистических методов вводятся понятия генеральной и выборочной совокупностей. В общем случае под генеральной совокупностью понимается случайная величина X с функцией распределения
. Выборочной совокупностью или выборкой объемаn для данной случайной величины X называется набор
независимых наблюдений этой величины, гденосит название выборочного значения или реализации случайной величиныX. Таким образом, можно рассматривать как числа (если эксперимент проведен и выборка состоялась) и как случайные величины (до проведения эксперимента), поскольку они меняются от выборки к выборке.

Пример 1 . Для определения зависимости толщины ствола дерева от его высоты было отобрано 200 деревьев. В данном случае объем выборки n=200.

Пример 2. В результате распиловки древесностружечных плит на круглопильном станке было получено 15 значений удельной работы резания. В этом случае n=15.

Д
ля того чтобы по данным выборки уверенно судить об интересующем нас признаке генеральной совокупности, объекты выборки должны правильно ее представлять, то есть выборка должна бытьрепрезентативной (представительной). Репрезентативность выборки обычно достигается случайностью отбора объектов: каждому объекту генеральной совокупности обеспечивается равная со всеми остальными вероятность попадания в выборку.

Рис.3. Демонстация репрезентативности выборки

Министерство образования и науки Российской Федерации

Костромской государственный технологический университет

И.В. Землякова, О.Б. Садовская, А.В. Чередникова

МАТЕМАТИЧЕСКАЯ СТАТИСТИКА

в качестве учебного пособия для студентов специальностей

220301, 230104, 230201 очной формы обучения

Кострома

ИЗДАТЕЛЬСТВО

УДК 519.22 (075)

Рецензенты: кафедра математических методов в экономике
Костромского государственного университета им. Н.А. Некрасова;

канд. физ.-мат. наук, доцент кафедры математического анализа

Костромского государственного университета им. Н.А. Некрасова К.Е. Ширяев.

З 51 Землякова, И.В. Математическая статистика. Теория и практика: учебное пособие / И.В. Землякова, О.Б. Садовская, А.В. Чередникова. – Кострома: Изд-во Костром. гос. технол. ун-та, 2010. – 60 с.

ISBN 978-5-8285-0525-8

Учебное пособие содержит в максимально доступной форме теоретический материал, примеры, тесты и прокомментированный алгоритм выполнения заданий по типовому расчету.

Предназначено для студентов вузов, обучающихся по специальностям 220301, 230104, 230201 очной формы обучения. Может использоваться как во время лекций, так и на практических занятиях.

УДК 519.22 (075)

ISBN 978-5-8285-0525-8

 Костромской государственный технологический университет, 2010

§1. ЗАДАЧИ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ 4

§2. ГЕНЕРАЛЬНАЯ И ВЫБОРОЧНАЯ СОВОКУПНОСТЬ. 4

РЕПРЕЗЕНТАТИВНОСТЬ ВЫБОРКИ. СПОСОБЫ ОТБОРА 4

(СПОСОБЫ ОРГАНИЗАЦИИ ВЫБОРКИ) 4

§3. СТАТИСТИЧЕСКОЕ РАСПРЕДЕЛЕНИЕ ВЫБОРКИ. 6

ГРАФИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ РАСПРЕДЕЛЕНИЙ 6

§4. СТАТИСТИЧЕСКИЕ ОЦЕНКИ ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЯ 18

§5. ГЕНЕРАЛЬНАЯ СРЕДНЯЯ. ВЫБОРОЧНАЯ СРЕДНЯЯ. 20

ОЦЕНКА ГЕНЕРАЛЬНОЙ СРЕДНЕЙ ПО ВЫБОРОЧНОЙ СРЕДНЕЙ 20

§6. ГЕНЕРАЛЬНАЯ ДИСПЕРСИЯ. ВЫБОРОЧНАЯ ДИСПЕРСИЯ. 22

ОЦЕНКА ГЕНЕРАЛЬНОЙ ДИСПЕРСИИ ПО ИСПРАВЛЕННОЙ ДИСПЕРСИИ 22

§7. МЕТОД МОМЕНТОВ И МЕТОД НАИБОЛЬШЕГО ПРАВДОПОДОБИЯ НАХОЖДЕНИЯ ОЦЕНОК ПАРАМЕТРОВ. МЕТОД МОМЕНТОВ 25

§8. ДОВЕРИТЕЛЬНАЯ ВЕРОЯТНОСТЬ. ДОВЕРИТЕЛЬНЫЙ ИНТЕРВАЛ 27

§9. ПРОВЕРКА ГИПОТЕЗЫ О СООТВЕТСТВИИ СТАТИСТИЧЕСКИХ ДАННЫХ ТЕОРЕТИЧЕСКОМУ ЗАКОНУ РАСПРЕДЕЛЕНИЯ 31

§ 10. ПОНЯТИЕ О КОРРЕЛЯЦИОННОМ И РЕГРЕССИВНОМ АНАЛИЗЕ 39

ИНДИВИДУАЛЬНЫЕ ЗАДАНИЯ 44

ОТВЕТЫ И УКАЗАНИЯ 46

Приложения 51

§1. ЗАДАЧИ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ

Математические законы теории вероятностей не являются абстрактными, лишёнными физического содержания, они представляют собой математическое выражение реальных закономерностей, существующих в массовых случайных явлениях.

Каждое исследование случайных явлений, выполняемое методами теории вероятностей, опирается на экспериментальные данные.

Зарождение математической статистики было связано со сбором данных и графическим представлением полученных результатов (сводки рождаемости, бракосочетаний и т.д.). Это описательная статистика. Нужно было свести обширный материал к небольшому числу величин. Разработка методов сбора (регистрации), описания и анализа экспериментальных (статистических) данных, получаемых в результате наблюдения массовых, случайных явлений, составляет предмет математической статистики .

При этом можно выделить три этапа :

    сбор данных;

    обработка данных;

    статистические выводы-прогнозы и решения.

Типичные задачи математической статистики:

    определение закона распределения случайной величины (или системы случайных величин) по статистическим данным;

    проверка правдоподобия гипотез;

    нахождение неизвестных параметров распределения.

Итак, задача математической статистики состоит в создании методов сбора и обработки статистических данных для получения научных и практических выводов.

§2. ГЕНЕРАЛЬНАЯ И ВЫБОРОЧНАЯ СОВОКУПНОСТЬ.

РЕПРЕЗЕНТАТИВНОСТЬ ВЫБОРКИ. СПОСОБЫ ОТБОРА

(СПОСОБЫ ОРГАНИЗАЦИИ ВЫБОРКИ)

Массовые случайные явления могут быть представлены в виде тех или иных статистических совокупностей однородных объектов. Каждая статистическая совокупность обладает различными признаками.

Различают качественные и количественные признаки. Количественные признаки могут изменяться непрерывно или дискретно .

Пример 1. Рассмотрим производственный процесс (массовое случайное явление) изготовления партии деталей (статистическая совокупность).

Стандартность детали – качественный признак. Размер детали – количественный признак, изменяющийся непрерывно.

Пусть требуется изучить статистическую совокупность однородных объектов относительно некоторого признака. Сплошное обследование, т. е. исследование каждого из объектов статистической совокупности на практике применяется редко. Если исследование объекта связано с его уничтожением или требует больших материальных затрат, то проводить сплошное обследование нет смысла. Если совокупность содержит очень большое число объектов, то провести сплошное обследование практически невозможно. В таких случаях из всей совокупности случайно отбирают ограниченное число объектов и исследуют их.

Определение. Генеральной совокупностью называется вся подлежащая изучению совокупность.

Определение. Выборочной совокупностью или выборкой называется совокупность случайно отобранных объектов.

Определение. Объёмом совокупности (выборочной или генеральной) называют число объектов этой совокупности. Объём генеральной совокупности обозначается через N , а выборки через n .

На практике обычно применяют бесповторную выборку , при которой отобранный объект не возвращается в генеральную совокупность (иначе получаем повторную выборку).

Для того чтобы по данным выборки можно было судить о всей генеральной совокупности, выборка должна быть репрезентативной (представительной). Для этого каждый объект должен быть отобран случайно, и все объекты должны иметь одинаковую вероятность попасть в выборку. применяются различные способы отбора (рис. 1).

Способы отбора

(способы организации выборки)

Двухступенчатый

(генеральная совокупность разделена

на группы)

Одноступенчатый

(генеральная совокупность не делится

на группы)


Простой случайный

(объекты извлекаются случайно

из всей совокупности)

Типический

(объект выбирается из каждой типической части)

Комбинированный

(из общего числа групп отбирают несколько и из них по несколько объектов)


Простая случайная повторная выборка

случайная бесповторная выборка

Механический

(из каждой группы

выбирают по одному объекту)

Серийный

(из общего числа групп – серий отбирают несколько

и их сплошь исследуют)

Рис. 1. Способы отбора


Пример 2. На заводе 150 станков производят одинаковые изделия.

1. Изделия со всех 150 станков перемешивают и случайно отбирают несколько изделий – простая случайная выборка .

2. Изделия с каждого станка располагаются отдельно.

      Со всех 150 станков отбирают по несколько изделий, причём анализируют отдельно изделия с более изношенных и менее изношенных станков – типическая выборка.

      С каждого из 150 станков по одному изделию – механическая выборка.

      Из 150 станков отбирают несколько (например, 15 станков), и все изделия с этих станков исследуют – серийная выборка.

      Из 150 станков выбирают несколько, а затем по несколько изделий с этих станков – комбинированная выборка.

§3. СТАТИСТИЧЕСКОЕ РАСПРЕДЕЛЕНИЕ ВЫБОРКИ.

ГРАФИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ РАСПРЕДЕЛЕНИЙ

Пусть требуется изучить статистическую совокупность относительно некоторого количественного признака X . Числовые значения признака будем обозначать через х i .

Из генеральной совокупности извлекается выборка объёма п.

    Количественный признак Х дискретная случайная величина .

Наблюдаемые значения х i называют вариантами , а последовательность вариантов, записанных в возрастающем порядке, – вариационным рядом .

Пусть x 1 наблюдалось n 1 раз,

x 2 наблюдалось n 2 раз,

x k наблюдалось n k раз,

причем
. Числа n i называют частотами , а их отношение к объёму выборки, т.е.
, – относительными частотами (или частостями), причем
.

Значение вариант и соответствующие им частоты или относительные частоты можно записать в виде таблиц 1 и 2.

Таблица 1

Варианта x i

x 1

x 2

x k

Частота n i

n 1

n 2

n k

Таблицу 1 называют дискретным статистическим рядом распределения (ДСР) частот, или таблицей частот.

Таблица 2

Варианта x i

x 1

x 2

x k

Относительная частота w i

w 1

w 2

w k

Таблица 2  ДСР относительных частот, или таблица относительных частот.

Определение. Модой называется наиболее часто встречающийся вариант, т.е. вариант с наибольшей частотой. Обозначается x мод .

Определение. Медианой называется такое значение признака, которое делит всю статистическую совокупность, представленную в виде вариационного ряда, на две равных по числу части. Обозначается
.

Если n нечетно, т.е. n = 2 m + 1 , то = x m +1.

Если n четно, т.е. n = 2 m , то
.

Пример 3 . По результатам наблюдений: 1, 7, 7, 2, 3, 2, 5, 5, 4, 6, 3, 4, 3, 5, 6, 6, 5, 5, 4, 4 построить ДСР относительных частот. Найти моду и медиану.

Решение . Объем выборки n = 20. Составим ранжированный ряд элементов выборки: 1, 2, 2, 3, 3, 3, 4, 4, 4, 4, 5, 5, 5, 5, 5, 6, 6, 6, 7, 7. Выделим варианты и подсчитаем их частоты (в скобках): 1 (1), 2 (2), 3 (3),
4 (4), 5 (5), 6 (3), 7 (2). Строим таблицу:

x i

w i

Наиболее часто встречающийся вариант x i = 5. Следовательно, x мод = 5. Так как объем выборки n – четное число, то

Если на плоскости нанести точки и соединить их отрезками прямых, то получим полигон частот .

Если на плоскости нанести точки , то получим полигон относительных частот .

Пример 4 . Построить полигон частот и полигон относительных частот по данному распределению выборки:

x i

В рамках образовательной программы вуза вряд ли встретишь отдельную дисциплину с названием «математическая статистика», однако элементы математической статистики часто изучаются в совокупности с теорией вероятностей , но только после изучения основного курса теории вероятностей.

Математическая статистика: общие сведения

Математическая статистика – это раздел математики, который разрабатывает методы регистрации, описания и анализа данных каких-либо наблюдений и экспериментов, целью которых является построение вероятностных моделей массовых случайных явлений.

Математическая статистика как наука возникла в XVII в. и развивалась параллельным курсом с теорией вероятностей. Большой вклад в развитие науки внесли в XIX-XX вв. Чебышев П.Л., Гаусс К., Колмогоров А.Н. и др.

Общая задача математической статистики заключается в создании методов сбора и обработки статистических данных для получения научных и практических выводов.

Основными разделами математической статистики являются:

  • выборочный метод (ознакомление с понятием выборки, способами сбора и обработки данных и т.д.);
  • статистическая оценка параметров выборки (оценки, доверительные интервалы и т.д.);
  • расчет сводных характеристик выборки (расчет вариант, моментов и т.д.);
  • теория корреляции (уравнения регрессии и т.д.);
  • статистическая проверка гипотез;
  • однофакторный дисперсионный анализ.

К наиболее распространенным задачам математической статистики, которые изучаются в вузе и часто встречаются на практике, относятся:

  • задачи определения оценок параметров выборки;
  • задачи на проверку статистических гипотез;
  • задачи определения вида закона распределения по статистическим данным.

Задачи определения оценок параметров выборки

Изучение математической статистики начинается с определения таких понятий как «выборка», «частота», «относительная частота», «эмпирическая функция», «полигон», «кумулята», «гистограмма» и т.д. Далее идет изучение понятий оценок (смещенная и несмещенная): выборочная средняя, дисперсия, исправленная дисперсия и т.д.

Задача

Измерение роста детей младшей группы детского сада представлено выборкой:
92, 96, 95, 96, 94, 97, 98, 94, 95, 96.
Найдем некоторые характеристики этой выборки.

Решение

Размер выборки (число измерений; N ): 10.
Наименьшее значение выборки: 92. Наибольшее значение выборки: 98.
Размах выборки: 98 – 92 = 6.
Запишем ранжированный ряд (варианты в порядке возрастания):
92, 94, 94, 95, 95, 96, 96, 96, 97, 98.
Сгруппируем ряд и запишем в таблицу (каждой варианте поставим в соответствие число ее появлений):

x i 92 94 95 96 97 98 N
n i 1 2 2 3 1 1 10

Вычислим относительные частоты и накопленные частоты, результат запишем в таблицу:

x i 92 94 95 96 97 98 Итого
n i 1 2 2 3 1 1 10
0,1 0,2 0,2 0,3 0,1 0,1 1
Накопленные частоты 1 3 5 8 1 10

Построим полигон частот выборки (отметим на графике варианты по оси ОХ, частоты по оси OY, соединим точки линией).

Выборочную среднюю и дисперсию вычислим по формулам (соответственно):


Можно находить и другие характеристики выборки, но для общего представления вполне достаточно найденных характеристик.

Задачи на проверку статистических гипотез

Задачи, относящиеся к данному типу, сложнее задач предыдущего типа и их решение зачастую более объемно и трудоемко. Прежде чем приступать к решению задач, сначала изучаются понятия статистической гипотезы, нулевой и конкурирующей гипотезы и т.д.

Рассмотрим простейшую задачу данного типа.

Задача

Даны две независимые выборки объема 11 и 14, извлеченные из нормальных совокупностей X, Y. Известны также исправленные дисперсии, равные соответственно 0,75 и 0,4. Необходимо проверить нулевую гипотезу о равенстве генеральных дисперсий при уровне значимости γ =0,05. Конкурирующую гипотезу выбрать по желанию.

Решение

Нулевая гипотеза для нашей задачи записывается следующим образом:

В качестве конкурирующей гипотезы рассмотрим следующую:

Вычислим отношение большей исправленной дисперсии к меньшей и получим наблюдаемое значение критерия:

Так как конкурирующая гипотеза, которую мы выбрали, имеет вид , то критическая область является правосторонней.
По таблице для уровня значимости 0,05 и числам степеней свободы равным 10 (11 – 1 = 10) и 13 (14 – 1 = 13) соответственно найдем критическую точку:

Так как наблюдаемое значение критерия меньше критического значения (1,875<2,67), то нет оснований отвергнуть гипотезу о равенстве генеральных дисперсий. Таким образом, исправленные дисперсии различаются между собой незначимо.

Рассмотренная задача непроста на первый взгляд, но вполне стандартна и решается по шаблону. Друг от друга такие задачи отличаются, как правило, значениями критериев и критической областью.

Более трудоемкими (так как содержат много вычислений, часть из которых сводится в таблицы) являются задачи на проверку гипотезы о типе распределения генеральной совокупности. При решении таких задач используются различные критерии, например, критерий Пирсона.

Задачи определения вида закона распределения по статистическим данным

Данный тип задач относится к разделу, изучающему элементы теории корреляции. Если рассматривать зависимости Y от Х, то тогда можно было бы вспомнить метод наименьших квадратов для определения вида зависимости. Однако в математической статистике все гораздо сложнее и в теории корреляции рассматриваются двумерные величины, значения которых, как правило, задаются в виде таблиц.

x 1 x 1 x n n y
y 1 n 11 n 21 n n1
y 1 n 12 n 22 n n2
y m n 1m n 2m n nm
n x N

Приведем формулировку одной из задач данного раздела.

Задача

Определить выборочное уравнение прямой линии регрессии Y на Х. Данные приведены в корреляционной таблице.

Y X n y
10 20 30 40
5 1 3 4
6 2 1 3
7 3 2 5
8 1 1
n x 1 5 4 3 N =13

Заключение

В заключении отметим, что уровень сложности задач по математической статистике достаточно сильно разнится при переходе от одного типа к другому. Задачи первого типа достаточно просты и не требуют особого понимания теории, можно просто выписать формулы и решить практически любую задачу. Задачи второго и третьего типа немного сложнее и для их успешного решения необходим определенный «багаж знаний» по данной дисциплине.

Приведем список всего из двух книг, но именно эти книги для автора статьи уже давно стали настольными.

  1. Гмурман В.Е. Теория вероятностей и математическая статистика: учебное пособие. – 12-е изд., перераб. – М.: ИД Юрайт, 2010. – 479 с.
  2. Гмурман В.Е. Руководство к решению задач по теории вероятностей и математической статистике. – М.: Высшая школа, 2005. – 404 с.

Решение математической статистики на заказ

Желаем удачи в освоении математической статистики. Будут проблемы — обращайтесь . Будем рады помочь!