Главная Обратная связь

Дисциплины:

Архитектура (936)
Биология (6393)
География (744)
История (25)
Компьютеры (1497)
Кулинария (2184)
Культура (3938)
Литература (5778)
Математика (5918)
Медицина (9278)
Механика (2776)
Образование (13883)
Политика (26404)
Правоведение (321)
Психология (56518)
Религия (1833)
Социология (23400)
Спорт (2350)
Строительство (17942)
Технология (5741)
Транспорт (14634)
Физика (1043)
Философия (440)
Финансы (17336)
Химия (4931)
Экология (6055)
Экономика (9200)
Электроника (7621)






Числовые характеристики статистического распределения



Статистическое распределение имеет числовые характери­стики, аналогичные числовым характеристикам теоретического распределения.

Аналогом математического ожидания случайной величины является среднее арифметическое. Если X — случайная величина, то

(2.77)

где хi —значения, принимаемые X в опытах; п — число опытов.

Среднее арифметическое, обычно называемое статистическим сродним, при большом п является наиболее достоверным значе­нием измеряемой величины; его следует принять за действитель­ное значение Х0 как значение, наиболее приближающееся к истинному Х00.

Одной из важнейших характеристик случайных величин является дисперсия — второй центральный момент, равный мате­матическому ожиданию квадрата центрированной случайной величины:

(2.78)

(дисперсия X и есть дисперсия δ).

Для определения статистической дисперсии математическое ожидание в (2.78) заменим его статистической аналогией — средним арифметическим. Тогда статистическая дисперсия

(2.79)

статистическое среднее квадратическое отклонение

(2.80)

Аналогично можно найти выражения для статистических на­чальных и центральных моментов:

(2.81)

(2.82)

В заключение следует отметить, что

(2.83)

является средним квадратическим отклонением случайных погрешностей δi от математического ожидания, равного нулю, и, следовательно, является числовой характеристикой точности каждого отдельного измерения в данной серии опытов.

Числовой характеристикой погрешности результата, т. е. по­грешности установления действительного значения Х0 измеряе­мой величины как степени отличия его от истинного значения, является среднее квадратическое отклонение результата изме­рения

(2.84)

Действительно,

(2.85)

В дальнейшем индекс х у σ и D опущен, если речь идет δ. Индекс т относится к математическому ожиданию тХ.

Так как опыты независимы, то дисперсия суммы равна сумме дисперсий,т.е.

(2.86)

Заменяя операцию математического ожидания определением среднего арифметического, получим

(2.87)

Таким образом, определяя X по среднему статистическому, мы допускаем ошибку, в √п раз меньшую, чем при определении по результату одного измерения.

Производство большого числа опытов в одинаковых усло­виях, естественно, затруднительно и требует большого времени. Статистические же данные, получаемые при этом, часто оказываются малоэффективными и даже неправильными вследствие изменения измеряемой величины и условий измерения. Поэтому названное выше число опытов (100—200) делается только при определении законов распределения погрешностей. При определении же числовых характеристик, что, понятно, приходится делать много чаще, достаточно 10—20 опытов.



Числовые характеристики определенные на основе ограни­ченной статистической совокупности, всегда содержат элемент случайности, т. е. сами являются случайными величинами, оцен­ками числовых характеристик. Если оценивается параметр а, то его оценка . Оценки, определяемые по результатам ограничен­ного числа наблюдений, должны вычисляться по таким форму­лам, чтобы их можно было принять за состоятельные, чтобы использование оценок по крайней мере не приводило к измене­нию (смещению) величины X или систематической погрешно­сти θ (как математического ожидания случайной погреш­ности ∆); чтобы найденная несмещенная оценка, как случайная величина, обладала наименьшей дисперсией по сравнению с другими возможными оценками (была бы наиболее эффек­тивной).

Поясним введенные понятия подробнее.

Оценка параметра (числовой характеристики) а называет­ся состоятельной, если при увеличении числа опытов п она приближается, сходится по вероятности к параметру а.

Оценка называется несмещенной, если при использо­вании ее вместо а не происходит увеличения или уменьшения математического ожидания, т. е.

(2.88)

Несмещенная оценка называется эффективной, если она обладает по сравнению с другими несмещенными оценками наи­меньшей дисперсией, т. е.

(2.89)

Удовлетворить всем этим требованиям при выборе оценки принципиально можно. Но формулы, которыми при этом прихо­дится пользоваться, оказываются слишком сложными, чтобы их можно было использовать в широкой практике. Поэтому обычно используют для расчета оценок более простые зависимости, хотя они и приводят к получению оценок, несколько отличных от эффективных или несмещенных. Рассмотрим оценки некото­рых числовых характеристик.



В качестве оценки математического ожидания измеряемой величины естественно принять среднее арифметическое

(2.90)

которое при увеличении п сходится по вероятности к тХ (формулы для определения и т*Х одинаковы , но значения их будут несколько разными). Так как эта оценка является состоя­тельной, то она будет и несмещенной, ибо

(2.91)

Дисперсия этой оценки [см. аналогичную формулу (2.87) для

(2.92)

Доказать, является ли эта оценка эффективной, можно, если X распределена по нормальному закону. Для определения ] необходимо найти оценку Выберем в качестве статистическую дисперсию D*Х Тогда

(2.93)

Проверим прежде, является ли она состоятельной. Учитывая независимость опытов, можно D*Х представить в виде

(2.94)

Первый член есть среднее арифметическое из п значений X2. По вероятности он сходится к второму начальному моменту α2[Х][Х2]. Второй член по вероятности сходится к т2Х. Тогда D*Х сходится по вероятности к величине

(2.95)

т. е. принятая оценка DХ (2.93) является состоятельной.

Для определения несмещенности D*Х как оценки DХ в (2.94)

вместо подставим его значение:

(2.96)

и найдем математическое ожидание оценки

(2.97)

Так как дисперсия D*X не зависит от того, чему равно математическое ожидание, то примем его равным нулю, т. е. будем считать Xi центрированной величиной. Тогда

(2.98)

(2.99)

(2.100)

(2.101)

Таким образом, принятая оценка DХ, или D*Х, не является несмещенной, так как ее математическое ожидание несколько меньше DХ. Определяя по (2.93) дисперсию X или принимая в качестве оценки погрешности δi отдельного измерения √D*X=√D*, мы допускаем систематическую ошибку, приводящую к получению несколько заниженных численных значений диспер­сии. Если в качестве оценки DX принять

(2.102)

(2.103)

Полученная оценка (2.102) является также состоятельной. Подставив ее в (2.92), найдем дисперсию оценки математиче­ского ожидания (действительного значения измеряемой величины)

(2.104)

Соответственно для средних квадратических отклонений отдельных погрешностей и погрешности результата получим оценки:

(2.105)

(2.106)

При определении числовых характеристик всегда пользуются ограниченным рядом наблюдений. Поэтому после обработки данных наблюдений получают лишь их оценки; чем больше число наблюдений, тем ближе оценки (если они состоятельные) к самим числовым характеристикам.

Выше было показано, что вероятность появления погрешностей, лежащих в разных интервалах, не одинакова. Так, по приложению 1 можно найти, что погрешность измерения не превы­шает ±2σт с вероятностью 0,95; с вероятностью 0,997 погреш­ность измерения не превысит ±3σт и т. д. Таблица составлена на основании теоретических расчетов и поэтому может быть использована для определения теоретических и статистических (при п→∞) числовых характеристик. Определять оценки по этой таблице было бы неверно.

Для определения оценок числовых характеристик существуют таблицы Стьюдента — Фишера, определяющие связь между погрешностями измерения и вероятностью их появления для различного числа наблюдений, т. е. закон распределения случайных ошибок с учетом количества статистического материала. Используя таблицы Стьюдента — Фишера, можно проследить деформацию нормального закона. При большом объеме статистических наблюдений п статистический закон распределения и его числовые характеристики, как было показано выше, совпадают с теоретическими. Действительно, данные последней строки приложения 2 совпадают с данными приложения 1. При уменьшении числа измерений вероятности появления погрешностей тех же значений уменьшаются. Так, при п=10 вероятное появления погрешностей, меньших ±2σт, становится равной 0,9266, а не 0,9545, как это имеет место для теоретического и статистического законов распределения (при п→∞).

Вероятность появления погрешностей, меньших ±zσ, согласно распределению Стьюдента — Фишера,

(2.107)

где fC(n,z)- плотность распределения Стьюдента — Фишера

Плотность распределении fC(n,z) выражается зависимостью

(2.108)

Таблицы Стьюдента- Фишера позволяют решить и обратную задачу — выбор числа экспериментов для обеспечения заданной степени приближения оценок к статистическим характеристикам. При п=121 погрешность в определении вероятности появления погрешностей, лежащих в разных интервалах, состав­ляет 0,5-2%.

В заключение следует отметить, что числовые характеристи­ки являются точечными параметрами законов распределения. Неверной является фраза «вероятность появления погрешности 2σ равна 0,4773», так как вероятность появления погрешности, точно равной 2σ, равна нулю. Р = 0,4773 есть вероятность появ­ления погрешностей, лежащих в интервале от 0 до 2σ.

Аналогично результат измерения X (истинное значение) не может быть выражен одним числом, так как при обработке статистических данных были получены лишь математическое ожидание тХ0, которое может быть принято за действитель­ное значение, и среднее квадратичоское отклонение σт. Следо­вательно, истинное значение лежит в некотором интервале. Ширина интервала зависит от требуемой вероятности его опре­деления, или, как принято говорить, от заданной доверительной вероятности. Так, при нормальном законе распределения Х и заданной доверительной вероятности Р = 0,997

(2.109)

т. е. истинное значение лежит в интервале

Интервал, в котором лежит истинное значение измеряемой величины с заданной доверительной вероятностью, называется доверительным интервалом.

Доверительные интервалы для погрешностей измерения могут задаваться различно; им будут соответствовать определен­ные значения доверительных вероятностей. Так, доверительному интервалу ±zσ соответствует доверительная вероятность (при нормальном законе распределения) появления погрешностей в этом интервале

(2.110)

Доверительному интервалу zσ—(z+1)σ соответствует веро­ятность появления погрешностей, лежащих в этом интервале:

(2.111)

При построении интервалов по оценкам следует пользоваться распределением Стьюдента — Фишера.

Оценки числовых характеристик являются случайными величинами, так как они получены из ограниченной выборки из результатов измерений. Для оценок, как случайных величин, также можно найти доверительные интервалы.

Hа рис. 2.17 самым узким прямоугольником выделен интервал, в котором лежит истинное значение измеряемой величины, определенный по математическому ожиданию .

Рис. 2.17. Уточнение интервала опре­деления X.

Так как , как случайная величина, лежит в некотором интервале (на рис. 2.16 более высокие прямоугольники), то истинное зна­чение измеряемой величины лежит для заданной доверительной вероятности в более широком интервале. При нормальном законе распределения X отношение

(2.112)

имеет так называемое хи-квадрат распределение Пирсона с k = n— 1 степенями свободы. Вид кривой плотности χ2-распределения изображен на рис. 2.18.

 

Рис. 2.18. Кривая плотности χ2-распределения.

 

Значения соответствующие вероятностям Р того, что при

n=k +1 отношение v будет меньше приведены в приложении 3. Доверительный интер­вал строится таким образом, чтобы вероятность выхода диспер­сии за его границы не превышала некоторой малой величины, например q. Примем вероятности выхода за каждую границу одинаковыми, равными 0,5 q (на рис. 2.18 это заштрихованные площади). Вероятности, соответствующие этим границам,

(2.113)

а значения χ2, полученные из приложения 3, соответственно равны

χн и χв.

Вероятность того, что отношение v не выйдет за пределы интервала,

ограниченного

(2.114)

или для среднего квадратического отклонения

(2.115)

Доверительный интервал, таким образом, определяется границами

(2.116)

Этот интервал на рис. 2.16 отмечен самым высоким прямо­угольником.

Итак, интервал, в котором лежит истинное значение изме­ряемой величины, при ограниченном числе измерений уточ­няется дважды. Первое уточнение —определение оценок число­вых характеристик с учетом числа опытов, т. е. из распределения Стьюдента—Фишера. Фактически это позволяет уточнить Второе уточнение связано с установлением вероятности откло­нения от принятой оценки, которое только что было рассмот­рено. Следует отметить, что при достаточно больших п эти уточнения часто не производятся.

 


Эта страница нарушает авторские права

allrefrs.ru - 2019 год. Все права принадлежат их авторам!