Характеристики рассеяния. Характеристики рассеяния Дисперсия и ее свойства Неравенство Чебышёва Точечное оценивание параметров распределения

В описательной статистике центральное место занимает оценивание параметров выборки.

Точечное оценивание параметров распределения

Точечная оценка - количественная характеристика генеральной совокупности, функция от наблюдаемых случайных величин. Далее речь пойдет о точечном оценивании параметров распределения.

Рассмотрим свойства точечных оценок.

А) Несмещенной оценкой параметра θ называется статистическая оценка θ* , математическое ожидание которой равно θ : М (θ* )= θ .

Если М (θ* ) > θ (или М (θ* ) < θ ) , то возникает систематическая ошибка (неслучайная ошибка, искажающая результаты измерений в одну сторону). Несмещенность оценки является гарантией защиты от систематических ошибок.

Б) Однако несмещенная оценка не всегда дает хорошее приближение оцениваемого параметра. Действительно, возможные значения θ* могут быть сильно рассеяны вокруг своего среднего значения (дисперсия D (θ* ) может быть велика). Тогда найденная по данной выборке оценка, например θ* 1 , может оказаться удаленной от М (θ* ), а значит и от θ . Поэтому естественным вслед за несмещенностью, является требование малости дисперсии.

Эффективной называют оценку, которая при данном объеме выборки имеет наименьшую дисперсию.

В) При рассмотрении выборок большого объема к статистическим оценкам предъявляется требование состоятельности. Состоятельной называют оценку, которая при n→∞ по вероятности стремиться к оцениваемому параметру:

Например, если дисперсия несмещенной оценки стремиться к нулю при n→∞, то такая оценка оказывается и состоятельной.

Перейдем к оцениванию параметров распределения.

Параметры распределения – это его числовые характеристики. Они указывают, где в среднем располагаются значения признака (мера положения ), насколько значения изменчивы (мера рассеяния), ихарактеризуют отклонение распределения от нормального (мера формы) . В реальных условиях исследования мы оперируем не параметрами, а их приближенными значениями – оценками параметров, которые являются функциями от наблюдаемых величин. Заметим, что чем больше выборка, тем ближе может быть оценка параметра к его истинному значению.



Пусть x 1 , x 2 , … x к вариационный ряд и n 1 , n 2 , … n к - частоты соответствующих вариант, n – объем выборки.

Показатели положения


Если дано интервальное статистическое распределение, то выборочная средняя определяется для соответствующих интервалов .

Где - середина интервала .

Выборочная средняя является несмещенной и состоятельной оценкой.

Медиана - значение признака, приходящееся на середину упорядоченного по возрастанию вариационного ряда. Если ряд состоит их (2N +1) вариант, то медианой является (N +1)-е значение варианта, если ряд состоит из 2N вариант, то медиана равна полусумме N – го и (N +1) – ого значений вариант.

Мода - вариант с наибольшей частотой. Если таких вариант несколько (у них одна и та же частота), то распределение называют полимодальным .

Показатели вариации

Размах – разница между наибольшим и наименьшим значениями вариант.

Выборочная дисперсия (оценка дисперсии) – характеристика рассеяния наблюдаемых значений количественного признака выборки вокруг своего среднего значения. Обозначим D в - выборочную дисперсию

Можно показать, что М(D в) = (n/(n-1))D в. Поэтому исправленная (несмещенная) дисперсия, которую будем обозначать через , равна


Кроме выборочной дисперсии для характеристики рассеяния пользуются сводной характеристикой - средним квадратическим отклонением (стандартом) σ
Выборочная асимметрия – характеристика симметричности распределения. Обозначается . Для симметричных распределений (в том числе для нормального распределения) асимметрия равна нулю. Если , то «длинная часть» кривой распределения расположена справа от математического ожидания, если , то слева от математического ожидания (рис.2.).

Выборочный эксцесс – характеристика «подъема, крутости» кривой распределения. Обозначается . Для нормального распределения эксцесс равен нулю. При , то кривая имеет более высокую и острую вершину, если , то кривая имеет более низкую вершину, чем нормальная кривая (рис.1).

Цель работы

Познакомиться с явлением рассеяния и научиться определять его характеристики.

Оснащение

1. Диски с номинальным значением А 1 .

2. Диски с номинальным значением А 2 .

3. Микрометр.

4. Стойка.

1. Общие сведения

При изготовлении партии деталей по одному и тому же технологическому процессу, одним и тем же рабочим, на одном и том же рабочем месте, в одних и тех же условиях наблюдаются отклонения значений параметров точности деталей от идеального прототипа и друг от друга. Это явление получило название рассеяние.

На всех этапах технологического процесса изготовления детали действует большое количество непрерывно или дискретно изменяющихся случайных и систематических факторов.

Систематические факторы бывают:

– постоянно действующие (например, погрешность формы обрабатываемой поверхности, обусловленная непараллельностыо оси шпинделя направляющим токарного станка; погрешность измерения и др);

– изменяющиеся по определенному закону у = f (x ) (например, размерный износ инструмента, тепловые деформации станка и др.).

Случайные факторы характеризуются большим их количеством, отсутствием связи между собой и нестабильностью (например, упругие отжатия звеньев системы СПИД).

На практике явление рассеяния любой характеристики качества изучается с помощью точечной диаграммы, которая позволяет определить все характеристики.

Для построения точечной диаграммы по оси абцисс откладываются порядковые номера измерений деталей, а по оси ординат в виде точек – полученные значения соответствующего номера измерений деталей (рис. 1.1). Через точки, соответствующие максимальному и минимальному значениям измерения, проводятся две линии, параллельные между собой и оси абцисс. Расстояние между этими линиями является первой характеристикой рассеяния значений и носит название поля рассеяния ω = А нб A нм . Эта характеристика обязательно дополняется координатой середины поля рассеяния – ∆ω , которая представляет собой расстояние между серединой поля рассеяния и номинальным значением. Она определяет положение поля рассеяния относительно номинала.

Второй характеристикой явления рассеяния служит практическая кривая рассеяния и определяющие ее параметры. Для построения практической кривой рассеяния необходимо поле рассеяния ω на точечной диаграмме разделить на 7…11 интервалов линиями, параллельными оси абцисс. В каждом интервале подсчитать количество попавших в него результатов измерений (абсолютная частость т) и изобразить это количество в виде прямоугольников шириной, равной величине интервала, и высотой, равной абсолютной частости т.

Получившаяся диаграмма называется гистограммой рассеяния. Изобразив абсолютную частоту т в виде прямых линий, расположенных посредине каждого интервала (нагруженных ординат), и соединив их верхние точки отрезками прямых линий, получают ломаную линию, называемую практической кривой рассеяния значений измерения (рис. 2.1).


Pиc. 1.1. Точечная диаграмма и практическая

кривая рассеяния значений измерения

Параметрами, характеризующими практическую кривую рассеяния, являются:

1. Уравнение кривой рассеяния у = φ (х ). Для большинства задач оценки точности в технологии машиностроения распределение текущих значений х i подчиняется нормальному закону (закону Гаусса), для которого

Кроме закона Гаусса текущие значения х i могут распределяться по закону равной вероятности, закону Симпсона, закону Шарлье и др.

2. Центр группирования случайной величины – это среднее значение, около которого располагается наибольшее количество значений. Иными словами, центр группирования – это значение случайной величины, принадлежащее большинству деталей в партии. Положение центра группирования определяется координатой центра группирования (математическим ожиданием) M (x ).

3. Среднее квадратичное отклонение σ, показывающее плотность группирования текущих значений относительно центра группирования М (х ). Графически σ изображается в виде двух абцисс, равноотстоящих от значения M (x ) на величину σ, Эта характеристика служит мерой рассеяния.

4. Коэффициент относительной асимметрии а, показывающий смещение центра группирования М (х ) относительно середины поля рассеяния. Для дискретных величин текущего значения х i характеристики M (x ), σ и а определяются по равенствам:

где р (х i ) = т / п количество значений измерений, попавших в соответству-ющий интервал, выраженное в процентах или долях всего количества измеренных величин (относительная частость).

Вычисленные характеристики рассеяния значений измерения представляются в графическом виде, учитывая, что у m ах ≈ 0,4/σ , у σ ≈ 0.24/σ (рис. 2.2).

Рис. 2.2. Характеристики явления рассеяния: M (x ); σ ; а



2. Порядок выполнения работы

Лабораторная работа выполняется двумя бригадами. Явление рассеяния в данной работе изучается на примере двух партий деталей по 50 штук номиналами А 1 , А 2 .

Произвести установку (50 раз) заготовки в трёхкулачковый патрон и измерить осевое смещение.

При установке деталь необходимо плотно прижимать торцовой поверхностью к оснастке, а при повторных установках деталь необходимо поворачивать вокруг ее оси на некоторый угол.

Результаты измерений зафиксировать после каждой установки детали.

По результатам измерений построить точечную диаграмму, гистограмму и кривую рассеяния аналогично этапу 2.

Определить параметры, характеризующие кривую рассеяния, аналогично этапу 3.

Сравнить результаты экспериментов и сделать выводы.

Построить схему этих характеристик явления рассеяния (рис.2.2).

1. Название, цель и оснащение работы.

2. Результаты измерений деталей номиналом А 1 .

3. Точечная диаграмма и характеристики явления рассеяния.

4. Результаты измерений деталей номиналом А 2 .

5. Точечная диаграмма и характеристики явления рассеяния.

6. Выводы.

4. Контрольные вопросы

1. Что такое явление рассеяния?

2. С помощью чего изучается явление рассеяния.

3. Назовите характеристики явления рассеяния.

4. Какие факторы действуют в процессе изготовления детали?

5. За что отвечают в точечной диаграмме систематические факторы?

6. За что отвечают в точечной диаграмме случайные факторы?

7. Почему при построении практической кривой рассеяния количество интервалов должно быть нечетным?

8. Что такое поле рассеяния?

9. Что такое координата середины поля рассеяния?

10. Зачем нужна координата середины поля рассеяния?

11. Что такое центр группирования?

12. Что такое математическое ожидание?

13. Что показывает математическое ожидание?

14. Что принято за меру рассеяния?

15. Назовите характеристики хода технологического процесса.

16. Назовите характеристики явления рассеяния при обработке партии деталей.

Наряду с наиболее вероятным значением риска важное значение имеет разброс возможных значений риска относительно его центрального значения. Учет разброса показателей необходим и при решении задач социально-гигиенического мониторинга.

Наиболее распространенными характеристиками разброса случайной величины являются дисперсия и среднеквадратичное отклонение.

Дисперсия случайной величины ξ обозначаемая как D (ξ) (используются также обозначения V (ξ) и σ 2 (ξ)), характеризует наиболее вероятное значение квадрата отклонения случайной величины от своего математического ожидания.

Для дискретной случайной величины, принимающей значения х i с вероятностями р i , дисперсия определяется как взвешенная сумма нитратов отклонений х i от математического ожидания ξ с весовыми коэффициентами, равными соответствующим вероятностям:

D(ξ) =

Для непрерывной случайной величины ξ ее дисперсия определяется по формуле:

D(ξ) =

Дисперсия обладает следующими практически важными свойствами:

1.Дисперсия любой случайной величины неотрицательна:

D(ξ) ≥ 0

2. Дисперсия постоянной величины равна 0:

D(C) = 0

где С - константа.

3. Дисперсия случайной величины ξ равна разности между математическим ожиданием квадрата этой случайной величины и квадратом математического ожидания ξ:

D(ξ) = M [ξ – M (ξ)] 2 = M(ξ 2) – ( .

4. Прибавление константы к случайной величине не изменяет дисперсии; умножение случайной величины на константу а приводит к умножению дисперсии на а 2 :

D(aξ + b) = a 2 D(ξ),

где а и b - константы.

5. Дисперсия суммы независимых случайных величин равна сумме их дисперсий:

где ξ и η - независимые случайные величины.

Среднеквадратичным отклонением случайной величины ξ (используются также термин «стандартное отклонение») называется число σ (ξ) равное квадратному корню из дисперсии ξ:

Среднеквадратичное отклонение измеряет отклонение случайной нвеличины от ее математического ожидания в тех же величинах, в которых измеряется сама случайная величина (в отличие от дисперсии, размерность которой равна квадрату размерности исходной случайной величины). Для нормального распределения среднеквадратичное отклонение равно параметру σ. Таким образом, математическое ожидание и стандартное отклонение представляют собой полный набор характеристик нормального распределения и однозначно определяют вид плотности распределения. Для распределений, отличающихся от нормального, эта пара показателей не является столь же эффективной характеристикой распределения.


В качестве характеристики рассеяния случайной величины используется также коэффициент вариации. Коэффициентом вариации случайной величины ξ имеющей ненулевое математическое ожидание, называется число V (ξ) равное отношению среднеквадратичного отклонения ξ к ее математическому ожиданию:

Коэффициент вариации измеряет рассеяние случайной величины в долях ее математического ожидания и часто выражается в процентах от последнего. Этой характеристикой не следует пользоваться, если математическое ожидание близко к 0 или существенно меньше стандартного отклонения (в этом случае малые ошибки при определении математического ожидания приводят к высокой погрешности для коэффициента вариации), а также, если вид плотности распределении существенно отличается от гауссовского.

Коэффициент асимметрии (As ) определяет 3-ю степень отклонении случайной величины от математического ожидания и определяется по формуле:

На практике этот показатель используется в качестве оценки симметричности распределения. Для любого симметричного распределения он равен 0. Если же плотность распределения несимметрична (что часто может иметь место при оценке риска смерти и рисков, связанных с загрязнением воды и воздуха), то положительный коэффициент асимметрии соответствует случаю, когда левое плечо кривой плотности круче правого, а отрицательный - случаю, когда правое плечо круче левого (рис 4.17).

Для асимметричных распределений стандартное отклонение не является хорошим показателем рассеяния случайной величины. Для характеристики рассеяния в этом случае можно использовать такие показатели, как квартили, квантили и процентили.

Первой квартилью случайной величины ξ, имеющей функцию распределения F(х), называется число Q 1 являющееся решением уравнения

F(Q 1) = 1/4

т. е. такое число, для которого вероятность того, что ξ принимает значения, меньшие Q 1 , равна 1/4, вероятность того, что она принимает значения, большие Q 1 равна 3/4.

Второй квартилью (Q 2 ) случайной величины называется ее медиана, а третьей (Q 3 ) - решение уравнения

F(Q 3) = 3/4

Квартили делят ось абсцисс на 4 интервала: [-∞,Q 1 ], [Q 1 , Q 2 ], [Q 2 , Q 3 ] и [Q 3 , + ∞] в каждый из которых случайная величина попадает c равной вероятностью, а фигуру, ограниченную осью абсцисс и графиком плотности распределения - на 4 области с одинаковой площадью. И интервале между первой и третьей квартилями сосредоточено 50% распределения случайной величины. Для симметричных распределений первая и третья квартили одинаково удалены от медианы.

Квантилью порядка р случайной величины ξ с функцией распределения F(х) называется число х , являющееся решением уравнения

Таким образом, квартили являются квантилями порядка 0,25, 0,5 и 0,75. Если порядок квантили р выражается в процентах, то соответствующие значения х называются процентилями, или р -процентными точками распределения.

На рис. 4.18 показаны, наряду с квантилями, 2,5- и 97,5-процентные точки распределения. Между этими точками сосредоточено 95% распределения случайной величины, поэтому заключенный между ними интервал называют 95 %-м доверительным интервалом среднего (в частности, при оценке рисков - 95 %-м доверительным интервалом риска).

Задача 2. Какие из перечисленных ниже сведений о случайной величине ξ позволяют отвергнуть предположение о том, что она распределена по нормальному закону:

а) ξ - дискретная случайная величина;

б) математическое ожидание ξ отрицательно;

в) распределение ξ унимодально;

г) математическое ожидание ξ не равно ее медиане;

д) коэффициент асимметрии ξ отрицателен;

е) стандартное отклонение ξ больше ее математического ожидания;

ж) ξ характеризует распределение продолжительности острых заболеваний органов дыхания на исследуемой территории;

з) ξ характеризует распределение продолжительности жизни на исследуемой территории;

и) медиана ξ не совпадает с центром интервала между первой и третьей квартилями.

Ответ: Предположение о нормальном законе распределения случайной величины несовместимо с утверждениями а), г), д), з), и).

Рис. 4.17. Зависимость между знаком Рис.4.18. Квартили и процентили:

коэффициента асимметрии и формой иллюстрация с помощью функции

функции плотности распределения

К основным статистическим характеристикам ряда измерений (вариацион­ного ряда) относятся характеристики положения (средние характе­ристики, или центральная тенденция выборки ); характеристики рассеяния (ва­риации, или колеблемости ) и характеристики формы распределения.

К характеристикам положения относятся среднее арифметическое значе­ние (среднее значение ), мода и медиана.

К характеристикам рассеяния (вариации, или колеблемости ) относятся: размах вариации , дисперсия , среднее квадратическое (стандартное ) отклонение , ошибка средней арифметической (ошибка средней ), коэффициент вариации и др.

К характеристикам формы относятся коэффициент асимметрии, мера ско­шенности и эксцесс.

Характеристики положения

Среднее арифметическое значение – одна из основных характеристик вы­борки.

Она, как и другие числовые характеристики выборки, может вычисляться как по необработанным первичным данным, так и по результатам группировки этих данных.

Точность вычисления по необработанным данным выше, но процесс вычисления оказывается трудоёмким при большом объёме выборки.

Для несгруппированных данных среднее арифметическое определяется по формуле:

где n - объем выборки, х 1 , х 2 , ... х n - результаты измерений.

Для сгруппированных данных:

где n - объем выборки, k – число интервалов группировки, n i – частоты интервалов, x i – срединные значения интервалов.

Мода

Определение 1. Мода - наиболее часто встречающаяся величина в данных вы­борки. Обозначается Мо и определяетсяпо формуле:

где - нижняя граница модального интервала, - ширина интервала группи­ровки, - частота модального интервала, - частота интервала, предшествую­щего модальному, - частота интервала, последующего за модаль­ным.

Определение 2. Модой Мо дискретной случайной величины называется наиболее вероятное её значение.

Геометрически моду можно интерпретировать как абсциссу точки максимума кривой распределения. Бывают двухмодальные и многомодальные распределения. Встречаются распределения, которые имеют минимум, но не имеют максимума. Такие распределения называются антимодальными .

Определение. Модальным интервалом называется интервал группировки с наибольшей частотой.

Медиана

Определение . Медиана - результат измерения, который находится в сере­дине ранжированного ряда, иначе говоря, медианой называется значение признака Х , когда одна половина значений экспериментальных данных меньше её, а вторая половина – больше, обозначается Ме .

Когда объем выборки n - четное число, т. е. результатов измерений четное количество, то для определения медианы рассчитывается среднее значение двух показателей выборки, находящихся в середине ранжированного ряда.

Для данных, сгруппированных в интервалы, медиану определяют по фор­муле:

,

где - нижняя граница медианного интервала; ширина интервала группи­ровки, 0,5n – половина объёма выборки, - частота медианного интервала, - накопленная частота интервала, предшествующего медианному.

Определение. Медианным интервалом называется тот интервал, в котором накопленная частота впервые окажется больше половины объёма выборки (n/ 2) или накопленная частость окажется больше 0,5.

Численные значения среднего, моды и медианы отличаются, когда имеет место несимметричная форма эмпирического распределения.

Характеристики рассеяния результатов измерений

Для математико-статистического анализа результатов выборки знать только характеристики положения недостаточно. Одна и та же величина среднего значе­ния может характеризовать совершенно различные выборки.

Поэтому кроме них в статистике рассматривают также характеристики рассеяния (вариации, или колеблемости ) результатов .

Размах вариации

Определение. Размахом вариации называется разница между наибольшим и наименьшим результатами выборки, обозначается R и определяется

R =X max - X min .

Информативность этого показателя невелика, хотя при малых объёмах вы­борки по размаху легко оценить разницу между лучшим и худшим результатами спортсменов.

Дисперсия

Определение. Дисперсией называется средний квадрат отклонения значений признака от среднего арифметического.

Для несгруппированных данных дисперсия определяется по формуле

s 2 = , (1)

где Х i – значение признака, - среднее арифметическое.

Для данных, сгруппированных в интервалы, дисперсия определяется по формуле

,

где х i – среднее значение i интервала группировки, n i – частоты интервалов.

Для упрощения расчётов и во избежание погрешностей вычисления при округ­лении результатов (особенно при увеличении объёма выборки) используются также другие формулы для определения дисперсии. Если среднее арифметическое уже вычислено, то для несгруппированных данных используется следующая фор­мула:

для сгруппированных данных:

.

Эти формулы получаются из предыдущих раскрытием квадрата разности под знаком суммы.

Характеристики положения описывают центр распределения. В то же время значения вариант могут группироваться вокруг него как в широкой, так и в узкой полосе. Поэтому для описания распределения необходимо охарактеризовать диапазон изменения значений признака. Для описания диапазона варьирования признака используются характеристики рассеяния. Наиболее широкое применение нашли размах вариации, дисперсия, стандартное отклонение и коэффициент вариации.

Размах вариации определяется как разность между максимальным и минимальным значением признака в изучаемой совокупности:

R =x max -x min .

Очевидным достоинством рассматриваемого показателя является простота расчета. Однако поскольку размах вариации зависит от величин только крайних значений признака, то область его применения ограничена достаточно однородными распределениями. В остальных случаях информативность этого показателя весьма невелика, поскольку существует очень много распределений, сильно отличающихся по форме, но имеющих одинаковый размах. В практических исследованиях размах вариации используется иногда при малых (не более 10) объемах выборки. Так, например, по размаху вариации легко оценить, насколько различаются лучший и худший результаты в группе спортсменов.

В рассматриваемом примере:

R =16,36 – 13,04=3,32 (м).

Второй характеристикой рассеяния является дисперсия. Дисперсия представляет собой средний квадрат отклонения значения случайной величины от ее среднего значения. Дисперсия есть характеристика рассеяния, разбросанности значений величины около ее среднего значения. Само слово «дисперсия» означает «рассеяние».

При проведении выборочных исследований необходимо установить оценку для дисперсии. Дисперсия, вычисляемая по выборочным данным, называется выборочной дисперсией и обозначается S 2 .

На первый взгляд наиболее естественной оценкой для дисперсии является статистическая дисперсия, вычисленная, исходя из определения, по формуле:

В этой формуле - сумма квадратов отклонений значений признака х i от среднего арифметиче­ского . Для получения среднего квадрата отклонений эта сумма поделена на объем выборки п .

Однако такая оценка не является несмещенной. Можно показать, что сумма квадратов отклонений значений признака для выборочного среднего арифметического меньше, чем сумма квадратов отклонений от любой другой величины, в том числе от истинного среднего (математического ожидания). Поэтому результат, получаемый по приведенной выше формуле, будет содержать систематическую ошибку, и оценочное значение дисперсии окажется заниженным. Для ликвидации смещения достаточно ввести поправочный коэффициент . В результате получается следующее соотношение для оценочной дисперсии:

При больших значениях n , естественно, обе оценки - смещенная и несмещенная – будут различаться очень мало и введение поправочного множителя теряет смысл. Как правило, уточнение формулы для оценки дисперсии следует производить при n <30.

В случае сгруппированных данных последнюю формулу для упрощения вычислений можно привести к следующему виду:

где k - число интервалов группировки;

n i - частота интервала c номером i ;

x i - срединное значение интервала c номером i .

В качестве примера проведем вычисление дисперсии для сгруппированных данных разбираемого нами примера (см. табл. 4.):

S 2 =/ 28=0,5473 (м 2).

Дисперсия случайной величины имеет размерность квадрата размерности случайной величины, что затрудняет ее интерпретацию и делает не очень наглядной. Для более наглядного описания рассеяния удобнее пользоваться характеристикой, размерность которой совпадает с размерностью исследуемого признака. С этой целью вводится понятие стандартного отклонения (или среднего квадратического отклонения ).

Стандартным отклонением называется положительный корень квадратный из дисперсии:

В разбираемом нами примере стандартное отклонение равно

Стандартное отклонение имеет те же единицы измерения, что и результаты измерения исследуемого признака и, таким образом, оно характеризует степень отклонения признака от среднего арифметического. Иными словами, оно показывает, как расположена основная часть вариант относительно среднего арифметического.

Стандартное отклонение и дисперсия являются наиболее широко применяемыми показателями вариации. Связано это с тем, что они входят в значительную часть теорем теории вероятностей, служащей фундаментом математической статистики. Помимо этого, дисперсия может быть разложена на составные элементы, позволяющие оценить влияние различных факторов на вариацию исследуемого признака.

Помимо абсолютных показателей вариации, которыми являются дисперсия и стандартное отклонение, в статистике вводятся относительные. Наиболее часто применяется коэффициент вариации. Коэффициент вариации равен отношению стандартного отклонения к среднему арифметическому, выраженному в процентах:

Из определения ясно, что по своему смыслу коэффициент вариации представляет собой относительную меру рассеяния признака.

Для рассматриваемого примера:

Коэффициент вариации широко используется при проведении статистических исследований. Будучи величиной относительной, он позволяет сравнивать колеблемости как признаков, имеющих различные единицы измерения, так одного и того же признака в нескольких разных совокупностях с различными значениями среднего арифметического.

Коэффициент вариации используется для характеристики однородности полученных экспериментальных данных. В практике физической культуры и спорта разброс результатов измерений в зависимости от значения коэффициента вариации принято считать небольшим (V<10%), средним (11-20%) и большим (V> 20%).

Ограничения на использование коэффициента вариации связаны с его относительным характером – определение содержит нормировку на среднее арифметическое. В связи с этим при малых абсолютных значениях среднего арифметического коэффициент вариации может потерять свою информативность. Чем ближе значение среднего арифметического к нулю, тем менее информативным становится этот показатель. В предельном случае среднее арифметическое обращается в ноль (например, температура) и коэффициент вариации обращается в бесконечность независимо от разброса признака. По аналогии со случаем погрешности можно сформулировать следующее правило. Если значение среднего арифметического в выборке больше единицы, то использование коэффициента вариации правомерно, в противном случае для описания разброса опытных данных следует использовать дисперсию и стандартное отклонение.

В заключение этой части рассмотрим оценку варьирования значений оценочных характеристик. Как уже было отмечено, значения характеристик распределения, рассчитанные по данным эксперимента, не совпадают с их истинными значениями для генеральной совокупности. Точно установить последние не представляется возможным, поскольку, как правило, невозможно обследовать всю генеральную совокупность. Если использовать для оценки параметров распределения результаты разных выборок из одной и той же генеральной совокупности, то окажется, что эти оценки для разных выборок отличаются друг от друга. Оценочные значения флуктуируют около своих истинных значений.

Отклонения оценок генеральных параметров от истинных значений этих параметров называются статистическими ошибками. Причиной их возникновения является ограниченный объем выборки - не все объекты генеральной совокупности входят в нее. Для оценки величины статистических ошибок используется стандартное отклонение выборочных характеристик.

В качестве примера рассмотрим наиболее важную характеристику положения - среднее арифметическое. Можно показать, что стандартное отклонение среднего арифметического определяется соотношением:

где σ - стандартное отклонение для генеральной совокупности.

Поскольку истинное значение стандартного отклонения не известно, то для оценки стандартного отклонения выборочного среднего используется величина, называемая стандартной ошибкой среднего арифметического и равная:

Величина характеризует ошибку, которая в среднем допускается при замене генерального среднего его выборочной оценкой. Согласно формуле, увеличение объема выборки при проведении исследования приводит к уменьшению стандартной ошибки пропорционально корню квадратному из объема выборки.

Для рассматриваемого примера значение стандартной ошибки среднего арифметического равно . В нашем случае она оказалась в 5,4 раза меньше значения стандартного отклонения.