Как рассчитать коэффициент вариации. Среднее квадратическое отклонение

Показатели вариации. При изучении варьирующего признака у единиц совокупности нельзя ограничиваться лишь расчетом средней величины из отдельных вариантов, так как одна и та же средняя может относиться далеко не к одинаковым по составу совокупностям.

Вариацией признака называется различие индивидуальных значений признака внутри изучаемой совокупности.

Термин «вариация» произошел от латинского variatio – изменение, колеблемость, различие. Однако не всякие различия принято называть вариацией.

Под вариацией в статистике понимают такие количественные изменения величины исследуемого признака в пределах однородной совокупности, которые обусловлены перекрещивающимся влиянием действия различных факторов. Колеблемость отдельных значений характеризуют показатели вариации. Чем больше вариация, тем дальше в среднем отдельные значения лежат друг от друга.

Различают вариацию признака в абсолютных и относительных величинах.

К абсолютным показателям относятся: размах вариации, среднее линейное отклонение, среднее квадратическое отклонение, дисперсия. Все абсолютные показатели имеют ту же размерность, что и изучаемые величины.

К относительным показателям относятся коэффициенты осцилляции, линейного отклонения и вариации.

Показатели абсолютные. Рассчитаем абсолютные показатели, характеризующие вариацию признака.

Размах вариации, представляет собой разность между максимальным и минимальным значением признака.

R = Xmax – Xmin.

Показатель размаха вариации не всегда применим, так как он учитывает только крайние значения признака, которые могут сильно отличаться от всех других единиц.

Более точно можно определить вариацию в ряду при помощи показателей, учитывающих отклонения всех вариантов от средней арифметической.

Таких показателей в статистике два: среднее линейное и среднее квадратическое отклонение.

Среднее линейное отклонение (L) представляет собой среднее арифметическое из абсолютных значений отклонений отдельных вариантов от средней.

Практическое использование среднего линейного отклонения заключается в следующем, с помощью этого показателя анализируется состав работающих, ритмичность производства, равномерность поставок материалов.

Недостаток этого показателя заключается в том, что он усложняет расчеты вероятного типа, затрудняет применение методов математической статистики.

Среднее квадратическое отклонение () является наиболее распространенным и общепринятым показателем вариации. Оно несколько больше среднего линейного отклонения. Для умеренно асимметричных распределений установлено следующее соотношение между ними

Для его исчисления каждое отклонение от средней возводится в квадрат, все квадраты суммируются (с учетом весом), после чего сумма квадратов делится на число членов ряда и из частного извлекается корень квадратный.

Все эти действия выражает следующая формула

т.е. среднее квадратическое отклонение представляет собой корень квадратный из средней арифметической квадратов отклонений от средней.

Среднее квадратическое отклонение является мерилом надежности средней. Чем меньше σ, тем лучше среднее арифметическое отражает собой всю представляемую совокупность.

Средняя арифметическая из квадратов отклонений вариантов значений признака от средней величины носит название дисперсии (), которая рассчитывается по формулам

Отличительной особенностью данного показатели является то, что при возведении в квадрат () удельный вес малых отклонений уменьшается, а больших увеличивается в общей сумме отклонений.

Дисперсия обладает рядом свойств, некоторые из них позволяют упростить её вычисление:

1. Дисперсия постоянной величины равна 0.

Если , то и .

Тогда .

2. Если все варианты значений признака (x) уменьшить на одно и то же число, то дисперсия не уменьшится.

Пусть , но тогда в соответствии со свойствами средней арифметической и .

Дисперсия в новом ряду будет равна

Т.е. дисперсия в ряду равна дисперсии первоначального ряда .

3. Если все варианты значений признака уменьшить в одно и то же число раз (k раз), то дисперсия уменьшится в k2 раз.

Пусть , тогда и .

Дисперсия же нового ряда будет равна

4. Дисперсия, рассчитанная по отношению к средней арифметической, является минимальной. Средний квадрат отклонений, рассчитанный относительно произвольного числа , больше дисперсии, рассчитанной по отношению к средней арифметической, на квадрат разности между средней арифметической и числом , т.е. . Дисперсия от средней имеет свойство минимальности, т.е. она всегда меньше дисперсий, исчисленных от любых других величин. В этом случае, когда приравниваем к 0 и, следовательно, не вычисляем отклонения, формула принимает такой вид:

Выше был рассмотрен расчет показателей вариации для количественных признаков, но в экономических расчетах может ставиться задача оценки вариации качественных признаков. Например, при изучении качества изготовленной продукции, продукцию можно разделить на качественную и бракованную.

В таком случае речь идет об альтернативных признаках.

Альтернативными признаками называются такие, которыми одни единицы совокупности обладают, а другие нет. Например, наличие производственного стажа у абитуриентов, ученая степень у преподавателей ВУЗов и т.д. Наличие признака у единиц совокупности условно обозначаем через 1, а отсутствие – 0. Тогда, если долю единиц, обладающих признаком (в общей численности единиц совокупности), обозначить через р, а долю единиц, не обладающих признаком, через q, дисперсию альтернативного признака можно рассчитать по общему правилу. При этом p + q = 1 и, значит, q = 1– p.

Сначала рассчитываем среднее значение альтернативного признака:

Рассчитаем среднее значение альтернативного признака

,

т.е. среднее значение альтернативного признака равно доле единиц, обладающих данным признаком.

Дисперсия же альтернативного признака будет равна:

Таким образом, дисперсия альтернативного признака равняется произведению доли единиц, обладающих данным признаком, на долю единиц, не обладающих данным признаком.

А среднее квадратическое отклонение будет равно =.

Показатели относительные. Для целей сравнения колеблемости различных признаков в одной и той же совокупности или же при сравнении колеблемости одного и того же признака в нескольких совокупностях представляют интерес показатели вариации, выраженные в относительных величинах. Базой для сравнения служит средняя арифметическая. Эти показатели вычисляются как отношение размаха вариации, среднего линейного отклонения или среднего квадратического отклонения к средней арифметической или медиане.

Чаще всего они выражаются в процентах и определяют не только сравнительную оценку вариации, но и дают характеристику однородности совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33%. Различают следующие относительные показатели вариации:

1. Коэффициент осцилляции отражает относительную колеблемость крайних значений признака вокруг средней.

3. Коэффициент вариации оценивает типичность средних величин.

.

Чем меньше , тем однороднее совокупность по изучаемому признаку и типичнее средняя. Если ≤33%, то распределение близко к нормальному, а совокупность считается однородной. Из приведенного примера вторая совокупность однородна.

Виды дисперсий и правило сложения дисперсий. Наряду с изучением вариации признака по всей совокупности в целом часто бывает необходимо проследить количественные изменения признака по группам, на которые разделяется совокупность, а также и между группами. Такое изучение вариации достигается посредством вычисления и анализа различных видов дисперсии.

При этом можно определить три показателя колеблемости признака в совокупности:

1. Общую вариацию совокупности, которая является результатом действия всех причин. Эта вариация может быть измерена общей дисперсией (), характеризующей отклонения индивидуальных значений признака совокупности от общей средней

.

2. Вариацию групповых средних, выражающих отклонения групповых средних от общей средней и отражающих влияние того фактора, по которому произведена группировка. Эта вариация может быть измерена так называемой межгрупповой дисперсией (δ2)

,

где - групповые средние, а -общая средняя для всей совокупности, и - численность отдельных групп.

3. Остаточную (или внутригрупповую) вариацию, которая выражается в отклонении отдельных значений признака в каждой группе от их групповой средней и, следовательно, отражает влияние всех прочих факторов кроме положенного в основу группировки. Поскольку вариацию в каждой группе отражает групповая дисперсия

,

то для всей совокупности остаточную вариацию будет отражать средняя из групповых дисперсий. Эту дисперсию называют средней из внутригрупповых дисперсий () и рассчитывается она по формуле

Это равенство, имеющее строго математическое доказательство, известно, как правило сложения дисперсий.

Правило сложения дисперсий позволяет находить общую дисперсию по её компонентам, когда индивидуальные значения признака неизвестны, а в распоряжении имеются только групповые показатели.

Коэффициент детерминации. Правило сложения дисперсии позволяет выявить зависимость результатов от определенных факторов при помощи коэффициента детерминации.

Оно характеризует влияние признака, положенного в основание группировки, на вариацию результативного признака. Корреляционное отношение изменяется в пределах от 0 до 1. Если , то группировочный признак не оказывает влияния на результативный. Если , то результативный признак изменяется только в зависимости от признака, положенного в основание группировки, а влияние прочих факторных признаков равно нулю.

Показатели асимметрии и эксцесса. В области экономических явлений строго симметричные ряды встречаются крайне редко, чаще приходится иметь дело с асимметричными рядами.

В статистике для характеристики асимметрии пользуются несколькими показателями. Если учесть, что в симметричном ряду средняя арифметическая совпадает по значению с модой и медианой, то наиболее простым показателем асимметрии () будет разность между средней арифметической и модой, т.е.

Величину эксцесса рассчитывают по формуле

Если >0, то эксцесс считают положительным (распределение островершинно), если <0, то эксцесс считается отрицательным (распределение низковершинно).

Относительные показатели вариации - раздел Экономика, Данные о деятельности банков одного из регионов РФ 1. Коэффициент Вариации (Vσ) – Относительный Пока...

Совокупность считается качественно однородной, если коэффициент вариации не превышает 0,33 (или 33%).

Таблица 5.1.3.

Шкала оценки однородности совокупности

При этом средняя величина исследуемого признака может считаться типичной, надёжной характеристикой статистической совокупности.

Если же коэффициент вариации больше 0,33 (или 33%) то, следовательно, вариация исследуемого признака велика , и найденная средняя плохо представляет всю статистическую совокупность, не является её типичной, надёжной характеристикой , а сама совокупность является неоднородной по рассматриваемому признаку.

Аналогично коэффициенту вариации рассчитывают другие относительные показатели вариации , которые в практике статистики применяются реже:

2. Показатель осцилляции: ; (5.1.12.)

3. Линейный коэффициент вариации: . (5.1.13)


Рассчитаем показатели вариации для сквозной задачи:

Таблица 5.1.4.

Расчетная таблица для нахождения характеристик ряда распределения

Группы банков по объему кредитных вложений, млн. руб. X Середина интервала Число банков, Произведение вариантов на частоты
гр.4= гр.2*гр.3 гр.6= гр.5*гр.5 гр.7= гр.6*гр.3
375,00 - 459,00 =417 417*4= 417-585= -168 = 28224*4=
459,00 - 543,00 ? ? ? ?
543,00 - 627,00 ? ? ? ?
627,00 - 711,00 ? ? ? ?
711,00 - 795,00 ? ? ? ?
Итого ? Х х ?

Расчет средней арифметической взвешенной:

Расчет дисперсии:

σ2 =

Расчет среднего квадратического отклонения:


Расчет коэффициента вариации:

Вывод. Анализ полученных значений показателей и σ говорит о том, что средний объем кредитных вложений банков составляет _______?млн. руб., отклонение от среднего объема в ту или иную сторону составляет в среднем _________?млн. руб. (или ______?%), наиболее характерные значения объема кредитных вложений находятся в пределах от ______________?млн. руб. до _______________?млн. руб. (диапазон ).(см. табл. 3.2.5 -_____? банков или ______?% входят в этот интервал).

Значение V σ = ______?% _____? превышает 33%, следовательно, вариация кредитных вложений в исследуемой совокупности банков незначительна и совокупность по данному признаку качественно однородна. Расхождение между значениями , Мо и Ме незначительно (=585 млн. руб., Мо=593,40 млн. руб., Ме=588,818 млн. руб.), что подтверждает вывод об однородности совокупности банков. Таким образом, найденное среднее значение объема кредитных вложений банков (585 млн. руб.) ______? является типичной, надежной характеристикой исследуемой совокупности банков.

Конец работы -

Эта тема принадлежит разделу:

Данные о деятельности банков одного из регионов РФ

Данные сквозной задачи.. таблица.. данные о деятельности банков одного из регионов РФ номер банка кредитные вложения млн руб прибыль..

Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ:

Что будем делать с полученным материалом:

Если этот материал оказался полезным ля Вас, Вы можете сохранить его на свою страничку в социальных сетях:

Все темы данного раздела:

Предмет, метод и задачи статистики
1.1. Предмет, методы, задачи статистики Термин «статистика» происходит от латинского «status»,которое вошло в употребление в Германии в середине 18 века. Впервые статистику стал преподават

Отдельные объекты или явления, образующие статистическую совокупность, называются единицами совокупности
Например, при проведении переписи торгового оборудования единицей наблюдения является торговое предприятие, а единицей совокупности - их оборудование (прилавки, холодильные агрегаты и т.д.).

Признак - это характерное свойство изучаемого явления, отличающее его от других явлений
В разных отраслях статистики изучаются разные признаки. Так, например, объектом изучения является предприятие, а его признаками - вид продукции, объем выпуска, численность работающих и т.д. Или объ

Понятие стат. наблюдения. Требования к собираемой информации
Статистическое наблюдение - это начальная стадия экономико-статистического наблюдения. Она представляет собой научно организационную работу по собиранию мас

Основные виды, формы и способы наблюдения
Специально организованное статистическое наблюдение представляет собой сбор сведений посредством переписей, единовременных учётов и обследований. Примером специально организованного статистического

Точность наблюдения и контроль данных наблюдения
Всякое статистическое наблюдение ставит задачу получения таких данных, которые точнее бы отражали действительность. Отклонения, или разности между исчисленными показателями и действительными (истин

Абсолютные и относительные величины
Для характеристики массовых явлений статистика использует статистические величины (показатели). Они подразделяются на абсолютные, относительные и

Каждая выделенная группа характеризуется СРЕДНЕЙ величиной (величинами) результативного признака
Таблица 3.2.3. Аналитическая группировка зависимости кредитных вложений и прибыли банков Номер группы Группы банков по величине кредитных вло

По объему кредитных вложений
Для построения интервального вариационного ряда, характеризующего распределение банков по объему кредитных вложений, необходимо вычислить величину и границы интервалов ряда.

Статистическим рядом распределения называют упорядоченное распределение единиц совокупности на группы по изучаемому признаку
В зависимости от вида признака, рассматриваемого как группировочный ряды могут быть вариационными (количественными) и атрибутивными (качественными).

Табличное и графическое представление статистических данных
Статистические таблицы – своего рода статистическое предложение, которое состоит из статистического подлежащего и статистического сказуемого. Статистические таблицы - э

Или 15 16 17
4.отсутствие данных может быть обусловлено различными причинами и это по-разному должно отражаться в таблицах: а) если данный признак вообще не подлежит заполнению, то ста

Графическое представление статистических данных
Применение графиков в статистике насчитывает более чем двухсотлетнюю историю. Основоположником графического метода в статистике коммерческой деятельности считают английского экономиста У. Плейфейра

Полигон распределения частот
На основе данных табл. 3.4.3. построим полигон частот Таблица 3.4.3. Распределение размеров обуви у мужчин-респондентов опроса № размера Число

Гистограммы
Для изображения интервального ряда распределения используется гистограмма. При ее построении на оси абсцисс откладываются величины интервалов (

Кумулята
Для изображения рядов распределения используется кумулятивная кривая (кривая сумм). При построении кумуляты интервального вариационного ряда по оси абсцисс откладываются варианты ряда (

Сущность средних величин. Две формы средних величин
Средняя величина – показатель, который дает обобщающую характеристику варьирующего признака однородной совокупности. Свойства средней величины: 1. Средняя характеризует всю совок

Средняя гармоническая
Гармоника – подобие, созвучие, средняя гармоническая близка к средней арифметической величине Средняя гармоническая используется в случаях, когда статистическая информация

Понятие вариации. Основные показатели вариации
Вариация – это различия в индивидуальных значениях признака у единиц изучаемой совокупности. Необходимость изучения вариации связана с тем, что

Прочих, неучтенных факторов
Этот показатель вычисляется по формуле, (5.2.1.) где yi

Объема кредитных вложений (наш факторный признак - х)
Показатель вычисляется по формуле

Прочих, неучтенных факторов
(5.2.9.) Средняя из внутригрупповых дисперсий (

Кривая имеет форму колокола
2. Так как функция нормального распределения – чётная, то есть f(-t)=f(t), то кривая нормального распределения симметрична относительно максимальной ординаты, равной

Следовательно ассиметрия левосторонняя
Наиболее точный коэффициент асимметрии – коэффициент, рассчитанный с использованием центрального момента распределения третьего порядка.

Понятие о выборочном наблюдении и ошибках выборки
Выборочным называется такое несплошное наблюдение, при котором признаки регистрируются у отдельных единиц изучаемой статистической совокупности, отобранных с использ

Средняя и предельная ошибки выборки
Применение выборочного метода наблюдения всегда связано с установлением степени достоверности оценок показателей генеральной совокупности, полученных на основе значений пока

Определение ошибки выборки для среднего объема кредитных вложений банков и границ, в которых будет находиться генеральная средняя
По условию сквозной задачи выборочная совокупность насчитывает 30 банков, выборка 20% механическая, следовательно, генеральная совокупность включает (______?)=________? банков.

Доля единиц выборочной совокупности, обладающих тем или иным заданным свойством, выражается формулой
, (6.3.4.) где m – число единиц совокупности, обладающих з

Определение необходимого объема выборки с заданным значением допустимой предельной ошибки выборки, равной 10 млн. руб
Для собственно-случайной и механической выборки с бесповторным способом отбора необходимый объем выборки для средней количественного признака вычисляется по формуле:

Понятие о корреляционной связи. Виды и формы корреляционных связей
Среди многих форм связей, имеющих количественный характер и изучаемых количественными методами, особое место занимают факторные связи, для исследований которых применяются методы кор

Функциональные связи
Связь результативного признака Y с факторным признаком X называется функциональной, если каждому возможному значению xi признака X

Если в модели учитывается зависимость признака Y от ряда факторов, то модель имеет вид
(7.1.5.) Характерной особенностью стохастических связей является

Визуально можно предположить существование корреляционной связи
3. Корреляционная таблица представляет собой комбинацию двух рядов распределения. Строки таблицы соответствуют группировке единиц совокупности по факторному признаку

Метод аналитической группировки
При использовании метода аналитической группировки строится интервальный ряд распределения единиц совокупности по факторному признаку Х и для каждой j-ой группы ряда определяется среднегруп

Регрессионный метод анализа взаимосвязи
Линию, сглаживающую эмпирическую ломаную линию связи, называют теоретической линией регрессии Y на X или просто линией регрессии. Эта линия от

Способ выражения уровней ряда
Таблица 8.1.2 Число квартир, построенных предприятиями и организациями всех форм собственности и их средний размер в РФ Показатели

Средние показатели в рядах динамики
В табл. 8.2.1. представлены данные, характеризующие динамику изменения уровней ряда за отдельные периоды времени. Для обобщающей оценки изменений уровней ряда за весь рассматриваемый период времени

Прогнозирование объемов реализации продукции с использованием среднего темпа роста
Прогнозирование уровня ряда динамики с использованием среднего темпа (коэффициента) роста осуществляется по следующей формуле:

Методы выявления сезонных колебаний
В ряде случаев закономерно повторяются различия в уровнях ряда в зависимости от времени года. Задача заключается в том, чтобы измерить такие различия, чтобы они были не случ

Методы анализа основной тенденции в рядах динамики
Тренд – основная достаточно устойчивая тенденция развития явления в ряду динамики, иначе говоря, плавное и устойчивое изменение уровней (у) во времени. На т

Производство зерна в РФ, млн.тонн
Годы t производство, млн. тн y Сред-няя за 3 года Сколь-зящая сумма за 5 лет, Сколь-зящая средняя за 5 лет, расче

Индивидуальные и общие индексы. Проблемы соизмерения индексируемых величин в агрегатных индексах
Индивидуальный индекс – характеризует динамику уровня изучаемого явления во времени за два сравниваемых периода или выражает соотношение отдельных элементов совокупности.

Формуле Пааше отдается предпочтение, когда индекс цен рассматривается в системе с индексом товарооборота и индексом физического объема
Пример 9.2.2. Таблица 9.2.3. Данные о реализации продукции в магазине «Звездочка» Продукт Ед. изм. Базисный период О

Индексы средние из индивидуальных
Средний индекс – это индекс, исчисленный как средняя величина из индивидуальных индексов. Эти индексы применяются в тех случаях, когда в исходной информации нет данных

Индекс товарооборота есть произведение индекса цен (по Пааше) и физического объема
, проверим это:

Индексы постоянного и переменного состава. Индексы фиксированной структуры
При изучении качественных показателей часто приходится рассматривать изменение во времени (или пространстве) СРЕДНЕЙ величины индексиру

Индекс структурных сдвигов
Все рассмотренные выше индексы рассчитывались по нескольким товарам, реализуемым в одном месте. Рассмотрим теперь случай, когда ОДИН товар реализуется в нескольких местах. Пример 9.5.1.

Практическое занятие
Задача 01 Рассчитать аналитические и средние показателигодовых изменений уровней ряда, сделать соответствующие выводы. Таблица 1. Объем реализации по изд

Средний темп прироста -
Годы (t) Объем реализации, тыс. тонн. Абсолютный прирост, тыс. тонн Темп роста, % Темп прироста, % Абсолютное значе-н

По данным выборочного обследования произведена группировка вкладчиков по размеру вклада в Сбербанке города:

Определите:

1) размах вариации;

2) средний размер вклада;

3) среднее линейное отклонение;

4) дисперсию;

5) среднее квадратическое отклонение;

6) коэффициент вариации вкладов.

Решение:

Данный ряд распределения содержит открытые интервалы. В таких рядах условно принимается величина интервала первой группы равна величине интервала последующей, а величина интервала последней группы равна величине интервала предыдущей.

Величина интервала второй группы равна 200, следовательно, и величина первой группы также равна 200. Величина интервала предпоследней группы равна 200, значит и последний интервал будет иметь величину, равную 200.

1) Определим размах вариации как разность между наибольшим и наименьшим значением признака:

Размах вариации размера вклада равен 1000 рублей.

2) Средний размер вклада определим по формуле средней арифметической взвешенной.

Предварительно определим дискретную величину признака в каждом интервале. Для этого по формуле средней арифметической простой найдём середины интервалов.

Среднее значение первого интервала будет равно:

второго - 500 и т. д.

Занесём результаты вычислений в таблицу:

Размер вклада, руб. Число вкладчиков, f Середина интервала, х xf
200-400 32 300 9600
400-600 56 500 28000
600-800 120 700 84000
800-1000 104 900 93600
1000-1200 88 1100 96800
Итого 400 - 312000

Средний размер вклада в Сбербанке города будет равен 780 рублей:

3) Среднее линейное отклонение есть средняя арифметическая из абсолютных отклонений отдельных значений признака от общей средней:

Порядок расчёта среднего линейонго отклонения в интервальном ряду распределения следующий:

1. Вычисляется средняя арифметическая взвешенная, как показано в п. 2).

2. Определяются абсолютные отклонения вариант от средней:

3. Полученные отклонения умножаются на частоты:

4. Находится сумма взвешенных отклонений без учёта знака:

5. Сумма взвешенных отклонений делится на сумму частот:

Удобно пользоваться таблицей расчётных данных:

Размер вклада, руб. Число вкладчиков, f Середина интервала, х
200-400 32 300 -480 480 15360
400-600 56 500 -280 280 15680
600-800 120 700 -80 80 9600
800-1000 104 900 120 120 12480
1000-1200 88 1100 320 320 28160
Итого 400 - - - 81280

Среднее линейное отклонение размера вклада клиентов Сбербанка составляет 203,2 рубля.

4) Дисперсия - это средняя арифметическая квадратов отклонений каждого значения признака от средней арифметической.

Расчёт дисперсии в интервальных рядах распределения производится по формуле:

Порядок расчёта дисперсии в этом случае следующий:

1. Определяют среднюю арифметическую взвешенную, как показано в п. 2).

2. Находят отклонения вариант от средней:

3. Возводят в квадрат отклонения каждой варианты от средней:

4. Умножают квадраты отклонений на веса (частоты):

5. Суммируют полученные произведения:

6. Полученная сумма делится на сумму весов (частот):

Расчёты оформим в таблицу:

Размер вклада, руб. Число вкладчиков, f Середина интервала, х
200-400 32 300 -480 230400 7372800
400-600 56 500 -280 78400 4390400
600-800 120 700 -80 6400 768000
800-1000 104 900 120 14400 1497600
1000-1200 88 1100 320 102400 9011200
Итого 400 - - - 23040000

Полученные из опыта величины неизбежно содержат погрешности, обусловленные самыми разнообразными причинами. Среди них следует различать погрешности систематические и случайные. Систематические ошибки обусловливаются причинами, действующими вполне определенным образом, и могут быть всегда устранены или достаточно точно учтены. Случайные ошибки вызываются весьма большим числом отдельных причин, не поддающихся точному учету и действующих в каждом отдельном измерении различным образом. Эти ошибки невозможно совершенно исключить; учесть же их можно только в среднем, для чего необходимо знать законы, которым подчиняются случайные ошибки.

Будем обозначать измеряемую величину через А, а случайную ошибку при измерении х. Так как ошибка х может принимать любые значения, то она является непрерывной случайной величиной, которая вполне характеризуется своим законом распределения.

Наиболее простым и достаточно точно отображающим действительность (в подавляющем большинстве случаев) является так называемый нормальный закон распределения ошибок :

Этот закон распределения может быть получен из различных теоретических предпосылок, в частности, из требования, чтобы наиболее вероятным значением неизвестной величины, для которой непосредственным измерением получен ряд значений с одинаковой степенью точности, являлось среднее арифметическое этих значений. Величина 2 называется дисперсией данного нормального закона.

Среднее арифметическое

Определение дисперсии по опытным данным. Если для какой-либо величины А непосредственным измерением получено n значений a i с одинаковой степенью точности и если ошибки величины А подчинены нормальному закону распределения, то наиболее вероятным значением А будет среднее арифметическое :

a - среднее арифметическое,

a i - измеренное значение на i-м шаге.

Отклонение наблюдаемого значения (для каждого наблюдения) a i величины А от среднего арифметического : a i - a.

Для определения дисперсии нормального закона распределения ошибок в этом случае пользуются формулой:

2 - дисперсия,
a - среднее арифметическое,
n - число измерений параметра,

Среднеквадратическое отклонение

Среднеквадратическое отклонение показывает абсолютное отклонение измеренных значений от среднеарифметического . В соответствии с формулой для меры точности линейной комбинации средняя квадратическая ошибка среднего арифметического определяется по формуле:

, где


a - среднее арифметическое,
n - число измерений параметра,
a i - измеренное значение на i-м шаге.

Коэффициент вариации

Коэффициент вариации характеризует относительную меру отклонения измеренных значений от среднеарифметического :

, где

V - коэффициент вариации,
- среднеквадратическое отклонение,
a - среднее арифметическое.

Чем больше значение коэффициента вариации , тем относительно больший разброс и меньшая выравненность исследуемых значений. Если коэффициент вариации меньше 10%, то изменчивость вариационного ряда принято считать незначительной, от 10% до 20% относится к средней, больше 20% и меньше 33% к значительной и если коэффициент вариации превышает 33%, то это говорит о неоднородности информации и необходимости исключения самых больших и самых маленьких значений.

Среднее линейное отклонение

Один из показателей размаха и интенсивности вариации - среднее линейное отклонение (средний модуль отклонения) от среднего арифметического. Среднее линейное отклонение рассчитывается по формуле:

, где

_
a - среднее линейное отклонение,
a - среднее арифметическое,
n - число измерений параметра,
a i - измеренное значение на i-м шаге.

Для проверки соответствия исследуемых значений закону нормального распределения применяют отношение показателя асимметрии к его ошибке и отношение показателя эксцесса к его ошибке.

Показатель асимметрии

Показатель асимметрии (A) и его ошибка (m a) рассчитывается по следующим формулам:

, где

А - показатель асимметрии,
- среднеквадратическое отклонение,
a - среднее арифметическое,
n - число измерений параметра,
a i - измеренное значение на i-м шаге.

Показатель эксцесса

Показатель эксцесса (E) и его ошибка (m e) рассчитывается по следующим формулам:

, где

Вариация - это несовпадение значений одной и той же статистиче­ской величины у разных объектов в силу особенностей их собственного развития, а также различия условий, в которых они находятся. Вариация имеет объективный характер и помогает познать сущность изучаемого явления. Если средняя величина сглаживает индивидуальные различия, то вариация, наоборот, их подчеркивает, устанавливая типичность или не типичность найденной средней величины для конкретной статистической совокупности. Тем самым можно делать вывод о качественности подобранных статистических данных.

Вариация измеряется с помощью относительных величин, называе­мых коэффициентами вариации и определяемых в виде отношения среднего отклонения к средней величине. Поскольку среднее отклоне­ние может определяться линейным и квадратическим способами, то соответствующими могут быть и коэффициенты вариации. Следова­тельно, коэффициенты вариации надо определять по формулам

линейный; (1.28)

квадратический. (1.29) Значения коэффициента вариации изменяются от 0 до 1 и чем ближе он к нулю, тем типичнее найденная средняя величина для изучаемой статистической совокупности, а значит и качественнее подобраны статистические данные. При этом критериальным значением коэффициен­та вариации служит 1/3.

То есть средняя величина считается типичной для данной совокуп­ности при λ 0,333 или при ν 0,333. В ином случае средняя величина не типична и требуется пересмотреть статистическую совокупность с целью включения в нее более объективных статистических величин.

Обычно квадратический коэффициент вариации несколько (примерно на 25%) больше линейного, рассчитанные по одним и тем же данным. А значит возможен случай, когда λ 0,333 и ν 0,333, тогда необходимо взять среднюю из этих коэффициентов и по ее значению сделать окончательный вывод о не/типичности найденной средней величины.

С помощью линейного коэффици­ента вариации принципиальный вывод о типичности или не типичности средней величины можно получить проще и быстрее, чем с помощью квадратического. Однако квадратический коэффициент применяется чаще, так как существует несколько способов для вычисления дисперсии.

У такого способа оценки вариации есть и существенный недостаток. Действительно, пусть, например, исходная совокупность рабочих, имеющих средний стаж 15 лет, со стандартным отклонением σ = 10 лет, «состарилась» еще на 15 лет. Теперь= 30 лет, а стандартное отклонение по-прежнему равно 10. Совокупность, ранее бывшая неоднородной (10/15*100 = 66,7%), со временем оказывается, таким образом, вполне однородной (10/30*100 = 33,3 %).

Поэтому возможен дополнительный анализ статистической сово­купности с помощью коэффициента осцилляции , определяемого по формуле

где R - размах вариации в виде разности наибольшего и наимень­шего значений в совокупности статистических величин. То есть

R = Хмах –Хmin, (1.31)

где Xмax и Xmin - максимальное и минимальное значения в совокупно­сти.

При упорядочении статистических величин в совокупности образу­ются группировочные интервалы. Тогда под обозначением ∆Х пони­мается размах интервала, а среднее интервальное значение обозначается ХИ . В случае ориентировки только на квадратический коэффициент ва­риации могут применяться разные методы определения дисперсии.