Оценка ско. Среднеквадратическое отклонение формулы в excel

Определяется как обобщающая характеристика размеров вариации признака в совокупности. Оно равно квадратному корню из среднего квадрата отклонений отдельных значений признака от средней арифметической, т.е. корень из и может быть найдена так:

1. Для первичного ряда:

2. Для вариационного ряда:

Преобразование формулы среднего квадратичного отклонени приводит ее к виду, более удобному для практических расчетов:

Среднее квадратичное отклонение определяет на сколько в среднем отклоняются конкретные варианты от их среднего значения, и к тому же является абсолютной мерой колеблемости признака и выражается в тех же единицах, что и варианты, и поэтому хорошо интерпретируется.

Примеры нахождения cреднего квадратического отклонения: ,

Для альтернативных признаков формула среднего квадратичного отклонения выглядит так:

где р - доля единиц в совокупности, обладающих определенным признаком;

q - доля единиц, не обладающих этим признаком.

Понятие среднего линейного отклонения

Среднее линейное отклонение определяется как средняя арифметическая абсолютных значений отклонений отдельных вариантов от .

1. Для первичного ряда:

2. Для вариационного ряда:

где сумма n - сумма частот вариационного ряда .

Пример нахождения cреднего линейного отклонения:

Преимущество среднего абсолютного отклонения как меры рассеивания перед размахом вариации, очевидно, так как эта мера основана на учете всех возможных отклонений. Но этот показатель имеет существенные недостатки. Произвольные отбрасывания алгебраических знаков отклонений могут привести к тому, что математические свойства этого показателя являются далеко не элементарными. Это сильно затрудняет использование среднего абсолютного отклонения при решении задач, связанных с вероятностными расчетами.

Поэтому среднее линейное отклонение как мера вариации признака применяется в статистической практике редко, а именно тогда, когда суммирование показателей без учета знаков имеет экономический смысл. С его помощью, например, анализируется оборот внешней торговли, состав работающих, ритмичность производства и т. д.

Среднее квадратическое

Среднее квадратическое применяется , например, для вычисления средней величины сторон n квадратных участков, средних диаметров стволов, труб и т. д. Она подразделяется на два вида.

Средняя квадратичная простая. Если при замене индивидуальных величин признака на среднюю величину необходимо сохранить неизменной сумму квадратов исходных величин, то средняя будет являться квадратичной средней величиной.

Она является квадратным корнем из частного от деления суммы квадратов отдельных значений признака на их число:

Средняя квадратичная взвешенная вычисляется по формуле:

где f - признак веса.

Средняя кубическая

Средняя кубическая применяется , например, при определении средней длины стороны и кубов. Она подразделяется на два вида.
Средняя кубическая простая:

При расчете средних величин и дисперсии в интервальных рядах распределения истинные значения признака заменяются центральными значениями интервалов, которые отличны от средней арифметической значений, включенных в интервал. Это приводит к возникновению систематической погрешности при расчете дисперсии. В.Ф. Шеппард определил, что погрешность в расчете дисперсии , вызванная применением сгруппированных данных, составляет 1/12 квадрата величины интервала как в сторону повышения, так и в сторону понижения величины дисперсии.

Поправка Шеппарда должна применяться, если распределение близко к нормальному, относится к признаку с непрерывным характером вариации, построено по значительному количеству исходных данных (n > 500). Однако исходя из того, что в ряде случаев обе погрешности, действуя в разных направлениях компенсируют друг друга, можно иногда отказаться от введения поправок.

Чем меньше значение дисперсии и среднего квадратического отклонения, тем однороднее совокупность и тем более типичной будет средняя величина.
В практике статистики часто возникает необходимость сравнения вариаций различных признаков. Например, большой интерес представляет сравнение вариаций возраста рабочих и их квалификации, стажа работы и размера заработной платы, себестоимости и прибыли, стажа работы и производительности труда и т.д. Для таких сопоставлений показатели абсолютной колеблемости признаков непригодны: нельзя сравнивать колеблемость стажа работы, выраженного в годах, с вариацией заработной платы, выраженной в рублях.

Для осуществления таких сравнений, а также сравнений колеблемости одного и того же признака в нескольких совокупностях с разными средним арифметическим используется относительный показатель вариации - коэффициент вариации.

Структурные средние

Для характеристики центральной тенденции в статистических распределениях не редко рационально вместе со средней арифметической использовать некоторое значение признака X, которое в силу определенных особенностей расположения в ряду распределения может характеризовать его уровень.

Это особенно важно тогда, когда в ряду распределения крайние значения признака имеют нечеткие границы. В связи с этим точное определение средней арифметической, как правило, невозможно, либо очень сложно. В таких случаях средний уровень можно определить, взяв, например, значение признака, которое расположено в середине ряда частот или которое чаще всего встречается в текущем ряду.

Такие значения зависят только от характера частот т. е. от структуры распределения. Они типичны по месту расположения в ряду частот, поэтому такие значения рассматриваются в качестве характеристик центра распределения и поэтому получили определение структурных средних. Они применяются для изучения внутреннего строения и структуры рядов распределения значений признака. К таким показателям относятся .

  • Ответы на экзаменационные вопросы по общественному здоровью и здравоохранению.
  • 1. Общественное здоровье и здравоохранение как наука и область практической деятельности. Основные задачи. Объект, предмет изучения. Методы.
  • 2. Здравоохранение. Определение. История развития здравоохранения. Современные системы здравоохранения, их характеристика.
  • 3. Государственная политика в области охраны здоровья населения (Закон Республики Беларусь "о здравоохранении"). Организационные принципы государственной системы здравоохранения.
  • 4. Страховая и частная формы здравоохранения.
  • 5. Профилактика, определение, принципы, современные проблемы. Виды, уровни, направления профилактики.
  • 6. Национальные программы профилактики. Роль их в укреплении здоровья населения.
  • 7. Врачебная этика и деонтология. Определение понятия. Современные проблемы врачебной этики и деонтологии, характеристика.
  • 8. Здоровый образ жизни, определение понятия. Социальные и медицинские аспекты здорового образа жизни (зож).
  • 9. Гигиеническое обучение и воспитание, определение, основные принципы. Методы и средства гигиенического обучения и воспитания. Требования к лекции, санитарному бюллетеню.
  • 10. Здоровье населения, факторы, влияющие на здоровье населения. Формула здоровья. Показатели, характеризующие общественное здоровье. Схема анализа.
  • 11. Демография как наука, определение, содержание. Значение демографических данных для здравоохранения.
  • 12. Статика населения, методика изучения. Переписи населения. Типы возрастных структур населения.
  • 13. Механическое движение населения. Характеристика миграционных процессов, влияние их на показатели здоровья населения.
  • 14. Рождаемость как медико-социальная проблема. Методика вычисления показателей. Уровни рождаемости по данным воз. Современные тенденции.
  • 15. Специальные показатели рождаемости (показатели фертильности). Воспроизводство населения, типы воспроизводства. Показатели, методика вычисления.
  • 16. Смертность населения как медико-социальная проблема. Методика изучения, показатели. Уровни общей смертности по данным воз. Современные тенденции.
  • 17. Младенческая смертность как медико-социальная проблема. Факторы, определяющие ее уровень.
  • 18. Материнская и перинатальная смертность, основные причины. Показатели, методика вычисления.
  • 19. Естественное движение населения, факторы на него влияющие. Показатели, методика вычисления. Основные закономерности естественного движения в Беларуси.
  • 20. Планирование семьи. Определение. Современные проблемы. Медицинские организации и службы планирования семьи в рб.
  • 21. Заболеваемость как медико-социальная проблема. Современные тенденции и особенности в Республике Беларусь.
  • 22. Медико-социальные аспекты нервно-психического здоровья населения. Организация психоневрологической помощи
  • 23. Алкоголизм и наркомания как медико-социальная проблема
  • 24. Болезни системы кровообращения как медико-социальная проблема. Факторы риска. Направления профилактики. Организация кардиологической помощи.
  • 25. Злокачественные новообразования как медико-социальная проблема. Основные направления профилактики. Организация онкологической помощи.
  • 26. Международная статистическая классификация болезней. Принципы построения, порядок пользования. Значение ее в изучении заболеваемости и смертности населения.
  • 27. Методы изучения заболеваемости населения, их сравнительная характеристика.
  • Методика изучения общей и первичной заболеваемости
  • Показатели общей и первичной заболеваемости.
  • Показатели инфекционной заболеваемости.
  • Основные показатели, характеризующие важнейшую неэпидемическую заболеваемость.
  • Основные показатели "госпитализированной" заболеваемости:
  • 4) Заболевания с временной утратой трудоспособности (вопрос 30)
  • Основные показатели для анализа заболеваемости с вут.
  • 31. Изучение заболеваемости по данным профилактических осмотров населения, виды профилактических осмотров, порядок проведения. Группы здоровья. Понятие «патологическая пораженность».
  • 32. Заболеваемость по данным о причинах смерти. Методика изучения, показатели. Врачебное свидетельство о смерти.
  • Основные показатели заболеваемости по данным о причинах смерти:
  • 33. Инвалидность как медико-социальная проблема Определение понятия, показатели. Тенденции инвалидности в Республике Беларусь.
  • Тенденции инвалидности в рб.
  • 34. Первичная медико-санитарная помощь (пмсп), определение, содержание, роль и место в системе медицинского обслуживания населения. Основные функции.
  • 35. Основные принципы первичной медико-санитарной помощи. Медицинские организации первичной медико-санитарной помощи.
  • 36. Организация медицинской помощи, предоставляемой населению амбулаторно. Основные принципы. Учреждения.
  • 37. Организация медицинской помощи в условиях стационара. Учреждения. Показатели обеспеченности стационарной помощью.
  • 38. Виды медицинской помощи. Организация специализированной медицинской помощи населению. Центры специализированной медицинской помощи, их задачи.
  • 39. Основные направления совершенствования стационарной и специализированной помощи в Республике Беларусь.
  • 40. Охрана здоровья женщин и детей в Республике Беларусь. Управление. Медицинские организации.
  • 41. Современные проблемы охраны здоровья женщин. Организация акушерско-гинекологической помощи в Республике Беларусь.
  • 42. Организация лечебно-профилактической помощи детскому населению. Ведущие проблемы охраны здоровья детей.
  • 43. Организация охраны здоровья сельского населения, основные принципы оказания медицинской помощи сельским жителям. Этапы. Организации.
  • II этап – территориальное медицинское объединение (тмо).
  • III этап – областная больница и медицинские учреждения области.
  • 45. Медико-социальная экспертиза (мсэ), определение, содержание, основные понятия.
  • 46. Реабилитация, определение, виды. Закон Республики Беларусь «о предупреждении инвалидности и реабилитации инвалидов».
  • 47. Медицинская реабилитация: определение понятия, этапы, принципы. Служба медицинской реабилитации в Республике Беларусь.
  • 48. Городская поликлиника, структура, задачи, управление. Основные показатели деятельности поликлиники.
  • Основные показатели деятельности поликлиники.
  • 49. Участковый принцип организации амбулаторной помощи населению. Виды участков. Территориальный терапевтический участок. Нормативы. Содержание работы участкового врача-терапевта.
  • Организация работы участкового терапевта.
  • 50. Кабинет инфекционных заболеваний поликлиники. Разделы и методы работы врача кабинета инфекционных заболеваний.
  • 52. Основные показатели, характеризующие качество и эффективность диспансерного наблюдения. Методика их вычисления.
  • 53. Отделение медицинской реабилитации (омр) поликлиники. Структура, задачи. Порядок направления больных в омр.
  • 54. Детская поликлиника, структура, задачи, разделы работы. Особенности оказания медицинской помощи детям в амбулаторных условиях.
  • 55. Основные разделы работы участкового педиатра. Содержание лечебно-профилактической работы. Связь в работе с другими лечебно-профилактическими учреждениями. Документация.
  • 56. Содержание профилактической работы участкового врача-педиатра. Организация патронажного наблюдения за новорожденными.
  • 57. Структура, организация, содержание работы женской консультации. Показатели работы по обслуживанию беременных женщин. Документация.
  • 58. Родильный дом, структура, организация работы, управление. Показатели деятельности родильного дома. Документация.
  • 59. Городская больница, ее задачи, структура, основные показатели деятельности. Документация.
  • 60. Организация работы приемного отделения больницы. Документация. Мероприятия по профилактике внутрибольничных инфекций. Лечебно-охранительный режим.
  • Раздел 1. Сведения о подразделениях, установках лечебно-профилактической организации.
  • Раздел 2. Штаты лечебно-профилактической организации на конец отчетного года.
  • Раздел 3. Работа врачей поликлиники (амбулаторий), диспансера, консультации.
  • Раздел 4. Профилактические медицинские осмотры и работа стоматологических (зубоврачебных) и хирургических кабинетов лечебно-профилактической организации.
  • Раздел 5. Работа лечебно-вспомогательных отделений (кабинетов).
  • Раздел 6. Работа диагностических отделений.
  • 62. Годовой отчет о деятельности стационара (ф. 14), порядок составления, структура. Основные показатели деятельности стационара.
  • Раздел 1. Состав больных в стационаре и исходы их лечения
  • Раздел 2. Состав больных новорожденных, переведенных в другие стационары в возрасте 0-6 суток и исходы их лечения
  • Раздел 3. Коечный фонд и его использование
  • Раздел 4. Хирургическая работа стационара
  • 63. Отчет о медицинской помощи беременным, роженицам и родильницам (ф. 32), структура. Основные показатели.
  • Раздел I. Деятельность женской консультации.
  • Раздел II. Родовспоможение в стационаре
  • Раздел III. Материнская смертность
  • Раздел IV. Сведения о родившихся
  • 64. Медико-генетическое консультирование, основные учреждения. Его роль в профилактике перинатальной и младенческой смертности.
  • 65. Медицинская статистика, ее разделы, задачи. Роль статистического метода в изучении здоровья населения и деятельности системы здравоохранения.
  • 66. Статистическая совокупность. Определение, виды, свойства. Особенности проведения статистического исследования на выборочной совокупности.
  • 67. Выборочная совокупность, требования, предъявляемые к ней. Принцип и способы формирования выборочной совокупности.
  • 68. Единица наблюдения. Определение, характеристика учетных признаков.
  • 69. Организация статистического исследования. Характеристика этапов.
  • 70. Содержание плана и программы статистического исследования. Виды планов статистического исследования. Программа наблюдения.
  • 71. Статистическое наблюдение. Сплошное и несплошное статистическое исследование. Виды несплошного статистического исследования.
  • 72. Статистическое наблюдение (сбор материалов). Ошибки статистического наблюдения.
  • 73. Статистическая группировка и сводка. Типологическая и вариационная группировка.
  • 74. Статистические таблицы, виды, требования к построению.

81. Среднее квадратическое отклонение, методика расчета, применение.

Приближенный метод оценки колеблемости вариационного ряда - определение лимита и амплитуды, однако не учитывают значений вариант внутри ряда. Основной общепринятой мерой колеблемости количественного приз­нака в пределах вариационного ряда является среднее квадратичес­кое отклонение (σ - сигма) . Чем больше среднее квадратическое отклонение, тем степень ко­леблемости данного ряда выше.

Методика расчета среднего квадратического отклонения включает следующие этапы:

1. Находят среднюю арифметическую величину (Μ).

2. Определяют отклонения отдельных вариант от средней арифмети­ческой (d=V-M). В медицинской статистике отклонения от средней обозначаются как d (deviate). Сумма всех от­клонений равняется нулю.

3. Возводят каждое отклонение в квадрат d 2 .

4. Перемножают квадраты отклонений на соответствующие частоты d 2 *p.

5. Находят сумму произведений (d 2 *p)

6. Вычисляют среднее квадратическое отклонение по формуле:

при n больше 30, или
при n меньше либо равно 30, где n - число всех вариант.

Значение среднего квадратичного отклонения:

1. Среднее квадратическое отклонение характеризует разброс вариант относительно средней величины (т.е. колеблемость вариационного ряда). Чем больше сигма, тем степень разнообразия данного ряда выше.

2. Среднее квадратичное отклонение используется для сравнительной оценки степени соответствия средней арифметической величины тому вариационному ряду, для которого она вычислена.

Вариации массовых явлений подчиняются закону нормального распределения. Кривая, отображающая это распределение, имеет вид плавной колоколообразной симметричной кривой (кривая Гаусса). Согласно теории вероятности в явлениях, подчиняющихся закону нормального распределения, между значениями средней арифметической и среднего квадратического отклонения существует строгая математическая зависимость. Теоретическое распределение вариант в однородном вариационном ряду подчиняется правилу трех сигм.

Если в системе прямоугольных координат на оси абсцисс отложить значения количественного признака (варианты), а на оси ординат - частоты встречаемости вариант в вариационном ряду, то по сторонам от средней арифметической равномерно располагаются варианты с большими и меньшими значениями.

Установлено, что при нормальном распределении признака:

68,3% значений вариант находится в пределах М1

95,5% значений вариант находится в пределах М2

99,7% значений вариант находится в пределах М3

3. Среднее квадратическое отлонение позволяет установить значения нормы для клинико-биологических показателей. В медицине интервал М1 обычно принимается за пределы нормы для изучаемого явления. Отклонение оцениваемой величины от средней арифметической больше, чем на 1 указывает на отклонение изучаемого параметра от нормы.

4. В медицине правило трех сигм применяется в педиатрии для индивидуальной оценки уровня физического развития детей (метод сигмальных отклонений), для разработки стандартов детской одежды

5. Среднее квадратическое отклонение необходимо для характеристики степени разнообразия изучаемого признака и вычисления ошибки средней арифметической величины.

Величина среднего квадра­тического отклонения обычно используется для сравнения колеблемости однотипных рядов. Если сравниваются два ряда с разными признаками (рост и масса тела, средняя длительность лечения в стационаре и больничная летальность и т.д.), то непосредственное сопоставление размеров сигм невозможно, т.к. среднеквадратичес­кое отклонение - именованная величина, выраженная в абсолютных числах. В этих случаях применяют коэффициент вариации (Cv ) , представляющий собой относительную величину: процентное отноше­ние среднего квадратического отклонения к средней арифметической.

Коэффициент вариации вычисляется по формуле:

Чем выше коэффициент вариации, тем большая изменчивость данно­го ряда. Считают, что коэффициент вариации свыше 30 % свиде­тельствует о качественной неоднородности совокупности.

По данным выборочного обследования произведена группировка вкладчиков по размеру вклада в Сбербанке города:

Определите:

1) размах вариации;

2) средний размер вклада;

3) среднее линейное отклонение;

4) дисперсию;

5) среднее квадратическое отклонение;

6) коэффициент вариации вкладов.

Решение:

Данный ряд распределения содержит открытые интервалы. В таких рядах условно принимается величина интервала первой группы равна величине интервала последующей, а величина интервала последней группы равна величине интервала предыдущей.

Величина интервала второй группы равна 200, следовательно, и величина первой группы также равна 200. Величина интервала предпоследней группы равна 200, значит и последний интервал будет иметь величину, равную 200.

1) Определим размах вариации как разность между наибольшим и наименьшим значением признака:

Размах вариации размера вклада равен 1000 рублей.

2) Средний размер вклада определим по формуле средней арифметической взвешенной.

Предварительно определим дискретную величину признака в каждом интервале. Для этого по формуле средней арифметической простой найдём середины интервалов.

Среднее значение первого интервала будет равно:

второго - 500 и т. д.

Занесём результаты вычислений в таблицу:

Размер вклада, руб. Число вкладчиков, f Середина интервала, х xf
200-400 32 300 9600
400-600 56 500 28000
600-800 120 700 84000
800-1000 104 900 93600
1000-1200 88 1100 96800
Итого 400 - 312000

Средний размер вклада в Сбербанке города будет равен 780 рублей:

3) Среднее линейное отклонение есть средняя арифметическая из абсолютных отклонений отдельных значений признака от общей средней:

Порядок расчёта среднего линейонго отклонения в интервальном ряду распределения следующий:

1. Вычисляется средняя арифметическая взвешенная, как показано в п. 2).

2. Определяются абсолютные отклонения вариант от средней:

3. Полученные отклонения умножаются на частоты:

4. Находится сумма взвешенных отклонений без учёта знака:

5. Сумма взвешенных отклонений делится на сумму частот:

Удобно пользоваться таблицей расчётных данных:

Размер вклада, руб. Число вкладчиков, f Середина интервала, х
200-400 32 300 -480 480 15360
400-600 56 500 -280 280 15680
600-800 120 700 -80 80 9600
800-1000 104 900 120 120 12480
1000-1200 88 1100 320 320 28160
Итого 400 - - - 81280

Среднее линейное отклонение размера вклада клиентов Сбербанка составляет 203,2 рубля.

4) Дисперсия - это средняя арифметическая квадратов отклонений каждого значения признака от средней арифметической.

Расчёт дисперсии в интервальных рядах распределения производится по формуле:

Порядок расчёта дисперсии в этом случае следующий:

1. Определяют среднюю арифметическую взвешенную, как показано в п. 2).

2. Находят отклонения вариант от средней:

3. Возводят в квадрат отклонения каждой варианты от средней:

4. Умножают квадраты отклонений на веса (частоты):

5. Суммируют полученные произведения:

6. Полученная сумма делится на сумму весов (частот):

Расчёты оформим в таблицу:

Размер вклада, руб. Число вкладчиков, f Середина интервала, х
200-400 32 300 -480 230400 7372800
400-600 56 500 -280 78400 4390400
600-800 120 700 -80 6400 768000
800-1000 104 900 120 14400 1497600
1000-1200 88 1100 320 102400 9011200
Итого 400 - - - 23040000

Для расчетов средней геометрической простой используется формула:

Геометрическая взвешенная

Для определения средней геометрической взвешенной применяется формула:

редние диаметры колес, труб, средние стороны квадратов определяются при помощи средней квадратической.

Среднеквадратические величины используются для расчета некоторых показателей, например коэффициент вариации, характеризующего ритмичность выпуска продукции. Здесь определяют среднеквадратическое отклонение от планового выпуска продукции за определенный период по следующей формуле:

Эти величины точно характеризуют изменение экономических показателей по сравнению с их базисной величиной, взятое в его усредненной величине.

Квадратическая простая

Средняя квадратическая простая вычисляется по формуле:

Квадратическая взвешенная

Средняя квадратическая взвешенная равна:

22. Абсолютные показатели вариации включают:

размах вариации

среднее линейное отклонение

дисперсию

среднее квадратическое отклонение

Размах вариации (r)

Размах вариации - это разность между максимальным и минимальным значениями признака

Он показывает пределы, в которых изменяется величина признака в изучаемой совокупности.

Опыт работы у пяти претендентов на предшествующей работе составляет: 2,3,4,7 и 9 лет. Решение: размах вариации = 9 - 2 = 7 лет.

Для обобщенной характеристики различий в значениях признака вычисляют средние показатели вариации, основанные на учете отклонений от средней арифметической. За отклонение от средней принимается разность .

При этом во избежании превращения в нуль суммы отклонений вариантов признака от средней (нулевое свойство средней) приходится либо не учитывать знаки отклонения, то есть брать эту сумму по модулю , либо возводить значения отклонений в квадрат

Среднее линейное и квадратическое отклонение

Среднее линейное отклонение - этосредняя арифметическая из абсолютных отклонений отдельных значений признака от средней.

Среднее линейное отклонение простое:

Опыт работы у пяти претендентов на предшествующей работе составляет: 2,3,4,7 и 9 лет.

В нашем примере: лет;

Ответ: 2,4 года.

Среднее линейное отклонение взвешенное применяется для сгруппированных данных:

Среднее линейное отклонение в силу его условности применяется на практике сравнительно редко (в частности, для характеристики выполнения договорных обязательств по равномерности поставки; в анализе качества продукции с учетом технологических особенностей производства).

Среднее квадратическое отклонение

Наиболее совершенной характеристикой вариации является среднее квадратическое откложение, которое называют стандартом (или стандартным отклонение). Среднее квадратическое отклонение () равно квадратному корню из среднего квадрата отклонений отдельных значений признака отсредней арифметической:

Среднее квадратическое отклонение простое:

Среднее квадратическое отклонение взвешенное применяется для сгруппированных данных:

Между средним квадратическим и средним линейным отклонениями в условиях нормального распределения имеет место следующее соотношение: ~ 1,25.

Среднее квадратическое отклонение, являясь основной абсолютной мерой вариации, используется при определении значений ординат кривой нормального распределения, в расчетах, связанных с организацией выборочного наблюдения и установлением точности выборочных характеристик, а также при оценке границ вариации признака в однородной совокупности.

Х i - случайные (текущие) величины;

среднее значение случайных величин по выборке, рассчитывается по формуле:

Итак, дисперсия - это средний квадрат отклонений . То есть вначале рассчитывается среднее значение, затем берется разница между каждым исходным и средним значением, возводится в квадрат , складывается и затем делится на количество значений в данной совокупности.

Разница между отдельным значением и средней отражает меру отклонения. В квадрат возводится для того, чтобы все отклонения стали исключительно положительными числами и чтобы избежать взаимоуничтожения положительных и отрицательных отклонений при их суммировании. Затем, имея квадраты отклонений, мы просто рассчитываем среднюю арифметическую.

Разгадка магического слова «дисперсия» заключается всего в этих трех словах: средний – квадрат – отклонений.

Среднее квадратичное отклонение (СКО)

Извлекая из дисперсии квадратный корень, получаем, так называемое «среднеквадратичное отклонение». Встречаются названия «стандартное отклонение» или «сигма» (от названия греческой буквыσ .). Формула среднего квадратичного отклонения имеет вид:

Итак, дисперсия – это сигма в квадрате, или – среднее квадратичное отклонение в квадрате.

Среднеквадратичное отклонение, очевидно, также характеризует меру рассеивания данных, но теперь (в отличие от дисперсии) его можно сравнивать с исходными данными, так как единицы измерения у них одинаковые (это явствует из формулы расчета). Размах вариации – это разница между крайними значениями. Среднеквадратичное отклонение, как мера неопределенности, также участвует во многих статистических расчетах. С ее помощью устанавливают степень точности различных оценок и прогнозов. Если вариация очень большая, то стандартное отклонение тоже получится большим, следовательно, и прогноз будет неточным, что выразится, к примеру, в очень широких доверительных интервалах.

Поэтому в методах статистической обработки данных в оценках объектов недвижимости в зависимости от необходимой точности поставленной задачи используют правило двух или трех сигм.

Для сравнения правила двух сигм и правила трех сигм используем формулу Лапласа:

Ф - Ф ,

где Ф(x) – функция Лапласа;



Минимальное значение

β = максимальное значение

s = значение сигмы (среднее квадратичное отклонение)

a = среднее значение

В этом случае используется частный вид формулы Лапласа когда границы α и β значений случайной величины X равно отстоят от центра распределения a = M(X) на некоторую величину d: a = a-d, b = a+d. Или (1) Формула (1) определяет вероятность заданного отклонения d случайной величины X с нормальным законом распределения от ее математического ожидания М(X) = a. Если в формуле (1) принять последовательно d = 2s и d = 3s, то получим: (2), (3).

Правило двух сигм

Почти достоверно (с доверительной вероятностью 0,954) можно утверждать, что все значения случайной величины X с нормальным законом распределения отклоняются от ее математического ожидания M(X) = a на величину, не большую 2s (двух средних квадратических отклонений). Доверительной вероятностью (Pд) называют вероятность событий, которые условно принимаются за достоверные (их вероятность близка к 1).

Проиллюстрируем правило двух сигм геометрически. На рис. 6 изображена кривая Гаусса с центром распределения а. Площадь, ограниченная всей кривой и осью Оx, равна 1 (100%), а площадь криволинейной трапеции между абсциссами а–2s и а+2s, согласно правилу двух сигм, равна 0,954 (95,4% от всей площади). Площадь заштрихованных участков равна 1-0,954 = 0,046 (»5% от всей площади). Эти участки называют критической областью значений случайной величины. Значения случайной величины, попадающие в критическую область, маловероятны и на практике условно принимаются за невозможные.

Вероятность условно невозможных значений называют уровнем значимости случайной величины. Уровень значимости связан с доверительной вероятностью формулой:

где q – уровень значимости, выраженный в процентах.

Правило трех сигм

При решении вопросов, требующих большей надежности, когда доверительную вероятность (Pд) принимают равной 0,997 (точнее - 0,9973), вместо правила двух сигм, согласно формуле (3), используют правило трех сигм.



Согласно правилу трех сигм при доверительной вероятности 0,9973 критической областью будет область значений признака вне интервала (а-3s, а+3s). Уровень значимости составляет 0,27%.

Другими словами, вероятность того, что абсолютная величина отклонения превысит утроенное среднее квадратическое отклонение, очень мала, а именно равна 0,0027=1-0,9973. Это означает, что лишь в 0,27% случаев так может произойти. Такие события, исходя из принципа невозможности маловероятных событий, можно считать практически невозможными. Т.е. выборка высокоточная.

В этом и состоит сущность правила трех сигм:

Если случайная величина распределена нормально, то абсолютная величина ее отклонения от математического ожидания не превосходит утроенного среднего квадратического отклонения (СКО).

На практике правило трех сигм применяют так: если распределение изучаемой случайной величины неизвестно, но условие, указанное в приведенном правиле, выполняется, то есть основание предполагать, что изучаемая величина распределена нормально; в противном случае она не распределена нормально.

Уровень значимости принимают в зависимости от дозволенной степени риска и поставленной задачи. Для оценки недвижимости обычно принимается менее точная выборка, следуя правилу двух сигм.




Top