Ряды распределения и их виды. Статистические ряды распределения

Результаты сводки и группировки материалов статистического наблюдения оформляются в виде статистических рядов распределения. Статистические ряды распределения представляют собой упорядоченное распределение единиц изучаемой совокупности на группы по группировочному (варьирующему) признаку. Они характеризуют состав (структуру) изучаемого явления, позволяют судить об однородности совокупности, границах ее изменения, закономерностях развития наблюдаемого объекта. В зависимости от признака статистические ряды распределения делятся на:

Атрибутивные (качественные);

Вариационные (количественные)

а) дискретные;

б) интервальные.

Атрибутивные ряды распределения

Атрибутивные ряды образуются по качественным признакам, которыми могут выступать занимаемая должность работников торговли, профессия, пол, образование и т.д.

Таблица 1 - Распределение работников предприятия по образованию.

В данном примере группировочным признаком выступает образование работников предприятия (высшее, среднее). Данные ряды распределения являются атрибутивными, поскольку варьирующий признак представлен не количественными, а качественными показателями. Наибольшее число составляют работники со средним образованием (порядка 40%); остальные работники распределяются на группы по данному качественному признаку: со средним специальным образованием - 25%; с неполным высшим - 20%; с высшим - 15%.

Вариационные ряды распределения

Вариационные ряды строятся на основе количественного группировочного признака. Вариационные ряды состоят из двух элементов: вариант и частот.

Варианта - это отдельное значение варьируемого признака, которое он принимает в ряду распределения. Они могут быть положительными и отрицательными, абсолютными и относительными. Частота - это численность отдельных вариант или каждой группы вариационного ряда. Частоты, выраженные в долях единицы или в процентах к итогу, называются частостями . Сумма частот называется объемом совокупности и определяет число элементов всей совокупности.

Частости - это частоты, выраженные в виде относительных величин (долях единиц или процентах). Сумма частостей равна единице или 100 %. Замена частот частостями позволяет сопоставлять вариационные ряды с разным числом наблюдений.

Вариационные ряды в зависимости от характера вариации подразделяются на: дискретные (прерывные) и интервальные (непрерывные). Дискретные ряды распределения основаны на дискретных (прерывных) признаках, имеющих только целые значения (например, тарифный разряд рабочих, число детей в семье).

Интервальные ряды распределения базируются на непрерывно изменяющемся значении признака, принимающем любые (в том числе и дробные) количественные выражения, т.е. значение признаков таких рядах задается в виде интервала.

При наличии достаточно большого количества вариантов значений признака первичный ряд является труднообозримым, и непосредственное рассмотрение его не дает представления о распределении единиц по значению признака в совокупности. Поэтому первым шагом в упорядочении первичного ряда является его ранжирование - расположение всех вариантов в возрастающем (убывающем) порядке.

Для построения дискретного ряда с небольшим числом вариантов выписываются все встречающиеся варианты значений признака Х i , а затем подсчитывается частота повторения варианта f i . Ряд распределения принято оформлять в виде таблицы, состоящей из двух колонок (или строк), в одной из которых представлены варианты, а в другой - частоты.

Для построения ряда распределения непрерывно изменяющихся признаков, либо дискретных, представленных в виде интервалов, необходимо установить оптимальное число групп (интервалов), на которые следует разбить все единицы изучаемой совокупности.

Федеральное агентство по образованию

Государственное образовательное учреждение высшего профессионального образования

Всероссийский заочный финансово-экономический институт


Кафедра Статистики


Курсовая работа

по дисциплине Статистика

Статистические ряды распределения в изучении структуры рынка


Руководитель: Пуляшкин В.В.


Введение

Статистические ряды распределения являются одним из наиболее важных элементов статистики. Они представляют собой составную часть метода статистических сводок и группировок, но, по сути, ни одно из статистических исследований невозможно произвести, не представив первоначально полученную в результате статистического наблюдения информацию в виде статистических рядов распределения. Первичные данные обрабатываются в целях получения обобщенных характеристик изучаемого явления по роду существенных признаков для дальнейшего осуществления анализа и прогнозирования; производится сводка и группировка; статистические данные оформляются с помощью рядов распределения в таблицы, в результате чего информация представляется в наглядном рационально изложенном виде, удобном для использования и дальнейшего исследования; строятся различного рода графики для наиболее наглядного восприятия и анализ информации. На основе статистических рядов распределения вычисляются основные величины статистических исследований: индексы, коэффициенты; абсолютные, относительные, средние величины и т.д., с помощью которых можно проводить прогнозирование, как конечный итог статистических исследований. Таким образом статистические ряды распределения являются базисным методом для любого статистического анализа. Понимание данного метода и навыки его использования необходимы для проведения статистических исследований.

В теоретической части курсовой работы рассмотрены следующие аспекты:

1) Понятие статистических рядов распределения, их виды;

2) Расчет средних величин, моды и медианы и представление рядов распределения графически;

Расчетная часть курсовой работы включает решение задачи по теме из варианта расчетного задания: Работа с таблицей «Выборочные данные торговых предприятий района: товарооборот и средние товарные запасы». Предметом исследования в работе будут служить так же торговые предприятия района (каждое предприятие, из которых, со своим товарооборотом). Работа содержит расчеты всех данных по ним, так же полное описание шагов действий для достижения конечного результата (вывода).

При написании курсовой работы использовались учебники курса, дополнительная литература, Интернет-ресурсы; при работе с табличными данными - персональный компьютер конфигурации:

Процессор – ADM Sempron 28000+S754

Память – DDR 512Mb PC3200 (DDR400)

Жесткий диск – 120Gb 7200/8 Mb/SATA

Принтер – hp deskjet 3325, струйный

OC – Windows XP Professional

ППП – Microsoft Word 2002, Excel

1. Теоретическая часть

1) Понятие статистических рядов распределения и их виды


Результаты сводки и группировки материалов статистического наблюдения оформляются в виде статистических рядов распределения. Статистические ряды распределения представляют собой упорядоченное распределение единиц изучаемой совокупности на группы по группировочному (варьирующему) признаку. Они характеризуют состав изучаемого явления, позволяют судить об однородности совокупности, границах ее изменения, закономерностях развития наблюдаемого объекта. В зависимости от признака статистические ряды распределения делятся на следующие:

Атрибутивные (качественные);

Вариационные (количественные):

a) дискретные;

b) интервальные.

а) Атрибутивные ряды распределения

Атрибутивные ряды образуются по качественным признакам, которыми могут выступать занимаемая должность работников торговли, профессия, пол, образование и т.д. В правовой статистике - это виды преступлений (убийства, грабежи, разбои); занимаемая должность лиц, совершивших административные правонарушения; образование и т.д.

Пример атрибутивных рядов распределения:


Таблица 1.Распределение преступлений в г. Москве за сутки по видам

Виды преступлений

Количество преступлений


абсолютное

в % к итогу

Убийства

Тяжкие телесные повреждения

Изнасилования

Изъятия наркотиков


В данном примере группировочным признаком выступают виды преступлений. Данный ряд распределения является атрибутивным, поскольку варьирующий признак представлен не количественными, а качественными показателями. Наибольшее число правонарушений составляют кражи 56%; далее правонарушения распределяются поровну между грабежами и случаями изъятия наркотиков (16%) и убийствами и случаями нанесения тяжких телесных повреждений (3%); разбои составили 4.5%, и наименьшее число зарегистрированных правонарушений составили изнасилования -1%.

б) Вариационные ряды распределения

Вариационные ряды строятся на основе количественного группировочного признака. При этом вариационные ряды по способу построения бывают дискретными (прерывными) и интервальными (непрерывными).

Дискретный ряд распределения - ряд, который основан на прерывной вариации признака, т.е. в котором значение признака выражено целым числом (число раскрытых преступлений и т.д.). Для построения дискретного ряда с небольшим числом вариантов выписываются все встречающиеся варианты значений признака, а затем подсчитывается частота повторения варианта. Ряд распределения принято оформлять в виде таблицы, состоящей из двух колонок (или строк), в одной из которых представлены варианты, а в другой - частоты.

Интервальный ряд распределения - ряд, базирующийся на непрерывно изменяющемся значении признака, имеющего любые количественные выражения, т.е. значение признаков таких рядах задается в виде интервала.

При наличии достаточно большого количества вариантов значений признака первичный ряд является труднообозримым, и непосредственное рассмотрение его не дает представления о распределении единиц по значению признака в совокупности. Поэтому первым шагом в упорядочении первичного ряда является его ранжирование – расположение всех вариантов в возрастающем (убывающем) порядке

Вариационные ряды состоят из двух элементов: вариант и частот.

Варианта - это отдельное значение варьируемого признака, которое он принимает в ряду распределения.

Частота - это численность отдельных вариант или каждой группы вариационного ряда. Частоты, выраженные в долях единицы или в процентах к итогу, называются частостями. Сумма частот составляет объем ряда распределения.

Для построения ряда распределения непрерывно изменяющихся признаков, либо дискретных, представленных в виде интервалов, необходимо установить оптимальное число интервалов, на которые следует разбить все единицы изучаемой совокупности.


2) Графическое изображение статистических данных


Статистический график– это чертеж, на котором статистические совокупности, характеризуемые определенными показателями, описываются с помощью условных геометрических образов или знаков. Представление данных таблиц в виде графика производит более сильное впечатление, чем цифры, позволяет лучше осмыслить результаты статистического наблюдения, правильно их истолковывать, значительно облегчает понимание статистического материала, делает его наглядным и доступным.

Значение графического метода в анализе и обобщении данных велико. Графическое изображение позволяет осуществить контроль достоверности статистических показателей, так как, представленные на графике, они более ярко показывают имеющиеся неточности, связанные либо с наличием ошибок наблюдения, либо с сущностью изучаемого явления. С помощью графического изображения возможны изучение закономерностей развития явления, установление существующих взаимосвязей. Простое сопоставление данных не всегда дает возможность уловить наличие причинных зависимостей, в то же время их графическое изображение способствует выявлению причинных связей, в особенности в случае установления первоначальных гипотез, подлежащих затем дальнейшей разработке. Графики также широко используются для изучения структуры явлений, их изменения во времени и размещения в пространстве. В них более выразительно проявляются сравнительные характеристики и отчетливо виды основные тенденции развития и взаимосвязи, присущие изучаемому явлению или процессу.


Таблица 2. Распределение студентов по возрасту


Расчет показателей вариации .

Вариация – это различие в значениях какого-либо признака у разных единиц данной совокупности в один и тот же период или момент времени. Исследование вариации в статистике имеет большое значение, помогает познать сущность изучаемого явления. Показатели вариации характеризуют колеблемость отдельных значений вариант около средних величин. Показатели вариации определяют различия индивидуальных значений признака внутри изучаемой совокупности. Существует несколько видов показателей вариации:

а) Размах вариации R представляет собой разность между максимальным и минимальным значениями признака:


R = Xmax – Xmin


Размах вариации показывает лишь крайние отклонения признака и не отражает отклонений всех вариантов в ряду.

б) Среднее линейное отклонение


(7) - невзвешенное;

(8) - взвешенное,


где: Х - варианты;

`Х - средняя величина;

n - число признаков;

f - частоты.

Линейное отклонение учитывает различия всех единиц изучаемой совокупности.

в) Дисперсия - показатель вариации, выражающий средний квадрат отклонений вариант от средних величин в зависимости от образующего вариационного фактора.


(9) - невзвешенная;

(10) - взвешенная.


Показатель дисперсии более объективно отражает меру вариации на практике.

г) Среднее квадратическое отклонение


(11) - взвешенное;

(12) - невзвешенное.


Среднее квадратическое отклонение является показателем надежности средней: чем меньше среднее квадратическое отклонение, тем лучше средняя арифметическая отражает собой всю статистическую совокупность.

д) Показатель вариации.



Показатель вариации отражает тенденцию развития явления, т.e. действие главных факторов. Показатель вариации выражается в % или коэффициентах.

Расчет моды и медианы .

Особым видом средних величин являются структурные средние. Они применяются для изучения внутреннего строения и структуры рядов распределения значений признака. К таким показателям относятся мода и медиана.

Мода - это величина признака (варианта), который наиболее часто встречается в данной совокупности, т.e. это варианта, имеющая наибольшую частоту.

В интервальном ряду распределения мода находится по следующей формуле:



где: минимальная граница модального интервала;

Величина модального интервала;

{частоты модального интервала, предшествующего и следующего за ним

Модальный интервал определяется по наибольшей частоте. Мода широко используется в статистической практике при изучении покупательского спроса, регистрации цен и т.д.

Медиана - варианта, находящаяся в середине ряда распределения.

Медиана делит ряд на две равные (по числу единиц) части – со значениями признака меньше медианы и со значениями признака больше медианы.

В случае если вариационный ряд имеет число значений вариант четное, то расчет медианы производится по следующей формуле:


где - варианты, находящиеся в середине ряда

В интервальном ряду распределения медиана рассчитывается следующим образом:



где: - нижняя граница медианного интервала;

Величина медианного интервала;

Полусумма частот ряда;

Сумма накопленных частот, предшествующих медианному интервалу;

Частота медианного интервала.

Структурные средние величины (мода и медиана) имеют довольно большое значение в статистике и широкое применение. Мода является именно тем числом, которое в действительности встречается наиболее часто. Медиана имеет важные свойства для анализа явлений: она обнаруживает типичные черты индивидуальных признаков явления, и, вместе с тем, учитывает влияние крайних значений совокупности. Медиана находит практическое применение в маркетинговой деятельности вследствие особого свойства – сумма абсолютных отклонений чисел ряда от медианы есть величина наименьшая:

2. Расчетная часть


По результатам 20%-ного выборочного обследования торговых предприятий района, проведенного на основе случайной бесповторной выборки, получены следующие данные за отчетный месяц (тыс. руб.)


Таблица 1. Исходные данные

Товарооборот

Средние товарные запасы

Товарооборот

Средние товарные запасы

Цель статистического исследования - анализ совокупности предприятий по признакам Товарооборот и Средние товарные запасы , включая:

· изучение структуры совокупности по признаку Товарооборота ;

· выявление наличия корреляционной связи между признаками Товарооборота и Средними товарными запасами предприятий, установление направления связи и оценка её тесноты;

· применение выборочного метода для определения статистических характеристик генеральной совокупности фирм.

Задание 1


По исходным данным (табл. 1) необходимо выполнить следующее:

1. Построить статистический ряд распределения предприятий по товарообороту , образовав пять групп с равными интервалами.

2. Графическим методом и путем расчетов определить значения моды и медианы полученного ряда распределения.

4. Вычислить среднюю арифметическую по исходным данным (табл. 1), сравнить её с аналогичным показателем, рассчитанным для интервального ряда распределения. Объяснить причину их расхождения.

Сделать выводы по результатам выполнения Задания 1.

Выполнение Задания 1

является изучение состава и структуры выборочной совокупности предприятий путем построения и анализа статистического ряда распределения фирм по признаку Товарооборот.

1. Построение интервального ряда распределения предприятий по товарообороту

Для построения интервального ряда распределения определяем величину интервала h по формуле:

,


где –наибольшее и наименьшее значения признака в исследуемой совокупности, k - число групп интервального ряда.

При заданных k = 5, x max = 795 тыс.руб. и x min = 375тыс руб.

h = тыс.руб.


При h = 5 чел. границы интервалов ряда распределения имеют следующий вид (табл. 2):


Таблица 2

Номер группы

Нижняя граница, тыс.руб.

Верхняя граница, тыс.руб


Определяем число предприятий, входящих в каждую группу, используя принцип полуоткрытого интервала [) , согласно которому предприятия со значениями признаков, которые служат одновременно верхними и нижними границами смежных интервалов (459, 543, 627, и 711 тыс.руб), будем относить ко второму из смежных интервалов.

Для определения числа предприятий в каждой группе строим разработочную таблицу 3 (данные графы 4 потребуются при выполнении Задания 2).


Таблица 3. Разработочная таблица для построения интервального ряда распределения и аналитической группировки

предприятия

Товарооборот,

Средние товарные запасы,



























На основе групповых итоговых строк «Всего» табл. 3 формируем итоговую таблицу 4, представляющую интервальный ряд распределения предприятий по товарообороту.

Таблица 4. Распределение предприятий по товарообороту


Приведем еще три характеристики полученного ряда распределения - частоты групп в относительном выражении, накопленные (кумулятивные) частоты S j , получаемые путем последовательного суммирования частот всех предшествующих (j -1) интервалов, и накопленные частости , рассчитываемые по формуле



Таблица 5. Структура предприятий по товарообороту

Группы предприятий по товарообороту, тыс.руб.x

Число предприятий,

Накопленная частота

Накопленная частость, %

в абсолютном выражении

в % к итогу




Вывод. Анализ интервального ряда распределения изучаемой совокупности предприятий показывает, что распределение предприятий по товарообороту не является равномерным: преобладают предприятия с товарооборотом от 543 тыс.руб. до 627 тыс.руб. (это 11 предприятий, доля которых составляет 36,7%); самые малочисленная группа предприятий имеет 711-795 тыс.руб.. Группа включает 3 предприятия, что составляет по 10% от общего числа фирм.

2. Нахождение моды и медианы полученного интервального ряда распределения графическим методом и путем расчетов

Для определения моды графическим методом строим по данным табл. 4 (графы 2 и 3) гистограмму распределения фирм по изучаемому признаку.


Рис. 1.Определение моды графическим методом


Расчет конкретного значения моды для интервального ряда распределения производится по формуле:


где х Мo – нижняя граница модального интервала,

h – величина модального интервала,

f Mo – частота модального интервала,

f Mo-1 – частота интервала, предшествующего модальному,

f Mo+1 – частота интервала, следующего за модальным.

Согласно табл. 4 модальным интервалом построенного ряда является интервал 35 - 40 чел., т.к. он имеет наибольшую частоту (f 4 =10). Расчет моды:


Вывод. Для рассматриваемой совокупности предприятий наиболее распространенный товарооборот характеризуется средней величиной 593,4 тыс. руб.

Для определения медианы графическим методом строим по данным табл. 5 кумуляту распределения предприятий по изучаемому признаку.


Рис. 2. Определение медианы графическим методом

Расчет конкретного значения медианы для интервального ряда распределения производится по формуле



где х Ме – нижняя граница медианного интервала,

h – величина медианного интервала,

– сумма всех частот,

f Ме – частота медианного интервала,

S Mе-1 – кумулятивная (накопленная) частота интервала, предшествующего медианному.

Определяем медианный интервал. Медианным интервалом является интервал 543-627 тыс.руб., т.к. именно в этом интервале накопленная частота S j =20 впервые превышает полусумму всех частот ().

Расчет медианы:


Вывод . В рассматриваемой совокупности предприятий половина из них имеют товарооборот не более 588,3 тыс.руб., а другая половина – не менее 588,3 тыс.руб.

3. Расчет характеристик ряда распределения

Для расчета характеристик ряда распределения, σ , σ 2 , V σ на основе табл. 5 строим вспомогательную таблицу 6 (– середина интервала).

Таблица 6. Расчетная таблица для нахождения характеристик ряда распределения

Группы предприятий по товарообороту, тыс.руб.

Середина интервала,

Число предприятий,

f j





Рассчитаем среднюю арифметическую взвешенную:

Рассчитаем среднее квадратическое отклонение:

Рассчитаем дисперсию:


σ2 = 972 = 9409


Рассчитаем коэффициент вариации:

Вывод . Анализ полученных значений показателей и σ говорит о том, что средняя величина товарооборота составляет 585 тыс.руб., отклонение от этой величины в ту или иную сторону составляет в среднем 97 тыс. руб. (или 16,5%), наиболее характерный товарооборот находится в пределах от 488 до 628 тыс. руб. (диапазон).

Значение V σ = 16,5% не превышает 33%, следовательно, вариация товарооборота в исследуемой совокупности предприятий незначительна и совокупность по данному признаку однородна. Расхождение между значениями, Мо и Ме незначительно (=585 тыс. руб., Мо =593,4 тыс. руб., Ме =588,3 чел.), что подтверждает вывод об однородности совокупности фирм. Таким образом, найденное среднее значение среднесписочной численности менеджеров (585тыс.руб.) является типичной, надежной характеристикой исследуемой совокупности предприятий.

4. Вычисление средней арифметической по исходным данным о среднесписочной численности менеджеров фирм

Для расчета применяется формула средней арифметической простой:



Причина расхождения средних величин, рассчитанных по исходным данным (17550 тыс. руб.) и по интервальному ряду распределения (17670 тыс. руб.), заключается в том, что в первом случае средняя определяется по фактическим значениям исследуемого признака для всех 30-ти фирм, а во втором случае в качестве значений признака берутся середины интервалов и, следовательно, значение средней будет менее точным. Вместе с тем, при округлении обеих рассматриваемых величин их значения совпадают, что говорит о достаточно равномерном распределении товарооборота внутри каждой группы интервального ряда.

Задание 2


По исходным данным (табл. 1) с использованием результатов выполнения Задания 1 необходимо выполнить следующее:

1. Установить наличие и характер корреляционной связи между признаками товарооборот и средние товарные запасы , образовав шесть групп с равными интервалами по каждому из признаков, используя методы:

а) аналитической группировки;

б) корреляционной таблицы.

2. Измерить тесноту корреляционной связи, используя коэффициент детерминации и эмпирическое корреляционное отношение .

Сделать выводы по результатам выполнения задания 2.

Выполнение задания 2

Целью выполнения данного задания является выявление наличия корреляционной связи между факторным и результативным признаками, а также установление направления связи и оценка ее тесноты.

По условию Задания 2 факторным является признак товарооборот , результативным – признак средние товарные запасы .

1. Установление наличия и характера корреляционной связи между признаками товарооборотом и средними товарными запасами методами аналитической группировки и корреляционных таблиц

1а. Применение метода аналитической группировки

Аналитическая группировка строится по факторному признаку Х и для каждой j-ой группы ряда определяется среднегрупповое значение результативного признака Y . Если с ростом значений фактора Х от группы к группе средние значения систематически возрастают (или убывают), между признаками X и Y имеет место корреляционная связь.

Используя разработочную таблицу 3, строим аналитическую группировку, характеризующую зависимость между факторным признаком Х - товарооборот и результативным признаком Y средние товарные запасы . Макет аналитической таблицы имеет следующий вид (табл. 7):


Таблица 7. Зависимость объема продаж от среднесписочной численности менеджеров

Номер группы

Группы предприятий по

товарообороту, тыс. руб.

x

Число предприятий,

f j


ИТОГО


Групповые средние значения получаем из таблицы 3, основываясь на итоговых строках «Всего». Построенную аналитическую группировку представляет табл. 8:


Таблица 8. Зависимость объема продаж от среднесписочной численности менеджеров

Номер группы

Группы предприятий по

товарообороту, тыс. руб.

x

Число предприятий,

f j

Средние товарные запасы, тыс. руб.

в среднем на одно предприятие,

Вывод. Анализ данных табл. 8 показывает, что с увеличением товарооборота от группы к группе систематически возрастает и средний товарный запас по каждой группе предприятий, что свидетельствует о наличии прямой корреляционной связи между исследуемыми признаками.

1б. Применение метода корреляционных таблиц

Корреляционная таблица строится как комбинация двух рядов распределения по факторному признаку Х и результативному признаку Y . На пересечении j -ой строки и k -ой графы таблицы указывается число единиц совокупности, входящих в j -ый интервал по признаку X и в k -ый интервал по признаку Y . Концентрация частот около диагонали построенной таблицы свидетельствует о наличии корреляционной связи между признаками - прямой или обратной. Связь прямая, если частоты располагаются по диагонали, идущей от левого верхнего угла к правому нижнему, обратная - по диагонали от правого верхнего угла к левому нижнему.

Для построения корреляционной таблицы необходимо знать величины и границы интервалов по двум признакам X и Y . Для факторного признака Х Товарооборот эти величины известны из табл. 4 Определяем величину интервала для результативного признака Y средние товарные запасы при k = 5 , у max = 301 тыс. руб., у min = 150 тыс. руб.:


Границы интервалов ряда распределения результативного признака Y имеют вид:

Таблица 9

Номер группы

Нижняя граница, Тыс. руб.

Верхняя граница, Тыс. руб.


Подсчитывая для каждой группы число входящих в нее фирм с использованием принципа полуоткрытого интервала [) , получаем интервальный ряд распределения результативного признака (табл. 10).


Таблица 10. Интервальный ряд распределения фирм по объёму продаж


Используя группировки по факторному и результативному признакам, строим корреляционную таблицу (табл. 11).


Таблица 11. Корреляционная таблица зависимости объема продаж от среднесписочной численности менеджеров

Группы предприятий по товарообороту, тыс. руб.


Группы предприятий по среднему товарному запасу, тыс. руб.















Вывод . Анализ данных табл. 11 показывает, что распределение частот групп произошло вдоль диагонали, идущей из левого верхнего угла в правый нижний угол таблицы. Это свидетельствует о наличии прямой корреляционной связи между среднесписочной численностью менеджеров и объемом продаж фирмами.

2. Измерение тесноты корреляционной связи с использованием коэффициента детерминации и эмпирического корреляционного отношения

Коэффициент детерминации характеризует силу влияния факторного (группировочного) признака Х на результативный признак Y и рассчитывается как доля межгрупповой дисперсии признака Y в его общей дисперсии:

где – общая дисперсия признака Y ,

– межгрупповая (факторная) дисперсия признака Y .

Общая дисперсия характеризует вариацию результативного признака, сложившуюся под влиянием всех действующих на Y факторов (систематических и случайных ) и вычисляется по формуле


где y i – индивидуальные значения результативного признака;

– общая средняя значений результативного признака;

n – число единиц совокупности.

Межгрупповая дисперсия измеряет систематическую вариацию результативного признака, обусловленную влиянием признака-фактора Х (по которому произведена группировка) и вычисляется по формуле



где –групповые средние,

– общая средняя,

–число единиц в j-ой группе,

k – число групп.

Для расчета показателей и необходимо знать величину общей средней , которая вычисляется как средняя арифметическая простая по всем единицам совокупности:

Значения числителя и знаменателя формулы имеются в табл. 8. Используя эти данные, получаем общую среднюю:

228 тыс. руб.


Для расчета общей дисперсии применяется вспомогательная таблица 12.


Таблица 12. Вспомогательная таблица для расчета общей дисперсии

предприятия

Средние товарные запасы, тыс.руб.


Рассчитаем общую дисперсию:



Для расчета межгрупповой дисперсии строится вспомогательная таблица 13, При этом используются групповые средние значения из табл.

Таблица 13ю Вспомогательная таблица для расчета межгрупповой дисперсии

Группы предприятий

по товарообороту,

тыс. руб. x

Число предприятий,

f j

Среднее значение в группе,




Рассчитаем межгрупповую дисперсию:


Определяем коэффициент детерминации:


Вывод. 81% вариации объёма продаж товаров фирмами обусловлено вариацией среднесписочной численности менеджеров по продажам, а 19% – влиянием прочих неучтенных факторов.

Эмпирическое корреляционное отношение оценивает тесноту связи между факторным и результативным признаками и вычисляется по формуле

Рассчитаем показатель:


Вывод : согласно шкале Чэддока связь между товарооборотом и средними товарными запасами предприятий является весьма тесной.

Задание 3


По результатам выполнения Задания 1 с вероятностью 0,954 необходимо определить:

1) ошибку выборки для средней величины товарооборота торгового предприятия, а также границы, в которых будет находиться генеральная средняя.

2) ошибку выборки доли торговых предприятий с объемом товарооборота 627 и более тыс. руб., а также границы, в которых будет находиться генеральная доля фирм.

Выполнение Задания 3

Целью выполнения данного Задания является определение для генеральной совокупности предприятий района границ, в которых будут находиться средняя величина товарооборота, и доля предприятий с товарооборотом не менее 627 тыс. руб.

1. Определение ошибки выборки для величины товарооборота, а также границ, в которых будет находиться генеральная средняя

Применяя выборочный метод наблюдения, необходимо рассчитать ошибки выборки (ошибки репрезентативности), т.к. генеральные и выборочные харак- теристики, как правило, не совпадают, а отклоняются на некоторую величину ε .

Принято вычислять два вида ошибок выборки - среднюю и предельную .

Для расчета средней ошибки выборки применяются различные формулы в зависимости от вида и способа отбора единиц из генеральной совокупности в выборочную.

Для собственно-случайной и механической выборки с бесповторным способом отбора средняя ошибка для выборочной средней определяется по формуле


где – общая дисперсия изучаемого признака,

N

n

Предельная ошибка выборки определяет границы, в пределах которых будет находиться генеральная средняя:



где – выборочная средняя,

– генеральная средняя.

Предельная ошибка выборки кратна средней ошибке с коэффициентом кратности t (называемым также коэффициентом доверия):

Коэффициент кратности t зависит от значения доверительной вероятности Р , гарантирующей вхождение генеральной средней в интервал, называемый доверительным интервалом .

Наиболее часто используемые доверительные вероятности Р и соответствующие им значения t задаются следующим образом (табл. 14):

Таблица 14


По условию Задания 2 выборочная совокупность насчитывает 30 фирм, выборка 20% механическая, следовательно, генеральная совокупность включает 150 фирм . Выборочная средняя, дисперсия определены в Задании 1. Значения параметров, необходимых для решения задачи, представлены в табл. 15:


Таблица 15



Рассчитаем среднюю ошибку выборки:


Рассчитаем предельную ошибку выборки:



Определим доверительный интервал для генеральной средней:



Вывод. На основании проведенного выборочного обследования с вероятностью 0,954 можно утверждать, что для генеральной совокупности предприятий средняя величина товарооборота находится в пределах от 553 до 616 тыс. руб.

2. Определение ошибки выборки для доли фирм товарооборотом 627 тыс. руб. и более, а также границ, в которых будет находиться генеральная доля

Доля единиц выборочной совокупности, обладающих тем или иным заданным свойством, выражается формулой



где m – число единиц совокупности, обладающих заданным свойством;

n – общее число единиц в совокупности.

Для собственно-случайной и механической выборки с бесповторным способом отбора предельная ошибка выборки доли единиц, обладающих заданным свойством, рассчитывается по формуле



где w – доля единиц совокупности, обладающих заданным свойством;

(1- w ) – доля единиц совокупности, не обладающих заданным свойством,

N – число единиц в генеральной совокупности,

n – число единиц в выборочной совокупности.

Предельная ошибка выборки определяет границы, в пределах которых будет находиться генеральная доля р единиц, обладающих исследуемым признаком:


По условию Задания 3 исследуемым свойством фирм является равенство или превышение товарооборота величины 627 тыс. руб .

Число предприятий с данным свойством определяется из табл. 3: m=7

Рассчитаем выборочную долю:

Рассчитаем предельную ошибку выборки для доли:

Определим доверительный интервал генеральной доли:


Вывод. С вероятностью 0,954 можно утверждать, что в генеральной совокупности предприятий района доля предприятий с товарооборотом 627 тыс. руб. и более будет находиться в пределах от 18% до 48,5%.

Задание 4


Имеются данные о продаже товара А на трех городских рынках:


Таблица 16

Базисный период

Отчетный период

Продано, т

Изменение цены, %

Индекс физического объема(q 1)

Без изменений


Определите:

2. Абсолютное изменение средней цены товара в результате влияния отдельных факторов.


Таблица 17



Базисный период

Отчетный период

Расчетные графы

Средняя цена за 1 кг., руб. (р 0)

Продано, т

Изменение цены, %

Индекс физического объема (q 1)









Вычислим индекс цен переменного состава:


Из таблицы видно, что цена продукции на каждом рынке в отчетном периоде по сравнению с базисным изменилась. В целом же средняя цена выросла на 4 % .Это объясняется влиянием изменений структуры реализации продукции по торговым городским рынкам. В базисном периоде по более низкой цене продавали продукцию меньше, чем в отчетном периоде по более высокой цене.

Рассчитываем индекс структурных сдвигов:



Первая часть приведенной формулы позволяет ответить на вопрос, какой была бы средняя цена в отчетном периоде. Вторая часть формулы отражает фактическую среднюю цену базисного периода.

Рассчитанный индекс показал, что за счет структурных сдвигов цены значительно не изменились.

Определим индекс фиксированного или постоянного состава, который не учитывает изменения структуры продаж:



Индекс цен фиксированного состава равен 104,1%, что позволяет сделать следующий вывод: если бы структура продаж продукции на городских рынках не изменилась, средняя цена возросла бы на 4,1%., что и произойдет в дальнейшем.

Между данными индексами существует следующая взаимосвязь:


Ip фс * I cc т = Ip пс;

1,041 * 0,99 =1,040


Определим абсолютное изменение средней цены товара в результате влияния отдельных факторов:


D pq = åp 1 q 1 - å p 0 q 0

D pq = 141407,9 – 134400 =7008 руб.

Заключение


Статистические ряды распределения являются базисным методом для любого статистического анализа.

Статистический ряд распределения представляет собой упорядоченное распределение единиц изучаемой совокупности на группы по определенному варьирующему признаку, характеризует структуру изучаемого явления. Анализируя рассчитанные показатели статистического ряда распределения, можно делать выводы об однородности или неоднородности совокупности, закономерности распределения и границах варьирования единиц совокупности. Изучив основные приемы исследования и практики применения рядов распределения, а также методику вычисления наиболее важных статистических величин, необходимо отметить, что конечная цель изучения статистики в целом - анализ изучаемого явления - крайне важен для всех сфер человеческой жизни. Анализ отображает явления в целом и вместе с этим учитывает влияние каждого фактора в отдельности. На основании проведенного анализа можно учитывать и прогнозировать факторы, негативно влияющие на развитие событий.

Социально-экономическая статистика обеспечивает предоставление важной цифровой информации об уровне и возможностях развития страны: ее экономическом положении, уровне жизни населения, его составе и численности, рентабельности предприятий, динамике безработице и т.д. Статистическая информация является одним из решающих ориентиров государственной экономической политики.

Статистические методы используют комплексно. Выделяют три основные стадии экономико-статистического исследования: сбор первичной статистической информации, статистическая сводка и обработка первичной информации, обобщение и интепретация статистической информации.

Качество, достоверность статистической информации определяют эффективность использования статистики на любом уровне и в любой сфере.

Литература

1. Статистика: Учеб. пособие/А.В. Багат, М.М. Конкина, В.М. Симчера и др.; Под ред. В.М. Симчеры.- М.: Финансы и статистика, 2005.

2. Громыко Г.Л. Теория статистики: Учебник. - М.: ИНФРА-М, 2006.

3. Практикум по статистике: Учеб. пособие для вузов/ Под ред. В.М. Симчеры. - М.: Финстатинформ, 1999.

4. Гусаров В.М. Статистика: Учеб. пособие для вузов. - М.: ЮНИТИ - ДАНА, 2001.

5. Гусаров В.М. Статистика: Учеб пособие/ В.М. Гусаров, Е.И. Кузнецова. – 2-е изд., перераб. и доп. – М.: ЮНИТИ-ДАНА, 2007.

6. Общая теория статистики: Статистическая методология в изучении коммерческой деятельности: Учебник / Под. ред. Башиной О.Э., Спирина А.А. – М.: Финансы и статисика, 2005.

7. Практикум по теории статистики: Учебное пособие/Под. ред. Шмойловой Р.А. – М.: Финансы и статистика, 2004.

8. Теория статистики: Учебник/Под. ред. Шмойловой Р.А. – М.: Финансы и статистика, 2001; 2003; 2006.

9. http://www.gks.ru


Репетиторство

Нужна помощь по изучению какой-либы темы?

Наши специалисты проконсультируют или окажут репетиторские услуги по интересующей вас тематике.
Отправь заявку с указанием темы прямо сейчас, чтобы узнать о возможности получения консультации.

Статистический ряд распределения - упорядоченное распределение единиц совокупности на группы по определенному признаку. Он характеризует состав (структуру) изучаемого явления, позволяет судить об однородности совокупности, закономерности распределения и границах варьирования единиц совокупности.

Ряды распределения, построенные по атрибутивным (качественным) признакам, называются атрибутивными (распределение населения по полу, занятости, национальности, профессии и т.д.).

Ряды распределения, построенные по количественному признаку, называются вариационными (распределение населения по возрасту, рабочих – по стажу работы, зарплате и т.д.). Вариационные ряды распределения состоят из двух элементов: вариантов и частот. Варианты – отдельные значения признака, которые он принимает в ряду. Частоты – это численность отдельных вариантов или каждой группы вариационного ряда, т.е. это числа, показывающие, как часто встречаются те или иные варианты в ряду распределения. Сумма всех частот называется объемом совокупности и определяет число элементов всей совокупности. Частости – это частоты, выраженные в долях единиц или в % к итогу.

Вариационные ряды в зависимости от характера вариации подразделяются на дискретные и интервальные. Дискретные вариационные ряды основаны на дискретных (прерывных) признаках, имеющих только целые значения, на дискретных признаках, представленных в виде интервалов. Интервальные вариационные ряды основаны на непрерывных признаках (имеющих любые значения, даже дробные).

7. Табличное и графическое представление статистических данных.

Результаты сводки и группировки излагаются в виде таблиц. Таблица – рациональная, наглядная и компактная форма стат.материала.

Статистическая таблица – таблица, содержащая результаты подсчета практических данных и является итогом сводки первоначальной информации.

Таблица характеризует совокупность по одному или нескольким признакам, взаимосвязанным логикой.

Статистическая таблица имеет свое подлежащее и сказуемое. Подлежащее – объект, характеризующийся цифрами. Сказуемое таблицы - система показателей.

Таблицы бывают простые и сложные. В простой таблице дается простой перечень объектов. Сложная таблица содержит группировку единиц совокупности одновременно по 2-м и более признакам. Таблица д/б компактной, заголовки краткими, информация в столбцах и графах должна завершаться итоговой строкой. Графы и строки должны иметь единицы измерения, затем необходимо провести четную и логическую проверку таблицы.

Статистический график – чертеж, на котором стат.совокупности, характеризуемые определенными показателями описываются с помощью условных геометрических образов или знаков. При построении графика необходимо соблюдать требования: наглядность, выразительность, понятность. Поле графика – часть плоскости, где расположены графические образы. Виды графиков: линейные, столбиковые, полосовые, круговые, секторные, фигурные, точечные, объемные, применяются диаграммы и стат.карты. Картограмма – схематическая географическая карта, на которой выделены отрасли промышленности или структура состава населения.

Зарегистрированные в результате наблюдения индивидуальные значения изучаемого варьирующего признака образуют так называемый первичный ряд .

Первым шагом в упорядочении первичного ряда является его ранжирование. Располагая значения признака первичного ряда, например, в возрастающем порядке, получают ранжированный ряд .

Рассмотрим первичный ряд, полученный при регистрации уровня квалификации рабочих

Ранжированный ряд будет иметь вид:

Рассматривая этот ранжированный ряд, мы видим, что некоторые значения признака повторяются у разных рабочих (единиц совокупности).

Оформим результаты наблюдений более компактно, поставив в соответствие каждому значению признака подсчет численности единиц совокупности, имеющих одинаковые значения признаков. Для нашего примера имеем:

Получим ранжированный (упорядоченный) ряд, характеризующий распределение изучаемого признака по единицам совокупности. В статистике такие ряды принято называть рядами распределения .

При достаточно большом числе единиц совокупности даже для несплошного наблюдения, приведенное выше упорядочение данных наблюдения может быть громоздким. Поэтому, такое ранжирование, как правило, сопровождается группировкой и сводкой. Изучаемый признак в этом случае является группировочным.

Отсюда общее определение:

Статистические ряды распределения – это упорядоченное расположение единиц изучаемой совокупности на группы по группировочному признаку .

Любой статистический ряд распределения состоит из двух элементов:

А) из упорядоченных значений признака или вариантов;

Б) количества единиц совокупности, имеющих данные значения, называемых частотами . Частоты, выраженные в долях единицы или в процентах к итогу, называются частостями .

Т.о., варианта – это отдельное значение (или вариант отдельной группы) варьируемого признака, которые он принимает в ряду распределения. Говоря о частотах надо иметь в виду, что сумма частот составляет объем изучаемой совокупности (или, по другому, объем ряда распределения).

Буквой “X” принято обозначать варианту признака, а буквой f – частоту.

По своему содержанию признаки могут быть атрибутивными или количественными.

Ряды распределения построенные по атрибутивному (или качественному) признаку называются атрибутивными рядами распределения .

Например, распределение студентов по форме обучения, по факультетам, по специальностям и т.д.

Ряды распределения, построенные по количественному признаку называются вариационными рядами .

Например, распределение работников по стажу работы, по уровню заработной платы, по производительности труда и т.д.

Изучаемые в статистике признаки являются изменяющимися.

По характеру изменения (вариаций) значений признака различают:

А) признаки с прерывным изменением;

Б) признаки с непрерывным изменением.

Признаки с прерывным изменением могут принимать лишь конечное число определенных значений (например, тарифный разряд работников, количество станков и т.д.).

Признаки с непрерывным изменением могут принимать в определенных границах любые значения (например, стаж работы, размер зарплаты, пробег автотранспорта и т.п.)

По способу построения различают дискретные (прерывные) вариационные ряды, основанные на прерывной вариации признака, и интервальными (непрерывными), базирующиеся на непрерывно изменяющемся значении признака.

При построении дискретного вариационного ряда в первой графе (строке) указываются конкретные значения каждого индивидуального значения признака (т.е. каждой варианты), а во второй графе(строке) – частоты или частости.

Например ряд, характеризующий распределение работников по тарифным разрядам.

При построении интервального вариационного ряда отдельные значения вариант указываются в значениях “от - до”.

Интервалы можно брать как равные, так и неравные. Для каждого из них указываются частоты и частости, (т.е. абсолютное или относительное числа единиц совокупности, у которых значение варианты находится внутри данного интервала).

Первый и последний интервалы ряда во многих случаях берутся незакрытыми, т.е. для первого интервала указывается только верхняя граница (“до… ”) а, для последнего только нижняя (“от… и выше”, “свыше…”). Использование незакрытых интервалов удобно, когда в совокупности встречается незначительное количество единиц, с очень малыми или очень большими значениями признака, резко отличающимися от всех остальных значений.

При построении интервальных вариационных рядов возникает вопрос о количестве групп, на которые следует разделить материал статистического наблюдения и вопрос о величине интервала каждой отдельной группы.

Эти вопросы уже изучались при рассмотрении метода группировки (см. тему 3). Там же были рассмотрены вопросы, важные для составления интервального ряда, такие как:

1) Определение начала отсчетов интервалов;

2) Подсчет частоты.

Следует иметь в виду, что интервальные вариационные ряды могут быть построены и для признаков с дискретной вариацией. Нередко в статистическом исследовании указывать отдельное значение дискретного признака нецелесообразно, т.к. это, как правило, затрудняет рассмотрение вариации признака. Поэтому возможные дискретные значения признака распределяются по группам и подсчитываются соответствующие им частоты (частости).

При построении интервального ряда по дискретному признаку, границы смежных интервалов не повторяют друг друга: следующий интервал начинается со следующего по порядку (после верхнего значения предыдущего интервала) дискретного значения признака.

Для расчета обобщенных характеристик рядов распределения можно пользоваться как частотами, так и частостями.

Частости как доли единицы: w1=f1/∑f, w2=f2/∑f и т.д.

Частости как проценты w1=(f1/∑f)*100, w2=(f2/∑f)*100 и т.д.


Похожая информация.


Ряд распределения представляет собой простейшую группировку, в которой каждая выделяемая группа характеризуется только одним признаком .

В таблице 2 (только число банков) – малая выборка – простейший ряд.

Пример: с детьми, которых в разное время во дворе было: 9 10 11 8 8 9 9 11 11. Ранжируем от min к max и получаем:

Пример 2. : со студентами в аудитории.

Таблица 0

Распределение числа студентов группы 302

Число студентов (чел.)

Итого:

Статистический ряд распределения – это упорядоченный ряд распределения единиц совокупности на группы по определенному варьирующему признаку.

Выделяются 2 вида рядов:

1. атрибутивный

Например: таблица 0 Распределения числа студентов группы 302 по полу (женский, мужской), число, % (нумерация столбцов обязательна).

Строится по качественному признаку, которые не имеет числового выражения. Такие ряды характеризуют совокупность по изучаемому признаку.

2. вариационный

Построен по количественному признаку, причем признак располагается в порядке возрастания или убывания значения признака, т.е. ряд должен быть проранжирован.

Характеристики ряда распределения:

1. x – вариант(а) – это значение признака в вариационном ряду, т.е. те значения, которые принимает группировочный признак;

2. f – частота – показывает сколько раз в совокупности встречается данное значение признака.

Пример 3. : Дети гуляли во дворе. В определенное время их было: 9 10 11 8 8 9 9 11 11. Ранжируем ряд от меньшего к большему и увидим сколько раз встречается тот или иной вариант.

Сумма всех частот равна сумме элементов ряда

Иногда для характеристики ряда используют частости – частоты, выраженные в % или долях 1,0 .

В любом случае Wi – частоты = 100% или Wi – частоты = 1 доле.

(см. табл. 0: 83,3+16,7 = 100,0%)

(см. табл. 0: 0,83+0,17 = 1,00).

В зависимости от характера вариационного признака вариационные ряды подразделяются на дискретные и интервальные .

В дискретных рядах варианты представлены в виде целых чисел и их значения можно пересчитать.

Пример 4:

Таблица 4

Распределение семей по числу детей

Число детей в семье (чел.)

Количество семей (ед.)

S (накопленные частоты)

Итого:

Интервальный ряд – это ряд, в кот. значение признака выражен в виде интервалов.

В интервальных рядах признак может меняться непрерывно (от min к max), причем отличаются друг от друга на сколь угодно малую величину .

Интервальные ряды применяются в тех случаях, если значение признака меняются непрерывно, а также если дискретный признак меняется в очень широких пределах, т.е. число вариантов достаточно велико.

Правила построения рядов, выбор количества групп и величин интервалов также как и при группировке.

Таблица 5

Распределение сотрудников предприятия по размерам месячной заработной платы, руб.

Зарплата (руб.)

Число сотрудников (чел.)

Накопленные частоты

Итого:

Кроме частот используются накопленные частоты или накопленные частости.

Они определяются путем последовательного суммирования частот предшествующих интервалов и обозначаются S.

Накопительные частоты называются аккумулированными частотами , они показывают сколько элементов ряда имеют значение до определенного ряда.




Top