Ряды распределения. Понятие статистических рядов, их виды

Федеральное агентство по образованию

Государственное образовательное учреждение высшего профессионального образования

Всероссийский заочный финансово-экономический институт


Кафедра Статистики


Курсовая работа

по дисциплине Статистика

Статистические ряды распределения в изучении структуры рынка


Руководитель: Пуляшкин В.В.


Введение

Статистические ряды распределения являются одним из наиболее важных элементов статистики. Они представляют собой составную часть метода статистических сводок и группировок, но, по сути, ни одно из статистических исследований невозможно произвести, не представив первоначально полученную в результате статистического наблюдения информацию в виде статистических рядов распределения. Первичные данные обрабатываются в целях получения обобщенных характеристик изучаемого явления по роду существенных признаков для дальнейшего осуществления анализа и прогнозирования; производится сводка и группировка; статистические данные оформляются с помощью рядов распределения в таблицы, в результате чего информация представляется в наглядном рационально изложенном виде, удобном для использования и дальнейшего исследования; строятся различного рода графики для наиболее наглядного восприятия и анализ информации. На основе статистических рядов распределения вычисляются основные величины статистических исследований: индексы, коэффициенты; абсолютные, относительные, средние величины и т.д., с помощью которых можно проводить прогнозирование, как конечный итог статистических исследований. Таким образом статистические ряды распределения являются базисным методом для любого статистического анализа. Понимание данного метода и навыки его использования необходимы для проведения статистических исследований.

В теоретической части курсовой работы рассмотрены следующие аспекты:

1) Понятие статистических рядов распределения, их виды;

2) Расчет средних величин, моды и медианы и представление рядов распределения графически;

Расчетная часть курсовой работы включает решение задачи по теме из варианта расчетного задания: Работа с таблицей «Выборочные данные торговых предприятий района: товарооборот и средние товарные запасы». Предметом исследования в работе будут служить так же торговые предприятия района (каждое предприятие, из которых, со своим товарооборотом). Работа содержит расчеты всех данных по ним, так же полное описание шагов действий для достижения конечного результата (вывода).

При написании курсовой работы использовались учебники курса, дополнительная литература, Интернет-ресурсы; при работе с табличными данными - персональный компьютер конфигурации:

Процессор – ADM Sempron 28000+S754

Память – DDR 512Mb PC3200 (DDR400)

Жесткий диск – 120Gb 7200/8 Mb/SATA

Принтер – hp deskjet 3325, струйный

OC – Windows XP Professional

ППП – Microsoft Word 2002, Excel

1. Теоретическая часть

1) Понятие статистических рядов распределения и их виды


Результаты сводки и группировки материалов статистического наблюдения оформляются в виде статистических рядов распределения. Статистические ряды распределения представляют собой упорядоченное распределение единиц изучаемой совокупности на группы по группировочному (варьирующему) признаку. Они характеризуют состав изучаемого явления, позволяют судить об однородности совокупности, границах ее изменения, закономерностях развития наблюдаемого объекта. В зависимости от признака статистические ряды распределения делятся на следующие:

Атрибутивные (качественные);

Вариационные (количественные):

a) дискретные;

b) интервальные.

а) Атрибутивные ряды распределения

Атрибутивные ряды образуются по качественным признакам, которыми могут выступать занимаемая должность работников торговли, профессия, пол, образование и т.д. В правовой статистике - это виды преступлений (убийства, грабежи, разбои); занимаемая должность лиц, совершивших административные правонарушения; образование и т.д.

Пример атрибутивных рядов распределения:


Таблица 1.Распределение преступлений в г. Москве за сутки по видам

Виды преступлений

Количество преступлений


абсолютное

в % к итогу

Убийства

Тяжкие телесные повреждения

Изнасилования

Изъятия наркотиков


В данном примере группировочным признаком выступают виды преступлений. Данный ряд распределения является атрибутивным, поскольку варьирующий признак представлен не количественными, а качественными показателями. Наибольшее число правонарушений составляют кражи 56%; далее правонарушения распределяются поровну между грабежами и случаями изъятия наркотиков (16%) и убийствами и случаями нанесения тяжких телесных повреждений (3%); разбои составили 4.5%, и наименьшее число зарегистрированных правонарушений составили изнасилования -1%.

б) Вариационные ряды распределения

Вариационные ряды строятся на основе количественного группировочного признака. При этом вариационные ряды по способу построения бывают дискретными (прерывными) и интервальными (непрерывными).

Дискретный ряд распределения - ряд, который основан на прерывной вариации признака, т.е. в котором значение признака выражено целым числом (число раскрытых преступлений и т.д.). Для построения дискретного ряда с небольшим числом вариантов выписываются все встречающиеся варианты значений признака, а затем подсчитывается частота повторения варианта. Ряд распределения принято оформлять в виде таблицы, состоящей из двух колонок (или строк), в одной из которых представлены варианты, а в другой - частоты.

Интервальный ряд распределения - ряд, базирующийся на непрерывно изменяющемся значении признака, имеющего любые количественные выражения, т.е. значение признаков таких рядах задается в виде интервала.

При наличии достаточно большого количества вариантов значений признака первичный ряд является труднообозримым, и непосредственное рассмотрение его не дает представления о распределении единиц по значению признака в совокупности. Поэтому первым шагом в упорядочении первичного ряда является его ранжирование – расположение всех вариантов в возрастающем (убывающем) порядке

Вариационные ряды состоят из двух элементов: вариант и частот.

Варианта - это отдельное значение варьируемого признака, которое он принимает в ряду распределения.

Частота - это численность отдельных вариант или каждой группы вариационного ряда. Частоты, выраженные в долях единицы или в процентах к итогу, называются частостями. Сумма частот составляет объем ряда распределения.

Для построения ряда распределения непрерывно изменяющихся признаков, либо дискретных, представленных в виде интервалов, необходимо установить оптимальное число интервалов, на которые следует разбить все единицы изучаемой совокупности.


2) Графическое изображение статистических данных


Статистический график– это чертеж, на котором статистические совокупности, характеризуемые определенными показателями, описываются с помощью условных геометрических образов или знаков. Представление данных таблиц в виде графика производит более сильное впечатление, чем цифры, позволяет лучше осмыслить результаты статистического наблюдения, правильно их истолковывать, значительно облегчает понимание статистического материала, делает его наглядным и доступным.

Значение графического метода в анализе и обобщении данных велико. Графическое изображение позволяет осуществить контроль достоверности статистических показателей, так как, представленные на графике, они более ярко показывают имеющиеся неточности, связанные либо с наличием ошибок наблюдения, либо с сущностью изучаемого явления. С помощью графического изображения возможны изучение закономерностей развития явления, установление существующих взаимосвязей. Простое сопоставление данных не всегда дает возможность уловить наличие причинных зависимостей, в то же время их графическое изображение способствует выявлению причинных связей, в особенности в случае установления первоначальных гипотез, подлежащих затем дальнейшей разработке. Графики также широко используются для изучения структуры явлений, их изменения во времени и размещения в пространстве. В них более выразительно проявляются сравнительные характеристики и отчетливо виды основные тенденции развития и взаимосвязи, присущие изучаемому явлению или процессу.


Таблица 2. Распределение студентов по возрасту


Расчет показателей вариации .

Вариация – это различие в значениях какого-либо признака у разных единиц данной совокупности в один и тот же период или момент времени. Исследование вариации в статистике имеет большое значение, помогает познать сущность изучаемого явления. Показатели вариации характеризуют колеблемость отдельных значений вариант около средних величин. Показатели вариации определяют различия индивидуальных значений признака внутри изучаемой совокупности. Существует несколько видов показателей вариации:

а) Размах вариации R представляет собой разность между максимальным и минимальным значениями признака:


R = Xmax – Xmin


Размах вариации показывает лишь крайние отклонения признака и не отражает отклонений всех вариантов в ряду.

б) Среднее линейное отклонение


(7) - невзвешенное;

(8) - взвешенное,


где: Х - варианты;

`Х - средняя величина;

n - число признаков;

f - частоты.

Линейное отклонение учитывает различия всех единиц изучаемой совокупности.

в) Дисперсия - показатель вариации, выражающий средний квадрат отклонений вариант от средних величин в зависимости от образующего вариационного фактора.


(9) - невзвешенная;

(10) - взвешенная.


Показатель дисперсии более объективно отражает меру вариации на практике.

г) Среднее квадратическое отклонение


(11) - взвешенное;

(12) - невзвешенное.


Среднее квадратическое отклонение является показателем надежности средней: чем меньше среднее квадратическое отклонение, тем лучше средняя арифметическая отражает собой всю статистическую совокупность.

д) Показатель вариации.



Показатель вариации отражает тенденцию развития явления, т.e. действие главных факторов. Показатель вариации выражается в % или коэффициентах.

Расчет моды и медианы .

Особым видом средних величин являются структурные средние. Они применяются для изучения внутреннего строения и структуры рядов распределения значений признака. К таким показателям относятся мода и медиана.

Мода - это величина признака (варианта), который наиболее часто встречается в данной совокупности, т.e. это варианта, имеющая наибольшую частоту.

В интервальном ряду распределения мода находится по следующей формуле:



где: минимальная граница модального интервала;

Величина модального интервала;

{частоты модального интервала, предшествующего и следующего за ним

Модальный интервал определяется по наибольшей частоте. Мода широко используется в статистической практике при изучении покупательского спроса, регистрации цен и т.д.

Медиана - варианта, находящаяся в середине ряда распределения.

Медиана делит ряд на две равные (по числу единиц) части – со значениями признака меньше медианы и со значениями признака больше медианы.

В случае если вариационный ряд имеет число значений вариант четное, то расчет медианы производится по следующей формуле:


где - варианты, находящиеся в середине ряда

В интервальном ряду распределения медиана рассчитывается следующим образом:



где: - нижняя граница медианного интервала;

Величина медианного интервала;

Полусумма частот ряда;

Сумма накопленных частот, предшествующих медианному интервалу;

Частота медианного интервала.

Структурные средние величины (мода и медиана) имеют довольно большое значение в статистике и широкое применение. Мода является именно тем числом, которое в действительности встречается наиболее часто. Медиана имеет важные свойства для анализа явлений: она обнаруживает типичные черты индивидуальных признаков явления, и, вместе с тем, учитывает влияние крайних значений совокупности. Медиана находит практическое применение в маркетинговой деятельности вследствие особого свойства – сумма абсолютных отклонений чисел ряда от медианы есть величина наименьшая:

2. Расчетная часть


По результатам 20%-ного выборочного обследования торговых предприятий района, проведенного на основе случайной бесповторной выборки, получены следующие данные за отчетный месяц (тыс. руб.)


Таблица 1. Исходные данные

Товарооборот

Средние товарные запасы

Товарооборот

Средние товарные запасы

Цель статистического исследования - анализ совокупности предприятий по признакам Товарооборот и Средние товарные запасы , включая:

· изучение структуры совокупности по признаку Товарооборота ;

· выявление наличия корреляционной связи между признаками Товарооборота и Средними товарными запасами предприятий, установление направления связи и оценка её тесноты;

· применение выборочного метода для определения статистических характеристик генеральной совокупности фирм.

Задание 1


По исходным данным (табл. 1) необходимо выполнить следующее:

1. Построить статистический ряд распределения предприятий по товарообороту , образовав пять групп с равными интервалами.

2. Графическим методом и путем расчетов определить значения моды и медианы полученного ряда распределения.

4. Вычислить среднюю арифметическую по исходным данным (табл. 1), сравнить её с аналогичным показателем, рассчитанным для интервального ряда распределения. Объяснить причину их расхождения.

Сделать выводы по результатам выполнения Задания 1.

Выполнение Задания 1

является изучение состава и структуры выборочной совокупности предприятий путем построения и анализа статистического ряда распределения фирм по признаку Товарооборот.

1. Построение интервального ряда распределения предприятий по товарообороту

Для построения интервального ряда распределения определяем величину интервала h по формуле:

,


где –наибольшее и наименьшее значения признака в исследуемой совокупности, k - число групп интервального ряда.

При заданных k = 5, x max = 795 тыс.руб. и x min = 375тыс руб.

h = тыс.руб.


При h = 5 чел. границы интервалов ряда распределения имеют следующий вид (табл. 2):


Таблица 2

Номер группы

Нижняя граница, тыс.руб.

Верхняя граница, тыс.руб


Определяем число предприятий, входящих в каждую группу, используя принцип полуоткрытого интервала [) , согласно которому предприятия со значениями признаков, которые служат одновременно верхними и нижними границами смежных интервалов (459, 543, 627, и 711 тыс.руб), будем относить ко второму из смежных интервалов.

Для определения числа предприятий в каждой группе строим разработочную таблицу 3 (данные графы 4 потребуются при выполнении Задания 2).


Таблица 3. Разработочная таблица для построения интервального ряда распределения и аналитической группировки

предприятия

Товарооборот,

Средние товарные запасы,



























На основе групповых итоговых строк «Всего» табл. 3 формируем итоговую таблицу 4, представляющую интервальный ряд распределения предприятий по товарообороту.

Таблица 4. Распределение предприятий по товарообороту


Приведем еще три характеристики полученного ряда распределения - частоты групп в относительном выражении, накопленные (кумулятивные) частоты S j , получаемые путем последовательного суммирования частот всех предшествующих (j -1) интервалов, и накопленные частости , рассчитываемые по формуле



Таблица 5. Структура предприятий по товарообороту

Группы предприятий по товарообороту, тыс.руб.x

Число предприятий,

Накопленная частота

Накопленная частость, %

в абсолютном выражении

в % к итогу




Вывод. Анализ интервального ряда распределения изучаемой совокупности предприятий показывает, что распределение предприятий по товарообороту не является равномерным: преобладают предприятия с товарооборотом от 543 тыс.руб. до 627 тыс.руб. (это 11 предприятий, доля которых составляет 36,7%); самые малочисленная группа предприятий имеет 711-795 тыс.руб.. Группа включает 3 предприятия, что составляет по 10% от общего числа фирм.

2. Нахождение моды и медианы полученного интервального ряда распределения графическим методом и путем расчетов

Для определения моды графическим методом строим по данным табл. 4 (графы 2 и 3) гистограмму распределения фирм по изучаемому признаку.


Рис. 1.Определение моды графическим методом


Расчет конкретного значения моды для интервального ряда распределения производится по формуле:


где х Мo – нижняя граница модального интервала,

h – величина модального интервала,

f Mo – частота модального интервала,

f Mo-1 – частота интервала, предшествующего модальному,

f Mo+1 – частота интервала, следующего за модальным.

Согласно табл. 4 модальным интервалом построенного ряда является интервал 35 - 40 чел., т.к. он имеет наибольшую частоту (f 4 =10). Расчет моды:


Вывод. Для рассматриваемой совокупности предприятий наиболее распространенный товарооборот характеризуется средней величиной 593,4 тыс. руб.

Для определения медианы графическим методом строим по данным табл. 5 кумуляту распределения предприятий по изучаемому признаку.


Рис. 2. Определение медианы графическим методом

Расчет конкретного значения медианы для интервального ряда распределения производится по формуле



где х Ме – нижняя граница медианного интервала,

h – величина медианного интервала,

– сумма всех частот,

f Ме – частота медианного интервала,

S Mе-1 – кумулятивная (накопленная) частота интервала, предшествующего медианному.

Определяем медианный интервал. Медианным интервалом является интервал 543-627 тыс.руб., т.к. именно в этом интервале накопленная частота S j =20 впервые превышает полусумму всех частот ().

Расчет медианы:


Вывод . В рассматриваемой совокупности предприятий половина из них имеют товарооборот не более 588,3 тыс.руб., а другая половина – не менее 588,3 тыс.руб.

3. Расчет характеристик ряда распределения

Для расчета характеристик ряда распределения, σ , σ 2 , V σ на основе табл. 5 строим вспомогательную таблицу 6 (– середина интервала).

Таблица 6. Расчетная таблица для нахождения характеристик ряда распределения

Группы предприятий по товарообороту, тыс.руб.

Середина интервала,

Число предприятий,

f j





Рассчитаем среднюю арифметическую взвешенную:

Рассчитаем среднее квадратическое отклонение:

Рассчитаем дисперсию:


σ2 = 972 = 9409


Рассчитаем коэффициент вариации:

Вывод . Анализ полученных значений показателей и σ говорит о том, что средняя величина товарооборота составляет 585 тыс.руб., отклонение от этой величины в ту или иную сторону составляет в среднем 97 тыс. руб. (или 16,5%), наиболее характерный товарооборот находится в пределах от 488 до 628 тыс. руб. (диапазон).

Значение V σ = 16,5% не превышает 33%, следовательно, вариация товарооборота в исследуемой совокупности предприятий незначительна и совокупность по данному признаку однородна. Расхождение между значениями, Мо и Ме незначительно (=585 тыс. руб., Мо =593,4 тыс. руб., Ме =588,3 чел.), что подтверждает вывод об однородности совокупности фирм. Таким образом, найденное среднее значение среднесписочной численности менеджеров (585тыс.руб.) является типичной, надежной характеристикой исследуемой совокупности предприятий.

4. Вычисление средней арифметической по исходным данным о среднесписочной численности менеджеров фирм

Для расчета применяется формула средней арифметической простой:



Причина расхождения средних величин, рассчитанных по исходным данным (17550 тыс. руб.) и по интервальному ряду распределения (17670 тыс. руб.), заключается в том, что в первом случае средняя определяется по фактическим значениям исследуемого признака для всех 30-ти фирм, а во втором случае в качестве значений признака берутся середины интервалов и, следовательно, значение средней будет менее точным. Вместе с тем, при округлении обеих рассматриваемых величин их значения совпадают, что говорит о достаточно равномерном распределении товарооборота внутри каждой группы интервального ряда.

Задание 2


По исходным данным (табл. 1) с использованием результатов выполнения Задания 1 необходимо выполнить следующее:

1. Установить наличие и характер корреляционной связи между признаками товарооборот и средние товарные запасы , образовав шесть групп с равными интервалами по каждому из признаков, используя методы:

а) аналитической группировки;

б) корреляционной таблицы.

2. Измерить тесноту корреляционной связи, используя коэффициент детерминации и эмпирическое корреляционное отношение .

Сделать выводы по результатам выполнения задания 2.

Выполнение задания 2

Целью выполнения данного задания является выявление наличия корреляционной связи между факторным и результативным признаками, а также установление направления связи и оценка ее тесноты.

По условию Задания 2 факторным является признак товарооборот , результативным – признак средние товарные запасы .

1. Установление наличия и характера корреляционной связи между признаками товарооборотом и средними товарными запасами методами аналитической группировки и корреляционных таблиц

1а. Применение метода аналитической группировки

Аналитическая группировка строится по факторному признаку Х и для каждой j-ой группы ряда определяется среднегрупповое значение результативного признака Y . Если с ростом значений фактора Х от группы к группе средние значения систематически возрастают (или убывают), между признаками X и Y имеет место корреляционная связь.

Используя разработочную таблицу 3, строим аналитическую группировку, характеризующую зависимость между факторным признаком Х - товарооборот и результативным признаком Y средние товарные запасы . Макет аналитической таблицы имеет следующий вид (табл. 7):


Таблица 7. Зависимость объема продаж от среднесписочной численности менеджеров

Номер группы

Группы предприятий по

товарообороту, тыс. руб.

x

Число предприятий,

f j


ИТОГО


Групповые средние значения получаем из таблицы 3, основываясь на итоговых строках «Всего». Построенную аналитическую группировку представляет табл. 8:


Таблица 8. Зависимость объема продаж от среднесписочной численности менеджеров

Номер группы

Группы предприятий по

товарообороту, тыс. руб.

x

Число предприятий,

f j

Средние товарные запасы, тыс. руб.

в среднем на одно предприятие,

Вывод. Анализ данных табл. 8 показывает, что с увеличением товарооборота от группы к группе систематически возрастает и средний товарный запас по каждой группе предприятий, что свидетельствует о наличии прямой корреляционной связи между исследуемыми признаками.

1б. Применение метода корреляционных таблиц

Корреляционная таблица строится как комбинация двух рядов распределения по факторному признаку Х и результативному признаку Y . На пересечении j -ой строки и k -ой графы таблицы указывается число единиц совокупности, входящих в j -ый интервал по признаку X и в k -ый интервал по признаку Y . Концентрация частот около диагонали построенной таблицы свидетельствует о наличии корреляционной связи между признаками - прямой или обратной. Связь прямая, если частоты располагаются по диагонали, идущей от левого верхнего угла к правому нижнему, обратная - по диагонали от правого верхнего угла к левому нижнему.

Для построения корреляционной таблицы необходимо знать величины и границы интервалов по двум признакам X и Y . Для факторного признака Х Товарооборот эти величины известны из табл. 4 Определяем величину интервала для результативного признака Y средние товарные запасы при k = 5 , у max = 301 тыс. руб., у min = 150 тыс. руб.:


Границы интервалов ряда распределения результативного признака Y имеют вид:

Таблица 9

Номер группы

Нижняя граница, Тыс. руб.

Верхняя граница, Тыс. руб.


Подсчитывая для каждой группы число входящих в нее фирм с использованием принципа полуоткрытого интервала [) , получаем интервальный ряд распределения результативного признака (табл. 10).


Таблица 10. Интервальный ряд распределения фирм по объёму продаж


Используя группировки по факторному и результативному признакам, строим корреляционную таблицу (табл. 11).


Таблица 11. Корреляционная таблица зависимости объема продаж от среднесписочной численности менеджеров

Группы предприятий по товарообороту, тыс. руб.


Группы предприятий по среднему товарному запасу, тыс. руб.















Вывод . Анализ данных табл. 11 показывает, что распределение частот групп произошло вдоль диагонали, идущей из левого верхнего угла в правый нижний угол таблицы. Это свидетельствует о наличии прямой корреляционной связи между среднесписочной численностью менеджеров и объемом продаж фирмами.

2. Измерение тесноты корреляционной связи с использованием коэффициента детерминации и эмпирического корреляционного отношения

Коэффициент детерминации характеризует силу влияния факторного (группировочного) признака Х на результативный признак Y и рассчитывается как доля межгрупповой дисперсии признака Y в его общей дисперсии:

где – общая дисперсия признака Y ,

– межгрупповая (факторная) дисперсия признака Y .

Общая дисперсия характеризует вариацию результативного признака, сложившуюся под влиянием всех действующих на Y факторов (систематических и случайных ) и вычисляется по формуле


где y i – индивидуальные значения результативного признака;

– общая средняя значений результативного признака;

n – число единиц совокупности.

Межгрупповая дисперсия измеряет систематическую вариацию результативного признака, обусловленную влиянием признака-фактора Х (по которому произведена группировка) и вычисляется по формуле



где –групповые средние,

– общая средняя,

–число единиц в j-ой группе,

k – число групп.

Для расчета показателей и необходимо знать величину общей средней , которая вычисляется как средняя арифметическая простая по всем единицам совокупности:

Значения числителя и знаменателя формулы имеются в табл. 8. Используя эти данные, получаем общую среднюю:

228 тыс. руб.


Для расчета общей дисперсии применяется вспомогательная таблица 12.


Таблица 12. Вспомогательная таблица для расчета общей дисперсии

предприятия

Средние товарные запасы, тыс.руб.


Рассчитаем общую дисперсию:



Для расчета межгрупповой дисперсии строится вспомогательная таблица 13, При этом используются групповые средние значения из табл.

Таблица 13ю Вспомогательная таблица для расчета межгрупповой дисперсии

Группы предприятий

по товарообороту,

тыс. руб. x

Число предприятий,

f j

Среднее значение в группе,




Рассчитаем межгрупповую дисперсию:


Определяем коэффициент детерминации:


Вывод. 81% вариации объёма продаж товаров фирмами обусловлено вариацией среднесписочной численности менеджеров по продажам, а 19% – влиянием прочих неучтенных факторов.

Эмпирическое корреляционное отношение оценивает тесноту связи между факторным и результативным признаками и вычисляется по формуле

Рассчитаем показатель:


Вывод : согласно шкале Чэддока связь между товарооборотом и средними товарными запасами предприятий является весьма тесной.

Задание 3


По результатам выполнения Задания 1 с вероятностью 0,954 необходимо определить:

1) ошибку выборки для средней величины товарооборота торгового предприятия, а также границы, в которых будет находиться генеральная средняя.

2) ошибку выборки доли торговых предприятий с объемом товарооборота 627 и более тыс. руб., а также границы, в которых будет находиться генеральная доля фирм.

Выполнение Задания 3

Целью выполнения данного Задания является определение для генеральной совокупности предприятий района границ, в которых будут находиться средняя величина товарооборота, и доля предприятий с товарооборотом не менее 627 тыс. руб.

1. Определение ошибки выборки для величины товарооборота, а также границ, в которых будет находиться генеральная средняя

Применяя выборочный метод наблюдения, необходимо рассчитать ошибки выборки (ошибки репрезентативности), т.к. генеральные и выборочные харак- теристики, как правило, не совпадают, а отклоняются на некоторую величину ε .

Принято вычислять два вида ошибок выборки - среднюю и предельную .

Для расчета средней ошибки выборки применяются различные формулы в зависимости от вида и способа отбора единиц из генеральной совокупности в выборочную.

Для собственно-случайной и механической выборки с бесповторным способом отбора средняя ошибка для выборочной средней определяется по формуле


где – общая дисперсия изучаемого признака,

N

n

Предельная ошибка выборки определяет границы, в пределах которых будет находиться генеральная средняя:



где – выборочная средняя,

– генеральная средняя.

Предельная ошибка выборки кратна средней ошибке с коэффициентом кратности t (называемым также коэффициентом доверия):

Коэффициент кратности t зависит от значения доверительной вероятности Р , гарантирующей вхождение генеральной средней в интервал, называемый доверительным интервалом .

Наиболее часто используемые доверительные вероятности Р и соответствующие им значения t задаются следующим образом (табл. 14):

Таблица 14


По условию Задания 2 выборочная совокупность насчитывает 30 фирм, выборка 20% механическая, следовательно, генеральная совокупность включает 150 фирм . Выборочная средняя, дисперсия определены в Задании 1. Значения параметров, необходимых для решения задачи, представлены в табл. 15:


Таблица 15



Рассчитаем среднюю ошибку выборки:


Рассчитаем предельную ошибку выборки:



Определим доверительный интервал для генеральной средней:



Вывод. На основании проведенного выборочного обследования с вероятностью 0,954 можно утверждать, что для генеральной совокупности предприятий средняя величина товарооборота находится в пределах от 553 до 616 тыс. руб.

2. Определение ошибки выборки для доли фирм товарооборотом 627 тыс. руб. и более, а также границ, в которых будет находиться генеральная доля

Доля единиц выборочной совокупности, обладающих тем или иным заданным свойством, выражается формулой



где m – число единиц совокупности, обладающих заданным свойством;

n – общее число единиц в совокупности.

Для собственно-случайной и механической выборки с бесповторным способом отбора предельная ошибка выборки доли единиц, обладающих заданным свойством, рассчитывается по формуле



где w – доля единиц совокупности, обладающих заданным свойством;

(1- w ) – доля единиц совокупности, не обладающих заданным свойством,

N – число единиц в генеральной совокупности,

n – число единиц в выборочной совокупности.

Предельная ошибка выборки определяет границы, в пределах которых будет находиться генеральная доля р единиц, обладающих исследуемым признаком:


По условию Задания 3 исследуемым свойством фирм является равенство или превышение товарооборота величины 627 тыс. руб .

Число предприятий с данным свойством определяется из табл. 3: m=7

Рассчитаем выборочную долю:

Рассчитаем предельную ошибку выборки для доли:

Определим доверительный интервал генеральной доли:


Вывод. С вероятностью 0,954 можно утверждать, что в генеральной совокупности предприятий района доля предприятий с товарооборотом 627 тыс. руб. и более будет находиться в пределах от 18% до 48,5%.

Задание 4


Имеются данные о продаже товара А на трех городских рынках:


Таблица 16

Базисный период

Отчетный период

Продано, т

Изменение цены, %

Индекс физического объема(q 1)

Без изменений


Определите:

2. Абсолютное изменение средней цены товара в результате влияния отдельных факторов.


Таблица 17



Базисный период

Отчетный период

Расчетные графы

Средняя цена за 1 кг., руб. (р 0)

Продано, т

Изменение цены, %

Индекс физического объема (q 1)









Вычислим индекс цен переменного состава:


Из таблицы видно, что цена продукции на каждом рынке в отчетном периоде по сравнению с базисным изменилась. В целом же средняя цена выросла на 4 % .Это объясняется влиянием изменений структуры реализации продукции по торговым городским рынкам. В базисном периоде по более низкой цене продавали продукцию меньше, чем в отчетном периоде по более высокой цене.

Рассчитываем индекс структурных сдвигов:



Первая часть приведенной формулы позволяет ответить на вопрос, какой была бы средняя цена в отчетном периоде. Вторая часть формулы отражает фактическую среднюю цену базисного периода.

Рассчитанный индекс показал, что за счет структурных сдвигов цены значительно не изменились.

Определим индекс фиксированного или постоянного состава, который не учитывает изменения структуры продаж:



Индекс цен фиксированного состава равен 104,1%, что позволяет сделать следующий вывод: если бы структура продаж продукции на городских рынках не изменилась, средняя цена возросла бы на 4,1%., что и произойдет в дальнейшем.

Между данными индексами существует следующая взаимосвязь:


Ip фс * I cc т = Ip пс;

1,041 * 0,99 =1,040


Определим абсолютное изменение средней цены товара в результате влияния отдельных факторов:


D pq = åp 1 q 1 - å p 0 q 0

D pq = 141407,9 – 134400 =7008 руб.

Заключение


Статистические ряды распределения являются базисным методом для любого статистического анализа.

Статистический ряд распределения представляет собой упорядоченное распределение единиц изучаемой совокупности на группы по определенному варьирующему признаку, характеризует структуру изучаемого явления. Анализируя рассчитанные показатели статистического ряда распределения, можно делать выводы об однородности или неоднородности совокупности, закономерности распределения и границах варьирования единиц совокупности. Изучив основные приемы исследования и практики применения рядов распределения, а также методику вычисления наиболее важных статистических величин, необходимо отметить, что конечная цель изучения статистики в целом - анализ изучаемого явления - крайне важен для всех сфер человеческой жизни. Анализ отображает явления в целом и вместе с этим учитывает влияние каждого фактора в отдельности. На основании проведенного анализа можно учитывать и прогнозировать факторы, негативно влияющие на развитие событий.

Социально-экономическая статистика обеспечивает предоставление важной цифровой информации об уровне и возможностях развития страны: ее экономическом положении, уровне жизни населения, его составе и численности, рентабельности предприятий, динамике безработице и т.д. Статистическая информация является одним из решающих ориентиров государственной экономической политики.

Статистические методы используют комплексно. Выделяют три основные стадии экономико-статистического исследования: сбор первичной статистической информации, статистическая сводка и обработка первичной информации, обобщение и интепретация статистической информации.

Качество, достоверность статистической информации определяют эффективность использования статистики на любом уровне и в любой сфере.

Литература

1. Статистика: Учеб. пособие/А.В. Багат, М.М. Конкина, В.М. Симчера и др.; Под ред. В.М. Симчеры.- М.: Финансы и статистика, 2005.

2. Громыко Г.Л. Теория статистики: Учебник. - М.: ИНФРА-М, 2006.

3. Практикум по статистике: Учеб. пособие для вузов/ Под ред. В.М. Симчеры. - М.: Финстатинформ, 1999.

4. Гусаров В.М. Статистика: Учеб. пособие для вузов. - М.: ЮНИТИ - ДАНА, 2001.

5. Гусаров В.М. Статистика: Учеб пособие/ В.М. Гусаров, Е.И. Кузнецова. – 2-е изд., перераб. и доп. – М.: ЮНИТИ-ДАНА, 2007.

6. Общая теория статистики: Статистическая методология в изучении коммерческой деятельности: Учебник / Под. ред. Башиной О.Э., Спирина А.А. – М.: Финансы и статисика, 2005.

7. Практикум по теории статистики: Учебное пособие/Под. ред. Шмойловой Р.А. – М.: Финансы и статистика, 2004.

8. Теория статистики: Учебник/Под. ред. Шмойловой Р.А. – М.: Финансы и статистика, 2001; 2003; 2006.

9. http://www.gks.ru


Репетиторство

Нужна помощь по изучению какой-либы темы?

Наши специалисты проконсультируют или окажут репетиторские услуги по интересующей вас тематике.
Отправь заявку с указанием темы прямо сейчас, чтобы узнать о возможности получения консультации.

Важнейшим этапом исследования социально-экономических явлений и процессов является систематизация первичных данных и получение на этой основе сводной характеристики всего объекта при помощи обобщающих показателей, что достигается путем сводки и группировки первичного статистического материала.

Статистическая сводка - это комплекс последовательных операций по обобщению конкретных единичных фактов, образующих совокупность, для выявления типичных черт и закономерностей, присущих изучаемому явлению в целом. Проведение статистической сводки включает следующие этапы :

  • выбор группировочного признака;
  • определение порядка формирования групп;
  • разработка системы статистических показателей для характеристики групп и объекта в целом;
  • разработка макетов статистических таблиц для представления результатов сводки.

Статистической группировкой называется расчленение единиц изучаемой совокупности на однородные группы по определенным существенным для них признакам. Группировки являются важнейшим статистическим методом обобщения статистических данных, основой для правильного исчисления статистических показателей.

Различают следующие виды группировок: типологические, структурные, аналитические. Все эти группировки объединяет то, что единицы объекта разделены на группы по какому-либо признаку.

Группировочным признаком называется признак, по которому проводится разбиение единиц совокупности на отдельные группы. От правильного выбора группировочного признака зависят выводы статистического исследования. В качестве основания группировки необходимо использовать существенные, теоретически обоснованные признаки (количественные или качественные).

Количественные признаки группировки имеют числовое выражение (объем торгов, возраст человека, доход семьи и т. д.), а качественные признаки группировки отражают состояние единицы совокупности (пол, семейное положение, отраслевая принадлежность предприятия, его форма собственности и т. д.).

После того, как определено основание группировки следует решить вопрос о количестве групп, на которые надо разбить исследуемую совокупность. Число групп зависит от задач исследования и вида показателя, положенного в основание группировки, объема совокупности, степени вариации признака.

Например, группировка предприятий по формам собственности учитывает муниципальную, федеральную и собственность субъектов федерации. Если группировка производится по количественному признаку, то тогда необходимо обратить особое внимание на число единиц исследуемого объекта и степень колеблемости группировочного признака.

Когда определено число групп, то следует определить интервалы группировки. Интервал - это значения варьирующего признака, лежащие в определенных границах. Каждый интервал имеет свою величину, верхнюю и нижнюю границы или хотя бы одну из них.

Нижней границей интервала называется наименьшее значение признака в интервале, а верхней границей - наибольшее значение признака в интервале. Величина интервала представляет собой разность между верхней и нижней границами.

Интервалы группировки в зависимости от их величины бывают: равные и неравные. Если вариация признака проявляется в сравнительно узких границах и распределение носит равномерный характер, то строят группировку с равными интервалами. Величина равного интервала определяется по следующей формуле :

где Хmax, Хmin - максимальное и минимальное значения признака в совокупности; n - число групп.

Простейшая группировка, в которой каждая выделенная группа характеризуется одним показателем представляет собой ряд распределения.

Статистический ряд распределения - это упорядоченное распределение единиц совокупности на группы по определенному признаку. В зависимости от признака, положенного в основу образования ряда распределения, различают атрибутивные и вариационные ряды распределения.

Атрибутивными называют ряды распределения, построенные по качественным признакам, то есть признакам, не имеющим числового выражения (распределение по видам труда, по полу, по профессии и т.д.). Атрибутивные ряды распределения характеризуют состав совокупности по тем или иным существенным признакам. Взятые за несколько периодов, эти данные позволяют исследовать изменение структуры.

Вариационными рядами называют ряды распределения, построенные по количественному признаку. Любой вариационный ряд состоит из двух элементов: вариантов и частот. Вариантами называются отдельные значения признака, которые он принимает в вариационном ряду, то есть конкретное значение варьирующего признака.

Частотами называются численности отдельных вариант или каждой группы вариационного ряда, то есть это числа, которые показывают, как часто встречаются те или иные варианты в ряду распределения. Сумма всех частот определяет численность всей совокупности, ее объем. Частостями называются частоты, выраженные в долях единицы или в процентах к итогу. Соответственно сумма частостей равна 1 или 100%.

В зависимости от характера вариации признака различают три формы вариационного ряда: ранжированный ряд, дискретный ряд и интервальный ряд.

Ранжированный вариационный ряд - это распределение отдельных единиц совокупности в порядке возрастания или убывания исследуемого признака. Ранжирование позволяет легко разделить количественные данные по группам, сразу обнаружить наименьшее и наибольшее значения признака, выделить значения, которые чаще всего повторяются.

Дискретный вариационный ряд характеризует распределение единиц совокупности по дискретному признаку, принимающему только целые значения. Например, тарифный разряд, количество детей в семье, число работников на предприятии и др.

Если признак имеет непрерывное изменение, которые в определенных границах могут принимать любые значения («от - до»), то для этого признака нужно строить интервальный вариационный ряд . Например, размер дохода, стаж работы, стоимость основных фондов предприятия и др.

Примеры решения задач по теме «Статистическая сводка и группировка»

Задача 1 . Имеется информация о количестве книг, полученных студентами по абонементу за прошедший учебный год.

Построить ранжированный и дискретный вариационные ряды распределения, обозначив элементы ряда.

Решение

Данная совокупность представляет собой множество вариантов количества получаемых студентами книг. Подсчитаем число таких вариантов и упорядочим в виде вариационного ранжированного и вариационного дискретного рядов распределения.

Задача 2 . Имеются данные о стоимости основных фондов у 50 предприятий, тыс. руб.

Построить ряд распределения, выделив 5 групп предприятий (с равными интервалами).

Решение

Для решения выберем наибольшее и наименьшее значения стоимости основных фондов предприятий. Это 30,0 и 10,2 тыс. руб.

Найдем размер интервала: h = (30,0-10,2):5= 3,96 тыс. руб.

Тогда в первую группу будут входить предприятия, размер основных фондов которых составляет от 10,2 тыс. руб. до 10,2+3,96=14,16 тыс. руб. Таких предприятий будет 9. Во вторую группу войдут предприятия, размер основных фондов которых составит от 14,16 тыс. руб. до 14,16+3,96=18,12 тыс. руб. Таких предприятий будет 16. Аналогично найдем число предприятий, входящих в третью, четвертую и пятую группы.

Полученный ряд распределения поместим в таблицу.

Задача 3 . По ряду предприятий легкой промышленности получены следующие данные:

Произведите группировку предприятий по числу рабочих, образуя 6 групп с равными интервалами. Подсчитайте по каждой группе:

1. число предприятий
2. число рабочих
3. объем произведенной продукции за год
4. среднюю фактическую выработку одного рабочего
5. объем основных средств
6. средний размер основных средств одного предприятия
7. среднюю величину произведенной продукции одним предприятием

Результаты расчета оформите в таблицы. Сделайте выводы.

Решение

Для решения выберем наибольшее и наименьшее значения среднесписочного числа рабочих на предприятии. Это 43 и 256.

Найдем размер интервала: h = (256-43):6 = 35,5

Тогда в первую группу будут входить предприятия, среднесписочное число рабочих на которых составляет от 43 до 43+35,5=78,5 человек. Таких предприятий будет 5. Во вторую группу войдут предприятия, среднесписочное число рабочих на которых составит от 78,5 до 78,5+35,5=114 человек. Таких предприятий будет 12. Аналогично найдем число предприятий, входящих в третью, четвертую, пятую и шестую группы.

Полученный ряд распределения поместим в таблицу и вычислим необходимые показатели по каждой группе:

Вывод : Как видно из таблицы, вторая группа предприятий является самой многочисленной. В нее входят 12 предприятий. Самыми малочисленными являются пятая и шестая группы (по два предприятия). Это самые крупные предприятия (по числу рабочих).

Поскольку вторая группа самая многочисленная, объем произведенной продукции за год предприятиями этой группы и объем основных средств значительно выше других. Вместе с тем средняя фактическая выработка одного рабочего на предприятиях этой группы наибольшей не является. Здесь лидируют предприятия четвертой группы. На эту группу приходится и довольно большой объем основных средств.

В заключении отметим, что средний размер основных средств и средняя величина произведенной продукции одного предприятия прямо пропорциональны размерам предприятия (по числу рабочих).

В результате обработки и систематизации первичных данных статистического наблюдения получают группировки, называемые рядами распределения.

Статистические ряды распределения представляют собой упорядоченное расположение единиц изучаемой совокупности на группы по группировочному признаку.

Различают атрибутивные и вариационные ряды распределения.

Атрибутивный – это ряд распределения, построенный по качественным признакам. Он характеризует состав совокупности по различным существенным признакам.

По количественному признаку строится вариационный ряд распределения. Он состоит из частоты (численности) отдельных вариантов или каждой группы вариационного ряда. Данные числа показывают, насколько часто встречаются различные варианты (значения признака) в ряду распределения. Сумма всех частот определяет численность всей совокупности.

Численности групп выражаются в абсолютных и относительных величинах. В абсолютных величинах выражается числом единиц совокупности в каждой выделенной группе, а в относительных величинах – в виде долей, удельных весов, представленных в процентах к итогу.

В зависимости от характера вариации признака различают дискретные и интервальные вариационные ряды распределения. В дискретном вариационном ряде распределения группы составлены по признаку, изменяющемуся дискретно и принимающему только целые значения.

В интервальном вариационном ряде распределения группиро–вочный признак, составляющий основание группировки, может принимать в определенном интервале любые значения.

Вариационные ряды состоят из двух элементов: частоты и варианты.

Вариантой называют отдельное значение варьируемого признака, которое он принимает в ряду распределения.

Частота – это численность отдельных вариант или каждой группы вариационного ряда. Если частоты выражены в долях единицы или в процентах к итогу, то их называют частостями.

Правила и принципы построения интервальных рядов распределения строятся по аналогичным правилам и принципам построения статистических группировок. Если интервальный вариационный ряд распределения построен с равными интервалами, частоты позволяют судить о степени заполнения интервала единицами совокупности. Для проведения сравнительного анализа заполненности интервалов определяют показатель, который будет характеризовать плотность распределения.

Плотность распределения – это отношение числа единиц совокупности к ширине интервала.

2. Графическое изображение рядов распределения

Анализ рядов распределения можно проводить на основе их графического изображения. Линейчатые и круговые диаграммы строятся для отображения структуры совокупности.

Применяются вместе с диаграммами и такие линии, как полигон, кумулята, огива, гистограмма. При изображении дискретных вариационных рядов используется полигон.

Полигон – ломаная кривая, строится на основе прямоугольной системы координат, когда по оси Х откладываются значения признака, а по оси У – частоты.

Гладкая кривая, соединяющая точки – это эмпирическая плотность распределения.

Кумулята – ломаная кривая, строящаяся на основе прямоугольной системы координат, когда по оси Х откладываются значения признака, а по оси У – накопленные частоты.

Для дискретных рядов на оси откладываются сами значения признака, а для интервальных – середины интервалов.

На основе гистограмм можно строить диаграммы накопленных частот с последующим построением интегральной эмпирической функции распределения.

3. Статистические таблицы

В виде статистических таблиц оформляются результаты сводки и группировки материалов наблюдения.

Статистическая таблица – это особый способ краткой и наглядной записи сведений об изучаемых общественных явлениях. Статистическая таблица позволяет охватить материалы статистической сводки в целом, она также является системой мыслей об исследуемом объекте, излагаемых цифрами на основе определенного порядка в расположении систематизированной информации.

По внешнему виду статистическая таблица представляет собой ряд пересекающихся горизонтальных и вертикальных линий, образующих по горизонтали строки, а по вертикали – графы (столбцы, колонки), которые в совокупности составляют как бы скелет таблицы.

В образовавшиеся внутри таблицы клетки записывается информация. Составленную таблицу принято называть макетом таблицы, в котором мысленно определяются в деталях цель обследования, объем разработки материалов сводки.

Статистическая таблица имеет свое подлежащее и сказуемое. Подлежащее таблицы показывает, о каком явлении идет речь в таблице, и представляет собой группы и подгруппы, которые характеризуются рядом показателей. Сказуемым таблицы называются числовые показатели, с помощью которых характеризуется объект, т. е. подлежащее таблицы.

Показатели, образующие подлежащее, располагают в левой части таблицы, а показатели, составляющие сказуемое, помещают справа.

Составленная и оформленная статистическая таблица должна иметь общий, боковые и верхние заголовки. Общий заголовок обычно располагается над таблицей и выражает ее основное содержание. Помещенные слева боковые заголовки раскрывают содержание строк подлежащего, а верхние – вертикальных граф (сказуемого таблицы),

В коммерческой деятельности разрабатываются и составляются различные статистические таблицы, которые в зависимости от построения подлежащего делятся на три вида: перечневые, групповые и комбинационные.

Простые таблицы не содержат в подлежащем систематизации изучаемых единиц статистической совокупности.

По характеру представляемого материала эти таблицы бывают собственно перечневые, территориальные и хронологические.

Простая таблица в подлежащем содержит перечисление единиц изучаемой совокупности.

Сведения простой таблицы применяют и для оценки изменения какого–либо явления во времени. Хронологическую таблицу можно составлять за любые по величине отрезки времени или на моменты, отстоящие друг от друга по времени на различную длину Таблицы, в подлежащем которых приводится перечень территорий (районов, областей и т. п.), называются перечневыми территориальными.

Групповые статистические таблицы дают более информативный материал для анализа изучаемых явлений благодаря образованным в их подлежащем группам по существенному признаку или выявлению связи между рядом показателей.

Комбинационными называют статистические таблицы, которые имеют в подлежащем группировку по двум или более группи–ровочным признакам, связанным между собой.

С помощью групповых и комбинационных таблиц можно изучать состав явлений, а также связь и зависимость числовых показателей сказуемого от группировочных признаков подлежащего.

Комбинационная таблица устанавливает взаимное действие на результативные признаки (показатели) и существующую связь между факторами группировки.

Одними из ответственных моментов построения статистических таблиц являются разработка сказуемого, определение его содержания, правильное установление связи между группировоч–ными признаками и показателями, их характеризующими.

Сказуемое, находясь во взаимосвязи с подлежащим таблицы должно быть построено так, чтобы с помощью системы его показателей можно было получить полную характеристику выделенных групп, охватить их существенные черты.

Сказуемое статистических таблиц бывает простым и сложным. При простой разработке показатели сказуемого располагаются последовательно один за другим. Распределяя показатели на группы по одному или нескольким признакам в определенном сочетании, получают сложное сказуемое.

4. Основные правила составления таблиц

Таблица должна быть составлена компактно, т. е. быть небольшой по размеру и легко обозримой.

Общий заголовок таблицы должен кратко выражать ее основное содержание. В нем стараются указать время, территорию, к которым относятся данные, единицы измерения, если они выступают едиными для всей совокупности.

Строки подлежащего и графы сказуемого располагают в виде частных слагаемых с последующим подытоживанием по каждому из них.

Для удобства анализа таблицы при большом числе строк подлежащего и граф сказуемого возникает потребность в нумерации тех из них, которые заполняются данными.

При заполнении таблиц нужно использовать следующие условные обозначения: при отсутствии явления пишется (-) прочерк, если нет информации о явлении, ставится многоточие (…) или пишется: «нет сведений».

Одинаковая степень точности, обязательная для всех чисел, обеспечивается соблюдением правил их округления (от 0,1 до 0,01 и т. д.). Когда одна величина превосходит другую многократно, полученные показатели динамики лучше выражать не в процентах (%), а в разах.

Если в таблице с отчетными данными приводятся сведения расчетного порядка, то нужно сделать соответствующую оговорку.

Графы и строки должны содержать единицы измерения, соответствующие поставленным в подлежащем и сказуемом показателям. При этом используются общепринятые сокращения единиц измерения, например: чел., руб. и т. д. Если графы имеют единую единицу измерения, то она выносится в заголовок таблицы.

Для удобной работы с цифровым материалом числа в таблицах следует расставлять в середине граф, одно под другим: единицы под единицами, запятая под запятой и т. д., четко соблюдая при этом их разрядность.

В таблицу можно включать примечания, в которых будут указываться источники данных, более подробное содержание показателей и другие необходимые пояснения.

В наше время необходимо научиться составлять и пользоваться статистическими таблицами.

Для того чтобы проанализировать данные, которые содержит таблица, необходимо прежде ознакомиться с названием таблицы заголовками ее граф и строк, установить, на какую дату и к какой территории относятся зафиксированные в таблице статистические данные, обратить внимание на единицы измерения и установить, какие процессы характеризуются средними и относительными величинами.

Анализ статистической таблицы логичнее начинать с общего итога, который позволяет получить общую характеристику совокупности, затем переходить к изучению данных отдельных строк и граф, т. е. к оценке частей изучаемого объекта, исследуя при этом вначале наиболее важные, а потом уже и все остальные элементы таблицы.

Наиболее простым способом обобщения статистического материала является построение рядов. Результатом сводки статистического исследования могут быть ряды распределения.

После определения группировочного признака, количества групп и интервалов группировки данные сводки и группировки представляются в виде рядов распределения и оформляются в виде статистических таблиц.

Ряд распределния является одним из видов группировок.

Рядом распределения в статистике называется упорядоченное распределение единиц совокупности на группы по какому-либо одному признаку: по качественному или количественному.

  1. Виды рядов распределения

В зависимости от признака, положенного в основу образования ряда распределения различают атрибутивные и вариационные ряды распределения:

    атрибутивными называют ряды распределения, построенные по качественными признакам;

    вариационными называют ряды распределения, построенные в порядке возрастания или убывания значений количественного признака.

Вариационный ряд распределения состоит из двух столбцов. В первом столбце приводятся количественные значения варьирующегося признака, которые называются вариантами и обозначаются. Дискретная варианта - выражается целым числом. Интервальная варианта находится в пределах от и до. В зависимости от типа варианты можно построить дискретный или интервальный вариационный ряд. Во втором столбце содержится количество конкретных вариант, выраженное через частоты или частости:

    частоты - это абсолютные числа, показывающие столько раз в совокупности встречается данное значение признака; сумма всех частот должна быть равна численности единиц всей совокупности;

    частости - это частоты выраженные в процентах к итогу; сумма всех частостей выраженных в процентах должна быть равна 100% в долях единице.

Вариационный ряд характеризуется двумя элементами: вариантой (Х) и частотой (f). Варианта – это отдельное значение признака отдельной единицы или группы совокупности. Число, показывающее, сколько раз встречается то или иное значение признака, называется частотой. Если частота выражена относительным числом, то она называется частостью.

Вариационный ряд может быть:

    интервальным, когда определены границы «от» и «до», интервальные ряды распределения можно представить графически в виде гистограммы;

    дискретным, когда изучаемый признак характеризуется определенным числом.

  1. Графическое изображение рядов распределения

Наглядно ряды распределения представляются при помощи графических изображений.

Ряды распределения изображаются в виде:

    полигона;

    гистограммы;

    кумуляты;

При построении полигона на горизонтальной оси (ось абсцисс) откладывают значения варьирующего признака, а на вертикальной оси (ось ординат) - частоты или частости.

Для построения гистограммы по оси абсцисс указывают значения границ интервалов и на их основании строят прямоугольники, высота которых пропорциональна частотам (или частостям).

Распределение признака в вариационном ряду по накопленным частотам (частостям) изображается с помощью кумуляты.

Кумулята или кумулятивная кривая в отличие от полигона строится по накопленным частотам или частостям. При этом на оси абсцисс помещают значения признака, а на оси ординат - накопленные частоты или частости.

Огива строится аналогично кумуляте с той лишь разницей, что накопленные частоты помещают на оси абсцисс, а значения признака - на оси ординат.

Разновидностью кумуляты является кривая концентрации или график Лоренца. Для построения кривой концентрации на обе оси прямоугольной системы координат наносится масштабная шкала в процентах от 0 до 100. При этом на оси абсцисс указывают накопленные частости, а на оси ординат - накопленные значения доли (в процентах) по объему признака.

Понятие о статистических рядах. В результате обработки и систематизации первичных статистических материалов получают ряды цифровых показателей, которые характеризуют отдельные стороны изучаемых явлений либо их изменение во времени. Эти ряды называются статистическими.

  • 1) ряды динамики, с помощью которых можно дать характеристику изменений размеров общественных явлений во времени;
  • 2) ряды распределения, характеризующие, как распределяются единицы совокупности по тому или иному признаку.

Рядом распределения называется упорядоченное распределение единиц совокупности по какому-либо варьирующему признаку. В большинстве случаев построение рядов распределения не имеет самостоятельного значения, а является составной частью операции обработки данных на основе их группировки.

Построение рядов распределения вытекает из принципов статистической группировки. В большинстве случаев ряд распределения - это простейшая группировка по одному признаку, в которой отдельные значения признака или выделенные группы характеризуются одним показателем: числом единиц или удельным весом каждой группы в общем объеме совокупности.

В ряду распределения выделяют два структурных элемента:

  • 1) варианты - различные значения группировочного признака. Их принято обозначать буквой X. Варианты могут характеризоваться словами (например, городское и сельское население) или цифрами (например, группировка рабочих по квалификации: 1, 2, 3, 4, 5, 6 разряды);
  • 2) число единиц в группах или их удельный вес в совокупности. Числа, показывающие, как часто встречается та или иная варианта в ряду распределения, называются частотами. Обозначаются латинской буквой /. Частоты являются всегда положительными числами, так как, показывая, сколько раз встречается варианта, они по своей природе не могут быть менее нуля. Частоты выражаются как в абсолютных величинах - числом единиц совокупности, так и в относительных величинах - в виде долей или в процентах к итогу.

Частоты, выраженные в виде относительных величин, называются частостями и обозначаются буквой d. Сумма частостей всегда равна 1, если они выражены в долях единицы, или 100%, если они выражены в процентах. Как правило, для расчета обобщающих характеристик используют как частоты, так и частости.

Частоты и частости могут быть кумулятивными (накопленными), когда они представлены в виде последовательно накопленных сумм.

Сумма частот ряда распределения называется объемом совокупности и обозначается латинской буквой п.

Пример распределения рабочих по заработной плате представлен в табл. 2.20.

Таблица 2.20

Распределение работников по заработной плате

Особый вид ряда распределения - ранжированный ряд, когда вместо частот или частостей поставлены ранги. Ранг - это число, показывающее порядковый номер варианты признака по возрастанию или убыванию.

Виды рядов распределения. Ряды распределения различаются по виду и характеру вариации признака (рис. 2.4).

  • 1. По виду признака ряды распределения могут быть атрибутивными и вариационными. Атрибутивные ряды - это ряды, в которых признак выражен определенным термином, фиксирующим свойство или качество предмета или явления. Вариационные ряды - это ряды, в которых варианты признака выражены цифрами.
  • 2. В зависимости от характера вариации различают дискретные и интервальные вариационные ряды.

Дискретные вариационные ряды - это ряды, в которых признак выражается в виде определенного числа, взятого с заданной степенью точности. Интервальные вариационные ряды - это ряды, в которых

варианты заданы в виде интервалов. Интервальные вариационные ряды объединяют варианты непрерывных признаков или имеющихся в широких пределах дискретных признаков.

Графически вариационный ряд можно изобразить, как и любой ряд значений аргумента и функции, используя прямоугольную систему координат. Наглядное представление о характере изменения частот вариационного ряда дают полигон и гистограмма распределения.

Графическое изображение дискретного вариационного ряда строится в виде полигона распределения, представляющего собой распределение по признаку X. Для его построения по оси абсцисс в одинаковом масштабе откладываются ранжированные значения варьирующего признака, а по оси ординат - величины частот (или частостей) (рис. 2.5). Иногда для замыкания полигона крайние точки соединяют с точками на оси абсцисс и получают многоугольник.

Графическое изображение интервального вариационного ряда строится в виде гистограммы распределения. При ее построении для вариационного ряда с равными интервалами на оси абсцисс откладываются границы интервалов и, используя отрезки, представляющие интервалы, как основания, строят на них прямоугольники с высотой, равной частоте данного интервала. В результате получается распределение, изображенное в виде смежных друг с другом столбиков. Гистограмма распределения рабочих по размеру месячной заработной платы представлена на рис. 2.6.


Рис. 2.5.


Рис. 2.6. Гистограмма распределения для вариационного ряда с равными

интервалами

Для интервальных рядов с неравными интервалами строят гистограмму плотностей распределения, так как в ряде с неравными интервалами именно плотность распределения дает представление о заполненности каждого интервала. Плотность распределения определяется по формуле

Площадь прямоугольников гистограммы равна произведению плотности на величину интервала, т.е. частоте. Следовательно, площадь всей гистограммы численно равна сумме частот или численности единиц совокупности.

Рассмотрим распределение населения района города по возрасту (табл. 2.21) и изобразим его графически.

Таблица 2.21

Распределение населения района по возрасту

График распределения населения района по возрасту представлен на рис. 2.7.

Рис. 2.7.

Любой вариационный ряд можно представить графически в виде кривой накопленных частот как функции признака. На оси абсцисс откладывают варианты или границы интервалов, а на оси ординат - соответствующие накопленные частоты. Полученные точки соединяют непрерывной линией, которая и является кумулятой. Изображение вариационного ряда в виде кумуляты более эффективно, если частоты выражены в частостях. График кумулятивной кривой представлен на рис. 2.8.

Если при графическом изображении вариационного ряда в виде кумуляты оси поменять местами, то получится огива. Термин «огива» для графика кумулятивной кривой ряда распределения в 1875 г. ввел


Рис. 2.8.

Ф. Гальтон. Он положил начало применению графического метода для определения обобщающих статистических характеристик распределения, так как на основе огивы находил медиану и квартили.

Преобразование вариационных рядов. Вариационные ряды можно преобразовывать: дискретный ряд в интервальный и интервальный ряд в дискретный.

Преобразование дискретного ряда в интервальный. Представим дискретный ряд распределения рабочих по заработной плате в виде интервального. Для этого необходимо по формуле 2.1 рассчитать величину интервала: h = (9000 - 4000) : 3 = 1667 руб. (2000 руб.).

Получаем:


Преобразование интервального ряда в дискретный. Для преобразования интервального ряда с закрытыми интервалами в дискретный достаточно заменить интервал его серединой.

Получаем:

Ряды распределения имеют следующее значение:

  • 1) вариационные ряды служат средством свертывания или сжатия многообразной массовой информации в компактную форму, по ним можно составить достаточно определенное суждение о характере вариации, изучить конкретные различия признаков явлений, входящих в исследуемую совокупность;
  • 2) на основе рядов распределения исчисляются особые обобщающие характеристики совокупности (средняя, мода, медиана, дисперсия и т.д.), которые используются для более глубокого анализа социально-экономических явлений и процессов.