РефератБар.ру: | Главная | Карта сайта | Справка
Статистическая обработка и статистический анализ данных. Реферат.

Разделы: Статистика | Заказать реферат, диплом

Полнотекстовый поиск:




     Страница: 1 из 2
     <-- предыдущая следующая -->

Перейти на страницу:
скачать реферат | 1 2 





Министерство образования Российской Федерации


Южно-Уральский государственный университет

Кафедра Экономики и финансов

Статистическая обработка и статистический анализ данных
по материалам реального статистического наблюдения

Пояснительная записка к курсовому проекту
по курсу статистики

Руководитель
Лазарева Галина Владимировна
« » 200- г.

Автор проекта
« » 200- г.

Проект защищен с оценкойо
. .
« » 200- г.


Челябинск
200-
Содержание

Введение…………………………………………………………………………………….3

1. Сводка и группировка данных статистического наблюдения……………...…………...4
2. Вариационный анализ……………………………………………………………………...8
3. Моделирование ряда распределения………………………………………………….….10
4. Корреляционный анализ…………………………………………………………………..11
5. Выборочное наблюдение…………………………………………………………………..14
6. Анализ динамики…………………………………………………………………………..16

Заключение……………………………………………………………………………………18
Литература……………………………………………………………………………….……19
Приложения…………………………………………………………………………………………20

Введение

В данной работе представлена статистическая обработка и статистический анализ данных по материалам реального статистического наблюдения над численностью населения в возрасте моложе трудоспособного на 1.01.2002, чел.

Актуальность проводимого исследования ярко проявляется в свете современной социально-экономической и демографической ситуации в нашей стране, когда вот уже на протяжении нескольких последних лет наблюдается отрицательный естественный прирост (естественная убыль) населения. Проблема снижения рождаемости и старения населения является характерной не только для России, но и для многих других развитых стран запада.

Владение методами статистики дает возможность превращать безликую и разрозненную массу числовых данных в стройную систему знаний, основываясь на которых можно принимать эффективные управленческие решения.

Цель курсового проекта – освоить инструменты статистики для дальнейшего применения в решении управленческих задач.

Можно выделить следующие задачи данного курсового проекта:
- приобрести навыки работы с большими массивами данных и навыки представления данных статистического наблюдения в виде, удобном для восприятия, анализа и принятия решений;
- освоить методы выполнения оценок параметров больших множеств по данным выборочного наблюдения;
- развить аналитические навыки в ходе применения вариационного и корреляционного методов и интерпретации полученных результатов.

Таким образом, проводимый статистический анализ позволит сделать выводы о характеристиках исследуемого показателях и тенденциях его развития.

1. Сводка и группировка данных статистического наблюдения

Результаты статистического наблюдения регионов РФ по показателю "Численность населения в возрасте моложе трудоспособного на 1.01.2002 г., чел." представим в
виде простой сводки , т.е. в единый документ без какого-либо ранжирования или разделения на группы. (Таблица 1.1)

Таблица 1.1- Численность населения в возрасте моложе трудоспособного на 1.01.2002 г., чел.



Регион

Численность населения в возрасте моложе трудоспособного на 1.01.2002 г., чел.

Белгородская область

272081

Брянская область

258812

Владимирская область

260718

Воронежская область

408451

Ивановская область

190699

Калужская область

177752

Костромская область

135393

Курская область

224612

Липецкая область

212032

Московская область

990986

Орловская область

152332

Рязанская область

204469

Смоленская область

184672

Тамбовская область

212447

Тверская область

256525

Тульская область

261924

Ярославская область

221876

г. Москва

1348893


Республика Карелия

137425

Республика Коми

214022

Архангельская область

265673

Вологодская область

239365

Калининградская область

165465

Ленинградская область

268037

Мурманская область

164789

Новгородская область

121690

Псковская область

131185

г. Санкт-Петербург

681209

Республика Адыгея

86616


Республика Дагестан

685577

Республика Ингушетия

138822

Кабардино-Балкарская Республика

193530

Республика Калмыкия

77289


Карачаево-Черкесская Республика

97987

Республика Северная Осетия-Алания

142074

Чеченская Республика

199841

Краснодарский край

947077

Ставропольский край

524337

Астраханская область

203780

Волгоградская область

475016

Ростовская область

760726

Республика Башкортостан

888812

Республика Марий Эл

152830

Республика Мордовия

164596

Республика Татарстан

769340

Удмуртская Республика

326297

Чувашская Республика

275529

Кировская область

272759

Нижегородская область

600910

Оренбургская область

450187

Пензенская область

257616

Пермская область

563021

Самарская область

564441

Саратовская область

478167

Ульяновская область

265331

Курганская область

209522

Свердловская область

808090

Тюменская область

693732

Челябинская область

674104

Республика Алтай

53706

Республика Бурятия

235795

Республика Тыва

97443

Республика Хакасия

116575

Алтайский край

479633

Красноярский край

592171

Иркутская область

572401

Кемеровская область

540088

Новосибирская область

480946

Омская область

415839

Томская область

194853

Читинская область

279006

Республика Саха (Якутия)

253905

Приморский край

388798

Хабаровский край

279700

Амурская область

198256

Камчатская область

69028

Магаданская область

40710

Сахалинская область

109353

Еврейская авт. область

41034

Чукотский авт. округ

14577



Построим две
простые группировки регионов Российской Федерации по данному показателю.
В первой группировке выделим группы регионов со значением показателя ниже и выше среднего по Российской Федерации. Для этого найдем среднее значение данного показателя по РФ. Так как показатель "Численность населения в возрасте моложе трудоспособного на 1.01.2002 г., чел." является абсолютным, его среднее значение будем искать по формуле средней арифметической простой. Получим среднее значение:
 Хi

n
Результаты простой группировки представлены в Таблице 1.2
Таблица 1.2 - Простая группировка с выделением групп регионов со значением показателя ниже и выше среднего по РФ




Количество регионов

Среднее значение показателя в группе, чел.

Регионы со значением показателя ниже среднего по РФ

54

184858

Регионы со значением показателя выше среднего по РФ

26

645498



Для наглядности представим данную группировку в виде диаграммы.

Диаграмма 1.1 - Простая группировка с выделением групп регионов со значением показателя ниже и выше среднего по РФ
Т.к. данный показатель является абсолютным, то мы не можем сравнивать значения показателей по регионам, вследствие их зависимости от размера территории и общего количества населения. Для возможности такого сравнения построим вторую простую группировку, в которой выделим группы регионов со значением показателя "Доля населения в возрасте моложе трудоспособного на 1.01.2002 г., %" ниже и выше среднего по Российской Федерации. Расчет значений этого показателя по регионам и среднего значения представлен в Приложении А (Российский статистический ежегодник 2002 (стр. 90, таблица 5.9))
Результаты простой группировки представлены в Таблице 1.3
Таблица 1.3 - Простая группировка с выделением групп регионов со значением показателя "Доля населения в возрасте моложе трудоспособного на 1.01.2002 г., %" ниже и выше среднего по РФ




Количество регионов

Среднее значение показателя в группе, %

Регионы со значением показателя ниже среднего по РФ

44

17,3

Регионы со значением показателя выше среднего по РФ

36

22,1



Для наглядности сопроводим группировки графиками:

Диаграмма 1.2 - Простая группировка с выделением групп регионов со значением показателя "Доля населения в возрасте моложе трудоспособного на 1.01.2002 г., %" ниже и выше среднего по РФ
Таким образом, если сопоставить абсолютные значения показателя "Численность населения в возрасте моложе трудоспособного на 1.01.2002 г., чел." по регионам со средним значением по РФ, то значительно большее количество регионов характеризуется значением показателя ниже среднего по РФ (54 региона против 26). Но если использовать относительный показатель "Доля населения в возрасте моложе трудоспособного на 1.01.2002 г., %", дающий возможность сравнения, то можно увидеть, что число регионов со значением показателя ниже среднего по РФ приближается к числу регионов со значением показателя выше среднего по РФ (44 и 36 регионов соответственно).
2. Вариационный анализ

Первый этап вариационного анализа - построение
вариационного ряда . На этом этапе важно правильно определить, ряд какого вида целесообразно построить. Т.к. изучаемый признак – чмсленность населения в возрасте моложе трудоспособного– относится к непрерывному виду, то строим интервальный вариационный ряд. Для построения вариационного ряда определим количество интервалов в ряду и длину интервала. Воспользуемся формулой Стержесса:
Количество интервалов k = 1 + 3,32 * lg80 = 7,3.
В качестве длины интервала l выберем целочисленное и удобное для восприятия значение в интервале от l2до l1:
l1= (1348893-14577)/7 = 190617
l2= (1348893-14577)/8 = 166790
Получим вариационный ряд, состоящий из 7 интервалов длиной 180000. (Таблица 2.1).
Таблица 2.1 - Вариационный ряд



Численность населения в возрасте моложе трудоспособного на 1.01.2002 г., тыс. чел.

Менее 180

180-360

360-540

540-720

720-900

900-1080

Более 1080

Число регионов

23

31

9

10

4

2

1



Графически интервальный вариационный ряд изображается гистограммой:

Диаграмма 2.1 - Вариационный ряд

Второй этап вариационного анализа -
расчет показателей вариации (Приложение Б). Оформим его в виде таблицы:
Таблица 2.2 - Показатели вариации



Показатель

Значение

Качественная оценка

Среднее значение

339750

На 1.01.2002 средняя численность населения в возрасте моложе трудоспособного по регионам РФ составляла 339750 чел.




Показатели структуры вариации





Мода

228000

Наиболее часто встречающееся значение численности населения в возрасте моложе трудоспособного составляет около 228000 чел.

Медиана

278710

40 регионов РФ характеризуется численностью населения в возрасте моложе трудоспособного ниже 278710 чел. и 40 регионов выше




Показатели силы и интенсивности вариации





Размах вариации

976409

Даже исключив из совокупности регион с аномальным значением показателя (г. Москва - 1348893 чел.), найдем, что абсолютный разброс значений признака чрезвычайно высок.

Среднее линейное отклонение

197663

Значения численности населения в возрасте моложе трудоспособного по регионам на 1.01.2002 отличались в среднем на 197663 чел. от среднего значения 339750 чел.

Дисперсия

61959937500

Квадрат отклонений значений признака по регионам от среднего значения по всей стране равен 61959937500 чел.2

Среднее квадратическое отклонение

248918

СКО является мерой надежности средней величины: чем оно меньше, тем точнее средняя арифметическая отражает собой всю изучаемую совокупность

Относительный размах вариации

287%

Разница между максимальным и минимальным значениями превышает среднее значение почти в 3 раза, т.е. относительный разброс значений признака также чрезвычайно высок

Относительное линейное отклонение

58%

Доля усредненного значения абсолютных отклонений от средней величины равна 58%

Коэффициент вариации

73%

По численности населения в возрасте моложе трудоспособного совокупность является неоднородной




Показатели характера вариации





Коэффициент асимметрии

0,45

Распределение умеренно асимметрично, асимметрия правосторонняя (смещение в область более низких значений показателя)

Показатель эксцесса

0,88

Распределение островершинное



3. Моделирование ряда распределения

Нормальное распределение - распределение, полностью определяющееся двумя параметрами - средним значением и СКО.


     Страница: 1 из 2
     <-- предыдущая следующая -->

Перейти на страницу:
скачать реферат | 1 2 

© 2007 ReferatBar.RU - Главная | Карта сайта | Справка