Статистические данные и как их

advertisement
CIJ/OSI Investigative Journalism – Public Finance School
April 2011
Statistics and how to interpret them
ЦЖР/ИОО Журналистские расследования
- Общественная Школа Финансов, Баку, 14-16
апреля 2011
Статистические модули
Инструктор: Эд Суирс-Хеннесси
ЦЖР/ИОО журналистское расследование Общественная Школа Финансов,
апрель 2011
Статистические данные и как их интерпретировать
Средняя величина или Среднее значение
Среднее значение вычисляется
путём суммирования значений и
деления суммы на количество
переменных.
В задаче по математике на «множества»,
количество правильных ответов из 10 были:
Значения:
3,4,5,5,4,10,4,10,4,6,4,7,10,3,10,5,4,6,10,5
ЦЖР/ИОО журналистское расследование Общественная Школа Финансов,
апрель 2011
Статистические данные и как их интерпретировать
Средняя величина или Среднее значение
 Сумма 20 значений составляет 119
 Среднее количество 119/20 = 5.95
ЦЖР/ИОО журналистское расследование Общественная Школа Финансов,
апрель 2011
Статистические данные и как их интерпретировать
Мода (Статистика)
 Рассортируйте числа в группах,
учитывая сколько людей собрали 3
балла, сколько 4 балла и т.д. Это
называется распределение чисел.
См. Excel пример
ЦЖР/ИОО журналистское расследование Общественная Школа Финансов,
апрель 2011
Статистические данные и как их интерпретировать
Медиана (Статистика)
 Сортируйте значения от меньшего к
большему.
 Подсчитайте количество значений.
 Если у вас нечетное число
значений, медианой является
среднее значение.
 Если число значений четное,
медиана является средним числом
от двух средних значений.
See Excel examples
ЦЖР/ИОО журналистское расследование Общественная Школа Финансов,
апрель 2011
Статистические данные и как их интерпретировать
Сумма
 Данные переменных потока и
запаса
 Добавьте данные о запасах
 Будьте осторожны с данными
потока – их можно добавить, но
будьте осторожны с описанием.
ЦЖР/ИОО журналистское расследование Общественная Школа Финансов,
апрель 2011
Статистические данные и как их интерпретировать
Население ,
2010
Азербайджан
Грузия
Таджикистан
Украина
Всего
8,997,400
4,436,400
7,595,000
45,870,700
66,899,500
ЦЖР/ИОО журналистское расследование Общественная Школа Финансов,
апрель 2011
Статистические данные и как их интерпретировать
Население, 2010
Процент
населения
который любит
футбол
Азербайджан
8,997,400
30.1
Грузия
4,436,400
25.6
Таджикистан
7,595,000
27.6
45,870,700
50.3
66,899,500
Average 33.4
Украина
Всего
ЦЖР/ИОО журналистское расследование Общественная Школа Финансов,
апрель 2011
Статистические данные и как их интерпретировать
Население, 2010
Процент
населения
который любит
футбол
Азербайджан
8,997,400
30.1
Грузия
4,436,400
25.6
Таджикистан
7,595,000
27.6
45,870,700
50.3
66,899,500
Среднее
(взвешенное)
43.4
Украина
Всего
ЦЖР/ИОО журналистское расследование Общественная Школа Финансов,
апрель 2011
Статистические данные и как их интерпретировать
Вероятность
 Количество между 0 и 1
 0 = невозможное событие
 1 = определенное событие
 0,5 = событие которое может
произойти и непроизойти
ЦЖР/ИОО журналистское расследование Общественная Школа Финансов,
апрель 2011
Статистические данные и как их интерпретировать
Вероятность
 0 = невозможное событие - все мы
позавтракали сегодня в Лондоне
 1 = определенное событие - все
встали с постели сегодня
 0,5 = событие может произойти,
или не произойти - монета упала
на одну из сторон
ЦЖР/ИОО журналистское расследование Общественная Школа Финансов,
апрель 2011
Статистические данные и как их интерпретировать
Вероятность
• Несмещённые кости
• Все шесть сторон имеют равную
вероятность выподания
• Вероятность = 1 / 6 = 0,1666
ЦЖР/ИОО журналистское расследование Общественная Школа Финансов,
апрель 2011
Статистические данные и как их интерпретировать
Вероятность
Отметим сумму вероятностей всех
вариантов = 1
ЦЖР/ИОО журналистское расследование Общественная Школа Финансов,
апрель 2011
Статистические данные и как их интерпретировать
Вероятность - возрастнополовая пирамида
ЦЖР/ИОО журналистское расследование Общественная Школа Финансов,
апрель 2011
Статистические данные и как их интерпретировать
Вероятность - эксперименты
типа да / нет ; биномиальное
распределение
ЦЖР/ИОО журналистское расследование Общественная Школа Финансов,
апрель 2011
Статистические данные и как их интерпретировать
Вероятность Невероятные
события; распределение
Пуассона
ЦЖР/ИОО журналистское расследование Общественная Школа Финансов,
апрель 2011
Статистические данные и как их интерпретировать
Вероятность - Нормальное
распределение, например, для
зарплаты на определенном уровне
ЦЖР/ИОО журналистское расследование Общественная Школа Финансов,
апрель 2011
Статистические данные и как их интерпретировать
Интерпретация данных, полученных
с помощью вопросника
 Не все люди отвечают
 Цена опроса высока – поэтому
рассматриваются образцы опросов
с малым количеством
респондентов
 Различные образцы могут давать
отличающиеся результаты
 Результатам присваивают меру
надежности - доверительный
интервал.
ЦЖР/ИОО журналистское расследование Общественная Школа Финансов,
апрель 2011
Статистические данные и как их интерпретировать
Интерпретация данных, полученных
с помощью вопросника
X
X
X Выборочная
оценка
X
X X
X X
X
X
X
X X X
X
X
X
X
X
X
Реальная
стоимость
X
X
ЦЖР/ИОО журналистское расследование Общественная Школа Финансов,
апрель 2011
Статистические данные и как их интерпретировать
Интерпретация данных, полученных
с помощью вопросника
X
X
X
X
X
Реальная
стоимость
X Выборочная оценка
X
X
X
X
ЦЖР/ИОО журналистское расследование Общественная Школа Финансов,
апрель 2011
Статистические данные и как их интерпретировать
Интерпретация данных, полученных
с помощью вопросника
 Статистика это среднее арифметическое от
всех наблюдений плюс-минус погрешность
измерения
 Для 67% доверия к результату???, средний
плюс или минус одно (1х) стандартное
отклонение.
 Для 95% доверия к результату????, средний
плюс или минус двукратное (2x) стандартное
отклонение.
 Для 99% доверия к результату, средний
плюс или минус трехкратное (3x)
стандартное отклонение.
ЦЖР/ИОО журналистское расследование Общественная Школа Финансов,
апрель 2011
Статистические данные и как их интерпретировать
Интерпретация данных, полученных
с помощью вопросника
 Пример возраста
ЦЖР/ИОО журналистское расследование Общественная Школа Финансов,
апрель 2011
Статистические данные и как их интерпретировать
Ошибки в данных
 Примените проверку смысла (sense
check)
 Если вы не уверены, ищите
альтернативные источники
 Существует ли показатель
предыдущего года?
 Является ли изменения по годам
допустимым?
 Правильно ли отображаются единицы
измерения?
ЦЖР/ИОО журналистское расследование Общественная Школа Финансов,
апрель 2011
Статистические данные и как их интерпретировать
Ошибки в данных
 Два примера, где данные не
были проверены
 1. Население Таджикистана
не составляет 7595 млн. (это больше,
чем населения земного шара!)
ЦЖР/ИОО журналистское расследование Общественная Школа Финансов,
апрель 2011
Статистические данные и как их интерпретировать
ЦЖР/ИОО журналистское расследование Общественная Школа Финансов,
апрель 2011
Статистические данные и как их интерпретировать
Ошибки в данных
 Два примера, где данные не
были проверены
 1. Население Таджикистана
не составляет 7,595,000,000 (это бол
ьше, чем населения земного шара!)
 2. Ошибка произошла из-за
неправильного применения точки и
запятой в дробях
ЦЖР/ИОО журналистское расследование Общественная Школа Финансов,
апрель 2011
Статистические данные и как их интерпретировать
Ошибки в данных
 Два примера, где данные не
были проверены
 1. Население Таджикистана
не составляет 7,595,000,000
 2. Не так много людей
нетрудоспособны.
ЦЖР/ИОО журналистское расследование Общественная Школа Финансов,
апрель 2011
Статистические данные и как их интерпретировать
ЦЖР/ИОО журналистское расследование Общественная Школа Финансов,
апрель 2011
Статистические данные и как их интерпретировать
Доверительные интервалы - сравнение результатов
Год
Доля
курящего
населения
Доверительн
ый интервал
2009
32.4
± 1.2
2010
31.6
± 1.3
33.6
31.2
30.3
32.9
Совпаде
ние
Поэтому статистически
не значительно
отличается
ЦЖР/ИОО журналистское расследование Общественная Школа Финансов,
апрель 2011
Статистические данные и как их интерпретировать
Индекс
 Используется для описания
тенденций в экономике, в частности, в
ценах и торговле
 Полезен для сравнения
разрозненных рядов данных.
 Позволяет сравнивать перемены во
времени относительно постоянной
точки.
ЦЖР/ИОО журналистское расследование Общественная Школа Финансов,
апрель 2011
Статистические данные и как их интерпретировать
Население четырех стран- числа
ЦЖР/ИОО журналистское расследование Общественная Школа Финансов,
апрель 2011
Статистические данные и как их интерпретировать
Население четырех стран2006=100
Download