Lect01

advertisement
Биометрия
(Биологическая статистика)
Жукова Анна Анатольевна,
к.б.н.,
доцент кафедры общей экологии и
методики преподавания биологии
Лекции - 24 ч;
Лаб. занятия - 28 ч
Источники, рекомендуемые для
подготовки к зачету:







Конспект лекций и лабораторных занятий
Гланц С. Медико-биологическая статистика. –
М., 1999.
Лакин Г. Ф. Биометрия, 4-е изд. – М., 1990.
В. П. Боровиков «STATISTICA для студентов и
инженеров». – М., 2001.
http://www.statsoft.ru/home/textbook/default.htm
www.biometrica.tomsk.ru
www.exponenta.ru
ЛЕКЦИЯ 1
ЗНАЧЕНИЕ СТАТИСТИЧЕСКИХ
МЕТОДОВ В НАУЧНЫХ
ИССЛЕДОВАНИЯХ.
ТИПЫ ДАННЫХ
1.1. Что такое
«статистика»?
Как была сделана эта фотография?
Как сделать красивую фотографию?
Стадии получения и обработки данных
 Сбор данных;
 Обработка (анализ);
 Представление результатов
заинтересованным людям.
Результаты анализа 22 докторских и 203
кандидатских диссертаций, успешно (!)
защищенных в России в последние годы
100
80
60
40
20
0
Корректное Некорректное
применение применение
методов
методов
статистики
статистики
Использование статистических методов в
статьях журнала «The American Naturalist»,
1890-1990 гг.
Цель данного курса
 Ознакомить с основными
современными методами статистики,
которые могут использоваться в
биологических измерениях
Что дает элементарная статистическая
грамотность?
 Возможность познания количественных
закономерностей в биологических явлениях и
процессах;
 Основы обработки экспериментальных
данных и правила корректного
представления их коллегам;
 Избавление от боязни математически
оформленных статей и критический анализ
представленных в них данных;
 Принципы построения математических
моделей биологических явлений и процессов.
«Статистика»?
Статистика занимается
изучением данных,
описывающих естественную
изменчивость.
1.2. Краткая история
развития статистики
Какие данные нужны были
государствам в древности?
Сведения о площадях
земельных угодий, величине
налогов, численности скота и
т.п.
Современная статистика зародилась в
XVII веке по следующим причинам:
 Государствам по-прежнему
необходимо было знать,
сколько жителей проживает в
стране, сколько из них женщин и
мужчин, сколько они платят
налогов и т.д.
Английские ученые, сделавшие вклад в
развитие математической статистики:
Уильям Петти (William Petty)
Джон Грант (John Graunt).
Современная статистика зародилась в
XVII веке:
 В связи с необходимостью
предсказания исходов азартных
игр стала интенсивно
развиваться теория
вероятностей.
Ученые, внесшие большой вклад в
развитие теории вероятностей:
Пьер-Симон де Лаплас
 Карл Фридрих Гаусс
XIX век:
Френсис Гальтон –
«отец» биометрии.
Впервые попытался
применить методы
математической
статистики для
объяснения
биологических
явлений.
XIX-й век:
Карл Пирсон –
продолжатель
идей Гальтона.
Внес большой
вклад в развитие
методов
описательной
статистики и
корреляционного
анализа.
XX век:
Рональд Фишер –
выдающийся
статистик 20-го
века.
Основатель
такой важнейшей
области, как
дисперсионный
анализ.
1.3. Типы данных
Что такое данные?
Данные – это совокупность
измерений (наблюдений),
выполненных на объектах
одной категории по
одинаковой схеме.
Элементы в совокупности данных
называются:
 «единичное наблюдение», или
 «отдельное наблюдение», или
 «варианта» (≠ «вариант»!)
Единичные наблюдения
 Обозначаются хi, где i –
порядковый номер в
совокупности;
 «Объем» - количество
наблюдений, составляющих
совокупность. Обозначается «n»
Важные понятия:
Переменная (=признак) – то
фактическое свойство,
которое измеряется в ходе
отдельных наблюдений.
Важные понятия:
 «Вариация» – различие между
отдельными наблюдениями (от лат.
variatio – изменение, колебание);
 «Вариабельность» - степень
различий между наблюдениями.
Виды ошибок
СИСТЕМАТИЧЕСКИЕ
СЛУЧАЙНЫЕ
Не поддаются
влиянию человека
Поддаются коррекции
Типы переменных:
 Количественные (дискретные и
непрерывные);
 Порядковые (=ранговые);
 Качественные;
 Производные переменные
(индексы, пропорции, проценты,
удельные скорости)
Примеры производных переменных:
 Относительные скорости
(интенсивности) – отражают
динамику того или иного
процесса в отношении к единице
времени (скорость роста
популяции, смертность,
продукция фермента и т.п.).
1.4. Генеральная
совокупность и выборка
Выборка
Выборка (sample) совокупность из нескольких
значений определенного
признака.
Генеральная совокупность
Генеральная совокупность
(population) - все множество
объектов определенной
категории, существующих в
мире.
Объем генеральной совокупности
обозначается «N»
Параметры
Параметры – это числовые
показатели, характеризующие
свойства генеральной
совокупности.
Наиболее важные параметры:
 Показатели, описывающие наиболее
«характерное» в генеральной
совокупности, ее «центральную
тенденцию» (средние величины);
 Показатели, отражающие степень
неоднородности членов
совокупности (дисперсия,
стандартное отклонение и др.).
«Тонкости обозначений»
Генеральная
совокупность
Выборка

x
2

2
s
β
b
Выборочные показатели должны
быть:
 Несмещенными;
 Эффективными;
 Состоятельными
Несмещенный выборочный
показатель:
x1
x2
x3
x4
x5
x6
n
n
Генеральная
совокупность
N,

n
n
n
n
…
xn
x
n
n

Эффективный выборочный
показатель:
n
Генеральная
совокупность
N,

x
Состоятельный выборочный
показатель:
Генеральная
совокупность
N,

x1
x2
x3
x4
x5
x6
x
1.5. Правила
получения данных
Подходы к получению данных:
 Сплошное обследование всей
генеральной совокупности;
 Выборочное обследование.
Правила получения данных:
Для того, чтобы по выборке
можно было судить о свойствах
генеральной совокупности
необходимо организовать
случайный отбор, или
рандомизацию («random» –
случайный) объектов из
генеральной совокупности.
Способы рандомизации:
 Простой случайный, или
полностью рандомизированный
отбор (randomized sampling).
Можно выполнить при помощи
таблиц случайных чисел.
Простой случайный отбор
Способы рандомизации:
 Стратифицированный отбор
(stratified sampling).
Предполагает разбиение
исследуемой совокупности объектов
или пространства на схожие
подгруппы или участки (страты).
Стратифицированный отбор
ГЛИНА
ПЕСОК
ИЛ
Способы рандомизации:
 Неслучайный (=систематический,
плановый) отбор (nonrandom
sampling).
Объекты для исследований выбираются
по определенной, заранее оговоренной
схеме.
Неслучайный отбор
«Репрезентативность»?
Репрезентативность – свойство
выборки правильно отражать
свойства генеральной
совокупности.
Смещенные выборки???
Смещенные выборки (biased
samples)
формируются при нарушении
случайного отбора вариант из
генеральной совокупности.
Эксперимент Рональда Фишера:
 На стол выложили 1200 камней;
 12 человек каждый по 3 раза
отбирали по 20 «типичных»
камней
Результат эксперимента Рональда
Фишера:
 Средний вес отобранных камней
оказался на 25% выше
истинного (66 г против 54 г);
ВЫВОД: Человек - очень плохой
инструмент для формирования
случайных выборок 
Download