Министерство образования и науки Республики Казахстан Павлодарский государственный университет им. С.Торайгырова

advertisement
Министерство образования и науки Республики Казахстан
Павлодарский государственный университет им.
С.Торайгырова
Т.К.Бексеитов
ОСНОВЫ БИОМЕТРИИ
Учебное пособие
для студентов специальности «Зоотехния»
Павлодар
1
УДК 57.087.1 (107)
ББК 28.04я73
О-75
Рекомендовано Ученым советом ПГУ им. С. Торайгырова
Рецензент:
кандидат сельскохозяйственных наук, доцент Мустафаев Б.А.
Составители: Т.К. Бексеитов
О -75 Основы биометрии: учебное пособие для студентов
сельскохозяйственных специальностей / сост. Т.К. Бексеитов,
Павлодар, 2006. - 82 с.
УДК 57.087.1 (107)
ББК 28.04я73
© Бексеитов Т.К., 2006
© Павлодарский государственный университет
им.С.Торайгырова, 2006
2
Содержание
Введение………………………………………………………………….3
1 Методы и задачи биометрии в системе генетических и
зооветеринарных исследований……………………………………...5
2 Статистический анализ варьирующих величин………………........10
3 Статистические взаимосвязи и способы вычисления их величин...25
4 Дисперсионный анализ……………………………………………....31
5 Статистический анализ наследуемости и повторяемости…………36
6 Генетическая структура популяции и анализ ее изменчивости…..44
7 Инбридинг. Вычисление коэффициента гомозиготности………....49
8 Селекционные индексы производителей…………………………..51
9 Алгоритмы биометрических расчетов на примерах зоотехнической
и ветеринарной практики……………………………………………53
10 Математические таблицы стандартных значений…………….......79
Литература…………………………………………………………...82
3
Введение
В творческой деятельности зооинженера и ветеринарного врача
большое
место
занимает
проведение
экспериментальных
исследований и сравнение полученных результатов опытов. Для этого
приходится применять простые и сложные математические методы.
При проведении зоотехнических экспериментов, ветеринарных
исследований, научных наблюдений в научно-исследовательских
институтах, на опытных станциях, на фермах совхозов и колхозов
возникает необходимость в выявлении таких закономерностей,
которые обычно скрыты случайной формой своего проявления.
Определение надежности научных диагнозов и прогнозов,
выдвижение научных рекомендаций о массовом применении новых
методов кормления, разведения, лечения и репродуктивного
использования
сельскохозяйственных
животных
требует
установления достоверности результатов тех исследований, на основе
которых делаются соответствующие выводы и даются рекомендации.
Генетический анализ, как и большинство теоретических и
прикладных экспериментальных зоотехнических и ветеринарных
работ, включает применение математико-статистических методов. О
степени развития любой науки можно судить по тому, насколько она
применяет методы математики (по К.Марксу).
Использование достижения современной биометрии - науки о
способах применения принципов и методов теории вероятности и
математической статистики в биологии вообще и в зоотехнии и
ветеринарии в частности - позволяет выделять новые закономерности
явлений жизни и событий животного мира. С помощью методов
математического анализа можно установить, насколько точно
достоверно данные, полученные на отдельной не большой группе
животных (выборке), отражают особенности всех животных
(генеральной совокупности).
Методами биометрического анализа пользуются как научные
работники и специалисты животноводства, так и преподаватели,
аспиранты и студенты вузов.
В настоящее время имеется много изданий фундаментальных
пособий по биометрии, однако им присуща теоретическая
направленность, позиционно- математическое изложение, что создает
трудности студентам самостоятельно освоить и применять
биометрические методы при обработке своих исследований.
В методических рекомендациях рассматриваются основные
характеристики биометрических величин, техника их вычислений и
4
область применения в исследовательской работе. Алгоритмы
биометрических расчетов даны на конкретных примерах
зоотехнических и ветеринарных исследований и наблюдений с
обоснованием полученных результатов.
Здесь также приведены режимы реализации программ решения
биометрических задач на ЭВМ СМ-2М.
5
1 Методы и задачи биометрии в системе генетических и
зооветеринарных исследований
1.1 Возникновение биометрии
Основателями биометрии считают А.Кетлэ, Ф.Гальтона и
К.Пирсона.
А.Кетлэ заложил основы современной статистики и учения об
индивидуальной изменчивости, ввел понятия о средней величине и
вариационном ряде.
Ф.Гальтон сформулировал закон регрессии, это положение нашло
отражение в современной генетике под названием коэффициента
наследственной детерминации аддитивного генотипа-потомка,
имеющего предков в свободно скрещивающейся популяции.
Философские концепции К. Пирсона были откровенно
идеалистическими, однако открытие им в области математической
статистики среднее квадратичное отклонение, коэффициент вариации,
метод хи-квадрат, коэффициенты прямолинейной и криволинейной
корреляции нашли широкое применение как генетико-селекционных
исследованиях, так и в других областях науки и техники.
Большую роль в развитии теории вероятности сыграли
классические
исследования
великих
русских
математиков
П.Л.Чебышева и А.А.Чупрова.
Датский ученый В.Л.Иогансен изложил методические основы
генетического анализа: чистые линии, математическая обработка и
искусственное скрещивание.
Г.Харди (Англия) и А.Вайнберг (Германия) заложили основу для
современной популяционной генетики.
В.Госсет (псевдоним Стьюдент) обосновал теорию малых
выборок.
Агроном Р.А.Фишер, работавший на Ротамстедской опытной
станции (Великобритания), предложил метод дисперсионного
анализа.
Ю.А.Филипченко предложил ряд математических формул,
применяемых в генетическом анализе, в частности, формулу
выражения закона Менделя.
Велики заслуги в становлении математических методов
генетического анализа С.С.Серебровского.
В последнее время в нашей стране и за рубежом выпущен ряд
пособий и учебников по биометрии: П.Ф.Рокицкого «Биологическая
статистика» и «Введение в статистическую генетику», Д.У.Снедекора
«Статистические методы в применении к исследованиям в сельском
6
хозяйстве и биологии», Н.А.Плохинского «Биометрия», «Руководство
по биометрии для зоотехников», Е.К.Меркурьева «Биометрия в
животноводстве», Д.С.Фолкера «Введение в генетику количественных
признаков», Г.Ф.Лакина «Биометрия» и др.
1.2 Основные понятия теории вероятности
Теория вероятности имеет дело с изучением закономерностей
случайных событий. Для понимания статистического подхода к
изучаемым явлениям нужно ознакомиться с некоторыми понятиями и
методами теории вероятности.
Опыт - процесс, в ходе которого могут осуществляться (или не
осуществляться) события, которые можно зафиксировать при
наблюдениях. Известные, существующие объективно или созданные
экспериментатором явления, влияющие на ход опыта, называются
условиями. События, которые могут произойти в данном опыте,
называются исходами. Условия данного опыта вместе с множеством
исходов составляют испытание.
Событие, которое в определенных условиях происходит
обязательно, называется достоверным; которое не может произойти –
невозможным; которое может возникнуть, но может и не возникнуть случайным.
Вероятность - это числовая характеристика степени возможности
появления какого- либо события, которое может повториться
неограниченное число раз.
Вероятность достоверного события полагается равной единице,
невозможного - нулю.
Если в опыте появление одного события исключает появление
другого, то эти события называются несовместимыми, в противном
случае такие события называются совместимыми.
Случайность есть форма проявления необходимости и в то же
время дополнение необходимости.
Диалектико-материалистические представления об объективной
случайности как форме необходимости дает возможность правильно
оценивать многочисленные факты статистических закономерностей в
явлениях природы и в том числе в явлениях изменчивости и
наследственности.
Статистические закономерности не дают возможности
предсказать появление отдельных событий, так как отдельное событие
имеет только свою вероятность появления. Главная особенность
статистических закономерностей заключается в том, что они
7
помогают предвидеть свойства больших совокупностей и предсказать
в них частоту определенных событий.
В основе всех статистических методов, которые широко
используются в статистической генетике, лежит теория вероятности.
Некоторые специфические для статистической генетики методы,
составляющие техническую основу, рассматривается в данной работе.
1.3
Статистическая
совокупность,
ее
свойства,
терминология и символика
Следует знать, что биометрия - это математическая статистика в
приложении к явлениям живой природы. С помощью методов
вариационной статистики она изучает их изменчивость и
наследственность.
Объектом исследований биометрии являются животные, у
которых изучают закономерности изменения и проявления признаков.
Закономерности
изменчивости
и
наследственности
устанавливаются на массовом материале, полученном на
многочисленных экземплярах.
Любое количество отдельных объектов, отличаются друг от
друга и в тоже время сходных по многим признакам, составляет
совокупность, которую разделяют на генеральную и выборочную.
Генеральную совокупность образуют особи, которые интересуют
исследования с точки зрения особенностей изменчивости и
наследственности их признаков (например, совокупность всех
животных какого-то стада, породы в целом или данного региона). Но,
как правило, обследовать всех животных, а тем более провести на них
какой- либо эксперимент, не всегда представляется возможным, так
как это требует больших затрат средств и времени. Поэтому изучают
(подвергают эксперименту)
только часть особей генеральной
совокупности.
Выборочная совокупность (выборка) – это группа особей,
выделенная методом случайного отбора из генеральной совокупности
для проведения на ней исследований. Выборка может с определенной
степенью достоверности характеризовать всю генеральную
совокупность. Чтобы выборочная совокупность более плотно
отражала генеральную, необходимо учитывать такие основы
положения:
- выборка должна быть вполне представительной, т.е. иметь
определенное количество наиболее типичных особей генеральной
совокупности;
8
- выборка должна быть объективной, т.е. сформированной по
принципу случайного отбора без субъективных влияний на ее состав;
выборка должна быть качественно однородной (выделенные для
опыта группы должны быть аналогами по видовым, возрастным,
физиологическим и другим факторам).
По объему выборки делятся на малочисленные, содержащие до
30 особей, и многочисленные.
Числовые значения признака отдельных особей называют
вариантами (от латинского Varians). Изменение признаков и свойств
живых существ называют варьированием. Совокупность вариант,
полученных при наблюдении (исследовании) без определенной
систематики называют первичным (сырым) рядом. Расстановка
вариант в порядке возрастания (или убывания) называется
ранжированием
(ранжированный
ряд).
Группа
чисел,
сгруппированная в классы в зависимости от величины изучаемого
признака, называется вариационным рядом.
Существующие между биологическими признаками связи, при
которых определенному значению одного признака соответствует
несколько значений другого признака, варьирующей около своей
средней величины, называется корреляцией.
Биологические признаки, если они выражаются при помощи
счета или меры, приобретают значение математических величин:
средняя арифметическая, средняя квадратическая, коэффициент
изменчивости, коэффициент корреляции и ряд других. Результаты
измерений признаков, как и их особенностей варьирования,
взаимосвязи и наследуемости обозначается в математических работах
разными символами (таблица 1).
Таблица 1
Символы
Принятые
В других
Название символа
в данной
работах по
работе
руководству
по
биометрии
1
2
3
V
V, X, x ,y, a Дата, варианта (числовое значение
признака)
N
N, n
Число особей генеральной совокупности
n
n
Число особей выборки
9
Продолжение таблицы 1
1
max V
min v
Lim
i
P
AФ
2
max V
min v
Lim
k
f
A
a
a
b
S
σ
CV
Cy ,Cx ,Cz
b
__
M
~ _
M, x
∑(V - M)2,
S,G, SQ
S
σ, S, ν
CV, Cv
Cy ,Cx ,Cz
m
m
d
t
td
d
t
td
F
F
P
ν
r
R
σ2
χ2
E
O
rG
rp
h2
П
Sd
Sэ
P, B
ν
r
R
σ2
χ2
E
O
rG
rp
h2, H
Пx, rp, rw
Sd
S э, S E
M
~
М
C
3
Максимальное
и
минимальное
значение
признака
Лимит, размах изменчивости
Величина классового промежутка
Частота (число вариант в классе)
Числовое значение модального класса
Отклонение классов от модального (условного,
среднего)
Поправка к условной средней
Средняя
арифметическая
генеральной
совокупности
Средняя арифметическая выборки
Дисперсия (сумма квадратов центральных
отклонений)
Сумма квадратов условных отклонений
Сигма (среднее квадратичное отклонение)
Коэффициент вариации
Дисперсия - общая, факториальная, остаточная
Статистическая
ошибка
(ошибка
репрезентативности)
Разность между двумя средними
Показатель достоверности
Показатель достоверности разности
Показатель
достоверности
Фишера
(при
дисперсионном анализе)
Вероятность
Число степеней свободы
Коэффициент корреляции
Коэффициент регрессии
Девиата (варианса)
Хи-квадрат (критерий соответствия)
Теоретически ожидаемое число особей в группе
Наблюдаемое число особей в группе
Коэффициент генотипической корреляции
Коэффициент ранговой корреляции
Коэффициент наследуемости
Коэффициент повторяемости
Селекционный дифференциал
Селекционный эффект
10
1.4 Биологические признаки и их классификация
Оценка животных и продуктов их жизнедеятельности, а
следовательно, и образование статистических совокупностей
производится по конкретным признакам, которые представляют
определенный научный и практический интерес и позволяют сравнить
и различать особи между собой.
По своей природе наследования и с учетом оценки признаки
делятся на качественные и количественные.
Качественные
признаки
обусловлены,
как
правило,
многоценным действием (одним генном), выражаются по
альтернативной схеме, и оценивается визуально (масть животных, тип
телосложения, вкус и запах продуктов и другое). В биометрической
обработке таких признаков используется число, отражающее место,
занимаемое животным в ранжированном ряду.
Количественные признаки - это такие свойства и особенности
организма, величина которых измерима и выражается на счетные и
мерные.
Счетные признаки учитываются путем подсчета, и варьирует
дискретно (прерывно). Величина их выражается только целыми
числами (например, яйценоскость кур, многоплодие свиноматок и
другое).
Мерные признаки измеряются, и величина их может выражаться
приближенно, т.е. целыми числами и дробными числами (например,
молочная продуктивность, живая масса животных и др.).
Количественные признаки, как правило, носят полигенный
характер наследования (т.е. один признак детерминирован многими,
однозначно действующими генами) и изменяются непрерывно.
2 Статистический анализ варьирующих величин
2.1 Основы статистических группировок
В процессе подготовки отчета проведенных исследованиях
цифровые данные, отражающие результаты опытов т экспериментов,
записывают
в
соответствующие
журналы
и
подвергают
определенному анализу, статистическому наблюдению. Для
нахождения
истины
полученные
наблюдения
необходимо
систематизировать и обработать.
Полученный в результате наблюдений материал подвергают
логическому и арифметическому контролю. Логический контроль
заключается в проверки смысловой согласованности сведений,
отраженных в первичных записях (например, при описании
11
экстерьера коровы обхват груди получился равным 18 см., что
естественно является явной несуразностью).
Арифметический контроль заключается в проверке счетной
согласовании отдельных записей. Например, в записи значиться: в
учхозе «Прогресс» 970 коров, а всего крупного рогатого скота 870
голов. Здесь явная ошибка, так как часть не может быть больше
целого.
Собранный в процессе исследований материал может включать
интересные сведения, отражающие какие-либо процессы и явления.
Однако сведения, рассеянные по всему собранному материалу, ничего
не дают. Закономерности этих явлений и процессов можно
обнаружить лишь при соответствующей обработке данных. Это
достигается группировкой.
Соединение единиц в группы дает возможность выявить
особенности, проявляющиеся в каждом отдельном случае.
В основе группировок лежит тот или иной признак. Например,
стадо коров можно сгруппировать по удою, по содержанию жира, по
живой массе, по возрасту и т.д.
В процессе группировки создается вариационный ряд. Ряды
бывают трех видов:
- ряд распределения, отражающий группировочный признак,
принимающий только количественное выражение (продуктивность,
возраст, и т.д.);
- ряд атрибутный, отражающий группировку по качественному
признаку, который регистрируется в виде текстовой записи - вид, тип,
родство (породный состав, половозрастная структура, тип кормление
и др.). Такие признаки записывают при помощи букв, а не цифр;
- ряд географический, представляющий группировку в
пространстве, в территориальном разрезе.
Вариационный ряд позволяет проводить группировку данных по
классам, показывающим закономерности варьирования признаков, и
вычислять ряд статистических величин. К построению вариационного
ряда прибегают в случаях, когда биометрические величины
рассчитывают без помощи вычислительной техники, а выборочные
совокупности составляют больше 30 вариант.
В качестве примера вариационного ряда может служить
распределение коров стада на классы по удою (таблица 2).
12
Таблица 2
W- классы (границы классов)
P - частоты, числовое
выражение
До 2000
4
2001-2500
21
2501-3000
33
3001-3500
58
3501-4000
37
4001-4500
19
4501-5000
5
5001-5500
6
5500-и выше
2
ΣP=185
Порядок
построения
вариационного
ряда,
вычисление
биометрических величин и его анализа приведён в пункте 9.2.
Закономерности вариационного ряда можно выразить графически
в виде гистограммы или полигона распределения.
60
50
40
30
20
10
0
1
2
3
4
5
6
7
8
9
Рисунок 1
На рисунке 1 изображена гистограмма распределения коров по
удою.
Ступенчатость
гистограммы
объясняется
небольшим
количеством вариант выборки. Если число наблюдений большое,
вариационная кривая приобретает плавный характер и превращается в
теоретическую, характеризующую распределение членов генеральной
13
совокупности, с теоретическим значением частот и по форме
напоминает биноминальную кривую (рисунок 2).
50
45
40
35
30
25
20
15
10
5
0
1
2
3
4
5
6
7
8
9
Рисунок 2
Используя параметры вариационного ряда, можно облегчить
процесс вычисления средней арифметической М и среднего
квадратического отклонения σ.
2.2 Средние величины и способы их вычисления
Основным показателем, характеризующим совокупность по
величине изучаемого признака, является средняя арифметическая.
Она дает суммарную характеристику любого признака, указывая на то
типичное и устойчивое в явлении, что наиболее полно выражает его
содержание. В средней величине находит свое проявление
закономерность.
Существует несколько видов средних, которыми пользуются в
биологической статистике: средняя арифметическая, средняя
арифметическая возвышенная, средняя квадратичная, средняя
гармоническая, средняя непараметрическая, мода, медиана и др.
2.2.1 Вычисление средней арифметической М
Вычисляют М путем суммирования значений всех вариант
(V1+V2+V3+…Vn) c последующим делением суммы на количество
вариант n
М=
V
,
n
14
где M - средняя арифметическая; ∑ - символ суммирования;
V - числовое значения вариант; n - объем выборки (количество
вариант).
Например, необходимо определить среднесуточный удой в
группе из шести коров, если удой каждой в отдельности составили:
12,3; 10,7; 9,5; 14,5; 13,5; 15,0кг.
М=
12,3  10,7  9,5  14,5  13,5  15,0 75,5

 12,58 кг
6
6
При наличии счетной техники такой метод вычисления средней
арифметической приемлем для выборки любой численности. Если
суммирующих машин нет, и непосредственное сложение вариант
становится затруднительным, то применяют обходной путь
вычисления
через
составления
вариационных
рядов.
Вычислительная работа при этом значительно облегчается за счет
небольшого снижения точности средней. Используется два способа
вычислений: М - произведений и сумм.
Техника расчетов средней арифметической для выборок
различной численности и с учетом использования ЭВМ показана в
алгоритмах 1,2,3 и режима 01 программы «БОИ»
2.2.2 Вычисление средней взвешенной Мвзв
Вычисление средней взвешенной подставляет собой результат
усреднения средних арифметических нескольких совокупностей, и
вычисляются по формуле
Мвзв=
M n M 1n1  M 2 n2  ...M n nn

,
n
n1  n2  ...nn
где Мn, М2, М1 – средние арифметические отдельных
совокупностей; n1, n2, nn – объемы совокупностей.
Если рассчитывают Мвзв для одной группы животных где
учитывается два признака (например, вычисление среднего жира в
молоке за лактацию, когда имеются помесячные удои со среднем
содержанием жира), то формулу можно записать так
Мвзв=
Vp
,
p
где V - значение признака; p - математический вес усредняемого
признака.
15
Например, необходимо вычислять среднюю жирность молока,
полученного от коровы за 10 месяцев лактации, по данным таблицы 3
Таблица 3
3,9
4,0
4,0
4,1
4,1
4,3
4,4
-
Удой, кг
р
430
410
370
320
290
110
ΣP=3990
Однопро
центное
молоко
Vp
1720
1640
1517
1312
1247
484
За
лактацию
460
10
1794
9
3,9
8
520
7
2028
6
3,8
5
590
4
2242
3
3,7
2
490
1
1813
Месяцы
лактаци
и
Средняя
жирность
молока,
%V
ΣVP=15797
Мвзв=
Vp 15797

 3.96%
p
3990
2.2.3 Вычисление средней непараметрической
Средняя непараметрическая определяется для качественных
признаков, которые имеют числовое выражение своей величины
проявления.
Например, в зверосовхозе, разводящих голубых норок, от двух
самцов и группы самок получено 12 щенков с различной
интенсивностью окраски меха: то светло-голубого до темно-голубого.
Необходимо установить, какой производитель дает в потомстве более
темную окраску меха. Для этого всех потомков распределяют в
ранжированный ряд в порядке усиления интенсивности окраски, а при
каждом порядковом номере проставляют номер отца:
- ранг (от слабого до темно-синего) 1 2 3 4 5 6 7 8 9 10 11 12;
- номер отца, давшего потомство
II I II I I II I II I I II I
Затем рассчитывают среднее ранги окраски в потомстве
каждого производителя следующим образом:
16
МI=
2  4  5  7  9  10  12
7
МII=

49
 7;
7
1  3  6  8  11 29

 5,8.
5
5
Сравнивая средние арифметические интенсивности окраски
меха потомства двух производителей, можно заключить, что самец I
дает потомства с более темной окраской.
2.3 Показатели изменчивости и способы их вычисления
Средняя величина характеризует группу в целом одним общим
показателем и совершенно не учитывает разнообразие особей по
изучаемому признаку. При равных средних двух выборок в них
можно определить существенные различия. Степень разнообразия
животных учитывается в селекционной работе, в технологических
расчетах, в научно-экспериментальных исследованиях.
В зоотехнической и ветеринарной практике в основном
используется три показателя разнообразия: лимиты, среднее
квадратическое отклонение и коэффициент вариации.
Первоначальную характеристику изменчивости признака
показывает лимит Lim (от латинского Limes - предел, граница). Он
указывает фактические границы вариабельности признака.
Величина вариации может быть оценена и по разности между
максимальным и минимальным значением признака. Этот показатель
называют размахом изменчивости.
Примером оценки групп животных по характеру изменчивости
при помощи лимита могут служить выборочные совокупности,
отражающие многоплодность свиноматок в учхозе « Прогресс»
Крупная
белая порода
Порода
ландрас
n1=5
7
9
10
10
11
М1=9,4
n2=5
6
8
10
10
13
М2=9,4
Lim1=117=4
Lim2=136=7
При одном и том же среднем значении признака(M1=M2),
изменчивость
второй
группы
значительно
выше,
чем
первой(Lim2=7>Lim1=4).
Однако лимиты не могут служить основным мерилом
вариабельности биологических величин. Отдельные
случайные
варианты могут сильно отражаться на лимите, в то время как на
17
закономерности изменчивости их влияние не может быть
незначительным. В других случаях при равных лимитах группы могут
иметь разные различия.
Сравнивая две группы коров по среднесуточным надоям,
устанавливаем, что они имеют одинаковые средние арифметические и
лимиты, однако различаются по характеру однородности
I
10 10 10 11 12 12 13 14 15 16 17 М1= Lim1=7
группа
13,0
II
10 10 12 13 13 13 13 13 13 13 17 М2= Lim2=7
группа
13,0
В таких случаях для определения величины изменчивости
особей в группе пользуются одним квадратичным отклонением.
Среднее квадратичное отклонение (сигма) показывает,
насколько в среднем каждая варианта данного ряда отклоняется от
средней арифметической, вычисленной для данной совокупности. Чем
больше значение сигмы, тем выше изменчивость. Сигма измеряется
теми же единицами, что и изучаемый признак.
Существует много методов, по которым можно рассчитать
сигму, и все они дают практически одинаковый результат.
Применение той или формулы обуславливается лишь техническими
удобствами расчетов. В основу этих формул заложено свойство
дисперсии
σ = V 2 
(V ) 2
n
При малочисленных выборках сигму можно рассчитать прямым
методом используя формулу
σ =
C
,
n 1
где С - дисперсия (сумма квадратов центральных отклонений,
т.е. квадратов разностей между каждой вариантой и средней
арифметической); n - 1- число степеней свободы ( число выборки без
одного).
18
Например, для группы коров в количестве три головы ∂ по
признаку жирномолочности на основании данных 3,0; 4,0 и 5,0%
рассчитывают следующим образом
V
V2
3,0
9,0
С=∑V 2
4,0
16,0
(V ) 2
n
 50 
∑V=12
∑V2=50
5,0
25,0
(12) 2
 2;
3
∂=±
ñ
±
n 1
2
 1,0%
3 1
Средняя арифметическая величина жирномолочности в этой группе
М=  
V
n
12
 4%
3
При многочисленных выборках рассчитывать сигму таким
образом при безмашинной обработке очень трудоемко. В таких
случаях применяют косвенный метод, используется параметры
вариационного ряда и следующие основные формулы:
σ=±
 Ðà  b
n
σ=±
2
 i (метод произведений - алгоритм 2);
S
2
 b  i ( метод сумм - алгоритм 3).
n
Сигма, являясь основным показателям разнообразия значений
признака в группе, имеет математическую связь со среднем
арифметическим, которая определяется следующими положениями:
- в пределах М±3σ находятся все варианты совокупности
(точнее 99,7%);
- в пределах М±2σ - 95,5 %;
- в пределах М±1σ - 68,3 % ;
Схематично это представлено на рисунке 3.
19
50
45
40
35
30
25
20
15
10
5
0
1
2
3
4
5
6
7
8
9
Рисунок 3
Для качественных (альтернативных) признаков
квадратическое отклонение определяет по формуле
σ=±
среднее
ðq ,
где р - доля особей, имеющих данный признак; q - доля особей,
не имеющих данного признака.
Например, в отаре каракульских овец, насчитывается 570
черных и 150 серых животных, необходимо вычислить сигму по
показателю наличия серой масти.
Всего животных N= 570+150=720 голов.
р=
570
 0,79;
720
q=
150
 0,21;
720
р+ q=1.
σ = ± 0,71* 0,21  ±0,41
Среднее
квадратичное
отклонение
используется
для
конструирования многих биометрических показателей; коэффициента
вариации, ошибок репрезентативности, коэффициентов корреляции и
регрессии, элементов дисперсионного анализа.
20
Сигма, выражающая величину изменчивости в абсолютных
величинах, не обеспечивает сравнительной оценки показателей,
выраженных разными единицами меры.
Например, сравнивая величину изменчивости в группах
животных по данным таблицы 4, трудно выяснить, какая из них
является более однородной и наоборот.
Таблица 4
Группа
животных
1 лошади
2 свиньи
3 коровы
Признак
Высота в холке, см.
Многоплодие, гол.
Содержание
жира
молоке, %
n
М±σ
93
137
в 75
160,9± 3,4
12,1±2,0
3,91±0,33
В таких случаях используют коэффициент вариации CV,
который выражает сигму в процентах от средней арифметической
величины по формуле
CV=

M
* 100
Чем больше значение CV, тем выше изменчивость признака в
совокупности. Выделяют изменчивость сильную - CV≥15%, слабуюCV≤5%, среднюю - CV>5%, <15%.
Определив CV для нашего примера,
3,4
*100  2,1% ;
160,9
2,0
2) CV=
*100  16,5 %;
12,1
0,33
3) CV=
*100  8,4%
3,91
1) CV=
можем заключить, что группы лошадей пот признаку высоты в холке
является наиболее однородной,
а группа свиней по признаку
многоплодия – наиболее изменчивой.
Сигма и CV являются показателями разнообразия,
характеризующими вариационный ряд в целом. Если необходимо
получить характеристику по отдельной конкретной варианте
21
(животному), тогда пользуется нормированным отклонением, которое
представляет выраженное в долях сигмы взвешенное отклонение этой
варианты от среднего арифметической
t=
V M

.
Нормированное отклонение находит применение при решении
селекционных и ветеринарных вопросов: при оценке производителей
по качеству потомства, при суждении о ходе выздоравливании
животного и др.
Например, сравнивая молочную продуктивность двух коров
при условии, что первая за 1 лактацию дала 3600 кг, а вторая за У4700 кг, нельзя утверждать, что у второй коровы молочная
продуктивность выше, так как эти коровы разных возрастов. Для
сравнения нужно вычислить М и σ первотелок и коров пятого отдела.
Предположим, что получены такие данные:
М1=2600кг,  1=  500кг, М5=3650кг,  5=± 620кг.
Вычисляем:
t1=
3600  2600
 2;
500
t5 =
4700  3650
 1,7 .
620
Первотелка превосходит среднею арифметическую по своей
группе на +2 сигмы, а корова с пятым отелом на +1,7 сигмы. Поэтому
есть основания предположить, что по пятой лактации первая корова
будет иметь более высокую молочную продуктивность, чем вторая.
Ветеринарной практике можно встретится с таким случаем: в
сыворотке крови здоровых свиней содержится 6,52% общего белка, а
больной 4,52%. Зная величину основного отклонения по этому
признаку σ =±1, можно найти нормированное отклонение
t=
6,5  4,5
2
1
Следовательно, больная особь имеет значительные отклонения от
средней величины данного признака в популяции здоровых свиней.
22
2.4 Статистические ошибки и оценка достоверности
выборочных показателей
Необходимо знать, что статистическая ошибка указывает на
возможные отклонения средней арифметической полученной на
выборке М от средней арифметической генеральной совокупности М.
Возникает она в силу тех обстоятельств, что любая выборка, являясь
только частью генеральной совокупности, не может абсолютно точно
отразить ее свойство.
Свойство выборочных групп с определенной точностью и
достаточной
надежной
надёжностью
характеризовать
соответствующие
генеральное
совокупности
называют
репрезентативностью. Она позволяет охарактеризовать всю
совокупность особей на основе изучения только ее части. Чем больше
выборка, тем меньше статистическая ошибка. Фактическая
выборочная средняя М отклоняется от теоретической средней
генеральной совокупности М в n раз по сравнению с отдельными
вариантами данного распределения. Ошибку репрезентативности
выборочной средней вычисляют по формуле
m= 

n 1
.
Для других биометрических показателей формулы вычисления
ошибок будут приведены далее.
Биометрические методы учета ошибок репрезентативности дают
возможности определять доверительные границы генеральных
параметров и достоверность выборочных разностей.
Крайние значения, в пределах которых может находиться
искомая средняя арифметическая генерального параметра, называют
доверительными границами. Зная среднюю арифметическую М и
ошибку m выборочной совокупности, можно с определенной
степенью доверенности и точности определить те границы, в которых
лежит средняя М генеральной совокупности. Доказано, что средняя
арифметическая выборки (М) n>30 отклоняется от средней
арифметической генеральной совокупности М в 95% случаев не
более, чем на 1,96 m (≈2m). Показатель 95%, выраженный не в
процентах, а в долях единицы, называется доверительной
вероятностью (Р=0,95) и указывает на вероятность безошибочного
суждения. В зоотехники и ветеринарии принято пользоваться тремя
порогами вероятностей: Р1=0,95; Р2=0,99; Р3=0,999. Вероятности,
23
которыми принято пренебрегать, записывают как Р1=0,05; Р2=0,01; и
Р3=0,001.
Зная величину статистической ошибки и ее свойства, можно
определить, насколько достоверны данные, полученные в процессе
эксперимента на отдельной выборке, соответствуют истинным
данным генеральной совокупности.
Показателями достоверности выборочной совокупности
разностей между средними арифметическими двух выборках
являются критерий достоверности и критерий достоверности разницы.
Средняя арифметическая или разность между средними двух групп
считается достоверной, т.е. находится в рамках доверительных
границ, если она в определенное количество, раз превосходит свою
ошибку. Эта величина зависит от численности выборки, и находят ее
по таблице Стьюдента (см. раздел 10). Общую ориентацию для такой
оценки дает правило утроенной ошибки, из которого следует, что
средняя арифметическая генеральной совокупности заключена между
пределами М±3m. Критерии достоверности вычисляют по формулам:
tM= M ;
m
td=
M1  M 2
m 1 m
2
2
.
1
Разность достоверна – это значит, что если в выборочном
исследовании оказалась разница между выборочными группами, то
такая же по знаку будет и между соответствующими генеральными
параметрами. Следовательно, основной вывод исследований может
быть обобщен и перенесен на соответствующие генеральные
совокупности.
Пример 1 Необходимо установить, имеется ли достоверная
разница между высотой в холке жеребцов и кобыл орловской породы.
Для проведений измерений было взято 10 жеребцов и 10 кобыл
методом случайного отбора. По результатам биометрической
обработки получены следующие показатели:
n1♂=10
M1±m1= 160.9±0.9см;
n2♀=10
M2±m2= 157.4±1.1см.
Отсюда td=
160,9  157,4
0,9 2  1,12

3,5
2,02
 2,46.
Сопоставив td=2,46 со стандартным значением таблицы
Стьюдента по графе ν=n1+n2-2=10+10-2=18, где t1=2,1 (при Р≥0,95),
t2=2,9 (P≥0,99) и t3=3.9 (Р≥0,999), можно с уверенностью заключить,
24
что данные, полученные на отдельных выборках, и имеющиеся между
ними разность являются достоверными с вероятностью не менее
Р=0,95, так как td (2,46) превышает принятый в исследовании
показатель вероятности безошибочного суждения t1(2,1) первого
порога надежности. Это означает, что при повторении исследований,
вероятно, то, что аналогичные выводы можно сделать в 95 случаях из
100.
При определении достоверности средней арифметической
руководствуются такой же методикой.
Пример 2 Средняя многоплодность свиноматок части стада
спецхоза (выборка n=137 гол.) составляет М=12,1 гол., а ошибка m
=±0,17 гол. Вычислив величину tМ=
M 12.1

 71 и сравнив ее со
m 0.17
значениями по графе  =n-1=137-1=136, где t1=2,0 (Р≥0,95); t2=2,6
(Р≥0,99); t3=3.4 (Р≥0,999), заключаем, что средняя, полученная на
выборке, с высокой достоверностью приближается к средней
генеральной совокупности, т.е. показательно многоплодности
свиноматок всего стада.
2.5 Критерий соответствия между наблюдаемыми и
ожидаемыми частотами
В зоотехнической и ветеринарной практике приходится
сравнивать эмпирические частоты с теоретически вычисленными, или
ожидаемыми частотами, оценивать фактические результаты
наблюдений по отношению к норме или гипотезе. При сравнительной
оценки наблюдаемого и ожидаемого результата применяют критерий
хи-квадрат χ2.
Вычисления критерия хи- квадрат основано на принципах
нулевой гипотезы Н0, предполагающей, что между сравниваемыми
выборками нет достоверных различий. Нулевую гипотезу следует
опровергнуть или оставить в силе. Критерий соответствия применяют
при гибридологическом анализе, при проверке различных гипотез,
при оценке эффективности применения лекарственных средств и др.
Этот метод весьма приближенный и поэтому применим при
численности выборок не менее 20 особей. При вычислении критерия
хи-квадрат используют следующие формулы:
(0  Å ) 2
;
Å
2
1

(0  Е )  2 
2
,
χ =
Е
χ2 = 
25
где 0 - наблюдаемое число особей; Е - теоретически ожидаемое
число особей;
1
-поправка Йетса в случаях, если N и ожидаемые
2
величины малы.
Для определения теоретически ожидаемых частот Е строят
специальную таблицу (см.п. 9.4).
Полученные значения χ2 сравнивает со стандартом критерия
согласия и, если оно превышает его, то нулевую гипотезу
опровергают.
Пример применения хи-квадрат.
Требуется оценить эффективность профилактического действия
препарата при инфекционном заболевании кур. При испытании 35
голов получили препарат (опытная группа), а 50 голов не получали
(контрольная группа). В опытной группе заболело 10 голов, а 25
осталось здоровыми. В контрольной группе заболело 20, а осталось
здоровыми 30. Нулевая гипотеза - препарат действия не оказывает.
Следует доказать это или опровергнуть.
3 Статистические взаимосвязи и способы вычисления их
величин
3.1 Коэффициент фенотипической корреляции
Существующие между биологическими признаками связи
характеризуются тем, что определенному значению одного признака
соответствует не одно, а несколько различных значений другого
признака, варьирующих около своей средней величины. Такой вид
связи между переменными х и у называется корреляции.
Например, между обхватом гуди у коров и их массой
наблюдается определенная зависимость: животные с большим
обхватом груди имеют большую живую массу. Однако из этого
общего правила бывают исключения, когда животные с меньшим
обхватом груди имеют большую живую массу. И только на
статистически большом материале, т.е. в свете закона больших чисел,
обнаруживается строгая зависимость между этими признаками.
По своей природе корреляция может быть положительной,
когда с увеличением (уменьшением) одного признака соответственно
изменяется другой, и отрицательной, когда с увеличением одного
признака другой, связанный с ним, уменьшается.
Мерилом связи между признаками является коэффициент
корреляции, который изменяется в пределах от 0 до 1.
26
Различают корреляцию: сильную r≥0,75; среднюю r=0,25…0,75
и слабую r≤0,25.
Знание величины и направленности корреляции имеет большое
значение в практической работе селекционеров. Обеспечивая отбор по
одному из признаков, всегда необходимо учитывать, какие возможные
изменения и последствия будут по другому коррелирующему с ним
признаку. Например, с повышением удоев у коров содержание жира в
молоке снижается - отрицательная корреляция.
Для вычисления коэффициента корреляции разработано много
рабочих формул в зависимости от условий - для малых и больших
выборок, при малозначных и многозначных вариантах.
При вычислении коэффициента фенотипической корреляции без
применения ЭВМ на многочисленных выборках (n>30) прибегают к
разбивке вариант на классы по построению корреляционной решетки
и используют рабочею формулу
r= 
Pxy  nbx b y
n x y
.
Порядок вычислений приведен в п.9.6.
Для малочисленных выборок (n<30) наиболее приемлемы в
зоотехнических исследованиях следующие формулы:
V V
1 2
r=
r=

( V1   V2 )
n
c1c 2
c1  c 2  c d
2 c1c 2
;
(алгоритм 5)
3.2 Коэффициент генетической корреляции
Генетическая корреляция указывает на изменчивость вторичных
признаков при селекции первичных признаков.
Корреляции между признаками имеют разную природу.
Признаки могут быть связаны между собой наследственными
факторами в виде плейотропного и сцепленного наследования, а их
связь может быть обусловлена влиянием внешней среды.
Генетическая и средовая корреляция могут быть не
одинаковыми как по величине, так и по направлению. Так как из-за
двойной природы фенотипической корреляции предсказать по ее
27
показателю эффект селекции затруднительно, то весьма важно
определять
генетическую
корреляцию
между
признаками.
Коэффициент
генетической
корреляции
определяет
по
фенотипическим показателям корреллируемых признаков у
родственых особей.
Один из способов вычисления коэффициента генетической
корреляции разработал Л.Н.Хейзель в 1943г. Для вычисления
генетической корреляции используют формулу
rGxy=
(rxÄyì  róÄxì )
rõÄõì  ryÄyì
,
Если в числителе этой формулы у коэффициентов стоят знаки
«минус», то эти знаки не учитываются. Если в числителе один знак
«минус», а второй «плюс», то используют такую формулу
rGxy=
(rõÄyì  ryÄõì ) / 2
rõÄõì  ryÄyì
.
Если в знаменателе один или оба знака коэффициентов
корреляции «минус», то пользоваться этими формулами нельзя.
Отрицательная связь между одноименными признаками дочерей
и матерей, т.е. между ХД и ХМ (УД и УМ), свидетельствует о
сильном взаимодействии генотипа со средой.
Зная генетические корреляции, можно прогнозировать
изменение одного признака при отборе животных по другому
признаку.
Косвенный отбор более эффективен при высокой наследуемости
признака, по которому он непосредственно ведется, и при высоком
коэффициенте генетической корреляции. Порядок вычисления
генетической корреляции проводится в п.9.7.
3.3 Коэффициент корреляции для альтернативных
признаков
В зоотехнической и ветеринарной практике часто приходится
прибегать к измерению сопряженности не только между
количественными признаками, но и между качественными, которые
не имеют числового значения. Это, как правило, альтернативные
(противоположные) признаки. Например, масть белая или рыжая,
28
упитанность высшая или средняя, животные больные или здоровые и
др.
Д.Юла предложил использовать четырехпольную таблицу с
применением формулы
r=
Р1 Р4  Р2 Р3
( Р1  Р 2 )( Р3  Р4 )( Р1  Р3 )( Р2  Р4 )
,
где Р1, Р2 Р3 Р4- частоты в каждой клетке корреляционной решетки.
Пример
вычислений
коэффициента
корреляции
для
альтернативных признаков показан в п.9.8.
3.4 Коэффициент корреляции рангов (непараметрическая
корреляция)
В том случае, когда вычисляют зависимость между
качественными признаками, не имеющими числового выражения, или
когда распределение одного или обоих коррелирующих признаков
весьма неравномерное или неправильное, целесообразно пользоваться
коэффициентом ранговой корреляции Спирмена. В этих случаях
признаки ранжируют, т.е. расставляют в порядке убывания или
возрастания. Порядковые номера признаков и являются рангами,
которые используются как числовые значения в формуле
коэффициента корреляции рангов.
rp=1-
6d 2
n(n 2  1)
.
Коэффициент Спирмена следует применять только в таких
случаях: объекты по изучаемому признаку должны быть
ранжированы; признак не может быть измерен ни точно, ни
приближенно; ранжирование требуется для решения зоотехнической
или ветеринарной задач. Пример расчета коэффициента корреляции
рангов дан в п. 9.9.
3.5 Коэффициент регрессии
Логическим продолжением изучения зависимости между
признаками является коэффициент регрессии. Регрессия отражает
динамику связей между признаками х и у и прямого отношения к
развитию признаков во времени и в зависимости от других причин не
имеет. Если коэффициент корреляции указывает на тесноту связей, то
29
коэффициент регрессии количественно конкретизирует эту
зависимость.
Коэффициент прямолинейной регрессии указывает, на сколько в
среднем изменяется один из признаков, если другой, связанный с ним,
изменяется в среднем на единицу.
Коэффициент регрессии каждой конкретной выборки имеет два
значения Rху и Rух (т.е. прямое и обратное влияние признаков друг на
друга) и вычисляется по формулам
Rxy= r
õ
;
ó
Rух= r
ó
.
õ
При изучении связи между обхватом груди и живой массы коров
установлена сильная положительная корреляция r = 0,8(см. п.9.6).
Вычислив Rxy=9кг и Rух= 0,1 см, констатируем, что если в процессе
селекции коров обхват груди увеличивается в среднем на 1 см, то
живая масса увеличится в среднем на 9 кг.
Расчет коэффициентов регрессии дан в п. 9.6.
3.6 Ошибки коэффициентов корреляции и регрессии и
оценка их достоверности
Коэффициенты корреляции и регрессии, характеризующие
зависимость между признаками групп животных, являются
статистическими величинами, поэтому обладают свойством
репрезентативности. Достоверность их величин устанавливают при
помощи ошибок репрезентативности, вытекающих из самой сущности
выборочного обследования, при котором целое характеризуется на
основании изучения части.
Ошибки коэффициентов корреляции вычисляют по следующим
формулам:
для коэффициента корреляции r при многочисленной выборке (n>30)
mr= ±
1 r2
n
2
или mr= ± 1  r
n 1
для r при малочисленной выборке (n < 30)
30
;
1 r2
;
mr=  n  2
для rp
mrp= 
1  rp2
n 1
;
Для коэффициентов регрессии
m Rxy   r

x
; m Rxy   y
y
x
Используя
величины
статистических
ошибок,
определяют
достоверность выборочных коэффициентов корреляции и регрессии:
критерий достоверности коэффициентов корреляций
tr 
r
mr
( V= n1+n2-2);
критерий достоверности коэффициентов регрессии
t Rxy 
t Rxy 
R xy
m Rxy
R yx
m Ryx
;
.
Величины корреляции и регрессии считаются достоверными, если они
превышают свои ошибки в определенное количество раз, зависящие
от размера выборки. Критерии достоверности сравнивают со
стандартами значений по таблице Стьюдента для установленного
числа степеней свободы и порога вероятности безошибочных
прогнозов (см. п.2.4).
3.7 Реальный и практический смысл показателей связи
Показатели связи имеют реальный смысл, если они
оказываются статистическими достоверными. Практическое же
значение они приобретают лишь тогда, когда имеют достаточную
величину.
Например,
коэффициент
корреляции
между
многоплодием свиноматок и энергий роста их потомства 0,25 
0,03 имеет вполне реальный смысл, так как он более чем в восемь
31
раз превосходит свою квадратическую ошибку (tp = 8,3). Однако
практическое значение этого показателя весьма невелико: он
свидетельствует, что всего 6%
общей вариации признака
2
2
(r =0,25 =0,06=6%) зависит от изменчивости другого, связанного с
ним признака; 94% составляют так называемую остаточную
вариацию, не зависящую от связи признаков между собой. Поэтому
строить практические расчеты на основании коэффициента
корреляции, значение которого не превышает 0,5, по меньшей
мере, ненадежно. Однако практическая значимость показателей
связи зависит от цели исследования, т.е. от того, с какой степенью
точности допустимы их вычисления и какова может быть их
величина в заданных условиях.
В ходе биологических исследований биометрические
величины показывают, какая доля общей вариации зависит от
взаимного влияния биологических признаков и какая – от
случайных причин.
4 Дисперсионный анализ
На развитие и формирование биологических оснований
особенностей животных влияет целый ряд различных факторов
генетической и негенетической природы. Математический метод, с
помощью которого можно установить долю влияния отдельных
факторов на величину результативного признака, называется
дисперсионным анализом. Этот метод нашел широкое применение
при решении ряда генетических вопросов, в том числе и при
вычислении коэфицента наследуемости. Он используется при оценке
производителей по качеству потомства.
Совокупность всех факторов, которые обуславливает величину
какого-либо результативного признака, составляют общую дисперсию
Су. Общая дисперсия расчленяется на ее слагаемые: факториальную
дисперсию Сх, вызванную организованными факторами, и случайную
дисперсию Сz, вызванную неорганизованными факторами.
Примером для дисперсионного анализа может быть следующая
задача: средний удой по стаду коров 1 отделения учхоза «Прогресс»
симментальской и черно-пестрой пород составляет 3000кг. Величина
удоя (результативный признак) детерминирована многими факторами,
составляющими случайную и факториальную дисперсию (рисунок 4).
32
Рисунок 4
Составив дисперсионный комплекс и сделав соответствующие
расчеты, и сделав соответствующие расчеты, представляется
возможным определить долю влияния каждого фактора на величину
удоя, т.е. установить, на сколько процентов фактор кормления,
содержания,
генотип
животных
(порода)
обуславливает
результативный признак.
При составлении дисперсионных комплексов необходимо
соблюдать следующие условия:
исследуемые
факторы
должны быть некоррелирующими. Нельзя брать, например, при
исследовании количества молочного жира, удоя и процентное
содержание жира в молоке. Независимые факторы - это порода
животных, уровень кормления, условия содержания и т.д.;
формировать группы животных для проведения исследований
нужно по методу случайного отбора.
4.1 Однофакторный комплекс
При изучении влияния одного кого-либо фактора на
результативный признак строят однофакторный дисперсионный
комплекс.
Влияющий фактор может иметь несколько градаций, т.е. в опыте
может изучаться несколько уровней интенсивности его действия.
Например, изучая действие белковой добавки в рационе свиноматок
на их многоплодие, можно установить четыре градации этого
фактора: первая группа- 0%, вторая- 5%, третья- 10%, четвертая – 15%
добавки переваримого протеина к суточному рациону сверх нормы.
Для каждой группы подбирают свиней по принципу аналогов. У
каждой особи, вошедшей в комплекс, измеряют результативный
признак, т.е. количество родившихся поросят. Для облегчения счетной
работы
многозначные
и
дробные
неудобные
величины
33
результативного признака можно преобразовать в удобные
малозначные и целые, таким образом:
- все значения признака можно умножить на одно и тоже число:
0,02*100=2 ; 0,03*100=3 и т.д., выполнив расчеты, а в конечный
результат внести поправку - разделить на это число;
- все значения признака можно разделить на одно и тоже
число;
- все значения признака можно уменьшить или увеличить или
уменьшить на одно и тоже число: 8-5=3; 6-5=1; 12-5=7 и т.д.
В среднюю арифметическую М в конечном результате вносят эту
поправку, т.е. прибавляют число 5 .
В данном случае исходные дисперсионного комплекса можно
представить в виде таблицы 5.
Таблица 5
Показатель
Градации
(добавки
рациону)
0
5
Количество особей
3
3
Результативный
8,10, 7,11,
признак
V 9
11
(многоплодие
свиноматок)
Преобразованный V 1,3,2 0,4,4
для
удобства
расчетов
путем
вычитания числа -7
фактора,% Число
протеина к градаций r=4
10
3
10,11,
10
15
3
8,9,
12
n= 12
∑V=116
3,4,3
1,2,5
∑Vпр=32
Расчеты однофакторного дисперсионного комплекса при
малочисленной выборке представлены в п.9.10 (алгоритм 10). Если
группы сформированы с большим количеством особей, то расчеты
дисперсионного комплекса будут несколько сложнее (см.п. 9.11).
При изучении статистического влияния различных факторов на
качественные признаки, которые не имеют числового значения и
располагаются в ранжированный ряд, используют непараметрический
показатель силы и достоверности влияния. Анализ такого комплекса
приведен в п.9.12.
34
4.2 Двухфакторный комплекс
При изучении влияния одновременно двух факторов на
результативный признак строят двухфакторный дисперсионный
комплекс. Условия построения двухфакторного комплекса те же, что
и однофакторного. При этом следует учитывать, что изучаемые
факторы, влияющие на результативный признак, должны быть
независимыми друг от друга. Изучая действия каждого фактора в
отдельности, необходимо учитывать их совместное влияние на
результативный признак.
Примером составления двухфакторного комплекса может быть
изучение влияния добавки травяной муки на многоплодие свиноматки
различных генотипов (пород). В качестве одного фактора тут
принимается уровень кормления, а в качестве другого - порода
свиней. Оба эти фактора независимы друг от друга, но вместе с тем
они оба оказывают влияние на результативный признак - многоплодие
свиноматок.
По первому фактору можно внести две градации: - рацион без травяной муки (0%) и рацион, содержащий 25 % травяной муки по
питательности. Второй фактор - это порода. Можно испытывать
добавку травяной муки на свинопоголовье крупной белой породы и
породы дюрок.
Общую
схему
изначальных
данных
дисперсионного
двухфакторного комплекса можно представить в виде таблицы 6.
Таблица 6
Первый фактор Второй фактор В Количество
А - порода
–
структура животных
рациона
группах
Крупная белая А1
Дюрок А2
В1 – рацион без
травяной муки
В2 – 25 % травяной
муки в структуре
рациона
В1 – рацион без
травяной муки
В2 – 25 % травяной
муки в структуре
рациона
2
Результативный
в признак
V
–
многоплодие
свиноматок
9, 12
2
11, 13
2
8,12
2
10,123
Для удобства расчетов величины
результативного признака
можно преобразовывать
в удобные для счета. Анализ двух
35
факторного дисперсионного комплекса показан в п.9.13 (алгоритма
13).
4.3 Достоверность детерминации факторов
Достоверность влияния отдельных факторов на величину результативного признака определяют по преобразованному критерию
Фишера:
F
 1  r  1 
 x2
2
2

F

при x  z ,
st
2
 z
 2  n  r 
где F - эмпирический критерий достоверности силы влияния;
Fst - стандартное значение критерия Фишера;
ν1,ν2- степени свободы, по которым в таблице находят стандартные
значения критерия Фишера;
2
σ x, σ2z - выборочные вариансы (девианты).
При двухфакторном комплексе берут σ2i вместо σ2x, т.е. вариансу
конкретного фактора. Если значение σ2z больше σ2x т.е. случайная
дисперсия больше факториальной, то конструкция критерия Фишера
будет иметь вид
в F2 
  n  r 
 z2
2
2
 Fst  1
при x  z .
2
 I
 2  r  1
Сопоставление эмпирического критерия с его стандартными значениями может иметь два принципиально различных результата:
1) влияние недостоверно.
Эмпирический критерий не
достигает своего стандартного значения. Однако делать заключение,
что это подтвердится на генеральной совокупности, не всегда
оправдано. Следует сделать анализ по обратному отношению
 2z
F2  2 ;
 x
2) влияние достоверно. Эмпирический критерий (прямой)
равен или превышает свое стандартное значение критерия Фишера с
требуемой вероятностью. Это означает, что изучаемый фактор влияет
на результативный признак. Достоверность влияния по обратному
критерию подтверждает с определенной вероятностью
малое
36
влияние фактора или достоверное
результативному признаку.
сходство
градации
по
5 Статистический анализ наследуемости и повторяемости
Развитие и степень выраженности отдельных полезных для
хозяйства и биологических признаков у животных зависят от
наследственной природы и конкретных условий среды обитания.
В практике животноводства известно, что изменчивость одних
признаков в большей мере зависит от условий внешней среды (удой,
упитанность, живая масса и др.), а других - в меньшей мере
(зкстерьер, конституция, жирномолочность, масть и др.).
Следовательно, одни признаки в меньшей степени подвержены
наследственной детерминации, а другие – в большей степени.
В селекционной работе важно знать, насколько стойко, даже при
некоторых изменениях внешней среды, будут передаваться
желательные особенности родителей их потомству. Если величина
признака стойко передается по наследству, то такой признак легко
селекционируется. Отбор можно вести по фенотипу, т.е. осуществлять
массовую селекцию.
Для определения статистической доли влияния наследственности
на величину развития признака вычисляют коэффициент
наследуемости.
5.1 Коэффициенты наследуемости и способы их вычисления
Коэффициент наследуемости h2 характеризует генетическую
изменчивость признаков и показывает, какая доля общей
изменчивости признака обусловлена наследования.
Коэффициент наследуемости - это мера наследственности,
которая реализуется через механизм наследования. Наследуемость это величина всего генетического разнообразия, обусловленного
аддитивным действием генов, доминированием и эпистазом.
Коэффициент наследуемости колеблется от 0 до1. Чем больше
количественный признак обусловлен генетической изменчивостью,
тем выше коэффициент наследуемости, и тем более устойчив этот
признак к воздействию внешней среды.
Коэффициент наследуемости вычисляют разными способами в
зависимости от используемой первоосновы.
При определении показателей наследуемости, основанных на
методе прямолинейной корреляции, используют следующие формулы.
37
h2= 2rм/д
применяется, если признак учитывается у животных одно пола;
коэффициент корреляции используется между признаками матерей и
дочерей.
h2= rр/п формула для признаков, учитываемых у обоих родителей;
коэффициент корреляции между родителями и потомками.
h2=4rп/с
используется, когда признаки матерей неизвестны, а имеется только
сведения об отцах; коэффициент корреляции вычисляют между
полусибцами (полубратья, полусестры).
При неодинаковой степени отбора среди родителей и детей
показатели разнообразия признака резко различаются. Тогда
целесообразно пользоваться формулой
h2=2Rд/м
Преимущество формул с использованием коэффициента
прямолинейной регрессии в том, что h2 не реагирует на изменение
всех видов генетической информации, получаемой от родителей.
Часто
при
использовании
формул
с
учетверенным
коэффициентами корреляции получают биологически абсурдные
значения коэффициента наследуемости - отрицательные или
превышающие единицу.
Причины получения абсурдных величин h2 могут быть
следующими:
- недостаточный объем выборки;
- взаимодействие генов со средой, что приводит к
отрицательному коэффициенту корреляции между родственниками;
- межаллельные взаимодействие генов, доминирование,
сверхдоминирование, эпистаз, оказывающее более сильное влияние на
признак, чем аддитивное действие генов;
- популяции родителей не является случайной выборкой.
Рассмотрим
примеры
вычисления
коэффициентов
наследуемости.
38
Пример 1
В учхозе «Прогресс» на маточном поголовье КРС вычислена
теснота зависимости между удоями коров- матерей и коров- дочерей,
которая составила
r =0, 13. Следовательно, коэффициент наследуемости
h2= 2r м/д= 2*0,13=0,26 (наследуемость удоя низкая).
По показателю жирномолочности коэффициент корреляции
r=0,27, а коэффициент наследуемости h2 =0,54 (наследуемость
средняя).
Коэффициент корреляции между живой массой родителей и
потомков равнялся 0,15. Этот признак учитывается у обоих
родителей, тогда коэффициент наследуемости
h2=rр/п= 0,15.
Имеются методы вычисления коэффициента наследуемости,
устраняющие получение его абсурдных показателей.
Широко используется формула, основанная на явлении
регрессии, где учитывается среднее показатели продуктивности
лучших и худших животных- дочерей и матерей
h2=М дочери лучшие- М дочери худшие
М матери лучшие- М матери худшие *2,
где М – средняя продуктивность группы лучших или худших
дочерей и матерей.
Например, удой группы молодых коров, полученных от
высокоудойных матерей в учхозе « Прогресс», составил в среднем
3790 кг, удой их матерей- 4405 кг. Дочери худших коров имели в
средний удой 3600 кг, а их матери 2944 кг. Поставив данные в
формулу, получим
h2=
3790  3600
* 2  0,26
4405  2944
Коэффициент наследуемости можно вычислить также по формуле
h2=
dппотомко
dрродителе
39
где d потомков - среднее превосходство потомков по данному
признаку над всеми средними показателями стада; d родителей среднее превосходство обоих родителей над всеми средними
показателями стада.
Пример 2
Средняя живая масса свиней крупной белой породы в возрасте
одного года по свиноферме учхоза « Прогресс» составила 148 кг.
Живая масса лучших молодых животных равнялась 160кг, а средняя
живая масса их родителей в этом возрасте - 188 кг.
Отсюда h2 =
160  148 12

 0,3 .
188  148 40
Для определения коэффициента наследуемости используют
также дисперсионный анализ. Основной показатель влияния такого-то
фактора и есть показатель наследуемости. Отсюда вытекает
следующая формула
h2=
Ñõ
  õ2 .
Ñó
В данном случае факториальная дисперсия будет показывать,
какова доля влияния, скажем, быка - производителя на величину
продуктивности его дочерей, если известно, что величина удоя
обуславливается многими факторами- наследственностью матерей,
условиями содержания и т.д.
В селекционной работе коэффициент наследуемости применяется
прежде всего для выбора методов селекции. При низкой (h2‹ 0,4)
наследуемости следует проводить индивидуальный отбор, используя
метод оценки производителей по качеству потомства. Если
наследуемость признака высокая (h2>0,6), можно проводить массовый
отбор. При этом влияние внешних факторов на изменение величины
признаков менее существенное
Однако генетическая структура популяции и особенности
средовых факторов оказывает влияние на величину h2. Поэтому одним
и тем же признакам h2 в разных стадах может сильно измениться. Это
следует учесть селекционеру. Показатели величины h2 имеют
реальное значение только для данной конкретной популяции. Чем
более генетически однородна популяция, тем ниже коэффициент
наследуемости.
40
Известно и то, что одни организмы более устойчиво сохраняют
величину наследуемости при изменении паратипических факторов, а
другие - менее устойчиво. Эту сторону взаимосвязи наследуемости и
среды характеризует повторяемость.
5.2 Коэффициенты повторяемости и способы их вычисления
Повторяемость - это способность организма удерживать свои
показатели на определенном уровне при постоянстве факторов среды,
а при изменении условий- сохранять свое ранговое место в сравнении
с другими животными. Повторяемость и наследуемость связаны
между собой. Чем выше повторяемость, там выше наследуемость.
Мерилом повторяемости является коэффициент повторяемости П. Он
позволяет судить о той части различий между животными, которая
остается устойчивой во все время их племенного использования.
Рассмотрим пример.
В учхозе «Прогресс» молочное стадо представлено двумя
породами - черно-пестрой и симментальской. При вычислении
коэффициента h2 и П по удою и жирномолочности установлено, что
разные породы по разному реагируют на изменение условий среды.
Отмечено также, что коэффициент повторяемости был выше по
жирномолочности, чем по удою, что обусловлено более высокой
изменчивостью удоя под влиянием факторов среды (таблица 7).
Таблица 7
Порода
Число
лактаций
Удой
П
0,252
0,429
n
Черно-пестрая
5
Симментальская 5
h2
0,12
0,26
Содержание
жира
в
молоке
П
h2
0,460
0,29
0,539
0,37
Коэффициент вычисляем по формуле
П=
h2n
,
1  (n  1)r
где h2- коэффициент наследуемости за один учетный год;
r – коэффициент корреляции;
n - число определений признака (число лактаций).
41
Определить коэффициент повторяемости можно также с
использованием коэффициентом корреляции между двумя смежными
показателями, а также коэффициента корреляции по Спирмену:
П=
V V
V  n
(Vx)
(Vy)
V  n  V  n
x
2
x
y
2
2
x
2
и П= 1 
2
y
6 d 2
n(n 2  1)
При
использовании
данных
дисперсионного
коэффициент повторяемости можно вычислять по формуле
П=
.
анализа
 A2
.
 A2   z2
Коэффициенты h2 и П широко применяются при расчетах
эффективности селекции.
5.3 Селекционный дифференциал и селекционный эффект
Селекционный дифференциал и селекционный эффект являются
основными показателями прогнозирования продуктивных качеств
животных при разведении и селекции.
Эффективность селекции зависит от многих факторов:
количества селекционных признаков, величины коэффициента
наследуемости, взаимосвязи между признаками, характера отбора и
др.
Селекционный дифференциал - это разница между средней
величиной признака у группы животных, отобранных для селекции
(племенное ядро), и средней величиной признака всего стада
(популяции)
Sd=M племядра - М популяции
Чем выше Sd, тем выше потенциал селекции.
Селекционный эффект показывает, насколько может измениться
(увеличиться) селекционируемый признак при соответствующей
организации отбора и подбора. При этом учитывается величина
наследуемости данного признака и время смены поколений. Интервал
между поколениями у КРС составляет 4-5 лет; у овец 4-4,5 года; у
свиней 2-2,5 года; у кур1,5 года; у лошадей 10-12 лет.
42
Sэ=
Sd h2
i
Рассмотрим пример использования данной формулы при
расчете эффекта селекции на стаде учхоза «Прогресс».
Данное стадо 1 отделения состоит из 400 коров. Средней удой на
корову равняется 3000кг. Однако в стаде имеется корова с высокими
удоями - 4000-5000кг молока и с низкими 1800-2000 кг. Цель
селекции - отбирать для дальнейшего воспроизводства стада
молодняк от высокоудойных коров. Поэтому лучших животных
выделяют племенную группу часть стада - племенное ядро. Схема
дифферинцировки показана на рисунке5.
Выход телят приносит 100%. Идеальные условия данной схемы
позволяют ежегодно обновлять стадо на 25%. Интервал смены
поколений составит 4 года. Коэффициент наследуемости h2=0,2.
При такой идеальной схеме отбора, когда не учитывается
браковка высокопродуктивных коров по болезням и другим
причинам, ежегодный прирост удоя при сохранении условий
кормления и содержания составит
Sd=3500кг-3000кг=500кг
Sэ=
500 * 0,2
 25кг
4
43
.ОТКОРМ
Рисунок 5
Однако выборка старых низкопродуктивных коров составляет
значительно меньший удельный вес, чем в данной схеме.
Селекционный эффект отбора в маточном стаде будет значительно
меньше. Вместе с тем более существенную роль в повышении
продуктивных качеств стада играют производители. За счет
производителей можно создать более высокий генетический
потенциал Sd. При одновременном учете влияния отбора и побора
селекционный эффект вычисляют по формуле
2

матерей  h S d отцов 
S
d
S  суммарный   iматерей  iотцов   2.


Если за стадом отделения закрепить быка – производителя улучшателя, удой его дочерей превышает удой матерей на 200кг,
следовательно, Sd отца =200кг.
Подставив данные в формулу получим
 500  0,2 200 

 2  41кг
3,5 
 4
Sэ = 
44
Предложенный метод расчета эффекта селекции не исчерпывает
всех детерминант генетических изменений. Процессы, происходящие
в популяции при отборе и подборе, значительно сложнее. Только
творческий подход селекционера позволит получить поступательное
приращение величины продуктивных качеств животных.
6 Генетическая
изменчивости
структура
популяции
и
анализ
ее
В животноводстве под популяцией понимают группу животных
одной породы, имеющих фенотипические и генотипические различия
и размножающихся путем свободного скрещивания друг с другом.
Для характеристики генетической структуры породы или стада,
установления их родства и происхождения прибегают к изучению
частот фенотипов, генотипов и отдельных аллелей, обуславливающих
группы крови и полиморфные системы белков сыворотки крови,
молока и лимфы тканей животных.
6.1 Определение частот фенотипов, генотипов и аллелей
Частота фенотипа в популяции - это относительное (процентное)
количество особей, характеризующихся определенным фенотипом.
Определяют частоту фенотипов по формуле
А=
n
* 100% ,
N
где А- частота определенного фенотипа в популяции;
n
–
число
особей
популяции
определенного
фенотипа(признака);
N- общее число особей в популяции.
Пример: среди стада симментальского скота учхоза
«Прогресс» 112 коров красно-пестрой масти и 388 палево-пестрой.
Необходимо вычислить частоту фенотипов красно-пестрых и палевопестрых коров.
Частота красно-пестрых
А=
112
* 100  22,4%
388  112
45
Частота палево-пестрых
А=
388
* 100  77,6%
388  112
Сумма частот фенотипов должна быть рана единице или 100%.
Частота генотипа - это относительное число особей с
определенными генами (АА, Аа, аа), выраженное в процентах или
долях единицы от общего поголовья, составляющего целое (единицу и
100%).
Например, у КРС шортгорнской породы красная масть
обусловлена генами АА, белая - аа, чалая – Аа. В данном случае
расщеплению по фенотипу соответствует генотипам. В стаде,
состоящем из N= 1610 голов, обнаружено 640 красных, 860 чалых и
150 белых животных. Отсюда
640
 100 = 40 % (0,40);
1610
860
 100 = 51 % (0,51);
частота генотипа Аа =
1610
150
100  9 % (0,09).
частота генотипа аа =
1610
частота генотипа АА =
Зная частоты генотипов в популяции, можно установить
частоты аллелей. При двухаллельной системе частоты аллелей
вычисляют по формулам:
2n1  n3
2N
2
n
n
Частота аллели а qa= 2 3
2N
Частота аллели А р А=
Где р - частота аллели А;
q - частота аллели а;
n1 - число особей генотипа АА;
n2 - число особей генотипа аа;
n3 - число особей генотипа Аа;
N - общее число особей АА+Аа+аа.
При этом участвуют аллели А и А равна единице, т.е. р+q=1 (или
100%).
В тех случаях, когда гетерозиготы Аа фенотипические не
отличаются от доминантных гомозигот АА, частоту генотипов
аллелей вычисляют по формуле Гради - Вайнберга
р2+2рq+q2=1
46
(р2АА+2рq Аа+q2 аа=1)
Например, у кроликов белая окраска шерсти детерминированна
геном а и является рецессивной по отношению к серой,
контролируемой геном А.
В популяции из 200 животных 50 кроликов оказались белыми,
остальные серыми. В данном случае генотипы АА и Аа не имеют
фенотипических отличий, те и другие кролики будут серыми. Отсюда:
частота генотипа аа=
n
50
 100 
 100  25%(0.25) ;
N
200
частота аллели а=q= q 2  0.25  0.5;
частота аллели А= р= 1-q=1-05=0,5;
частота генотипа АА=р 2= 0,52=0,25;
частота генотипа Аа= 2рq= 2·0,5·0,5=0,5.
Выразив каждую величину в процентах, определяем
количество животных в популяции с генотипами АА, Аа и аа. Так,
доминантные гомозиготы АА составляют 25% от 200 голов, т.е. 50
кроликов, гетерозиготы Аа - 50% от 200 т.е. 100 кроликов.
6.2 Генетическое равновесие популяции
Генетическое равновесие популяции выражается формулой
Гарди-Вайнберга. Это означает, что если в свободно
размножающейся (панмиктической) популяции ген А встречается с
частотой р, а его аллель а - с частотой q при р+q=1, то в пером же
поколении устанавливается равновесие генотипов АА, Аа и аа.
Метод позволяет вычислить, соответствует ли фактическое
расщепление фенотипов и генотипов любой популяции
теоритически ожидаемому.
Например, изучая распространение безухости в популяции
карапульских овец, Б.Н.Васин по гену безухости установил
следующие соотношения генотипов: 729АА+111Аа+4аа. Следует
определить частоты аллелей фенотипов и генотипов и соответствие
фактических генотипов теоретически ожидаемым по формуле
Гарди-Вайнберга
Частота (фактическая) аллели А=р=
Частота (фактическая) аллеля а=q=
Частота генотипа АА=
2n1  n3 2  279  111 1569


 0.93 ;
2N
2  844
1688
2n2  n3 2  4  3 119


 0.07 ;
2N
2  844 1688
n1 729

 0.864(86.4%) ;
N 844
47
Частота генотипа аа=
n2
4

 0.004(0.4%) ;
N 844
Частота генотипа Аа=
n3 111

 0.132(13.2%).
N 844
В популяции частоты генотипов совпадают с частотами
фенотипов.
Расчет ожидаемых частот генотипов по формуле ГардиВайнберга начинают с рецессивных гомозигот. Если частота
генотипа аа= q2=0,004, следовательно, частота аллея, а= √
q2=0,004=0,063. Отсюда частота аллели А=р=1- q=1-0,063=0,973.
Частота гомозигот А= р 2=0,973=0,883.
Ожидаемые частоты генотипов будут следующими:
0,883 АА+ 0,113 Аа+0,004аа=1 или
88,3% АА+11,3% Аа+0,4% аа=100%,
а фактически частоты генотипов были
86,4% АА+13,2%Аа+0,4%аа=100% (844 гол.).
Таким образом, теоретически ожидаемые частоты генотипов
близки к наблюдаемым.
Рассмотрим вычисление генетического равновесия на
следующем примере.
У лошадей чистокровной верховой породы бывает носовое
кровотечение, обусловленное рецессивным геном а. Его
доминантный аллель А не вызывает носового кровотечения. На
конном заводе среди 5400 голов 17 лошадей оказались с носовым
кровотечением. Они погибли во время скачек. Необходимо
определить, сколько животных в этой популяции являются
носителями гена носового кровотечения, и каково вероятность
появления лошадей с носовым кровотечением в следующем
поколении при свободном спаривании фенотипические здоровых
животных?
2
n
17
 0,003(0,3%);
Частота генотипа q aa  
N 5400
2
частота аллеля qa  q  0,003  0,054;
частота аллеля рА= 1- q=1-0,054=0,946;
частота генотипа рАА=0,946 2=0,8949 (89,49%);
частота генотипа 2 рq Аа= 2*0,946*0,054=0,1021 (10,21%).
Следовательно, частоты генотипа по формуле Гарди-Вайнберга
будут следующими:
0,8949 АА+0,1221 Аа+0,003 аа или
48
89,49% АА без носителя носового кровотечения (4832 гол.);
10,21% Аа с носителями гена носового кровотечения (551 гол.);
0,3% аа больных животных (17 гол.).
Если проводить элиминацию животных с генотипом аа, то
структура популяции изменится. При этом число гетерозиготных
животных Аа- носителей гена носового кровотечения - составил:
n3= 0,1021*5400=551 гол. Количество гомозиготных животных
будет:
n1=0,89499*5400=4832 гол.
Частоты при изменении состава генов определяем по формулам:
рА=
2n1 n3 2 * 4832  551 10215


 0,9458(94,58%) ,
2N
2 * 5400
10800
р а=
2n2  n3 2 *17  551
585


 0,054(5,4%)
2N
2 * 5400
10800
Отсюда появление животных с генотипом аа, составит 0,0029
или 0,29%, что на 0,01% ниже, чем в предыдущем поколении
(таблица 8). Количество животных с носителем гена носового
кровотечения снижается до 9,66% против 10,21%
Таблица 8
♀
♂
А=0,9458
а=0,054
А= 0,9458
А=0,054
АА=0,8945
Аа=0,4830
Аа=0,4830
аа=0,0029
6.3 Определение генетического сходства популяций
При сравнении пород и популяций по сходству некоторых
аллелей эритроцитарных антигенов крови или полиморфным
белкам пользуются коэффициентом генетического сходства по
формуле Майяла и Линдстрема
r
 (x y )
x y
i
2
i
i
2
i
,
где xi, yi- частоты одноименных аллелей в сравниваемых
популяциях.
49
Чем больше r, тем больше степень генетического сходства
популяций.
Например, по данным Н.Н.Колесник и В.И.Соколова частота
встречаемости аллелей у черно-пестрого и голландского скота была
следующей:
Таблица 9
популяция
Чернопестрый
скот, xi
Голландский
скот, yi
Частота аллелей
Y
L
A
F
0,14
0,79
0,10
0,16
0,80
0,07
M
Z
0,28
0,05
0,53
0,13
0,02
0,40
Расчет данных для формулы производят по таблицы 10
Таблица 10
xi
0,14
0,79
0,10
0,28
0,05
0,53
∑ xi yi=0,9108
yi
0,16
0,80
0,07
0,13
0,02
0,40
x i yi
0,0224
0,6320
0,0070
0,0364
0,0010
0,2120
∑ xi2=1,0155
xi2
0,0196
0,6241
0,0100
0,0784
0,0025
0,2809
yi 2
0,0256
0,6400
0,0049
0,0169
0,0004
0,1690
∑ yi2=0,8478
Отсюда получаем:
r
0.9108
1.0155 * 0.8478
 0.9816  0.98 .
Сравниваемые популяции имеют большое генетическое
сходство, что указывает на общность их происхождения.
7 Инбридинг. Вычисление коэффициента гомозиготности
Инбридинг - родственное спаривание животных. Инбридинг
ведет к возрастанию гомозиготности потомков и разложению
50
популяции на ряд генотипически различных линий, вследствие чего
изменчивость
инбридируемой
популяции
возрастает,
а
вариабельность каждой относительной линии снижается.
Инбридинг в разных формах используют в селекции, так как с
его помощью можно выявить имеющиеся в популяции цепные
комбинации генов и закрепить их в потомстве. Отрицательное
последствия инбридинга- инбредная депрессия, ведущая к потере
ценных комбинаций генов, имевшихся у гетерозиготных предков.
Степень инбридинга зависит от степени родства спариваемых
животных. Определяют степень инбридинга по методу РейтаКисловского

F   0.5 1
n  n2 1
1  f à *100 ,
где F- коэффициент инбридинга (степень гомозиготности);
0,5- доля наследственности одного родителя, передаваемая
потомству; n1-ряд родословной, где встречается общий предок по
материнской стороне; n2- ряд родословной, где встречается предок
по отцовской стороне; fа- коэффициент инбридинга самого предка,
если он инбридирован; ∑- знак суммы, указывает, что данные по
каждому предку, на которого проведен инбридинг, суммированы.
Чем больше величина F, тем больше число генов у пробанда
(потомка) переходит в гомозиготное состояние.
В зависимости от степени родства спариваемых животных
различают инбридинг тесный (кровосмешение) F больше 25%;
Близкий =25,0…12,5%
Умеренный = 12,5…1,55%
Отдаленный меньше 1,55%
Гомозиготность пробанда можно оценить по его родословной
(упорядоченной записи всех известных предков изучаемого
животного на протяжении нескольких поколений).
Пример вычисления коэффициента гомозиготности для быка –
производите6ля Рубина 119 дан в таблицы 11.
51
Таблица 11
ОООО Индус
ООО
Наполеон I
МООО Диана
ОМОО Индус
МОО
Неделя
ООМО Неизвестный
ОММО Неизвестный
ММОО Венера
ОО Нарядный
ОМО Борис
ММО Марта
ОООМ Индус
ООМ
Наполеон I
МООМ Дина
ОМОМ Игрок
ММОМ Ева
МОМ
Малютка
ОМ Надежда
ООММ Борис
ОММ Дубок
МОММ Вишня
ОМММ Борис
ММ
Девчурка
ММММ Бонна
ММ Летопись
О
Рыжик
МО
Земляничка
МОМО Неизвестная
Лия
МММО Неизвестная
М
Степень родства III-III на Наполеона I и IY, IY-III на Бориса.

F   0,5
3 31
 0,5
4  31
100  0,03  0,015100  4,5% .
Полученный коэффициент гомозиготности свидетельствует о
том, что при данной степени родственного спаривания в
родословной Рубина 119 гомозиготность возросла по сравнению с
исходным поколением на 4,5 %.
8 Селекционные индексы производителей
Математические методы в селекции животных дают
значительные возможности для оценки племенных качеств
производителей. В специальной литературе имеются различные
методы для определения препотентности. Одни из них характеризуют
препотентность по индивидуальному сходству дочерей производителя
с их матерями, другие по степени однородности потомства, по
улучшающей препотенции. Многие из них давая количественную
52
характеристику препотентности, не дают чёткой градации
препотентности по категориям племенной ценности.
Вместе с возможностью применения для оценки племенной
ценности производителей по известным ранее методам, предлагаем
методику определения племенной ценности производителей по
индексу племенной ценности, который сочетает в себе вместе с
простотой расчёта и улучшающую препотенцию, и характеристику
однородности потомства, и даёт качественную градацию категорий
племенной ценности производителей.
ИПЦ=
Д М
Д
где Д – выраженность признака у дочерей;
М – выраженность признака у матерей в том же возрасте;
Д – среднее квадратическое отклонение признака в группе
дочерей.
Здесь числитель (Д-М) характеризует улучшающий эффект
производителя, а знаменатель (Д) – амплитуду изменчивости
признака в натуральных величинах. Чем больше улучшающий эффект
производителя и чем меньше изменчивость признака у дочерей
(потомки более однородны), тем выше индекс племенной ценности
производителя. В случае когда ИПЦ равен или больше единицы, т.е.
дочери превышают матерей по развитию признака на одну сигму и
более, то производителя считаем препотентным улучшателем. ИПЦ
менее единицы до 0,4 характеризует производителя как улучшателя
широкоамплитудного, что вытекает из следующих расчетов: согласно
инструкции по оценке баранов по качеству потомства разница в
средних показателях между потомством отдельных баранов и
потомством всех проверяемых баранов может считаться достоверной
только в том случае, если она не менее чем в 2 раза превышает свою
ошибку (Д-М  2m), т.е. когда критерий достоверности разности (td)
равен 2 и более. Ошибка средних показателей (m) рассчитывается по
формуле:
m

n
,
где  - среднее квадратическое отклонение признака;
n – количество потомков при оценке.
53
Из формулы следует, что при количестве потомков при оценке
равном в среднем 25 среднее квадратическое отклонение  = 5m, тогда
индекс племенной ценности улучшателя 1 > ИПЦ  0,4 характеризует
его как улучшателя широкоамплитудного.
Индекс племенной ценности производителя менее 0,4 и до 0
характеризует его как нейтрального, и меньше 0 – как ухудшателя.
Значение индекса племенной
ценности
ИПЦ  1
1 > ИПЦ  0,4
0,4 > ИПЦ  0
ИПЦ < 0
Категория племенной ценности
производителя
Улучшатель препотентный
Улучшатель широкоамплитудный
Нейтральный
Ухудшатель
9 Алгоритмы биометрических расчетов на примерах
зоотехнической и ветеринарной практики
9.1 Алгоритм 1. Вычисление М, σ, СV, m, tm, td для малых
выборок и обоснование полученных результатов
Пример. В учхозе «прогресс» разводят свиней нескольких
пород- крупную белую, дюрок, ландрас, украинскую степную
белую. Всего в хозяйстве 87 свиноматок крупной белой породы, 26
дюрок, 18 ландрас, 7 украинской степной белой. Каждая
свиноматка любой породы характеризуется определенным уровнем
продуктивности по многоплодию, крупноплодности, молочности и
другим показателям. Вместе с тем существуют и породные
различия. Для того чтобы определить средний уровень
продуктивности по каждой породе, однородная или разнородная
данная порода по показателю продуктивности, достоверна ли
разница между средними показателями различных пород, нужно
провести расчеты по данным отдельных выборочных групп
интересующих нас пород. Можно взять выборки по 5 голов. Схему
проведения опыта и алгоритм расчета по многоплодию свиноматок
можно представлять следующим образом:
54
Крупная белая порода
Дюрок
N1=87 гол. генеральная
совокупность
N2=26 гол. генеральная
совокупность
n2=5 гол.
выборка
n1=5 гол.
выборка
?
M1; σ1; CV1; m1; tMr; td P ; M2; σ2; CV2; m2; tM2
n1=5
V1
многоплодие
12
9
10
V1
многоплодие
13
15
1
2
3
n1=5
4
5
V1 2
n2=5
V2
V2 2
144
81
100
V1 2
1
2
3
n2=5
11
13
7
V2
121
169
46
V2 2
169
225
4
5
9
7
81
49
∑ V1=59
V
M 
n
1
1
1
С  V
1
1

47
 9,4гол.
5
1
n
5
47  469  441,9  27,1
 469 
2
C   22,8  2,38гол.
5 1
n 1
2,38

CV   100  11,8  100  20,2%.
M

2
∑ V22=469
2
C
1
V
n
2
 V   719  59  719  696,2  22,8

1

∑ V2=47
M2
59

 11,8гол.
5
2
2
∑ V12=719
2
5

1
1
2

27,1
 2,6гол.
5 1

2,6
100  27,7%
9,4
1
1
1
CV
55
2
m 
1

n 1

1
2,38
5 1
 1,19гол.
m
2
tM1 
M
m
1
1

11,8
 9,9
1,19

tm
2

2,6
 1,3гол.
5 1
9,4
 7,2
1,3
P > 0,99
ν=n1-1=5-1=4 по Стьюденту P>0,999.
td 
M1  M 2
m m
2
1
2
2

11,8  9,4
1,19  1,3
2
2

2,4
1,42  1,69
 1,36 ;
ν= n1+ n2-2=5+5-2=8
Р<0,95 (это число находим по таблице Стьюдента по строке
числа степеней свободы- 8 и графе t1)
Вывод: среднее многоплодие свиноматок крупной белой
породы составляет 11,8 голов, что на 2,4 головы больше, чем
породы дюрок - 9,4 голов. Крупная белая порода является более
однородной по этому показателю продуктивности: СV=20,2%, а
порода дюрок – более изменчивой: CV=27,7%. Выборочные
совокупности достоверно отражают генеральные, т.е. полученные
данные на малом числе животных (n=5), и в сущности отвечают тем
данным, которые были бы получены на всем поголовье
исследуемых пород. Однако разница по многоплодию между
породами не является достоверной, т.е. у нас нет оснований
утверждать, что при повторных исследованиях свиноматки крупной
белой породы всегда будут более многоплодны, чем свиноматки
породы дюрок.
9.2 Алгоритм 2. Вычисление М и σ для больших выборок
путем построения вариационных рядов способом произведений
Пример. В учхозе «прогресс» 475 коров симментальской
породы. Необходимо определить среднее содержание жира в
молоке по этому стаду и силу изменчивости признака.
Для решения задачи удобно взять часть животных (выборку)
из стада и на их показателях вычислить биометрические параметры
в такой последовательности:
1) данные содержания жира по каждой корове
56
3,72
3,56
3,87
3,34
3,92
3,51
3,32
4,13
3,68
3,59
3,29
3,31
3,81
3,51
3,89
3,12
3,44
3,63
3,98
3,55
3,67
3,75
3,56
4,00
4,14
4,09
3,90
3,90
3,93
4,58
3,70
4,35
3,84
3,99
4,25
3,86
4,56
3,72
3,93
3,88
4,23
3,60
4,20
3,83
4,15
3,92
4,00
3,67
4,04
3,99
3,99
4,36
4,46
4,20
4,00
4,09
3,60
3,57
4,00
3,46
3,88
3,87
4,05
4,16
3,67
3,95
4,23
3,59
4,33
3,97
3,94
3,71
5,02
4,30
4,37
2) подсчитываем количество вариант (размер выборки) n=75
гол.;
3) находим минимальную и максимальную варианту:
min V= 3.12%;
max V= 5.02%;
4) вычисляем размах изменчивости- лимит:
Lim= max V- min V=5.02%-3.12%=1.9%;
5) устанавливаем количество классов (лучше брать 10) и
определяем величину классового промежутка
i=
lim 1.9

 0.19  0.2 ;
10 10
6) строим рабочую решетку и заполняем ее строки и графы
(таблица 12)
Таблица 12
W-классы.
Начинается от
min
V
и
заканчивается
max
V
с
промежутками
i
3,10-3,29
3,30-3,49
3,50-3,69
3,70-3,89
Р-частоты,
значение каждой
варианты
заносим
в
соответствующий
класс
аРа
отклонения
данного
класса от
модального
Ра2
2
5
15
14
-4
-3
-2
-1
А 3,90-4,09
4,10-4,29
21
9
0
1
32[2(4)2]
45
60
14
0
9
57
-8(2-4)
-15
-30
-14
Σ=-67
0
9
4,30-4,49
4,50-4,69
4,70-4,89
4,90-5,09
(или выше)
6
2
0
1
2
3
4
5
12
6
0
5
Σ=32
∑Ра=35
∑Р=75
24
18
0
25
∑Ра2=2
27
7) вычисляем условное среднюю величину:
1
2
1
2
Аф=А1  i  3.90  0.2  4.0%.
При дискретной изменчивости (прерывное варьирование)
пользуются формулой
Аф =
A1  A2
,
2
где А1 и А2 – значения первой и второй границ модального
класса;
8) вычисляем поправку к условному среднему
b
Pa  35

 0.46. ;
n
75
9) определяем среднюю арифметическую
M=Aф+b·i=4,0+(-0.46)·0.2=3.91%;
10) вычисляем силу – силу изменчивости
 
Pa 2
227
 b2  i  
 (0.46) 2  0.2  0.33%
n
75
CV, m и tM вычисляют по формулам, приведённым в пункте 9.1.
Решение данной задачи можно выполнить другим способом –
способом сумм. Алгоритм данного способа рассмотрим на этом же
примере. Первоначальная последовательность операций алгоритма
способом сумм та же, что и способом произведений.
58
9.3 Алгоритм 3. Вычисление М и σ для больших выборок
способом сумм
W
3,10-3,29
3,30-3,49
3,50-3,69
3,70-3,89
А 3,90-4,09
4,10-4,29
4,30-4,49
4,50-4,69
4,70-4,89
4,90-5,09
P
2
5
15
14
21
9
6
2
0
1
p1=67
2
7
22
36
0
18
9
3
1
1
p2=42
2
9
31
0
14
5
2
1
ΣP=75
q1=32
q2=22
p1 и p2 – суммы накопленных частот отрицательной части первого и
второго рядов суммирования; q1 q2 – то же положительные части.
1. Определяем величину S1 (ΣPa):
S1=q1-p1=32-67=-35/
.
2. Вычисляем поправку к условной средней:
b
S1  35

 0.46.
n
75
3. Условную
среднюю
и
среднюю
арифметическую
определяем способом произведений (см. пункт 9.2)
M=Aф+b·i=4,0+(-0.46)·0.2=3.91%.
4. Определяем величину S2 (ΣPa2)
S2=p1+p2+2(q1+q2)=67+32+2(42+22)=227.
5. Вычисляем сигму
 
S2
227
 b2  i  
 (0.46) 2  0.2  0.33%
n
75
9.4 Алгоритм 4. Оценка различий между эмпирическим
распределением и теоретическим: критерий хи-квадрат
Пример. Требуется оценить сравнительную эффективность
вакцины Ла-Сота по сравнению с Н как профилактических
препаратов при инфекционных заболеваниях (чуме кур). При
испытании 35 голов получали вакцину Ла-Сота (опытная группа), а
59
50 голов получали вакцину Н ( контрольная группа). В опытной
группе заболело 10 голов, а 25 остались здоровыми. В контрольной
группе заболело 20, а здоровыми остались 30. Предполагаем, что
вакцина Ла-Сота является более эффективной, чем вакцина Н.
Следует доказать или опровергнуть это предположение (нулевую
гипотезу).
1. Подчитываем теоретические ожидаемые Е для заболевших и
здоровых птиц в опытной и контрольной группах (таблица
13).
Таблица 13
Теоретически
ожидаемых (Е)
Наблюдаемых
(О)
Теоретически
ожидаемых (Е)
Число здоровых птиц
Всего
птиц в
группе
Наблюдаемых
(О)
Группа птиц
Число заболевших
птиц
Опытная
Контроль
ная
10
12,35(Е1)
25
22,65(Е2)
35
20
17,65(Е3)
30
32,35(Е4)
50
Итого
30
30
55
55
85
Е1 =
35  30
 12,35 ;
85
Е3 =
50  30
 11,7 ;
85
Е 2=
Е4 =
2. Вычисляем значение хи-квадрата:
2
1

O  E   2 
2  
;
E
60
35  55
 22,65;
85
50  55
 32,35. ;
85
2
2
2
1
1
1



10  12,35  2 
25  22,65  1
20  17,65  2 
2 



12,35
22,65
17,65
2
1

30  32,35  2 
 0,73.
32,35
3. Находим число степеней свободы для четырёхпольной
таблицы:
ν=(r-1)·(с-1)=(2-1)·(2-1)=1
4. Сравниваем значение χ 2=0,73 со стандартным по таблице
(строка ν=1), где Р≥0,95(3,84), Р≥0,99(6,63), Р≥0,999(10,83).
Наш показатель меньше всех стандартных её значений в
строке
таблицы. Следовательно, считать, что вакцина Ла-Сота более
эффективна, чем вакцина Н, нет оснований.
9.5
Алгоритм
5.
Вычисление
коэффициентов
фенотипической корреляции и регрессии, их ошибок и
достоверности для малочисленных групп и обоснование
полученных результатов
Пример. Следует установить: оправданно ли вести отбор коров
по величине удоя, не учитывая жирномолочности; существует ли
между этими признаками взаимосвязь? Для решения этой задачи
методом случайного отбора из стада коров учхоза «Прогресс»
вычленена группа исследуемых животных. Параметры их
продукции даны в таблице 14.
61
Белка
Норка
Алиса
Майка
Сливка
Соя
Синька
Берёзка
Ария
Коровы
Показатель
Полянка
Таблица 14
Продолжение таблицы 14
4865
4520
3,7
3,7
4700
3900
5100
3,6
3,9
4600
3,6
3390
4,0
4100
4250
3,7
3,8
3840
4,1
Удой х
3,7
Содержание
жира у, %
n=10
1. Для удобства расчетов многозначные варианты сокращаем в
100 раз, а остаток округляем (3840/100=3,8).
2. Строим расчетную таблицу 15 и записываем в нее варианты
первого х и второго у признаков.
Таблица 15
15.5
13.60
15.58
15.91
0.09
0.36
0.36
-0.3
0.09
11.56
16.81
-0.6
4.0
3.8
0.3
3.4
4.1
Vx*
Vy
16.00
4.0
3.8
0.6
16.81
62
Числовая
разность
между
значениями
первого и d2
второго
рода
признаков
d=Vx Vy
14.44
3390
V y2
13.69
14.44
Vx2
18.48
4.1
Vy
3.7
3.8
Vx
4.3
4.1
Vy
4100
4250
3840
Vx
y
3.7
x
Преобразованные Значения
значения
признаков,
возведенных
в квадрат
x
y
2
 7,23
VxVy  162,99
3. Рассчитываем дисперсии:
Cx   V
 Vx   190,02  43,3  2,53;

2
2
x
n
2
10
V y   143,14  37,8  0,26;

2
Cy  V y
2
2
n
10
63
16.56
18.36
15.21
18.13
16.65
 143,14
 d  5,5
d
1.0
17.39
 190,02
2
2.25
0.64
1.0
 Vy  37,8
2
0
1.5
0
1.2
0.8
1.0
 Vx  43,3
Vx
Vy
1.44
1.0
12.96
15.21
13.69
13.69
24.01
22.09
20.25
13.69
15.21
12.96
21.16
26.01
3.6
3.6
3.9
3.7
3.7
3.7
4.6
5.1
3.9
4.5
4.7
4.9
3.6
3.6
3.9
3.7
3.7
3.7
4520
4700
4865
3900
5100
4600
Продолжение таблицы 15
 d   7,23  5,5  4,21.

2
Cd   d
2
2
n
10
4.Вычисляем коэффициент корреляции:
r
C x  C y  Cd
2 CxC y

2,53  0,26  4,21
2 * 2,53 * 0,26

 1,42
 0,88
1,62
Или
r
5.
VxVy 
Vx Vy 
n
43,3  37,8
 0,684
10

 0,84.
0,81
2,53  0,26
162,99 

CxCy
Вычисляем статистическую ошибку:
m
r

1 r
2
n 1

1
0,88  0,075.
2
10  1
6. Определяем критерий достоверности:
t
r

r
m

2
 0,88
 11,7
0,075
при числе   n  2  10  2  8 , по таблице Стьюдента находим P>0,999.
6. Вычисляем коэффициент регрессии:
 Vx  Vy
43,3  33,8
162,99 
 0,684
n
10
Rx | y 


 2,63;
2
2
0,25
2

Vy
37
,
8
143,14 
 Vy 
10
 Vx  Vy
43,3  37,8
 VxVy 
162,99 
0,684
n
10
Ry | x 


 0,27.
2
2
2,53

Vx
43
,
3
2
190,02 
 Vx  n
10
 VxVy 








64
Поскольку коэффициенты регрессии величины именованные,
их значения преобразуем на величину, применяемую для
сокращения ,-100:
Rx | y  2,63  100  263кг ;
Ry | x  0,27 : 100  0,0027%.
7. Вычисляем статистические ошибки:
V
m Rx / y  
2
x

V
(n  2)V
2
y
2
y
Vx2 
mRy / x  
( V x *  V y ) 2
(V x *  V y ) 2
V
(n  2)V
2
y
2
y
(162,99) 2
143,14

 0,0039 *100  0.39кг ;
(10  2) *143,14
190,02 
(162,99) 2
190,02

 0,0022  100  0,000022%.
(10  2) *190,02
143,14 
9. Определяем критерий достоверности:
t Rx / y 
t Ry / x 
Rx / y
m Rx / y
Ry / x
m Ry / x


263
 674,4P  0,999 ;
0,39
0,0027
 122,7P  0,999  .
0,000022
Вывод. Между величиной удоя и содержанием жира в молоке
коров учхоза “Прогресс” установлена сильная отрицательная
высокодостоверная корреляция. Коэффициент регрессии указывает,
что при такой селекции на каждый 1 кг повышения удоя содержание
жира будет снижаться на 0,0027%, или каждый один процент
снижения жира сопровождается повышением удоя в среднем по стаду
на 263 кг. Эти данные также являются статистически достоверными.
65
9.6 Алгоритм 6. Вычисление коэффициента регрессии для
многочисленных групп способом произведений путем построения
корреляционной решетки
Пример. Вычислим r и R между живой массой и обхватом
груди у коров симментальской породы, записанных в ХХУ том ГПК
по следующим данным:
735-216 680-206
500-180 650-212
494-188 575-200
494-196 615-202
597-208 697-211
443-191 591-205
770-206 515-187
860-215 615-200
470-180 675-210
560-194 598-205
635-195
601-200
570-194
685-208
533-195
593-592
590-204
713-200
590-202
725-205
610-200 670-212 680-207
555-194 610-200 615-198
570-197 612-202 675-201
695-200 690-216 580-197
640-200 555-198 705-202
670-205 785-215 540-196
560-197 625-197 650-205
645-201 563-195 663-210
655-202 670-197 670-199
600-200 680-204 735-210
600-205
645-210
625-204
625-205
590-197
680-210
590-192
635-203
600-203
660-202 828-210 654-206 520-190 560-197 630-197
715-206 582-193 687-197 590-200 605-200 685-211
750-201 634-192 715-206 653-203 625-200 678-205
674-198 760-202 640-200 670-204 660-210 553-190
659-195 840-218 750-208 695-210 527-192 600-193
566-188 736-208 686-203 667-205 670-208 680-202
821-216 787-210 730-207 597-197 666-205 615-194
643-196 745-206 600-202 578-192 645-205 740-210
650-198 864-214 642-198 532-192 573-197 600-194
637-204 732-206 721-206 645-203 620-195 670-201
1.Условно обозначаем признаки: х – живая масса, у – обхват
груди.
2. Подсчитываем количество вариант в выборке: n = 130.
3. Находим минимальные и максимальные варианты по
признакам х и у:
minVx = 443 кг;
maxVx = 864 кг;
minVy = 180 см;
maxVy = 218 см.
4. Вычисляем размах изменчивости по обоим признакам:
Limx = 864 – 443 = 421;
Limy = 218 – 180 = 38 см.
66
5. Определяем величину классового промежутка по обоим
признакам:
ix 
421
 42,1  40 кг;
10
iy 
38
 3,8  4
10
см.
6. Строим корреляционную решётку и заполняем ее графы и
строки (таблица 16)
7. Определяем границы классов по обоим признакам и вписываем
их в таблица 16.
8. Разносим попарно варианты признаков х и у в квадратики на
пересечении соответствующих классов.
9. Подсчитываем частоты по каждому классу обоих признаков и
определяем их сумму: Σ P = 130.
10. Выделяем модальные классы по признакам х и у (Ах и Ау).
11. Определяем отклонение от модальных классов (ах и ау).
12. По каждому классу обоих признаков подсчитываем
произведение P·а и определяем их алгебраические суммы:
Σ Pх ах = -46 и
Σ Pу ау = 9.
13. По каждому классу обоих признаков подсчитываем
произведение P а² и определяем их суммы:
14. Вычисляем сумму произведений частот на отклонения по
признакам х и у (Σ Рахау), для чего к каждой частоте каждого малого
квадрата подставляем множитель, перемножив отклонения ах на ау,
пересекающихся с данной частотой; а также перемножаем в каждом
малом квадрате частоту на множитель и определяем алгебраическую
сумму этих произведений по всей решетки:
I
II
III
IV
1 * 25 = 25
3 * (-2) = - 6
1 * -1 = -1
4*1=4
1 * 15 = 15
5 * (-1) = -5
5 * 2 = 10
1 * 20 = 20
1 * (-4) = -4
1*3=3
1 * 16 = 16
5 * 2 = 10
1 * 12 = 12
4 * 4 = 16
1*4 =4
1*6=6
2 * 9 = 18
1*8=8
4 * 6 = 24
1*3=3
2*3=6
1*9=9
1*6=6
2 * 15 = 30
7 * 4 = 28
1*4=4
67
7 * 2 = 14
1*8=8
6 * 2 = 12
1 * 16 = 16
3*1=3
1 * 20 = 20
∑ = 203
∑ = -15
∑ = -1
∑ = 147
∑Р ахау= ∑І + (-∑ІІ) + (-∑ІІІ) + ∑IV = 203 + (-15) + (-1) + 147 = 334.
15. Вычисляем поправки к условным средним:
 Px a x  46

 0,35 кг;
n
130
 Py a y
9
by 

 0,07 см.
n
130
bx 
Таблица 16
Px ax
Px a²x
216 219
212 215
208 211
204 207
200 203
196 199
192 155
188 191
ax
25
/1
Px
440
–
479
480
–
515
520
–
559
560
–
599
600
–
639
Ax
640
679
680
–
184 187
180 183
y/x
2
-5
10
50
4/
1
4
-4
16
64
8
-3
24
72
22
-2
44
88
26
-1
26
26
0
0
0
0
17
1
17
17
15
/1
20 16 12
/1 /1 /1
2/
2
6/
4
3/
2
6/
1
4/
7
2/
7
3
2/
6
1/
3
12
1
6
9
1/
5
2/
3
1/
5
8
4/
1
5
2
1/
4
2/
5
3/
1
68
4/
1
719
1
720
–
759
760
–
799
800
–
839
840
–
879
Py 2
Ay
Py
ay
Py
a²y
1
2/
5
4/
4
1
3/
1
6/
1
8/
1
11
2
22
44
4
3
12
36
16
/1
2
4
8
32
15
/2
20
/1
3
5
15
45
46
50
4
9/
1
8/
1
1
-5 -4
-4
10
16
50
5
18
20
0
26
17
6
4
13
-3
15
45
-2
36
72
-1
20
20
0
0
1
26
2
34
3
18
4
16
9
0
26
68
54
64
41
5
16. Вычисляем δ относительные:
 Px  a x
504  (0,35) 2
2
x  
 bx  
 1,9 ;
n
130
2
y  
 Py  a y
n
 by  
2
415
 0,07  1,7 .
130
17. Вычисляем коэффициент корреляции:
r
 Pa x a y  nbx b y
n x   y

334  130  (0,35)  0,07
 0,8 .
130  1,9  1,7
18. Вычисляем статистическую ошибку и критерий достоверности
корреляции:
mr  
1 r2
n 1

1  0,8 2
69
130  1
 0,03 ;
tr 
r
0,8

 27 ,
m r 0,03
P≥0,999.
19. Вычисляем коэффициент регрессии:
 x  ix
1,9  40
 0,8
 9;
 y  iy
1,7  40
 y  iy
1,7  4
r
 0,8
 0,09 см.
 x  ix
1,9  40
Rx / y  r
Ry / x
20. Вычисляем статистические ошибки и критерий достоверности
регрессии:
 x  ix
1,9  40
 0,03
 0,335 ;
 y  iy
1,7  4
 y  iy
1,7  4
  mr
 0,03
 0,07
 x  ix
1,9  40
m Rx / y   m R
m Ry / x
9.7 Алгоритм 7. Вычисление коэффициента генетической
корреляции и обоснование полученных результатов
Пример. Между удоем и содержанием жира в молоке у коров
учхоза “Прогресс” установлена определенная зависимость. Однако ее
величина зависит как от паратипических факторов, так и
генотипических. Коэффициент фенотипической корреляции не
вскрывает возможности эффективной селекции по сочетающимся
признакам. Для вычисления генетической корреляции первоначально
определяют фенотипические корреляции между учитываемыми
признаками родителей и потомков. Вычисленные фенотипические
корреляции по стаду учхоза представлены на рисунке 6.
Рисунок 6
70
Вычисляем коэффициент генетической корреляции:
rG 
rXДДY  rYДДX
rXДДY  rYДДX

 0,57  (0,49)
 0,88 .
0,47  0,7
Вывод. Коэффициент генетической корреляции между удоем
матерей и содержанием жира дочерей высокий. Следовательно, если
проводить отбор стада по удою, то жирномолочность будет также
изменяться. Факторы кормления и содержания не оказывают
существенного влияния на эту зависимость.
9.8 Алгоритм 8. Вычисление коэффициента корреляции
для альтернативных признаков
Пример. На свиноводческой ферме из 200 голов свиней 100 были
провакционированы против болезни Ауэски, остальные 100 остались
невакцинированными. Хозяйство являлось неблагополучным по этому
заболеванию, и в результате часть свинопоголовья заболела Ауэски
(таблица 17).
Таблица 17
Показатель
С прививкой
Без прививки
Количество животных
не заболевших заболевших
94 (Р1)
6 (Р2)
7 (Р3)
93 (Р4)
ΣΡ
Р1 + Р2 = 100
Р3 + Р4 = 100
Р1 + Р3 = 101 Р2 + Р4 = 99 П = Р1 + Р2 + Р3 + Р4 = 200
Необходимо установить, существует ли зависимость между
заболевшими и не заболевшими животными и вакцинированием
против Ауэски. Подставляем данные таблицы в формулу:
r
P1 P4  P2 P3
( P1  P2 )  ( P3  P4 )  ( P1  P3 )  ( P2  P4 )

94  93  7  6
100  100  101  99
 0,87 .
Числовое значение коэффициента указывает о наличии тесной
зависимости
между
вакцинированием
и
сохранностью
свинопоголовья.
71
9.9 Алгоритм 9. Вычисление коэффициента корреляции
рангов
Пример. В племенном заводе изучали зависимость густоты
спермы быков от их упитанности. Для этого семь быков –
производителей были ранжированы по двум признакам: от самого
плохого до самого лучшего по густоте спермы – первый ряд, во
втором ряду – их упитанность от наибольшей до наименьшей
(таблица 18).
Таблица 18
Быки
А
Б
В
Г
Д
Е
Ж
х
–
густота
спермы
у – упитанность
d
–
разность
рангов
d²
1
5
-4
2
4
-2
3
7
-4
4
6
-2
5
2
3
6
1
5
7
3
4
16
4
16
4
9
25
16
п = 7
голов
Σd² = 90
Вычисляем коэффициент корреляции рангов:
rp  1 
6d 2
6  90
 1
 1  1,61  0,61 .
2
7(49  1)
n(n  1)
Вывод. Между упитанностью производителей и густотой
продуцированной
ими
спермы
существует
отрицательная
зависимость. Следовательно, быки высокой упитанности дают сперму
худшего качества, чем быки средней упитанности.
9.10 Алгоритм 10. Дисперсионный анализ однофакторных
комплексов количественных признаков для малых групп и
обоснование полученных результатов
Пример. В учхозе “Прогресс” изучалось влияние возраста
свиноматок на их крупноплодность. Исследования проводилось на
свиноматках І, ІІ и ІІІ опоросов – три градиции фактора. В кахдой
группе было три свиноматки. В опыте учитывали среднюю живую
массу поросенка при прохождении по каждому гнезду.
Крупноплодность свиноматок составила по І опоросу 0,9 кг, І,І кг и І,0
кг, по П – І,І кг, І,І кг и І,3 кг, по Ш – І,0 кг, І,3 кг и І,4 кг (таблица 19).
72
Таблица 19
Возраст свиноматок
Обозначе опросах (градации)
ние
1
2
3
V
– 0,9;
1,1;
1,0;
значение 1,1;
1,1;
1,3;
признака 1,0
1,3;
1,4
V²
0,81; 1,21;
1,0;
1,21; 1,21;
1,69;
1,0
1,69
1,96
n
ΣV
3
3,0
3
3,5
3
3,7
в Число
градаций
r=3
Расчет
дисперсий
Факториальная
дисперсия
ΣV = 10,2
Cx = Σh – H =
= 11,64 – 11,56 =
0,06
ΣV²
11,78
n=9
Н=
V 2

n
2

10,2 

 11,56случайная
9
дисперсия
(ΣV)²
h= n
ΣV
M= n
(3)²:3 4,08
=3
(3:3) 1,16
=1,0
Σh = 11,64
Cz = ΣV² – Σh =
11,78 – 11,64 =
“М”
по 0,14
всем
Общая
животным дисперсия
= 1,13 кг
Су = ΣV² – H =
= 11,78 – 11,58
= = 0,22
4,56
1,23
Определяем долю влияния случайных и организованных факторов на
величину результативного признака и достоверность полученных
результатов (таблица 20).
Таблица 20
Показатель
С
Дисперсия
х – факториальная
z - случайная
0,08
0,14
η2-степень
73
у
общая
0,22
влияния фактора
C x 0,08

 0,36
C y 0,22
C z 0,14

 0,64
C y 0,22
1
на признак
36,0%
64,0%
100,0%
ν – число степеней
6
свободы
опыте
σ2- корректированная
 z2 
Cz
z

νх = r–1=3–1=2
νz = n–r = 9–3 =
r – число радиации
n – число ж–х в
 x2 
Cx
y

0,08
 0,04
2
0,14
 0,07
6
дисперсия (дивианта)
F-критерий
F
 2 x 0,04

 0,57
 2 z 0,07
достоверности
Стандартные табличные значения при νх = 2 и νz = 6:
t1 = 5,1 – P1 > 0,95; t2 = 10,9 – P > 0,99; t3 = 27,0 – P >0,999.
Вывод. С возрастом крупноплодность свиноматок незначительно
увеличивается, однако полученные данные в нашей выборке не
являются достоверными.
F = 0,57 < t = 5,1, т.е. Р < 0,95.
Для уточнения этого вопроса опыт необходимо повторить на большом
числе животных.
9.11 Алгоритм 11. Дисперсионный анализ однофакторных
комплексов количественных признаков для больших групп при
многозначных вариантах
Пример. В учхозе “Шевченковский” на стаде коров использовали
шесть быков-производителей линии Анас-Адема. Продуктивность их
дочерей характеризуется определенной изменчивостью. Необходимо
74
определить, оказали ли эти производители свое влияние на величину
удоя, или этот признак в большей мере обуславливается другими
факторами. Поскольку признак удоя имеет большое числовое
выражение, вычисление проводит по способу, изложенному в п.9.10,
не совсем удобно. В таком случае выстраивают классы по уровню
продуктивности, а количество животных, отвечающих по величине
удоя соответствующему классу, записывают в графу по градации
своего отца – быка-производителя. Быков производителей условно
обозначим А, Б, В, Г, Д, Е, (Таблица 21).
3
2
1
1
1
1
9
144
34003449
3
2
3
3
2
1
2
13
117
33503399
2
1
2
4
3
2
2
14
56
1
3
2
2
1
8
8
Р
Р
Р
1
1
Р
75
n
S
(na2)
3
75
Р
Расчет дисперсий
34503499
4
Р
Б
В
Г
Д
Е
Частота-Р/кол-во дочерей
Сx=Σh-ΣH=333.9-317.5=16.4 Сz=ΣS-Σh=400333.9=66.1
Сy=ΣS-H=400-317.5=82.5
Отклонение условное а
1
А
Число градаций r=6
Классы W
3500 и
выше
5
33003349
Градации-быки-производители
H=ΣPa/N=(126)2/50=317,5
Таблица 21
1
2
3
0
7
7
12
10
8
6
ΣS=400
N=Σn=50
ΣPa
25
21
29
23
13
15
Σpa=126
(Σpa)2 h=nA
nA
89.3 63.0 70.1 59.9 21.1 37.5
Σh=333.9
Факториальная варианса
δ2x=Cx/(r-1)=16.4/5=3.28
Случайная варианса
2
δ z=Cz/(N-r)=66.1/44=1.5
32503299
0
Показатель силы влияния η² = Сх/Су = 16,4/82,5 = 0,199 или 19,9%.
Критерий достоверности F = δ²x/ δ²z = 3,28/1,50 = 2,2.
Число степеней свободы νх = r – 1 = 6 – 1 = 5; νz N – r = 50 – 6 = 44
t – стандартное = 2,4 (Р > 0,95) – 3,5(P > 0,99) – 5 – 1(P > 0,999).
Вывод. Полученные данные оказались недостоверными (на грани
достоверности). Следовательно, величина удоя в большей мере
детерминирована другими факторами, а не наследственностью быков.
9.12 Алгоритм 12. Дисперсионный анализ однофакторных
комплексов качественных признаков и обоснование полученных
результатов
Пример. В зверосовхозе “Агроном” появляются животные с
пороком окраски меха – «красная вода». Для того чтобы выяснить,
является этот порок следствием кормового фактора или обусловлен
наследственностью, следует сделать дисперсионный анализ. Всего
хозяйстве оказалось 30 животных с разной степенью выраженности
этого порока. Все эти животные были ранжированы от самого слабого
до самого сильного проявления порока и распределены по пяти своим
отцам, причем каждый потомок, попавший в данную градацию,
сохранял свой ранг общего рада. Отцов условно обозначим А, Б, В, Г,
Д. Расчет проводим с учетом данных в таблицы 22.
76
Таблица 22
отцы
А
Б
В
Г
Д
Ранги детей (R)
2,17,20,21,23,25,28
1,3,8,12
16,19,22,14,30
4,5,6,7,9,10,11,14
13,15,18,26,27,29
n
7
4
5
8
6
N=30
ΣR
136
24
111
66
128
465
Σh=(ΣR)²/n
2642,3
144,0
2464,2
544,5
2730,7
8525,7
M=ΣR/n
19,4
6,0
22,2
8,2
21,3
N ( N  1)
 7207,5 ;
4
( N  1)  N ( N  1) 19  30  31
S

 2247,5 ;
12
12
H 
 2x 
 h  H 8525,7  7207,5

 0,59
S
2247,5
 2  ( N  1)   2 x  29  0,59  17 ;
или 59%;
P≥0,99;
  r 1  6 1  5.
Стандартное значение хи-квадрата соответствует 9,5 (Р ≥ 0,95) – 13,3
(Р ≥ 0,99) – 18,5 (Р ≥ 0,999).
Вывод. Установлено, что отцы достоверно различаются
генотипически по способности давать потомков с порочной окраской
меха. Следовательно, этот признак передаются по наследству,
поэтому производителей, дающих потомков с ярко выраженным
пороком по окраске меха, следует выбраковывать.
9.13 Алгоритм 13. Дисперсионный анализ двухфакторных
комплексов количественных признаков для малых групп
Пример. Многоплодие свиноматок в учхозе “Прогресс” зависит
от условий кормления, так и от принадлежности к породе. Для того
чтобы определить долю влияния этих факторов на результативный
признак, проводят научный опыт. Результаты этого опыта отражены в
таблице 23.
77
Таблица 23
2
11,17
8,11
9,13
6,12
3,6
4,8
В2
В1
В2
78
ΣV
n
Факторы
В1
Градации по
факторам ra=2 rb=2
Показатель
Техника расчета комплекса показана в таблице 24.
Таблица 24
Фактор А
А1
А2
Фактор В
А1
А2
M=ΣV/n
В2 – 25%
травяной
муки
2
h=(ΣV)2/n
2
(ΣV)2
В1
–
рацион
без
травяной
муки
Количество 2
животных в
опытных
группах
Результатив 10,15
ный признак
V
(многоплоди
е
свиноматок)
Преобразова 5,10
нное число
признака,
удобное для
расчетов (от
каждого
значения
отнимаем
число 5)
А2 – дюрок
В2 – 25%
травяной
муки
В1
–
рацион
без
травяной
муки
Второй
фактор В
–
структура
рациона
Первый
А1 – крупная белая
фактор А порода
4,8
2
2
ΣV 15
18
9
12
ΣV 225
324
81
144
162
40,5 72
Расчёт
η2
дисперсий
Cy=ΣV2-H= C y 65

1
=430-365=
C y 65
=65
Cz=ΣV2-Σh C z  44  0,68
C y 65
=430-386=
=44
Cy
Cx= Σh-H=
 0,32
=386-365=
Cx
=21
CA= Σha-H= C A  0,26
Cy
=382-365=
=17
νz=N-r=
=8-4=4
Cz
79
21
110
8
54
ΣHA
=
382
4
24
576
144
4
30
900
225
8
54
ΣHB
=
369
11
σ2
νA=ra-1=
=2-1=1
4
12,5
ν
νx=r1=4-1=3
1089 272
11,75
112
H=(ΣV)2/N=(54)2/8=365
Σh=386
h=(ΣV)2/n
2
33
441
N=Σn=8
2
4
13,3
25,10 36,144 9,36 16,
64
2
3,6
10,3
V2
n
6,12
11,8
5,10
ΣV2=430
V
ΣV=54
Продолжение таблицы 24
z
Cx
x
CA
A
F

44
 11
4

21
 5,25
4
 x2 5,25

 0,48
11
 z2

17
 17
1
 A2 17

 1,55
 z2 11
CB= Σhb-H=
=369-365=4
CB
 0,06
Cy
νB=rB-1=
=2-1=1
CAB=
=Cx-Ca-Cb=
=21-17-4=0
C AB
 0,0
Cy
νA·νB=
=1·1=1
CB
B
C AB
 AB

4
4
1

0
0
1
 B2 4

 0,36
 z2 11
2
 AB
0

0
2
11
z
Вывод. В выборочном комплексе результаты оказались не
достоверными. Опыт следует повторить на значительно большем
поголовье.
10 Математические таблицы стандартных значений
Стандартные значения критерия Стьюдента (t)
63,7
9,9
5,8
4,6
4,0
3,7
3,5
3,4
3,3
3,2
3,1
3,1
673,0
31,6
12,9
8,6
6,9
6,0
5,3
5,0
4,8
4,6
4,4
4,2
13
14-15
16-17
18-20
21-24
25-28
29-30
31-34
35-42
43-62
63-175
175-∞
P≥0,999
12,7
4,3
3,2
2,8
2,6
2,4
2,4
2,3
2,3
2,2
2,2
2,2
t3
P≥0,99
ν
t2
P≥0,95
t1
P≥0,999
t3
P≥0,99
1
2
3
4
5
6
7
8
9
10
11
12
t2
P≥0,95
ν-число
степеней
свободы
t1
2,2
2,1
2,1
2,1
2,1
2,1
2,0
2,0
2,0
2,0
2,0
2,0
3,0
3,0
2,9
2,9
2,8
2,8
2,8
2,7
2,7
2,7
2,6
2,6
4,1
4,1
4,0
3,9
3,8
3,7
3,7
3,7
3,6
3,5
3,4
3,3
10,8
26
80
P≥0,999
6,6
P≥0,99
3,8
ν
P≥0,95
P≥0,999
1
P≥0,99
ν
P≥0,95
Стандартные значения критерия χ² (хи–квадрат)
38,9
45,6
54,1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
6,0
7,8
9,5
11,1
12,6
14,1
15,5
16,9
18,3
19,7
21,0
22,4
23,7
25,0
26,3
27,6
28,9
30,1
31,4
32,7
33,9
35,2
36,4
37,7
9,2
11,3
13,3
15,1
16,8
18,5
20,1
21,7
23,2
24,7
26,2
27,7
29,1
30,6
32,0
33,4
34,8
36,2
37,6
38,9
40,3
41,6
43,0
44,3
13,8
16,3
18,5
20,5
22,5
24,3
26,1
27,9
29,6
31,3
32,9
34,5
36,1
37,7
39,3
40,8
43,3
43,8
45,3
46,8
48,3
49,7
51,2
52,6
27
28
29
30-31
32-34
35-36
37-38
39-40
41-42
43-44
45-46
47-48
49-50
51-55
56-60
61-65
66-70
71-75
76-80
81-85
86-90
91-95
96-100
100 и
выше
81
40,1
41,3
42,6
43,8
46,2
48,6
51,0
53,4
55,8
58,1
60,5
62,8
65,2
67,5
73,3
79,1
84,8
90,5
96,2
101,9
107,5
113,1
118,7
124,3
47,0
48,3
49,6
50,9
53,5
56,0
58,6
61,1
63,7
66,2
68,7
71,2
73,7
76,2
82,3
88,4
94,4
100,4
106,4
112,3
118,2
124,1
130,0
135,8
55,5
56,9
58,3
59,7
62,4
65,2
67,9
70,7
73,4
76,1
78,7
81,4
84,0
86,7
93,2
99,6
106,0
112,3
118,5
124,8
131,0
137,1
143,3
149,4
Стандартные значения критерия Фишера
νx
νz
3P≥0,95
P≥0,99
P≥0,999
1
2
3
167
34,1
10,1
148,5
30,8
9,6
141,1 137,1 134,6 132,9 131,8 130,6 130
29,5 28,7 28,2 27,9 27,7 27,5 27,4
9,3
9,1
9,0
8,9
8,9
8,8
8,8
129,5
27,2
8,8
4
74,1
21,2
7,7
47,0
16,3
6,6
35,5
13,4
6,0
29,2
12,3
5,6
25,4
11,3
5,3
22,9
10,6
5,1
21,0
10,0
5,0
19,7
9,7
4,8
18,6
9,3
4,8
61,2
18,8
6,9
36,6
13,3
5,8
27,0
10,9
5,1
21,7
9,6
4,7
18,5
8,7
4,6
16,4
8,0
4,8
14,9
7,9
4,1
13,8
7,2
4,0
12,3
6,9
3,9
56,1
16,7
6,6
33,2
12,1
5,4
23,7
9,8
4,8
18,8
8,5
4,4
15,8
7,6
4,1
13,9
7,0
3,6
12,3
6,6
3,7
11,6
6,2
3,6
10,8
6,0
3,5
48,2
14,7
6,0
27,0
10,1
4,7
18,5
7,9
4,1
14,2
6,6
3,6
11,6
5,6
33
10,0
5,3
3,1
8,9
4,9
2,9
8,0
4,5
2,9
7,4
4,3
2,8
5
6
7
8
9
10
11
12
4
53,4
16,0
6,4
31,1
11,4
5,2
21,9
9,2
4,5
17,2
7,9
4,1
14,4
7,0
3,8
12,6
6,4
3,5
11,3
6,0
3,5
10,4
5,7
3,4
9,6
5,4
3,3
5
51,7
15,5
6,3
29,8
11,0
5,1
20,8
8,8
4,4
16,2
7,5
4,0
13,5
6,6
3,7
11,7
6,1
3,5
10,5
5,6
3,3
9,6
5,3
3,2
8,9
5,1
3,1
82
6
50,5
15,5
6,2
28,8
10,7
5,0
20,0
8,5
4,3
15,5
7,2
3,9
12,9
6,4
3,6
11,1
5,8
3,4
9,9
5,4
3,2
9,1
5,1
3,1
8,4
4,8
3,0
7
49,8
15,0
6,1
28,2
10,5
4,9
19,5
8,3
4,2
15,1
7,0
3,8
12,5
6,2
3,5
10,8
5,6
3,3
9,6
5,2
3,1
8,8
4,9
3,0
8,1
4,7
2,9
8
49,0
14,8
6,0
27,6
10,3
4,8
19,0
8,1
4,1
14,6
6,8
3,7
12,0
6,0
3,4
10,4
5,5
3,2
9,2
5,1
3,1
8,4
4,7
3,0
7,7
4,5
2,9
9
48,6
14,7
6,0
27,3
10,2
4,8
18,8
8,0
4,1
14,4
6,7
3,7
11,8
5,9
3,4
10,2
5,4
3,2
9,0
5,0
3,0
8,2
4,6
2,9
7,5
4,4
2,8
10
Литература
1 Бейли Н.Е. Математика в биологии и медицине. – М., 1970 . –
157 с.
2 Бексеитов Т.К.Инбридинг и препотентность баранов –
производителей. Павлодар. 2003. 160 с.
3 Демьянов Ю.Э., Литвин Ф.Ф. Применение математических
методов и ЭВМ в биологии. – М., 1981 . – 238 с.
4 Носов В.И. Компьютерная биометрика. – Л., 1990 . – 121 с.
5 Лакин Г.Ф. Биометрия. – М., 1990 . – 89 б.
6 Удольская Н.л. Введение в биометрию. – Алма-Ата, 1976. –
256 с.
7 Урбах В.Ю. Биометрические методы. – М., 1964. – 312 с.
8 Тихомирова М.Т., Короткина А.С. Успехи биометрии и
бионики. – Л., 1976 . – 112 с.
9 Фелоров А.И. Методы математической статистики в биологии
и опытном деле. – Алма-Ата, 1967. – 157 с.
10 Шмидт В.М. Математические методы в ботанике. – Л., 1984.
– 98 с.
11 Шортников Б.Э. Биометрические аспекты изучения
целостности организма. – М., 1987. – 254 с.
83
Download