ЛБ № 2 - Томский политехнический университет

advertisement
R*rМИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ
ФЕДЕРАЦИИ
Федеральное государственное бюджетное образовательное учреждение
высшего профессионального образования
«НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ
ТОМСКИЙ ПОЛИТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ»
УТВЕРЖДАЮ
Директор ИНК
_______________В.Н. Бориков
«___» ____________ 2014г.
Лабораторная работа №2
«Применение MATHCAD для решения задач по оценке
параметров функциональных зависимостей»
Томск – 2014
Цель работы: научиться использовать MathCAD для решения задач по оценке
параметров функциональных зависимостей.
1. Корреляционный анализ
Степень тесноты корреляционной связи между двумя величинами
определяется коэффициентом корреляции.
Необходимым и достаточным условием корреляции отличия выражения (1.1)
от нуля, которое называют корреляционным моментом:
K xy  Mx - Mx y - My
(1.1)
Корреляционный момент — размерная величина, количественно зависящая от
рассеяния аргументов. Нормированную безразмерную величину называют
коэффициентом корреляции:
K xy
K xy
(1.2)


D( x ) D( y )  x  y
Для экспериментального оценивания коэффициента корреляции нужно
провести n испытаний, в каждом из которых регистрировать одновременно X и Y , и
получить n пар значений (x1, y1), (x2, y2), . . . (xn, yn).
Для наглядности эти
пары значений можно отметить как координаты точек на плоскости.
Образовавшаяся совокупность сразу дает представление о силе корреляции
(рисунок 2, а) - сильная, б) - слабая, в) – отсутствие корреляции).
а)
б)
Рисунок 1.
в)
Оценку зависимости между случайными величинами по выборочному
коэффициенту корреляции называют корреляционным анализом. Выборочный
коэффициент корреляции r вычисляют по формуле (1.2), где вместо истинных
математических ожиданий и дисперсий берутся их оценки:
1 n
1 n
x   xi ; y   y i ;
(1.4)
n i 1
n i 1
1 n
xi  x 2 (в Mathcad S2 = Var(x));
S x2 

n  1 i 1
1 n
2
S y2 
(1.5)
  yi  y  (в Mathcad S2 = Var(y));
n  1 i 1
Выборочные корреляционный момент и коэффициент корреляции равны:
1 n
K xy 
 xi  x ( yi  y ) ;
n  1 i 1
2
n
1
r
n 1
 x
i 1
i
 x ( y i  y )
(1.6)
SxSy
2. Проверка гипотезы о значимости выборочного коэффициента
корреляции
При достаточно большом объеме выборочный коэффициент корреляции r
приближается к истинному значению ρ, однако при сравнительно небольшом
объеме выборки оценить степень связи затруднительно из-за неизвестной
погрешности выборочного коэффициента корреляции. Распределение его зависит от
истинного значения, которое неизвестно, поэтому на практике обычно
ограничиваются лишь проверкой общей гипотезы о наличии корреляционной связи
между наблюдаемыми величинами. Т.е. проверять нулевую гипотезу Но: ρ = 0 - о
том, что генеральный коэффициент корреляции равен нулю.
В качестве критериев значимости при проверке нулевой, гипотезы могут быть
использованы r - критерий или t - критерий (r - или t - распределение).
Проверка с помощью r - критерия осуществляется в следующем
порядке:
а) по таблицам r – распределения определяется граничное значение критерия.
rгр по заданному уровню значимости α и числу степеней свободы k = n – 2.
б) проверяется выполнение условия: /r/ < rгр. Если рассчитанное по
выборочным данным значение r удовлетворяет этому условию, то нулевая гипотеза
о равенстве нулю генерального коэффициента корреляции ρ принимается и
считается, что случайные величины не коррелированы между собой.
Проверка с помощью t - критерия осуществляется
порядке:
а) вычисляется наблюдаемое значение критерия
n2
Tнабл  rв
2
1  rв
в
следующем
(2.1)
б) по таблицам t–распределения (Распределение Стьюдента) находится.
граничное значение критерия t кр по уровню. значимости α и числу степеней
свободы k = n – 2. Для заданного уровня доверия P определяется В Mathcad tn-2,кр =
qt(P, n – 2).
в) проверяется выполнение условия Tнабл.  t кр . Если условие выполняется,
принимаем нулевую гипотезу: коэффициент корреляции r незначимо отличается от
нуля, т.е. между случайными величинами отсутствует корреляционная связь. В
противном случае случайные величины считаются коррелированными
3. Регрессионный анализ
Корреляционный анализ одновременно оценивает факт случайности или
причинности зависимости от фактора, но и одновременно степень неслучайности.
Регрессионный анализ является более высокой ступенью анализа по сравнению
корреляционным: он позволяет оценить как количественные характеристики
степени связи между случайными величинами, так и характер этой связи, для чего
3
необходимо получить зависимость среднего mу величины у от другой случайной
величины х. Эту зависимость называют регрессией, а кривую, описывающую эту
зависимость, - линией регрессии.
3.1 Линейная регрессия
Метод наименьших квадратов
Самый простой и наиболее часто используемый вид регрессии – линейная.
Приближение данных (xi, yi) осуществляется линейной функцией у(х) = b + ах.
Классическим алгоритмом линейной регрессии является метод наименьших
квадратов, идея которого сводится к поиску таких коэффициентов для уравнения
прямой, чтобы сумма квадратов абсолютных ошибок (b + axi – yi) была минимальна.
Для расчета линейной регрессии в Mathcad имеются два дублирующих друг
друга способа. Результаты обоих способов получаются одинаковым.
1. line(x, y) – вектор из двух элементов (b, а) коэффициентов линейной
регрессии ax + b;
2. intercept (x, у) – коэффициент b линейной регрессии;
slope (x, у) – коэффициент а линейной регрессии;
• х – вектор действительных данных аргумента;
• у – вектор действительных данных значений того же размера.
Оценить, насколько хорошо экспериментальные точки ложатся на построенную
с помощью регрессии линию, можно и чисто визуально. Но лучше получить
некоторую количественную оценку. Оптимальной количественной оценкой (при
отсутствии в данных промахов) является так называемая стандартная ошибка,
равная среднеквадратичному расстоянию от точек экспериментальных данных до
прямой (линии регрессии). Если линейная регрессия рассчитывается по методу
наименьших квадратов, то для нахождения стандартной ошибки можно
использовать встроенную функцию Mathcad:
stderr(x, y), где x и y – вектора данных. Данная функция применима только для
линейной регрессии.
Рассеяние результатов относительно прямой оценивают с помощью дисперсии
Sy2, которая находится по формуле:
1 n
(3)
 yi  axi  b2 ,

n  1 i 1
корень квадратный из которой определяет стандартное отклонение точек от
найденной зависимости.
Sy 
3.1 Полиномиальная регрессия
Очень многие эффекты и явления в физике и других точных науках
описываются алгебраическими полиномами. По этой причине практическая
важность полиномиальной регрессии ничуть не уступает, а может, даже и
превосходит таковую линейной регрессии.
В Mathcad рассчитать полиномиальную регрессию можно с помощью
встроенной функции regress(x,y,n),
где x и y – векторы экспериментальных данных (количество точек должно быть
больше порядка полинома хотя бы на 1), n – порядок полинома.
4
В общем случае n может принимать совершенно любые значения, однако
реально сталкиваться с полиномами выше 3–4 степени приходится редко.
Вектор результата функции regress содержит первые три строки служебных, а
остальные – значения коэффициентов полинома, расположенные сверху вниз
исходя из возрастания степени членов, к которым они относятся.
Построить кривую полинома регрессии можно, просто присвоив его
коэффициентам значения, полученные в результате выполнения функции regress:
R:=regress(x,y,3)
S t  :
N 3
t
i 3
i 3
 Ri
(4)
Однако можно поступить и проще – задать полином с помощью функции
interp(s,x,y,t).
Для этого в качестве ее параметра s следует определить вектор
коэффициентов, вычисленный функцией regress (именно для interp, кстати, в нем и
имеются служебные строки).
S t  : interp( R, x, y, t )
(5)
4. Задание
С помощью аналогового вольтметра была получена ВАХ несимметричного
TVS-диода, где X – напряжение на диоде (В). У – ток на диоде (мА).
Исходные данные приведены в таблице 1:
Таблица 1
X
Y
0
63,2
X
Y
11
1177
1
11,4
2
81,35
3
207,4
4
40,1
5
66,75
6
342,6
7
116,7
8
149
9
312,9
12
13
14
457,2 488,85 893,3
15
1488
16
1773
17
2214
18
2193
19
2746
20
2864
Построить график экспериментальной зависимости. По внешнему виду
зависимости определить степень корреляции и проверить значимость выборочного
коэффициента корреляции.
Найти наиболее приемлемую аппроксимирующую функцию на основе
исходных данных из таблицы 1. В качестве аппроксимирующей использовать
линейную, параболическую и гиперболические функции.
1.
2.
3.
4.
Ход работы:
Изобразить на графике экспериментальные значения в виде точек:
а) Создать вертикальные матрицы значений x и y;
б) Построить графически точки с координатами (xi, yi) и отредактировать
график.
Рассчитать выборочный коэффициент корреляции.
Провести проверку коэффициента корреляции на значимость по t-критерию.
Найти уравнения регрессии. Определить наиболее приемлемую регрессию
(линейную, полиномиальную):
5
10
972,3
4.1 Вычислить коэффициенты линейной регрессии:
b = intercept (x,у), a = slope (x,у).
4.2 Построить линейную регрессию, используя полученные коэффициенты.
4.3 Изобразить на том же графике, что и экспериментальные данные,
полученную линию регрессии.
4.4 Сравнить полученные данные.
4.5 Оценить ошибку по формуле (3).
4.6 Используя функцию regress, рассчитать полиномиальную регрессию
второго и третьего порядков.
4.7 Изобразить на предыдущем графике линии регрессий.
4.8 Оценить ошибки регрессий второго и третьего порядков по формуле (3).
4.9 Сравнить графики, определить наиболее приемлемую аппроксимирующую
функцию.
Требования к отчету.
В отчете представить решение всех заданий, исходные данные, полученные
графики и требуемые выводы, а также необходимые фрагменты из Mathcad.
Литература
1. Садовский Г.А. Теоретические основы информационно-измерительной
техники: учеб. пособие. – М.: Высш. шк., 2008. – 478 с.
2. Плис А.И. MATHCAD 2000. Математический практикум для экономистов
и инженеров: учеб. пособие для вузов / А.И. Плис, А.Н. Сливина. – М.: Финансы и
статистика, 2000. – 656 с.
6
Download