Рассмотрим двумерную случайную величину (X,Y), где X и Y — зависимые случайные величины. Представим одну из величин как функцию другой. Ограничимся приближенным представлением (точное приближение, вообще говоря, невозможно) величины Y в виде линейной функции величины X:
,
где
и
— параметры, подлежащие определению. Это можно сделать различными способами, наиболее обоснованный из которых – метод наименьших квадратов.
Функцию
называют “наилучшим приближением” Y в смысле метода наименьших квадратов, если математическое ожидание 
принимает наименьшее возможное значение; функцию g(x) называют среднеквадратической регрессией Y на X .
ТЕОРЕМА 13.1.21. Линейная средняя квадратическая регрессия Y на X имеет вид

где
,
где
— коэффициент корреляции величин X и Y.
Доказательство. Введем в рассмотрение функцию двух независимых аргументов
и
:
. (13.1.54)
Учитывая, что
и выполнив выкладки, получим
.
Исследуем функцию
на экстремум, для чего приравняем нулю частные производные:

.
Отсюда 
Легко убедиться, что при этих значениях
и
рассматриваемая функция принимает наименьшее значение.
Итак, линейная средняя квадратическая регрессия Y и X имеет вид

или

Коэффициент
называют коэффициентом регрессии Y на X , а прямую
(13.1.55)
называют прямой среднеквадратической регрессии Y на X.
Подставив найденные значения
и
в соотношение (13.1.54), получим минимальное значение функции
, равное
.
Величину
называют остаточной дисперсией случайной величины Y относительно случайной величины X; она характеризует величину ошибки, которую допускают при замене Y линейной функцией
.
При
остаточная дисперсия равна нулю; другими словами, при этих крайних значениях коэффициента корреляции не возникает ошибки при представлении Y в виде линейной функции от X.
Итак, если коэффициент корреляции
, то Y и X связаны линейной функциональной зависимостью.
Аналогично можно получить прямую среднеквадратической регрессии X на Y:
(13.1.56)
— коэффициент регрессии X на Y и остаточную дисперсию
величины X относительно Y.
Если
, то обе прямые регрессии, как видно из (13.1.55) и (13.1.56), совпадают.
Из уравнений (13.1.55) и (13.1.56) следует, что обе прямые регрессии проходят через точку
, которую называют центром совместного распределения величин X и Y.
Онлайн помощь по математике >
Лекции по высшей математике >
Примеры решения задач >