Линейная регрессия. Прямые линии среднеквадратической регрессии

Рассмотрим двумерную случайную величину (X,Y), где X и Y — зависимые случайные величины. Представим одну из величин как функцию другой. Ограничимся приближенным представлением (точное приближение, вообще говоря, невозможно) величины Y в виде линейной функции величины X:

,

где и — параметры, подлежащие определению. Это можно сделать различными способами, наиболее обоснованный из которых – метод наименьших квадратов.

Функцию называют “наилучшим приближением” Y в смысле метода наименьших квадратов, если математическое ожидание
принимает наименьшее возможное значение; функцию g(x) называют среднеквадратической регрессией Y на X .

ТЕОРЕМА 13.1.21. Линейная средняя квадратическая регрессия Y на X имеет вид

где ,

где — коэффициент корреляции величин X и Y.

Доказательство. Введем в рассмотрение функцию двух независимых аргументов и :

. (13.1.54)

Учитывая, что

и выполнив выкладки, получим

.

Исследуем функцию на экстремум, для чего приравняем нулю частные производные:

.

Отсюда

Легко убедиться, что при этих значениях и рассматриваемая функция принимает наименьшее значение.

Итак, линейная средняя квадратическая регрессия Y и X имеет вид

или

Коэффициент называют коэффициентом регрессии Y на X , а прямую

(13.1.55)

называют прямой среднеквадратической регрессии Y на X.

Подставив найденные значения и в соотношение (13.1.54), получим минимальное значение функции , равное .

Величину называют остаточной дисперсией случайной величины Y относительно случайной величины X; она характеризует величину ошибки, которую допускают при замене Y линейной функцией .

При остаточная дисперсия равна нулю; другими словами, при этих крайних значениях коэффициента корреляции не возникает ошибки при представлении Y в виде линейной функции от X.

Итак, если коэффициент корреляции , то Y и X связаны линейной функциональной зависимостью.

Аналогично можно получить прямую среднеквадратической регрессии X на Y:

(13.1.56)

— коэффициент регрессии X на Y и остаточную дисперсию величины X относительно Y.

Если , то обе прямые регрессии, как видно из (13.1.55) и (13.1.56), совпадают.

Из уравнений (13.1.55) и (13.1.56) следует, что обе прямые регрессии проходят через точку , которую называют центром совместного распределения величин X и Y.

Онлайн помощь по математике >
Лекции по высшей математике >
Примеры решения задач >