Видео: Лекция 17: Уравнение регрессии между двумя признаками
При изучении какого-то явления или процесса очень часто необходимо узнать, существует ли взаимосвязь между факторами (переменными величинами) и функцией отклика (зависимой величиной), и насколько тесным является их взаимодействие. Сделать это позволяет регрессионный анализ, который выполняется в несколько этапов.
Одним из основных этапов регрессионного анализа является вычисление математической зависимости между факторами и функцией отклика, которая позволяет количественно оценить существующую между ними взаимосвязь. Эта зависимость получила название уравнение регрессии. Формально основным аналитическим методом определения указанного уравнения считается метод наименьших квадратов, так как данный метод оптимален и позволяет сгладить точки корреляционного поля. На практике же найти такую функцию бывает достаточно сложно, так как приходится опираться на теоретические знания об изучаемом явлении, на опыт своих предшественников в данной научной области или с помощью метода «проб и ошибок» производить простой перебор и оценку различных функций. В случае успеха будет получено уравнение регрессии, позволяющее адекватно оценить воздействие различных факторов на функцию отклика, то есть найти ожидаемое значение функции отклика (зависимой переменной) при определенных значениях факторов (зависимых переменных).
В качестве исходных данных для регрессионного анализа используются значения фактора x и соответствующее им значение функции отклика Y, полученные при проведение экспериментальной части работы. Для наглядности и более удобного восприятия данные значения представляются в табличной форме.
Видео: Уравнение регрессии
Линейное уравнение регрессии, как правило, имеет следующий вид Y=a+b X. В него входит постоянный коэффициент (константа) a, и коэффициент регрессии (угловой коэффициент) b, умножаемый на значение переменного фактора Х. Коэффициент b показывает среднее изменение функции отклика при изменении значения фактора на одну единицу. При построении графика уравнения регрессии с помощью коэффициента b можно также определить угол наклона прямой к линии абсцисс. Стоит отметить, что данный коэффициент имеет определенные свойства:
·- b может принимать различные значения-
Видео: Лекция 14: Линейная регрессия и корреляция
·- b не симметричен, то есть меняет свое значения в случае изучения влияния Y на X-
·- единицей измерения коэффициента корреляции является отношение единицы измерения функции отклика Y к единице измерения переменных факторов X-
·- в случае изменения единиц измерения переменных X и Y значение коэффициента регрессии также меняется.
В большинстве случаев наблюдаемые значения редко располагаются точно на прямой. Практически всегда можно наблюдать некоторый разброс экспериментальных данных относительно регрессионной прямой, которую образую предсказанные значения. Отклонение отдельной точки от линии регрессии от ее теоретического или предсказанного значения называется остатком.
Очень часто на практике определяется выборочное уравнение регрессии, основным методом вычисления значений коэффициентов которого является метод наименьших квадратов. Коэффициенты рассчитываются по исходным данным, представляющим выборку значений переменного фактора и функции отклика.
На первый взгляд может показаться, что вычисление значение коэффициентов, входящих в уравнение регрессии достаточно сложное и трудоемкое. Но это не так. К услугам исследователей представлены многочисленные пакеты прикладных программ (самым простым является Microsoft Excel), которые по вашим исходным данным не только рассчитают все входящие в уравнение коэффициенты, смогут установить степень взаимосвязи между переменными и зависимыми величинами, но представят полученные значения в графическом виде.