가장 기본적인 regression, 회귀에 사용된다.
data와 최적으로 fit하는 직선을 찾는 문제
기본적으로 데이터가 선형성을 띄고 있어야 좋은 결과를 얻을 수 있다.
y=b0+b1xy=b_0+b_1x인yy를 구해야한다.
xx는 Independent Variable(IV)yy는 Dependent Variable(DV)라한다.
b1b_1은 Coefficient로yy와xx의 관계를 비율로 표현하는 값이 된다.
b0b_0는 Constant인데 Linear regression의 Reset value(초기값)을 말한다.
이렇게 IV,DV,Coefficient,Constant로 이루어진다.
IV가 다양하면 다중선형회귀, IV가 하나인데 지수로 표현되면 다항회귀로 표현한다.
다항 회귀는 IV가 n제곱으로 곡선이지만 coefficient들에 대해서는 선형회귀이므로 선형회귀로 친다.
최적인 Coefficient와 Constant를 찾기 위해 평균 제곱오차를 사용(오차의 부호를 없애주려고 제곱)해 평균 제곱오차가 최소가 되는 직선을 찾는다.
평균제곱오차
y와 x에 데이터를 대입해w0,w1w_0, w_1에 관한 식으로 나타내 최적값을 찾을 수 있다.
Uploaded by Notion2Tistory v1.1.0