본문 바로가기
반응형

Statistics48

[회귀] 다중회귀에서 조정된 회귀계수와 최종회귀식 R 단순 회귀 (Simple Regression) : 하나의 설명변수(X1)를 가지고 Y의 변화를 설명하는 회귀모형 다중 회귀 (Multiple Regression) : 두개 이상의 설명변수(X1, X2, ...)를 가지고 Y의 변화를 설명하는 회귀모형 매우 당연한 논리이겠지만, 다중 회귀가 필요한 이유는, 반응변수의 변화에 대한 설명이 하나의 설명변수만으로는 충분하지 않다고 생각되는 경우들 때문이다. 물론, 하나의 설명변수만으로 충분히 Y의 값을 예측할수 있는 현상들도 분명히 있지만, 사회과학 현상은 그보다 매우 복잡함으로, 다중회귀 모형의 필요성이 대두된것이다. 다중회귀 모형에 대한 기본적인 전제는, X1 만으로는 설명되지 않는 Y의 부분에 새로운 변수(X2, X3, X4,...)를 추가함으로써 Y에 대.. 2021. 1. 14.
[회귀] Lack of fit test with R/ Simple Linear regression/ 적합 결여 검정 / 단순 선형 회귀 설명변수와 반응변수의 관계를 적절히 설명하는 회귀식을 찾았다면, 이 회귀모형이 올바른 모형인지 확인 할 수 있어야 한다. 이에 대한 검정을 '적합 결여 검정' (lack of fit test) 라고 한다. 앞선 포스팅 https://jangpiano-science.tistory.com/61 에서 살펴 보았듯이, MSE(Mean Square error)는 추정량의 분산과 편향(bias)의 제곱에 의해 결정된다. 따라서, MSE의 크기는 잘못된 회귀모형으로 인한 편향에 영향을 받는다. 이 특징으로 인해, MSE는 회귀모형이 관측값을 잘 설명하는 모형인지 검토하는데 유용하게 쓰이는 요소이다. 적합 결여 검정에 대한 자세한 설명을 시작하겠다. 앞선 포스팅에서도 언급하였듯이, 추정 회귀 모형이 실제 관측값(실제 .. 2021. 1. 13.
[회귀] 단순회귀분석에서의 구간추정과 가설검정 이전 포스팅에서는 최소제곱법을 활용하여 추정량을 추론하는 방법을 설명했다. https://jangpiano-science.tistory.com/103?category=875432 최소제곱법 - Method of least squares / 단순 선형 회귀모형/ 특성 / 가우스 마코브 정리 설명변수(X) 와 반응변수(Y) 의 관계성을 가지고, 설명변수 값만으로 반응변수값을 예측하는 학문인 회귀분석에서, 몇가지 가정들로 구성된 가장 간단 jangpiano-science.tistory.com 최소제곱법으로 구한 추정량의 분포를 알아보기 위해선, 역시 오차에 대한 정규성이 전제되어야 한다. 따라서, 오차의 표준 정규 분포성에 대한 가정이 필요하다. 오차의 분포에 대한 가정에 의해, 반응변수가 정규분포를 따른다는.. 2021. 1. 10.
[회귀] Anova in Simple regression /단순회귀 분산분석, 결정계수 하나의 설명변수와 반응변수의 관계로 나타내어지는 단순회귀 모형을 추정과정을 마친 후에는, 추정회귀식의 타당성을 확인하여야 한다. 추정량의 타당성은 보통, 분산의 크기에 의해 결정되곤 한다. 앞선 포스팅에서 최소분산 비편향 추정량의 정당성을 설명하였듯이, 분산은 추정량의 타당성을 확인하기 위한 중요한 요소이다. 즉, 추정회귀식의 분산을 더 작게 만드는 모형이 현상을 더 바람직하게 설명한다는 것이다. 이렇게 분산에 의해 추정회귀식의 타당성을 비교하는 방법을 '분산분석(Analysis of variance / Anova)' 라고 한다. 설명변수와 반응변수의 관계를 추정하는 회귀식에 기울기 모수가 포함되어 있다는것은, 변수들이 선형관계에 있다는것을 보여준다. 즉, 추정관계식에 기울기 모수가 포함되어 있는 모형의.. 2021. 1. 10.
반응형