반응형 r16 [회귀] 범주형 독립변수를 지시변수로 포함한 선형 회귀모형/교호작용 / R 숫자로 표현된 설명변수와 반응변수의 관계를 파악하고, 이를 설명하는 최적의 회귀식을 찾는것을, 양적자료(quantitative data)를 기반으로 한 회귀분석 이라고 할 수 있습니다. 설명변수와 반응변수의 선형 관계를 파악하기 위해서는 주로 연속적 표현이 가능한 양적자료가 많이 사용되지만, 종종 질적 자료(qualitative data)를 설명변수로 채택해야하는 경우도 생기기 마련입니다. 양적자료와 질적자료에 대한 간략한 설명을 덧붙이자면, 양적자료란, 수치로 측정하고 표현하는것이 가능한 자료입니다. 따라서, 수치형 자료(numerical data)로도 불리우죠. 질적자료(qualitative data)란, 수치로 측정 및 표시가 불가능한 자료입니다. 성별 혹은 혈액형과 같이 집단을 구분하는 변수로서,.. 2021. 11. 2. 확률적 표본 추출법 R/ 단순 임의 추출, 체계적 추출, 층화 임의 추출, 군집 추출 모집단을 대표할 표본을 추출할 방법인 표본추출법(Types of sampling)은 확률적 표본 추출법과 비확률적 표본 추출법으로 나뉩니다. 양적 연구(quantitative research)에 주로 쓰이는, 확률적 표본 추출법은 다음 네가지 방법으로 세분화되죠. 단순 임의 추출(Simple Random Sampling), 체계적 추출(Systematic Sampling), 층화 임의 추출(Stratified Random Sampling) 그리고 군집 추출(Cluster Sampling)이 세분화된 확률적 표본 추출법이라고 할 수 있습니다. 단순 임의 추출 모집단으로부터 뽑힐 확률이 균등한 샘플을 무작위 추출 체계적 추출 표집간격(sampling interval) 배수만큼 떨어져 있는 요인들을 추출 층화.. 2021. 5. 26. 선형 보간법과 적용 / Linear Interpolation and Application 보간법이란, 하나의 추정 방법으로, 실험과 조사로부터 관측된 데이터(x) 사이(중간)의 x값에 대해 함수값을 예측하는 방법입니다. 주어진 관측값들을 바탕으로 근사시킨 함수(f(x))를 이용하여, 직접 조사되지 않은 데이터(주어진 관측값들의 범위 안에 존재해야함) 에 대한 함수값을 예측하는 방법 인 것이죠. 예를 들어 설명해봅시다. 아버지의 일주일 총 운전거리와 기름의 비용, 그리고 한달 총 운전거리와 그에따른 기름의 양을 관측했다고 가정합시다. 일주일 총 운전거리가 350km이고 이에 따른 경유의 비용은 6만원이 관측, 한달 총 운전거리가 1400km 일때 이에 따른 경유의 비용은 24민원이 기록되었다고 가정합시다. 그렇다면 X1 의 값 350에 대응하는 Y1 함수값은 6만원이고, X2의 값 1400에 .. 2021. 5. 19. 중심 극한 정리(CLT)와 R / Central Limit Theorem and R 중심 극한 정리는, 통계학에서 가장 기본적이고 가장 중요하게 여겨지는 정리이므로, 이번 포스팅이 이해에 도움을 드렸으면 하네요:) 중심 극한 정리(CLT : Central Limit Theorem)는 다음을 의미합니다. " 평균 μ , 표준편차 σ를 가지는 모집단 분포에서 iid 한 표본을 충분히 많이 추출한다면, 표본 평균은 정규분포에 근사하게 된다 ." 라는 정리입니다. 위 정의는, 모분포가 정규분포를 따르지 않아도, 종 모양(bell-shape)를 가지지 않아도 성립됩니다. 모분포가 정규분포가 아닌 분포를 따른다고 하더라도, 특정 조건만 만족된다면, 표본평균은 정규분포의 형태를 띄게 된다는 정의이죠. 통계학에서 정규분포를 가장 중요한 분포라고 하는 이유도, 우리는 중심 극한 정리에서 찾을 수 있습니.. 2021. 5. 18. 이전 1 2 3 4 다음 반응형