본문 바로가기
반응형

분류 전체보기123

[회귀] Method of least squares - 최소제곱법 / 단순 선형 회귀모형/ 특성 / 가우스 마코브 정리 설명변수(X) 와 반응변수(Y) 의 관계성을 가지고, 설명변수 값만으로 반응변수값을 예측하는 학문인 회귀분석에서, 몇가지 가정들로 구성된 가장 간단한 회귀 모형이 '단순 선형 회귀 모형'이다. 단순 선형 회귀 모형은 설명변수가 하나일때, 이 세가지 가정을 만족하는 경우 성립된다. 1. 고정오차[각주:1]가 없다 --> 오차의 평균은 0이다. 2. 모든 i 에 관하여 오차가 회귀모형과 같은 분산을 가진다 (σ^2). 3. 오차는 다른 오차에 영향을 주지 않는다 (상관 관계가 아니다.) 통계학에서는 대부분, 모집단의 일부인, 표본집단을 통해 설명변수와 반응변수의 관계를 예측한다. 모집단을 모두 관측하는것은 비 효율적이며, 많은 경우에 실질적으로 불가능하기 때문이다. 표본집단에서 회귀식을 얻은 경우, 이 회귀.. 2021. 1. 3.
(R) split function/ sapply--> tapply split function divides the data in the vector x into the groups defined by function. There are two main arguments in split function. x: a vector or a data frame f: a factor or a list of factors >?split > list_1=list(x=rnorm(5,0,1),y=runif(3,5,10))> list_1$x[1] -0.1205420 0.6790684 -1.0631887 0.7876966 0.3130599 $y[1] 8.521317 5.693054 5.061110 > sapply(list_1,mean) x y 0.1192188 6.4251602 > str(.. 2020. 11. 17.
(R) tapply function/ comparision to aggregate function /permutation test with tapply function the tapply function applies a function to each group of values given by a unique combination of the levels of certain factors. >?tapply the apply function needs three main arguments which are x, INDEX, FUN.x : typically vector which we want to apply functions to. INDEX: a list of one or more factors, each of same length as x. fun: a function to be applied Depending on the number of factors in th.. 2020. 11. 17.
(R) lapply, sapply, mapply/ two-sample t-test using mapply function lapply function always returns the result of function as a list from a list. sapply function always returns the result of functions as a vector from a list. > list_1=list(x=rnorm(5,0,1),y=runif(3,5,10))> list_1$x[1] -0.1718824 -0.1953697 -0.3611449 1.1755966 -1.0458594 $y[1] 7.881664 9.084847 9.950752 > list_2 = list(x = rnorm(10,0,1), y = c(rnorm(5,3,8), NA)) > list_2$x [1] 1.76547974 -0.748861.. 2020. 11. 17.
반응형