📊 통계/🐠 회귀분석 5

제5장 질적 예측변수

5.1 소개  성별, 결혼여부 등과 같은 질적 또는 범주형 요인들이 회귀분석에서 반응변수의 변화를 설명하는 데 매우 유용한 예측변수 역할을 할 때가 있다. 이런 질적요인들을 예측변수로 이용할 경우 이들은 다음에 설명되는 바와 같이 지시변수indicator variable 또는 가변수dummy variable 의 형식으로 표현된다. 가변수들은 관측개체가 취하는 질적 상태에 따라 0 또는 1의 두 가지 값을 갖는 경우가 많다. 이 두 가지 가능한 값은 범주의 양적 순서를 나타내기 위한 것이 아니라, 단지 관측개체가 속하는 범주나 집단을 식별하는 역할을 한다.     5.2 급료조사 데이터  이 데이터는 어떤 회사에 근무하는 컴퓨터 전문인들의 급료조사로부터 얻은 것이다. 이 조사의 목적은 급료의 차이를 결정하..

제4장 회귀진단

4.1 소개  앞서 언급한 분포이론, 신뢰구간, 가설검정 등은 표준적인 회귀의 가정들이 만족될 때만 유효하고 의미를 가질 수 있다. 이들 가정이 위반된다면, 이전에 언급된 표준적인 결과들은 유효하지 않으며 결과의 응용이 심각한 오류를 야기할 수도 있다. 이 장은 엄격한 수치적 규칙들을 적용하는 것보다도, 그래프적인 방법에 의존해 이러한 가정들을 검토하는 방법을 제시한다.     4.2 회귀분석의 표준적인 가정들  제2장과 제3장에서 제시된 최소제곱추정량과 통계분석들은 다음과 같은 가정들에 근거한 것이다.  이것은 선형성linearity 가정이라고 불린다. 단순회귀에서는 Y 대 X의 산점도가 선형적인지를 봄으로써 쉽게 확인할 수 있다. 다중회귀에서는 데이터의 고차원성 때문에 선형성을 검토하는 것이 쉽지 않..

제3장 다중선형회귀

3.1 소개  이 장에서는 여러 개의 설명변수를 가지는 다중선형회귀모형을 다룬다.     3.2 데이터와 모형에 대한 서술   다중선형회귀는 단순선형회귀의 확장(일반화)이다. 모든 단순회귀의 결과들은 예측변수의 수가 p = 1인 경우의 다중회귀를 이용하여 얻을 수 있기 때문에, 단순회귀를 다중회귀의 특별한 경우로 생각할 수 있다.     3.3 사례: 감독자 직무수행능력 데이터  다음의 데이터는 어떤 대형금융기관에 근무하는 사무직원들에게 그의 감독자에 대한 만족도를 질문하는 설문조사를 진행한 것이다. 문항은 총 6개이며, 응답은 각 문항에 대한 만족도에 따라 1에서 5까지의 값을 가진다. 이때 각 문항에 대하여 그 값이 {1, 2}에 해당하면 '만족한 응답'으로, {3, 4, 5}에 해당하면 '불만족한 ..

제2장 단순선형회귀

2.1 소개  반응변수 Y와 하나의 예측변수 X 사이의 관계를 연구하는 간단한 경우를 가지고 시작한다.     2.2 공분산과 상관계수  Y와 X 간 연관관계의 방향direction과 강도strength를 측정하고자 한다. 공분산covariance과 상관계수correlation coefficient로 알려진 두 개의 측도들은 아래와 같이 전개된다.  만약 Y와 X의 선형관계가 양이면(X가 증가함에 따라서 Y도 증가하면), 1 사분면과 3 사분면에 더 많은 점들이 있게 되어 편차곱의 합계는 양의 값을 가질 것이고, 반대로 Y와 X의 선형관계가 음이면(X가 증가함에 따라서 Y가 감소하면), 2 사분면과 4 사분면에 더 많은 점들이 있게 되어 편차곱의 합계는 음의 값을 가질 것이다.  Cov(Y, X) > 0..

제1장 서론

1.1 회귀분석이란 무엇인가?  회귀분석Regression Analysis은 변수들 사이의 함수적 관계를 탐색하는 개념적으로 단순한 방법이다.여기서 관련성은 반응response 혹은 종속dependent변수와 설명explanatory 혹은 예측predictor변수들을 연결하는 방정식 또는 모형의 형태로 표현된다.       1.2 공개적으로 이용 가능한 데이터 세트  회귀분석은 매우 다양한 응용 영역을 가지고 있다. 회귀분석은 독자들이 직접적으로 관심이 있는 데이터를 분석함으로써 매우 효과적으로 학습된다. 독자들은 적절한 데이터를 수집하고, 이 책에서 제시된 회귀분석 방법들을 자신의 데이터에 적용해야 한다.     1.3 회귀분석의 몇 가지 응용 예  회귀분석은 가장 널리 사용되는 통계적 도구 중 하나로..