상관관계는 인과관계가 아니다. 상관관계는 단순히 두 변수 사이의 관계를 나타내지만, 두 변수 사이에 원인과 결과와 같은 관계가 있다는 걸 이야기 하지는 않는다. 예: 물에 빠져서 죽는 사람에 대한 통계와, 아이스크림의 수를 함께 모델링 했을때 높은 상관관계가 나왔다. 하지만 아이스크림을 사먹는다고 해서 물에 빠져죽는 것이 아니고, 더운 날씨에는 사람들이 물에 자주 들어가거나 아이스크림을 사먹게 되기 때문에 상관관계가 나올 수 있는 것이다. 혼선자 (confounder) 위의 예시에서, 물에 빠져 죽는 사람수와 아이스크림의 수를 이어주는 날씨를 조사에서 생략된 제 3의 변수로 볼 수 있다. 이렇게 반응변수 response variable과 하나 이상의 예측변수 predictor variable 모두에 영향..