본문 바로가기

통계로 본 세상

Factor analysis_인자분석

자기가 알고 있는 것을 누구나 알 수 있도록 말로 표현하는 것은 어렵고, 글로 기술하는 것은 더 어렵다.

통계관련 지식이 부족하다는 것을 알면서도 이제까지 계속 모른척해왔는데, 이제는 제대로 알아서 말로 표현하고, 글로 기술할 수 있도록 노력해야겠다.

 

연구생, 석사때부터 데이터 분석때 빠지지 않았던 인자 분석.

데이터 해석 테크니컬 북이라는 모리씨가 쓴 책에서 소개하고 있는 인자분석을 정리해보았다.

 

인자 분석이란, 변수간의 상관행렬에 기초하여, 그들의 관계를 규정하고 있는 잠재변수를 추출하기위한 해석법이다.

 

인자 분석의 목적은 아래의 2가지로 요약할 수 있다.

 

첫째, 심리학 분야에서 인간의 능력, 인격, 태도, 욕구, 행동 등의 개인차나 상황에 의한 차이를 설명하는 유효한 인자를 찾는 것과 인간이 여러 대상을 지각또는 인지할 때 잠재적인 관점으로써 작용하는 차원을 밝히는 것을 목적으로 인자분석이 적용되고 있다.

 

둘째, 잠재인자추출을 위한 절차를 통해서 변수의 grouping이나, 각변수에  대한 데이터의 변동을 좀더 잘 표현하는 소수의 합성변수의 구성을 하여, 그 소수의 합성변수의 득점에 의한 각 케이스를 기술함으로써 정보의 압축과 기술의 중복(redundancy)을 배제 또는 절약을 위해서도 인자분석의 주된 목적이 된다.

 

인자 분석은 아래의 2가지 사례에서 유래를 찾을 수 있다. 모두 심리학에 기원을 두고 있다.

 

첫째, 추리력, 이해력, 개사력, 기억력, 표현력 등, 인간은 다양한 지적능력을 지니고 있다. 그러나, 이러한 지적능력은 서로 관계없는 것이 아닌, "기억력이 뛰어난 자는 계산력도 뛰어나다"등의 각능력 간에 어떠한 상관관계가 존재하는 경우가 많다.

 

그리고, 이러한 경우 상호간에 강한 상관관계가 있는 지적능력에는 뭔가 공통적인 잠재인자가 개제하고 있을지도 모른다. 또한 역으로 서로 거의 관계가 없는 능력은,  각각의 다른 인자에 의해 규정되고 있다고 생각할 수 있다.

 

게다가, 각 능력 간에 비교적 강한 상관관계가 존재한다면, 그러한 능력을 규정하고 있는 잠재변수의 수는 실제 측정되는 능력의 숫자보다는 적을 것이다.

 

즉, 각 능력의 관계는 그 숫자보다 더 적은 소수의 인자에 의해 설명가능하다고 추정할 수 있다.

 

둘째, "밝은", "착실한","재치있는","적당한"등의 다양한 특성어를 사용하여 사람들의 개성을 기술하고 있다. 그리고, 과거에 다양한 사람과 접해본 경험을 통해 "신중한 사람은 성실하기도 하다"와 같이 각 특성간의 연결을 통해서 잠재적으로 일정한 지식, 신념의 체계를 가지고 있다.

 

즉, 이러한 특성은 서로 관련이 없는 것이아닌, 상호간에 어떠한 관계을 가지고 있고, 게다가 그것들은 몇개의 주요한 관점(인지차원)에 의해 규정되고 있다고 할 수 있다.

 

여기서도 사람의 인격에 관해서 잠재적으로 가지고 있는 인지차원은 어떠한 것이며, 또한 그것들 간에 어떤 관계가 있는지 잠재인자를 탐색하려는 문제의식에서 인자분석은 유래하고 있다.

 

인자부하량(Factor loading): 각인자와 각변수의 관계의 강도와 방향을 표현. 또한 같은 인자의 열에서 동시에 큰 절대치를 보이고 있는 변수군에는 공통의 인자가 강하게 개제하고 있다고 판단할 수 있다.

 

인자득점(Factor score): 모든 측정변수의 각항목의 득점이 아닌, 상호간에 비교적 독립한 인자의 경향을 표현하는 합성득점. 정보를 받는 사람에게는 중복된 정보를 얻기 보다는 요점을 정리하여 간략하게 받는 편이 이해하기도 쉽고 유익하기에, 각변수와 각인자간의 관계(인자부하량)을 파악하면, 각인자의 득점을 알수 있게되어 각변수의 득점도 거의 짐작할 수 있다 .