본문 바로가기

통계로 본 세상

만화로 쉽게 배우는 인자분석 - SHIN TAKAHASHI '탐색형' 데이터 분석의 흐름1. 주위에 데이터가 있다.2. 이들 데이터를 다양한 분석 방법을 통해 이리 저리 분석해 본다.3. '아무래도 세상은 이런 것 같아' 라는 것을 후천적으로 알게 된다.4. 분석결과를 발표한다. '검증형' 데이터 분석의 흐름1. 가설을 세운다.2. 가설의 옳고 그름을 판단하기 위해 데이터를 모아 분석해 본다.3. 가설의 옳고 그름을 안다.4. 분석결과를 발표한다. - p48 '실태'를 묻고해 본 적이 있는지? 가지고 있는지?언제 구매했는지? 어디서 샀는지? 등 '의식'을 묻기만족 or 불만족인 점만족 or 불만족인 이유, 가치관 등 '속성'묻기성별,연력,미혼,기혼,수입,최종학력,가족구성 등 - p55 주성분 분석의 흐름1. 주성분과 주성분 점수를 구한다.2. 분석 결과의 정도를.. 더보기
Factor analysis_인자분석 자기가 알고 있는 것을 누구나 알 수 있도록 말로 표현하는 것은 어렵고, 글로 기술하는 것은 더 어렵다.통계관련 지식이 부족하다는 것을 알면서도 이제까지 계속 모른척해왔는데, 이제는 제대로 알아서 말로 표현하고, 글로 기술할 수 있도록 노력해야겠다. 연구생, 석사때부터 데이터 분석때 빠지지 않았던 인자 분석.데이터 해석 테크니컬 북이라는 모리씨가 쓴 책에서 소개하고 있는 인자분석을 정리해보았다. 인자 분석이란, 변수간의 상관행렬에 기초하여, 그들의 관계를 규정하고 있는 잠재변수를 추출하기위한 해석법이다. 인자 분석의 목적은 아래의 2가지로 요약할 수 있다. 첫째, 심리학 분야에서 인간의 능력, 인격, 태도, 욕구, 행동 등의 개인차나 상황에 의한 차이를 설명하는 유효한 인자를 찾는 것과 인간이 여러 대상.. 더보기
Structural Equation Model -구조방정식모형, 공분산구조분석- 논문에서 데이터 분석과 해석관련해서 유용한 모델로 사용되고 있는 SEM에 관해서 정리하려고 한다.앞으로는 통계적 지식을 명확하고 정리하여 논문을 쓸때나 세미나에서 발표때 망설임이 없도록 해야겠다. SEM은 직접적으로 측정할 수 없는 잠재변수를 도입하여, 잠재변수와 관측변수와의 인과관계를 파악하여, 사회현상과 자연현상을 이해하기 위한 통계적 접근방법. 인자분석과 다중회기분석(패스 분석)의 확장. 연구자가 상정한 인과에 관한 가설을 가설을 모델화한다. 구체적으로는 아래의 3가지 정보를 얻을 수 있다.1. 모델(가설)의 타당성의 검토2. 모델 수정에 대한 제언3. 인과의 크기와 강도의 측정과 검증 최근에는 공분산구조분석보다도 구조방정식모델이라 부름. 평균구조도 분석가능하기에 공분삭구조분석으로는 오해를 불러일으.. 더보기
가변수(假變數: dummy variable) 변수가 범주형일 경우 각 범주들을 지칭하기 위해 만들어진 변수로 각 범주에 속하느냐 아니냐에 따라 0이나 1의 값을 갖는 변수. 한 연구에서 변수의 범주가 몇 개냐에 따라 가변수의 개수가 결정되는데 범주의 수(k)에서 하나를 뺀 개수 만큼(k-1)의 가변수가 만들어질 수 있다. 더보기
가법모형(加法模型: additive model) 하나의 측정치가 여러 개의 구성요인을 갖는 경우에, 각 구성요인들이 서로 상관을 갖지 않아서 각 구성요인의 값 또는 효과의 합이 곧 측정치의 값이 되는 모형. 예를 들어, 준거변수의 값이 복수 요인에 의하여 영향을 받는 경우에 각 요인의 효과 사이에 상관이 없어서 각 요인효과의 합이 곧 준거변수의 값이 되는 경우를 말한다. 분산분석모형, 심리측정학의 진점수이론의 수학모형은 가법모형의 예이다. 더보기
9분점수(구분점수: stanine scores) 일종의 표준점수로서, 평균이 5이고 표준편차가 2인 정상분포를 참조하여 ½ 표준편차의 구간을 1점구간으로 표현하여 9개의 구간으로 척도화한 점수. 구분점수는 1에서 9까지의 구간점수를 가지며 5점 구간에 평균치가 포함된다. 더보기
2요인설계(二要因設計: two-factor design) 여러개의 독립변수들의 효과를 동시에 검정하는 요인설계법(factorial design) 중에서 가장 단순한 형태의 실험설계법. 두 개의 독립변수들의 효과를 동시에 검정할 수 있다. 또한 두가지 독립변수들을 동시에 다루기 때문에 이들간의 상호작용효과도 검정할 수 있는 장점이 있다. 이와 같은 형태의 설계법은 각 독립변수가 포함하는 수준의 개수를 가지고 제시한다. 예를 들어, 성별효과와 3가지 처치효과의 차에 대한 실험의 경우 2×3 요인설계라고 부른다. 더보기
1종오류(一種誤謬: Type I error) 통계적 가설검정시 발생할 수 있는 두 가지(일종, 이종) 가능한 오류 중의 하나로, 연구자가 상정한 영가설이 실제로 참임에도 이를 기각할 확률. 예를 들어 모집단에서 집단간의 평균을 비교하는 경우에 모평균에는 실제로 차이가 없음에도 표본자료의 분석결과 모집단간 차이가 있다고 판단하는 오류를 말한다. 일종오류는 유의도 수준 α에 따라 크기가 결정되므로 α-오류라고도 한다. 더보기
내가 통계를 공부하는 이유 통계는 경영 의사결정에 보조도구다. 보조 도구 가운데 큰 영향을 끼친다. 통계는 그냥 자료일 뿐... 그것을 활용하는 것은 사람이다. 적어도 틀(frame)을 제대로 파악해야 한다. 그동안 내 통계 수준이 떨어진 이유... '두려움'에 대한 '선입견' 이다. 더보기
요인분석이란? 요인분석은 인자분석이라 불리기도 하며, 자연현상을 간결한 방법으로 파악하여 주어진 현상에 대한 설명을 작은 수의 요인을 통해서 설명하는 간결의 원리이다. 자연현상과 사회현상의 상호관계 밑에 놓여있는 변수간의 상호관련성을 유형화 시켜 판단해 본다든가, 어떤 복잡한 현상의 구조를 간단하게 파악하고자 할 때 쓰이고 있다. 즉, 상호 연관된 다수개의 다변량 변수들 간의 공분산관계로부터 적은 수(보통2~3개)의 잠재적이고 가상적이며 관측 불가능한 요인을 추출해 내는 다변량 분석법으로 변수들 간의 상관관계를 이용하여 서로 유사한 변수들끼리 묶어주는 방법이다. ❤ 요인 : 서로 상관계수가 높은 변수들끼리 모아서 작은 수의 변수집단으로 구분한 것. 더보기