논문과통계학/SPSS

[SPSS] 요인분석에 대해 쉽게 알아보자. 실제로 도전도 해보고 :)

발큰신데렐라 2010. 6. 22. 21:54
앞서 회귀분석에 대해서 포스팅을 했는데, 그때 말씀드렸 듯이 앞서 해야할 것이 바로 요인분석입니다.
전 제가 몰랐을때 고생한거 고려해 쉽게 쓴다고 쓰다 너무 길어졌어요;ㅠ


요인분석은 뭘까?

요인분석은 쉽게 말해 문항들을 묶는 것이다. 보통 리쿼드 척도 문항을 통한 설문을 했을때 이용한다.

한 질문에 대한 여러 세부 질문들의 문항들을 다 통털어서 정말 한 질문을 물어보는것이 맞느냐. 즉  단하나의 요인으로 떨어지는지, 그 외의 다른 요인이 존재하는지 여부에 대해 알아보기 위한 것이다.

예를들어 난 수면시간이 성적에 영향을 미치는 지 여부에 대한 질문을 했지만, 막상 설문지를 코딩해 요인분석하고 나면 수면시간과 성적과의 연관관계와 공부와 집중력에 대한 연관관계 이런식으로 두가지를 한꺼번에 질문한 것일 가능성이 높다는 말이다. 이를 확인하기 가장 좋은 방법이 바로 요인분석을 통해 성분을 분류해 보는것이다. 물론 그렇게 분류된 성분의 신뢰도는 다시 확인해야 한다.

(무슨소리야!! 하시는 분을 위해 길지만 쉽게써놨어요. 전문용어 하나도 없어요.
 저도 처음 접할땐 그들만의 용어(?)를 이해할 수 없었거든요. 아시는 분은 그냥 넘기세요.)

[보통 한 질문을 통해서는 신뢰도를 얻기 어렵죠? 사랑에 대해 물어보려 하더라도 딱 한 마디로 묻는것보다 15번도 묻는게 신뢰성이 더 높아지니까요. 근데 설문지를 막상 수거해서보면 의도와는 다르게 한 질문에 대해 15개를 물어본 것이 아니라 2질문에 대해 15개를 묻는게 되버릴때가 있어요. 의도와는 다르게 말이죠.(그런데 이런경우 정말 많답니다.)

그래서 바로 이때를 위해 쓰이는 거에요! 정말 하나에 대해서 물어본게 맞는지 아니면 그 이상에 대한 질문이었는지 알아보기 위해 하는 방법이 바로 요인분석이에요.]

[근데 이거 꼭 해야 하냐고 묻는다면 그렇다고 대답해야죠. 왜냐면 처음 의도 자체가 질문 하나의 신뢰도를 높히기 위한 방책이었으니까요. 근데 내가 그렇게 물어봤으니 그냥 믿어라!! 해봤자 아무도 안믿어요. 직접 보여줘야죠. 그래서 하는거에요. 그럼 진짜로 서로 연관성이 있느냐고 묻는다면? 그 질문을 위해 있는게 신뢰도 분석입니다. 내일 포스팅할거에요.]

[아래처럼 두개의 요인이 아니라 한개로 나와야 좋은거고, 설문지의 의도가 정확하게 전달된게에요.]

   

왜 신뢰도 분석을 하지?
신뢰도 분석인 크롬바크 알파에 대해서는[http://melissaeh.tistory.com/31]

간략하게 다시 설명하면 크롬바크 알파는 문항간의 신뢰성을 판단하는 것으로 과연 하위척도를 잘 구성하고 있는지 여부를 보는 것이다.

 

신뢰도 분석 그거 꼭 해야해?
당연. 보통 학사나 석사의 경우 기존의 외부 설문지를 사용하는 경우가 많아 문제가 되는 것이, 다른무엇보다 문항구조에 대한 문제이다. 그러므로 요인분석을 해서 혹시 하위척도로 구성이 되는지 안되는지 여부를 알아 봐야 한다. 문지의 경우 신뢰성에 대한 문제는 확실한 경우가 많지만 논문에 꼭 포함이 되어야 하므로 써주어야 한다.

요인분석 시작 :)

1. 데이터 불러오기

 

2. 요인분석 불러오기
(분석→ 차원감소→ 요인분석)

 

3. 요인분석하기
요인분석할 데이터를 옮긴다.(리쿼드척도 문항) -S에 대한

여기서!! 요인추출, 요인회전 두개만 더 확인해주면 된다.

1. 요인추출
요인추출방법은 주성분으로 상관행렬로 고유값기준은 그냥 두면 됩니다.

 

2. 요인회전
요인분석에서는 원래 지정않음에서 베리멕스에 체크 해준다.
:) 베리멕스에 체크하는 이유는 출력데이터를 좀더 깔끔하게 보기위해서.(회전된 성분행렬로 나온다.)


4.
출력값 확인하기
회전된 성분행렬값을 엑셀로 옮겨 정리한뒤 아래아한글로 정리한다.(그게 더 편하다.)
근데 여기서 끝이 아니다. 나온 데이터 설명해줘야겠지?
                 ▶   

왼쪽 값은 아래아 한글로 정리한 표이다. 여기서 중요한건 노랑색과 녹색을 표시한 부분인데,
잘 보면 차이를 확인할 수 있다. 근데 이렇게 딱 반으로 나뉜 경우도 좀 드물다.

....

어떤 부분에 표시해 뒀을까?
바로 값이 0.6이상 곳에만 체크가 되어 있다는 것이다!! 성분1따로,성분2따로.

S가 사랑 하나로 된 성분이 아니라 요인분석 결과 두개의 성분으로 각기 따로 존재한다는것을 알게되었다.  요인분석 결과 S1.S2 이렇게 나뉘었는데,  요인분석이 이걸로 끝일까? 절대 전혀 아니다.


이제 본격적으로 들어 보자.
우선 회전된 요인분석이라 되어있는 위에 나온 성분값을 바탕으로
각기 다른 따른 변수를 만들어보자.

5. 변수 정리하기
(변환→ 변수계산)


어떻게 입력할까?

1. 대상변수: 설문지를 직접 읽어보고 가장 적합하다고 생각하는 변수이름을 만들어 입력한다.
2. 숫자표현식: 위에 분류된 노랑색변수들 모아다가 각각 더해준 뒤 그 숫자만큼 나눈다.
3. 그리고 아래 있는 확인 클릭.

 

6. 변환된 변수 확인하기
이건 출력데이터에 없다.  변수가 하나 더 생긴것이니까 데이터 보기에서 확인해야 한다.
새로 생긴 변수가 보인다. 아까 입력한 S사랑 이라고 쓰여있다. 

이런식으로 똑같이 녹색변수들도 해준다.
S애정 이라는 새로운 변수가 생겼다. 이로서 S는 두개의 변수로 나뉜것.

 

7. 변환된 변수 신뢰도 검사 하기
두개의 변수로 분리 되었으니 각각의 신뢰도 검사도 필수.
 (신뢰도 검사 하는 방법 : http://melissaeh.tistory.com/31)
S사랑의 신뢰도값 S애정의 신뢰도값

물론 성분2에 대해서도 동일하다. 그리고 각각의 요인값 아래 신뢰도값을 써준다.

주의) 여기서 서는!!!

성분1에 0.6이 넘는 데이터만 골라서 옮긴다.(즉 S사랑)


물론 성분2에 대해서도 동일하다. 그리고 각각의 요인값 아래 신뢰도값을 써준다.
그럼 나온 값을 바탕으로 아까와 마찬가지로 정리한다.

 

여기서는 신뢰도값도 함께 써준다.


spss
은 그냥 멀리서 보면 어려운데 하나씩 보면 너무 사랑스러운 프로그램