R101 - Bài 5: Kiểm Định Thang Đo: Cronbach's Alpha & EFA - Đừng "Đốt Nhà" Trước Khi Xây
Việc đầu tiên của mọi nghiên cứu là xem "thước đo" có chuẩn không. Thước cong mà đòi đo đường thẳng thì vứt. Cronbach Alpha và EFA chính là bộ đôi kiểm chứng chất lượng thước đo này.

Nhiều bạn newbie hăm hở lao vào chạy hồi quy ngay lập tức. Giống như đi xây nhà lầu mà xây trên nền cát vậy. Nó sập lúc nào không hay.
Trong nghiên cứu khoa học, trước khi xem "X có tác động đến Y không", ta phải xem "X và Y có được đo lường chuẩn xác không".
Có 2 khái niệm bạn phải khắc cốt ghi tâm:
1. Độ tin cậy (Reliability): Đo lường sự ổn định, nhất quán của thang đo. (Công cụ: Cronbach's Alpha).
2. Giá trị (Validity): Đo lường xem nó có đo đúng cái cần đo không, hay đo nhầm sang cái khác? (Công cụ: EFA - Phân tích nhân tố khám phá).

EFA giúp gom nhóm các câu hỏi rời rạc (Q1, Q2...) thành các khái niệm lớn (Factor 1, Factor 2).
1. Cronbach's Alpha: Kiểm tra độ "Đoàn kết"
Giả sử bạn dùng 3 câu hỏi (Sat1, Sat2, Sat3) để đo lường "Sự hài lòng". Nếu một khách hàng trả lời Sat1 = 5 điểm (Rất hài lòng), Sat2 cũng phải tầm 4-5 điểm. Chứ Sat2 mà tụt xuống 1 điểm thì chứng tỏ bộ câu hỏi này "nội bộ lủng củng".
Trong R, ta dùng gói `psych`:
`library(psych)`
`alpha(df %>% select(Sat1, Sat2, Sat3), check.keys=TRUE)`
Nhìn vào 2 chỉ số:
1. raw_alpha: > 0.7 là ngon lành.
2. r.drop (Item-total Correlation): Phải > 0.3. Nếu nhỏ hơn 0.3 nghĩa là câu hỏi đó "lạc quẻ", cần xóa.
Lưu ý: Nếu có câu hỏi ngược (Reverse items), nhớ thêm `check.keys=TRUE` để R tự động đảo chiều cho đúng.
2. EFA (Exploratory Factor Analysis): Gom nhóm tinh gọn
Bạn không thể "mơ" ra số nhóm được. Phải dùng thuật toán để chọn số nhóm tối ưu (Eigenvalues > 1).
Bước 1: Vẽ biểu đồ đá cuội (Scree Plot) xem nên chọn mấy nhóm
`fa.parallel(df_scale)` -> Nó sẽ gợi ý dòng "Parallel analysis suggests n factors".
Bước 2: Chạy EFA chính thức
`fa(r = cor(df_scale), nfactors = 3, rotate = "promax")`
(Thay số 3 bằng số gợi ý ở trên)
Dân kinh tế ưu tiên xoay Promax (xoay xiên) hơn Varimax (vuông góc) vì các khái niệm xã hội thường dính dây mơ rễ má với nhau.
Tổng kết Module kiểm định
Nếu Cronbach Alpha là vòng gửi xe, thì EFA là vòng sơ khảo. Qua được 2 ải này thì dữ liệu của bạn mới "đủ tuổi" để chạy hồi quy. Nhiều bạn làm đến đây là rụng như sung rụng vì dữ liệu rác. Nên nhớ bài 1 tôi nói gì không? Data Cleaning là quan trọng nhất!

