So sánh phương pháp efa và cfa

Ngành Da giày Việt Nam bắt đầu tiếp nhận sự chuyển giao công nghệ từ các nước thông qua đầu tư FDI. Cùng với đó là sự dịch chuyển các đơn đặt hàng từ Đài Loan, Hàn Quốc sang Việt Nam. Xuất khẩu của ngành tăng trưởng cao, giai đoạn 1993-1995 đạt hơn 20%/năm. Năm 1995, Việt Nam và EU ký kết Hiệp định khung về hợp tác, tạo đà cho kim ngạch mặt hàng này sang EU tăng nhanh trong giai đoạn sau. Năm 1995 đạt trên 480 triệu USD, đến 1999 đã tăng hơn gấp đôi, đạt trên 1,3 tỷ USD.

Đầu tiên, chúng ta sẽ so sánh phân tích nhân tố khám phá EFA (Exploratory Factor Analysis) và phân tích nhân tố khẳng định CFA (Confirmatory Factor Analysis) để thấy được sự giống và khác nhau của hai loại phân tích này. Từ đó, có thể biết được cách sử dụng, khi nào nên sử dụng phân tích nhân tố khám EFA, khi nào nên sử dụng phân tích nhân tố khẳng định CFA.

Tham khảo thêm bài viết PHÂN TÍCH NHÂN TỐ KHÁM PHÁ EFA để nắm bắt các nội dung cơ bản.

1. Mô hình nhân tố chung

Giống như phân tích nhân tố khám phá EFA, mục đích của phân tích nhân tố khẳng định CFA là xác định các yếu tố tiềm ẩn được tính toán với phương sai (variation) và hiệp phương sai (covariation) theo bộ các biến đo lường (hay biến quan sát). Cả EFA và CFA đều dựa trên mô hình nhân tố chung, và do đó, nhiều khái niệm và thuật ngữ đã được thảo luận trong bài viết PHÂN TÍCH NHÂN TỐ KHÁM PHÁ EFA sẽ được áp dụng cho CFA, chẳng hạn như hệ số tải nhân tố (factor loadings), phương sai riêng phần (unique variances), phần chung (communalities) và phần dư (residuals).

Tuy nhiên, trong khi EFA là một quy trình mô tả hoặc thăm dò, thì trong CFA, nhà nghiên cứu phải quy định trước tất cả các khía cạnh của mô hình nhân tố như số lượng các yếu tố, mô hình các biến – hệ số tải nhân tố… CFA đòi hỏi một nền tảng thực nghiệm hoặc khái niệm mạnh mẽ để giải thích các thông số và đánh giá mô hình nhân tố. Theo đó, CFA thường được sử dụng trong các giai đoạn phát triển thang đo hoặc xây dựng sự xác nhận có giá trị sau khi cấu trúc cơ bản được thiết lập tạm thời bằng các phân tích thực nghiệm trước đó như EFA, hay dựa trên cơ sở lý thuyết.

2. Mô hình chuẩn hóa và không chuẩn hóa

Mặc định, trong phân tích EFA, là chuẩn hóa hoàn toàn tất cả các biến. Cụ thể, ma trận tương quan được sử dụng như dữ liệu đầu vào trong EFA và cả các yếu tố và biến tiềm ẩn đều được chuẩn hóa hoàn toàn với phương sai nhân tố bằng 1, hệ số tải nhân tố được hiểu là mức độ tương quan hoặc hệ số hồi quy chuẩn hóa. Thay vì sử dụng ma trận tương quan, CFA thường phân tích dựa trên ma trận phương sai – hiệp phương sai hoặc dữ liệu thô được sử dụng bởi chương trình phần mềm tạo ra một ma trận phương sai – hiệp phương sai đầu vào. Do đó, ma trận đầu vào CFA bao gồm các phương sai biến nằm trên đường chéo (phương sai bằng bình phương độ lệch chuẩn SD của biến; tức là Vx = SDx2) và hiệp phương sai là những giá trị ngoài đường chéo (hiệp phương sai có thể được tính bằng cách nhân hệ số tương quan của hai biến với độ lệch chuẩn SD của chúng, tức là COVxy = rxySDxSDy). Đặc biệt lưu ý, thực tế nhiều khía cạnh chính khác của CFA vẫn dựa trên các ước lượng không chuẩn hóa, chẳng hạn như các sai số chuẩn và kiểm tra ý nghĩa thống kê của các tham số mô hình.

Các giá trị trung bình không chuẩn hóa của các biến cũng có thể được đưa vào CFA. Do đó, trái ngược với EFA, tập trung vào các giá trị được chuẩn hóa hoàn toàn, CFA có thể yêu cầu phân tích cả cấu trúc phương sai – hiệp phương sai không chuẩn hóa và những cấu trúc trung bình (do kết quả của sự chuẩn hóa trong EFA, biến độc lập được giả sử bằng 0). Việc phân tích các cấu trúc trung bình đặc biệt phù hợp với các mô hình CFA đa nhóm, ở đó, nhà nghiên cứu có thể quan tâm đến việc so sánh các nhóm trên các giá trị tiềm ẩn hoặc xác định sự tương đương của các đặc tính đo lường của công cụ kiểm tra giữa các nhóm.

Tuy nhiên, trong nghiên cứu CFA ứng dụng, các giải pháp chuẩn hóa hoàn toàn được báo cáo phổ biến hơn. Tuy nhiên, phương pháp phân tích SEM (Structural Equation Modeling – Mô hình cấu trúc tuyến tính hoặc Mô hình phương trình cấu trúc tuyến tính) thường thể hiện sự ưu tiên cho việc báo cáo các giải pháp không chuẩn hóa vì bản thân phân tích dựa trên các biến không được chuẩn hóa. Ví dụ, bản chất thực sự của phương sai và mối quan hệ giữa các biến và yếu tố có thể không được thấy rõ khi các biến này được chuẩn hóa, các ước lượng không chuẩn hóa thể hiện rõ hơn tầm quan trọng hoặc ý nghĩa thực sự của tác động (Willett, Singer và Martin, 1998).

3. Biến tải chéo và mô hình phân tích

Ngoài ra, EFA và CFA khác nhau rõ rệt theo cách xử lý biến tải chéo trong các mô hình đòi hỏi nhiều yếu tố (trong các mô hình một yếu tố, các vấn đề về tải chéo và xoay nhân tố là không cần thiết). Như đã lưu ý ở PHÂN TÍCH NHÂN TỐ KHÁM PHÁ, tất cả các biến trong EFA tải tự do trên tất cả các nhân tố và giải pháp xoay để tối đa hóa hệ số tải trên một nhân tố chính và cực tiểu hóa hệ số tải trên các nhân tố còn lại (tải chéo). Xoay nhân tố không áp dụng cho CFA. Điều này là do sự hạn chế nhận dạng liên quan đến CFA đã đạt được một phần bằng cách cố định hầu hết hoặc tất cả các biến tải chéo về 0. Nói cách khác, xoay nhân tố là không cần thiết trong CFA vì cấu trúc đơn giản có được bằng cách mặt định các biến để tải trên chỉ một yếu tố duy nhất.

4. Phương sai riêng phần

Do CFA thường đòi hỏi giải pháp tối ưu hơn, nghĩa là CFA thường cố gắng mô phỏng các mối tương quan quan sát giữa các biến với ước lượng tham số ít hơn EFA. Do các hạn chế nhận dạng EFA, các mô hình nhân tố được giả định sai số đo lường là ngẫu nhiên. Ngược lại, sai số đo lường tương quan có thể được mô hình hóa trong giải pháp CFA.

Không thể chỉ rõ các sai số tương quan (nghĩa là bản chất của các mối tương quan giữa các phương sai riêng phần) là một hạn chế rất đáng kể của EFA. Ví dụ, một tài liệu tâm lý học rất rộng lớn tồn tại với thang đo Lòng tự trọng (Self-Esteem Scale – SES) của Rosenberg (1965), bao gồm 4 phát biểu tích cực (ví dụ, “tôi cảm thấy tốt về bản thân mình”) và 3 phát biểu tiêu cực (ví dụ, “có lúc tôi nghĩ mình không giỏi gì cả”). Nghiên cứu EFA ban đầu tạo ra hai nhân tố bao gồm các phát biểu có ý nghĩa tiêu cực và tích cực. Tuy nhiên, như lập luận thuyết phục của Marsh (1998), một cơ sở khái niệm đủ mạnh đã không tồn tại để hỗ trợ cho các khía cạnh khác biệt của lòng tự trọng tích cực và tiêu cực. Thay vào đó, Marsh (1998) lưu ý rằng hai nhân tố này là một hệ quả của các kiểu phản ứng kết hợp với nội dung các phát biểu. Sử dụng CFA, Marsh (1998) đã đánh giá các mô hình đo lường SES khác nhau tương ứng với các giải pháp được báo cáo trước đó và mô hình tương quan riêng phần (phần dư). Mặc dù có một cơ sở thực tiễn, mô hình này không thể ước lượng được với giải pháp EFA vì EFA không cho phép các sai số tương quan.

5. So sánh mô hình

Giải pháp CFA cung cấp tính linh hoạt cao hơn EFA về số lượng các yếu tố, mô hình tương quan các biến – yếu tố, có hoặc không có sự xuất hiện của hiệp phương sai sai số. Ngoài các khía cạnh này, CFA cho phép nhà nghiên cứu áp đặt các ràng buộc khác đối với giải pháp nhân tố, chẳng hạn như bắt buộc tất cả các hệ số tải nhân tố hoặc tất cả các phương sai riêng phần phải bằng nhau. Khả năng tồn tại của các ràng buộc này có thể được đánh giá bằng cách so sánh thống kê xem mức độ phù hợp của giải pháp hạn chế hơn có tệ hơn một giải pháp so sánh mà không có các ràng buộc này hay không.

So sánh thống kê trực tiếp các giải pháp thay thế là có thể khi các mô hình được lồng vào nhau. Một mô hình lồng vào nhau chứa một tập hợp con các tham số tự do của mô hình khác, thường được gọi là mô hình mẹ. Ví dụ, hãy xem xét hai mô hình sau: (1) Mô hình P – Mô hình 1 nhân tố bao gồm 6 biến tải tự do lên nhân tố, và (2) Mô hình N – Mô hình 1 nhân tố giống hệt với Mô hình P, ngoại trừ việc hệ số tải nhân tố bị hạn chế tải bằng nhau lên nhân tố. Mặc dù các mô hình có cấu trúc giống nhau (nghĩa là, chúng bao gồm 1 nhân tố và 6 biến giống nhau), nhưng chúng khác nhau về số lượng các tham số ước lượng tự do so với các tham số ràng buộc.

Khi các tham số ước lượng tự do (mô hình khả biến), nhà nghiên cứu cho phép phân tích tìm các giá trị cho các tham số trong giải pháp CFA (hệ số tải nhân tố, tương quan nhân tố, phương sai riêng phần) mô phỏng một cách tối ưu các phương sai và hiệp phương sai của ma trận đầu vào. Trong trường hợp tham số cố định (mô hình bất biến), nhà nghiên cứu chỉ định các giá trị cụ thể (ví dụ, cố định các hệ số tải chéo bằng 0 để chỉ ra không có mối tương quan nào giữa các biến và nhân tố). Khi các tham số bị ràng buộc, nhà nghiên cứu không chỉ định các giá trị cụ thể của tham số, nhưng đặt các ràng buộc khác về độ lớn mà các giá trị này có thể đạt được (trong trường hợp của Mô hình N, nhà nghiên cứu chỉ định phân tích tối ưu ma trận đầu vào dưới điều kiện tất cả các hệ số tải là bằng nhau). Do đó, N được lồng trong P (P là mô hình mẹ) vì nó chứa một tập hợp con của các tham số tự do của P. Theo đó, mức độ phù hợp của Mô hình N (đại diện cho mô hình bất biến) có thể được so sánh thống kê so với mức độ phù hợp của Mô hình P (đại diện cho mô hình khả biến, thông qua phương pháp kiểm định sự khác biệt Chi bình phương χ2) để đánh giá một cách trực tiếp khả năng tồn tại của điều kiện hệ số tải nhân tố bằng nhau. Do EFA chỉ yêu cầu các tham số ước lượng tự do (không thể chỉ định tham số cố định), nên việc đánh giá mô hình so sánh về bản chất là không thể.

Các quy trình này (kiểm định khác biệt Chi bình phương χ2) có thể được sử dụng để so sánh thống kê các dạng khác của các mô hình lồng vào nhau trong CFA. Ví dụ, CFA có thể được sử dụng để xác định xem các tham số khác nhau của mô hình nhân tố (hệ số tải nhân tố) có giống nhau ở hai hoặc nhiều nhóm (đặc điểm nhân khẩu học như giới tính nam và nữ,...) hay không.

Tài liệu tham khảo

  1. Hair, J. F., Black, W. C., Babin, B. J. & Anderson, R. E. (2010). Multivariate Data Analysis. Publisher: Pearson; 7 Edition.
  2. Marsh, H. W., Hau, K.-T., Balla, J. R., & Grayson, D. (1998). Is more ever too much? The number of indicators per factor in confirmatory factor analysis. Multivariate Behavioral Research, 33(2), 181–220.
  3. Rosenberg, M. (1965). Society and the adolescent self-image. Princeton, NJ: Princeton University Press. Willett, J. B., Singer, J. D., & Martin, N. C. (1998). The design and analysis of longitudinal studies of development and psychopathology in context: Statistical models and methodological recommendations. Development and Psychopathology, 10(2), 395–426.