Python101 - Bài 7: Chi-Square Test & Cross-tab - Tìm Mối Liên Hệ Giữa Các Dòng Sản Phẩm
Liệu Giới tính (Nam/Nữ) có ảnh hưởng đến việc chọn mua iPhone hay Samsung không? Hay là ngẫu nhiên? Chi-Square Test sẽ vạch trần mối liên hệ bí ẩn này.

T-test dùng cho biến số (Doanh thu, Điểm số...). Còn nếu bạn muốn tìm mối liên hệ giữa các biến phân loại (Categorical) thì sao?
Ví dụ: Nam giới thì hay mua màu đen, Nữ giới hay mua màu hồng. Đây là định kiến hay sự thật?
Công cụ: Chi-Square Test of Independence.

Bảng chéo (Crosstab) thể hiện tần suất xuất hiện của các cặp giá trị. Chi-Square sẽ tính xem phân phối này có ngẫu nhiên không.
1. Tạo bảng chéo (Crosstab)
`ct = pd.crosstab(df["Gender"], df["Product_Color"])`
`print(ct)`
Bạn sẽ thấy bảng tần số. Nhưng nhìn bảng chưa đủ kết luận.
2. Chạy kiểm định Chi-Square
Nếu P-value < 0.05: Có mối liên hệ (Association). Tức là Giới tính CÓ ảnh hưởng đến việc chọn màu sắc.
Marketing Action: Chạy ads màu hồng target vào nữ, màu đen target vào nam.
Đấy, nghiên cứu định lượng trong kinh doanh nó thực dụng như thế đấy!

