Kiểm định khi bình phương trong spss

-

1. Bao giờ sử dụng χ2

Kiểm tra Chi-square (χ2) bao hàm cả bài kiểm soát Chi-bình phương một mẫu về tính chất độc lập (One-sample Chi-square test of independence) và bài bình chọn Chi-bình phương hai mẫu về tính chất đồng nhất (Twosample Chi-square chạy thử of homogeneity) là kiểu như nhau về cả tính toán và diễn giải.

Bạn đang xem: Kiểm định khi bình phương trong spss

Kiểm tra χ2 là 1 kiểm tra sấp xỉ về mức ý nghĩa sâu sắc đối với sự links (association) giữa hai đổi mới phân các loại (categorical variables) khi dữ liệu ở dạng đếm gia tốc và mối quan tâm tập trung vào số lượng đối tượng thuộc những loại khác nhau. Độ đúng chuẩn được kiểm tra phụ thuộc vào vào kiến tạo mẫu được sử dụng. Những tần suất là quan giáp được trong bảng 2 × 2 (‘2’ đầu tiên cho biết thêm số hàng trong bảng với ‘2’ vật dụng hai cho thấy số cột). Hai thiết kế lấy mẫu phổ cập là “kiểm tra χ2 về tính độc lập” (χ2 thử nghiệm of independence) với tổng cộng biên của hàng cùng cột ngẫu nhiên và “kiểm tra χ2 về tính đồng hóa của tỷ lệ” (χ2 thử nghiệm of homogeneity of proportions) với toàn bô biên của hàng cố định và thắt chặt hoặc là cột cầm cố định.

(1) soát sổ χ2 một mẫu mã về tính hòa bình với tổng cộng biên của hàng cùng cột ngẫu nhiên

Trong kiến tạo này, một mẫu bỗng nhiên được mang từ một số lượng dân sinh duy tốt nhất của các đối tượng người dùng nhưng với nhị thước đo cho từng đối tượng, đó là những biến nhị phân hàng và cột. Tổng kích thước mẫu, n, là cố định nhưng các tần suất vào cả tổng cộng biên của hàng cùng cột là hốt nhiên và không theo thông tin được biết trước hoặc cố định và thắt chặt trước. Những tần số biên ngẫu nhiên phụ thuộc vào cách mỗi đối tượng người tiêu dùng được phân các loại trên cả hai biến hóa nhị phân. Nghĩa là, mỗi đối tượng người dùng sẽ được phân chia vào một trong những bốn ô trong bảng 2 × 2.

Ví dụ, một công ty nghiên cứu điều tra vai trò của gia sư giáo dục quan trọng đặc biệt trong chăm lo trẻ em mắc bệnh tự kỷ hoàn toàn có thể đặc biệt cân nhắc mối quan hệ nam nữ giữa thời gian kinh nghiệm cùng với tư giải pháp là thầy giáo (biến cột) và cảm giác chi phối của mình với tư bí quyết là gia sư (biến hàng). Một mẫu bỗng nhiên duy nhất tất cả 100 thầy giáo giáo dục quan trọng được chọn từ một dân số những giáo viên này. Hồ hết giáo viên giáo dục đặc biệt được hỏi hai câu hỏi: bọn họ đã chăm sóc trẻ em mắc chứng tự kỉ được bao lâu? (các câu trả lời được phân nhiều loại thành lớn hơn hoặc bằng 5 năm hoặc thấp hơn năm năm), và cảm giác chủ đạo của mình với tư bí quyết giáo viên là gì? (các câu vấn đáp được phân loại hầu hết là giận duy trì hoặc đồng cảm). Trả thuyết nghiên cứu và phân tích là cảm hứng về phương châm của thầy giáo giáo dục đặc biệt có liên quan đến thời hạn kinh nghiệm có tác dụng việc. Giả thuyết loại bỏ là các biến hàng cùng cột là độc lập, kia là phần trăm (số lượng) kỳ vọng ​​trong từng ô của bảng tạo nên sẽ bằng nhau và sẽ không còn khác với con số quan gần kề được. Nói một cách bao quát hơn, không tồn tại mối tình dục giữa thời gian là thầy giáo và xúc cảm chi phối về phương châm của giáo viên giáo dục và đào tạo đặc biệt.

(2) đánh giá χ2 hai chủng loại về tính đồng bộ của xác suất với tổng biên của sản phẩm (hoặc cột) được cầm định

Thiết kế này được thực hiện để so sánh sự bày bán của hai xác suất trong hai dân sinh độc lập. Vào bảng gây ra 2 × 2, mỗi trở nên được xem là nhị phân. Ví dụ: đổi thay cột trong bảng 2 × 2 có thể đại diện đến hai quần thể độc lập, nam với nữ, và biến hóa hàng (biến bội phản hồi) hoàn toàn có thể đại diện cho kết quả kiểm tra được phân loại là đã đạt được hoặc ko đạt. Nhà nghiên cứu hoàn toàn có thể muốn khảo sát xem tỷ lệ ứng viên đạt có tương quan đến nam nữ hay không. Ví dụ: một mẫu ngẫu nhiên hòa bình gồm 50 nam và một chủng loại ngẫu nhiên hiếm hoi gồm 50 nữ sẽ được chọn. Tổng cột của phái nam và thiếu nữ trong ví dụ này được cố định bởi nhà nghiên cứu. Mỗi nam cùng nữ sẽ được phân nhiều loại thành một một số loại đạt hoặc ko đạt, tổng số biên của hàng là tự dưng (không được nhà nghiên cứu và phân tích cố định) và rất có thể chịu không nên số mẫu. Nếu tỷ lệ ứng viên “đạt” được biểu hiện bằng P, thì tỷ lệ không đạt vẫn là 1-P (biến là nhị phân). Trả thuyết vô hiệu hóa sẽ là phần trăm dân số (hoặc phần trăm) của nam giới và nữ vượt qua kỳ thi là bởi nhau, xuất xắc nói một phương pháp khác là không có sự biệt lập giữa nam và cô gái về tỷ lệ tỷ lệ vượt qua kỳ thi. Một dạng tổng quát hơn của trả thuyết vô hiệu hóa này là không có mối quan hệ tình dục giữa nam nữ và các thành tích thi.

2. Tư duy thống kê cùng giả thuyết vô hiệu

Suy luận thống kê là về tần suất, trong số đó số lượng những quan gần kề thuộc một loại rõ ràng trong một đội là được đối chiếu với xác suất các quan ngay cạnh thuộc thuộc một các loại từ đội kia.

Các nhóm có thể chỉ mang lại hai phép đo chủ quyền từ một số lượng dân sinh hoặc cho hai dân số tự do đã được lựa chọn ngẫu nhiên. Ví dụ, trong một nghiên cứu và phân tích về ảnh hưởng của chương trình tứ duy tích cực đến sự sáng sủa của sinh viên (sự tự tin giao tiếp tăng lên / ko tăng lên), chất vấn χ2 một mẫu về tính hòa bình sẽ được sử dụng với thi công này để phát hiện ngẫu nhiên mối tương tác nào thân sự từ tin và giới tính hay không.Các nhóm cũng hoàn toàn có thể đề cập mang lại hai dân số độc lập, ví dụ, trong một nghiên cứu về mối quan hệ giữa nam nữ và thành tựu thi, hai đội học sinh thắt chặt và cố định gồm 50 nam và 50 nữ sẽ tiến hành chọn (biến cột), tiếp nối được phân loại thành nhóm đạt và không đạt (biến hàng). Với thi công mẫu này, kiểm soát χ2 hai mẫu về sự đồng bộ của các phần trăm sẽ được thực hiện để kiểm tra sự khác biệt giữa tỉ lệ nam và phụ nữ vượt qua kỳ thi.

Đối với kiểm soát χ2 một mẫu về tính độc lập, các tham số được mong tính là tỷ lệ của mỗi ô của bảng 2 × 2 trong dân số. Giả thuyết phân tích là những biến hàng với cột thúc đẩy với nhau, nghĩa là bọn chúng không chủ quyền và phần trăm quan giáp được trong bốn ô là không giống nhau.

Tương tự, so với kiểm tra χ2 hai mẫu về tính đồng nhất của các tỷ lệ, những tham số được mong tính là xác suất của mỗi ô của bảng 2 × 2 trong dân số. Mang thuyết nghiên cứu là sự phân phối xác suất (cho một biến chuyển phân loại) là không giống nhau trong hai dân sinh (biến phân loại kia với tổng biên cố kỉnh định).

Giả thuyết vô hiệu cho tất cả χ2 một mẫu mã và hai chủng loại là không tồn tại mối dục tình giữa các biến cột với hàng. Nếu đưa thuyết loại bỏ là đúng, tỷ lệ bốn ô sẽ cân nhau và không có sự khác biệt đáng nhắc giữa tần suất ô quan tiếp giáp được với tần số ô kỳ vọng.

Phân phối χ2 là được xác định hoàn toàn bởi một thông số duy nhất, bậc thoải mái (df). Bất cứ lúc nào chúng ta đánh giá thống kê χ2, họ cần chú ý df thích hợp hợp. Trong đó, df = (số mặt hàng − 1) × (số cột − 1) với do đây luôn là giá trị ‘1’ vào bảng 2 × 2. Kiểm tra χ2 với df cung ứng một xác suất cho sự khác hoàn toàn giữa các tần suất quan liền kề được và tần suất kỳ vọng. Khi gia tốc quan gần cạnh và gia tốc kỳ vọng hệt nhau nhau, thống kê lại χ2 sẽ bởi không. Với bất kỳ độ lệch nào, quý hiếm χ2 càng khủng thì ý nghĩa thống kê càng lớn.

3. Những giả định kiểm tra (Test Assumptions)

Các giả định cơ phiên bản của cả đánh giá χ2 về tính chủ quyền và tính đồng nhất cho bảng 2 × 2 là:

Các quan liền kề là thay mặt tiêu biểu của các dân số quan lại tâm.Dữ liệu ngơi nghỉ dạng đếm tần suất quan sát.Các quan sát đề xuất độc lập, có nghĩa là, một quan gần cạnh rơi vào ngẫu nhiên hàng ví dụ nào của bảng tạo ra không nhờ vào vào cột nó ngơi nghỉ trong (và ngược lại).Các quan lại sát chỉ nên rơi vào một ô của bảng vạc sinh.Kiểm tra χ2 tránh việc được sử dụng khi ngẫu nhiên tần suất ô kỳ vọng ​​nào là nhỏ. Tần số kỳ vọng nhỏ tuổi là điểm yếu kém phổ đổi thay nhất vào việc áp dụng kiểm tra Chi-square (nghĩa là áp dụng sai Chi-bình phương). Cực hiếm kỳ vọng của 5 là số lượng giới hạn thấp duy nhất tuyệt đối. Khi form size mẫu tổng là ≥20, thì gia tốc kì vọng ​trong một hoặc hai ô rất có thể thấp mang lại 1 hoặc 2. Tuy nhiên Chi-square là 1 trong những quy trình mạnh mẽ và gia tốc ô kỳ vọng ​​2 là cung cấp liên tục, cho nên vì vậy việc thêm 0.5 vào mỗi tần số ô quan lại sát được biết sẽ cải thiện phép dao động χ2. Nói chung, phép hiệu chỉnh này không hẳn trên cơ sở triết lý mà dựa vào ứng dụng của nó vì chưng nó có thể dẫn tới sự việc mất mối cung cấp không nên thiết. Cùng với cỡ chủng loại nhỏ, nên áp dụng phép thử đúng chuẩn của Fisher (Fisher, 1935) (vui lòng đọc khám nghiệm Fisher).

4. Giấy tờ thủ tục kiểm tra χ2

Ví dụ, một nhà nghiên cứu cần đánh giá xem giới tính và hiến tiết tự nguyện của sinh viên đh có quan hệ giới tính với nhau không. Một tập tài liệu gồm 50 sinh viên được thu thập. Biến giới tính được chia thành các mức giá trị 1 = nam, 2 = nữ, và biến hiến ngày tiết tự nguyện (bạn đã từng tham gia hiến máu tự nguyện chưa?) được chia làm các mức chi phí trị 1= yes (có), 2 = no (không).

Giả thuyết thống kê H0: Không có quan hệ giữa nguyên tố giới tính với sự hiến huyết tự nguyện của các sinh viên? nút alpha được lựa chọn là 5%.

Kiểm tra χ2 đối chiếu tần số đếm được trong những ô trong bảng phát sinh với tần số đếm hy vọng ​​cho từng ô (chúng ta phải ước tính tần số kỳ vọng). Con số ô kỳ vọng ​​được ước lượng theo đưa định rằng trả thuyết vô hiệu hóa là đúng, có nghĩa là không có sự link giữa những biến hàng và cột.

Giá trị χ2 được tính cho từng ô trong bảng phân phát sinh được tính theo công thức:

*

Trong đó, O là tần suất ô quan gần cạnh được, E là tần suất ô kì vọng.

Dữ liệu khảo sát điều tra đếm gia tốc được trình diễn trong bảng bên dưới đây:

*

Các bước khám nghiệm χ2:

Bước 1: Tính quý giá kì vọng cho từng ô trường đoản cú A mang đến D

ô A: EA= (25×30)/50 = 15ô B: EB= (25×30)/50 = 15ô C: EC= (25×20)/50 = 10ô D: ED= (25×20)/50 = 10

Bước 2: Tính quý hiếm χ2 cho từng ô tự A mang lại D

ô A: χ2 = (18 – 15)2/ 15 = 0.6ô B: χ2 = (12 – 15)2/ 15 = 0.6ô C: χ2 = (7 – 10)2/ 10 = 0.9ô D: χ2 = (13 – 10)2/ 10 = 0.9

Bước 3: Tính tổng toàn bộ χ2

Tổng χ2 = 0.6 + 0.6 + 0.9 + 0.9 = 3.00

Cách suy đoán kết quả: Để đánh giá ý nghĩa sâu sắc thống kê của những thống kê χ2 được cầu lượng sinh hoạt trên, họ cần giám sát và đo lường bậc từ bỏ do thích hợp cho bảng vạc sinh, ở chỗ này df = 1. Tra bảng phân phối các giá trị χ2 cho tới hạn (vui lòng xem bảng trưng bày χ2), nút alpha được chọn đầu tiên là p≤0.05, quý giá χ2 cho tới hạn là 3.841, là giao điểm của cột alpha sống 0.05 và hàng df là 1. Vày giá trị χ2 được thống kê giám sát (3.00) bé dại hơn cực hiếm χ2 tới hạn (điều sẽ tiến hành mong hóng theo đưa thuyết vô hiệu hóa là không can dự giữa những biến hàng với cột) nên chúng ta không thể bác bỏ bỏ giả thuyết vô hiệu hóa và kết luận rằng hai thay đổi số, sự hiến tiết tự nguyện cùng giới tính là không liên quan với nhau. Tuy nhiên tỷ lệ nam giới của 60% (18/30 × 100) so với phái nữ 40% (12/30 × 100) có sự biệt lập chút ít, cơ mà sự biệt lập này là không có ý nghĩa sâu sắc thống kê sinh hoạt mức chân thành và ý nghĩa p≤0.05, bao gồm nghĩa rằng sự hiến ngày tiết tự nguyện cùng giới tính là không tương quan với nhau.

Xem thêm: Ông Chồng Quốc Dân Diễn Viên

5. Chất vấn χ2 vào SPSS

Trong SPSS, họ thực hiện nay theo tiến trình sau:

Bước 1. Vào Analyze > Descriptives Statistics > Crosstabs…

*

Bước 2. Tại cửa sổ Crosstabs, đưa phát triển thành giới tính (sex) vào ô Row(s) và biến đổi hiến máu tự nguyện (hienmau) vào ô Column(s). Chúng ta có thể nhấp vào ô Display clustered bar charts nhằm hiện đồ gia dụng thị quan hệ hai biến.

*

Bước 3. Nhấp vào tùy lựa chọn Statistics, chọn vào Chi-square, Phi & Cramer’s V. Sau đó nhấp Continue.

*

Bước 4. Nhấp vào tùy lựa chọn Cells, lựa chọn Observed, Expected với Total như trong hình. Về ý nghĩa sâu sắc thì Observed là số lượng thực tế quan sát, Expected là con số kì vọng, Total là tổng phần trăm theo từng cái và từng cột. Nếu cần hiển thị thêm quý giá % của các ô, chúng ta chọn thêm Row cùng Column. Nhấp vào Continue.

*

Bước 5. Nhấp vào OK nhằm chạy kết quả

Đọc bảng kết quả:

*

Trong bảng Giới tính * Hiến huyết tự nguyện? Crosstabulation, những giá trị sinh sống ô red color là giá bán trị thực tiễn quan tiếp giáp được. Ví dụ, tất cả 18 sv nam tham gia hiến ngày tiết tình nguyện. Tương tự, gồm 7 sinh viên cô gái tham gia hiến huyết tình nguyện. Những giá trị ngơi nghỉ ô blue color là cực hiếm kì vọng. Ví dụ, bao gồm 15 sv nam được kì vọng hiến máu tự nguyện. Tất cả 10 sinh viên bạn nữ được kì vọng hiến huyết tình nguyện. Ý nghĩa của quý hiếm kì vọng (expected), đó là lúc có đưa thiết giới tính và hiến huyết tự nguyện không tồn tại quan hệ cùng với nhau. Thì xác suất lộ diện của giới tính và sự hiến tiết tự nguyện là tự do nhau.

*

Bảng hiệu quả quan trọng độc nhất là Chi-square test. Kiểm tra Chi-bình phương chỉ có chân thành và ý nghĩa khi số quan liền kề đủ lớn, nếu có tương đối nhiều hơn 20% số ô trong bảng tạo ra có tần suất kỳ vọng (expected) nhỏ dại hơn 5 thì quý hiếm chi-square không còn đáng tin cậy. Cuối bảng Chi-Square Tests (ô màu sắc xanh) luôn luôn đưa ra một chiếc thông báo cho mình biết gồm bao nhiêu % số ô có gia tốc mong chờ expected value bên dưới 5 của bảng. Nếu như trên 20% chúng ta phải tính đến các biện pháp khác, như là sử chu chỉnh Fisher’s exact test.

Có 3 giá bán trị yêu cầu lưu ý: quý hiếm χ2 là 3.00, cực hiếm bậc tự do thoải mái df là 1, quý hiếm sig. Là 0.083. Vị sig. > 0.05 bắt buộc có bằng chứng cho thấy thêm hai biến đổi giới tính và sự hiến máu tự nguyện là hòa bình với nhau.

Còn nếu như sig. Bảng trưng bày χ2 cùng với bậc từ bỏ do là 1 trong những df. Trong lấy một ví dụ này, bởi giá trị χ2 tới hạn là 3.841 lớn hơn giá trị χ2 được tính toán (3.00) nên chúng ta không thể bác bỏ bỏ trả thuyết vô hiệu hóa và tóm lại rằng hai vươn lên là số, sự hiến tiết tự nguyện cùng giới tính là không tương quan với nhau.

*

Giả sử, giả dụ hai biến này còn có mối quan hệ giới tính với nhau, bọn họ sẽ cần nhận xét mức độ link giữa hai biến chuyển qua quý hiếm của hệ số Phi cùng Cramer’s V. Thông số Phi chỉ phù hợp để xem xét quan hệ giữa 2 thay đổi mà mỗi biến hóa chỉ gồm 2 giá bán trị, nếu 1 trong những hai biến tất cả từ 3 quý hiếm trở lên bọn họ sẽ dùng hiệu quả của Cramer’s V. Trả sử trong ví dụ như trên, họ sẽ sử dụng thông số Phi, quý giá này là 0.083, tức 8.3%, như vậy hai biến chuyển này tương quan thấp.

Trong nghiên cứu, chu chỉnh χ2 (hay rất có thể gọi là chất vấn Crosstab) thường xuyên được vận dụng nhiều khi họ cần phân tích sâu hơn mối quan hệ giữa các đặc điểm nhân khẩu học của bạn trả lời, hoặc so sánh sự liên kết giữa những yếu tố trung ương lí giáo dục.

6. Ý nghĩa của hệ số Phi và Cramer’s Phi

Kiểm định χ2 nhạy bén với cỡ mẫu mã và sát như luôn luôn có ý nghĩa sâu sắc với các mẫu lớn. Chu chỉnh χ2 đánh giá chân thành và ý nghĩa thống kê của một link chứ không hẳn sức mạnh mẽ của liên kết. Vày đó, thống kê lại kiểu tương quan được yêu ước để xác định độ bạo phổi của ngẫu nhiên mối liên kết có chân thành và ý nghĩa thống kê nào được phạt hiện bởi thống kê χ2. Hai trong các các thước đo link hữu ích độc nhất vô nhị được thực hiện là: Φ, (Hệ số Phi) và thông số Cramer’s V (đôi khi được điện thoại tư vấn là Cramer’s Phi).

*

Phi nên làm được sử dụng làm thước đo độ khỏe mạnh của liên kết khi cả hai đổi thay đều là nhị phân. Phi có số lượng giới hạn dưới là 0, có nghĩa là không có độ mạnh link (các trở nên không liên quan) và giới hạn trên là 1, độ mạnh khỏe tối nhiều của link (các biến đổi có đối sánh hoàn hảo). Lúc 1 bảng vạc sinh có rất nhiều hơn tứ ô thì nên cần sử dụng Cramer’s V nhằm đo độ bền của liên kết. Giống như như Phi, phạm vi của thống kê này đổi khác từ 0 mang lại 1.

*

Trong đó, n là tổng form size mẫu, j là số nhỏ tuổi nhất của hàng hoặc cột vào bảng phát sinh.

Tài liệu tham khảo