Giá trị p-value của kiểm định bằng bao nhiêu năm 2024

Khi kiểm nghiệm một giả thuyết, chúng ta chọn một mức ý nghĩa (α), và sau đó tính toán số liệu thống kê dựa trên các dữ liệu để lấy được một mức ý nghĩa quan sát được (p-value). Cuối cùng, so sánh 2 mức này (α và p-value) để đưa ra quyết định bác bỏ giả thuyết hoặc không bác bỏ giả thuyết.

Giá trị p (p value) là mức ý nghĩa quan sát (observed significance level), tương ứng với giá trị thống kê kiểm định.

Ví dụ: khi dùng hàm kiểm định z, giá trị p là diện tích (xác suất) của đường phân bố từ giá trị thống kê kiểm định z đến vô cực. Hay nói cách khác, giá trị p là giá trị nhỏ nhất của mức ý nghĩa α mà chúng ta từ chối giả thuyết H0. Nếu α nhỏ hơn nữa thì chúng ta chấp nhận H0 vì lúc nãy z sẽ nhỏ zα (và p sẽ lớn hơn α). Giá trị p cũng là giá trị lớn nhất của α cho phép chúng ta chấp nhận H0. Nếu α lớn hơn giá trị này, chúng ta từ chối H0.

Giá trị p đóng vai trò quan trọng trong kiểm định thống kê vì các phần mềm xử lý thống kê đều cho chúng ta giá trị này. Hơn nữa, nó rất dễ dàng nhận biết và sử dụng. Khi ra quyết định từ chối hay chấp nhận một giả thuyết chúng ta chỉ cần xem xét giá trị p. Nếu p > α chúng ta từ chối HR (chấp nhận H0) và nếu p < α chúng ta chấp nhận HR (từ chối H0)

Giá trị xác suất của kiểm định: giá trị P (P-value): Chúng ta nhìn lại bài toán kiểm định 2 phía: H 0 : a= a 0 ; H 1 : a ≠ a 0 với trường hợp n≥30 và chưa biết phương sai tổng thể. Giả sử mức ý nghĩa đang được xem xét là α 1 = 0,05 thì z α1 =1,96 và miền bác bỏ tương ứng là W α1 =(-;-1,96)  (1,96; +). Nếu từ một mẫu cụ thể ta tính được z qsA = 2,0  W α1 thì giả thiết H 0 tương ứng bị bác bỏ. Giả thiết từ một mẫu cụ thể khác ta tính được z qsB = 10 chẳng hạn thì giả thiết H 0 cũng bị bác bỏ. Ta nhận thấy việc bác bỏ H 0 trong trường hợp mẫu sau có vẻ " thuyết phục " hơn. Mặt khác, nếu thay đổi mức ý nghĩa đang được xem xét thành α 2 =0,02 thì z α2 =2,33 và miền bác bỏ tương ứng là W α2 =(-;-2,33)  (2,33;-). Lúc này ta vẫn bác bỏ H 0 nếu z qsB = 10 nhưng lại phải chấp nhận H 0 nếu dùng z qsA = 2,0. Qua đó ta thấy việc bác bỏ H 0 với z qsB = 10 khá thuyết phục nhưng việc bác bỏ H 0 với z qsB = 2,0 lại ít thuyết phục hơn. Quá trình kiểm định như trên được gọi là kiểm định theo cách tiếp cận cổ điển. Bây giờ ta tìm hiểu một cách tiếp cận khác bài toán kiểm định. Thay vì kiểm định giả thiết với một mức ý nghĩa  định trước thì người ta cho rằng sau khi định rõ các giả thiết kiểm định H 0 và giả thiết đối H 1 , ta thu thập các số liệu mẫu và xác định mức độ khẳng định việc bác bỏ giả thiết H 0. Mức độ khẳng định này thường được gọi là giá trị xác suất P hay P-value. Ta nói rằng mức ý nghĩa nhỏ nhất tại đó giả thiết H 0 bị bác bỏ được gọi là giá trị P kết hợp với mẫu quan sát được. Người ta còn gọi giá trị P là mức ý nghĩa quan sát, nó cho biết xác suất mắc sai lầm loại I tối đa khi bác bỏ giả thiết Ho với một mẫu quan sát cụ thể. Xét bài toán kiểm định trung bình tổng thể trong trường hợp mẫu lớn (n  30) và chưa biết phương sai tổng thể. Tiêu chuẩn kiểm định là thống kê 0 X-a Z= n (0,1) N s nếu chấp nhận giả thiết H 0 : " a = a 0 " đúng. a) Giả thiết kiểm định H 0 : " a = a 0 ". H 1 : " a  a 0 ". P-value = 2 P(Z >Z qs ) = 2 [ 0,5-(|Z qs |) ] = 1-(|Z qs |) VD: Nếu z qs = 2,01  P_value = 1-(2,01) = 4,44 %

Phương pháp kiểm định trị số P (tiếng Anh: P-test) là một phương pháp thống kê kiểm tra tính hợp lệ của giả thuyết không.

Giá trị p-value của kiểm định bằng bao nhiêu năm 2024

Hình minh họa. Nguồn: Thegreatcoursesplus.com

Phương pháp kiểm định trị số P

Khái niệm

Phương pháp kiểm định trị số P trong tiếng Anh là P-test.

Phương pháp kiểm định trị số P là một phương pháp thống kê kiểm tra tính hợp lệ của giả thuyết không.

Mục tiêu của phương pháp kiểm định trị số P là bác bỏ giả thuyết không (null hypothesis) bằng cách kiểm tra trong thực tế.

Kiểm định trị số P cung cấp bằng chứng để bác bỏ hoặc không thể bác bỏ (hay không kết luận được) một kết luận được chấp nhận rộng rãi.

Đặc điểm Phương pháp kiểm định trị số P

Phương pháp kiểm định trị số P tính toán giá trị p-value cho phép nhà nghiên cứu xác định độ tin cậy của giả thuyết không.

Giá trị p-value được so sánh với mức ý nghĩa thống kê (α), mà nhà nghiên cứu đã chọn để đánh giá tính ngẫu nhiên của kết quả.

Thống kê kiểm định trị số P thường theo phân phối chuẩn khi cỡ mẫu sử dụng càng lớn.

Các nhà nghiên cứu thường sẽ chọn mức α bé hơn hoặc bằng 5%, hay độ tin cậy 95% hoặc hơn.

Nói cách khác, giá trị p-value nhỏ hơn α = 5% có nghĩa là có hơn 95% khả năng kết quả của kiểm định giả thuyết là không phải do ngẫu nhiên mà có, do đó làm kết quả đáng tin cậy hơn, cho phép nhà nghiên cứu bác bỏ giả thuyết không.

Giá trị p-value

Khi tiến hành kiểm tra giả thuyết để xác nhận độ chính xác của một kết luận, nhà nghiên cứu đưa ra hai giả thuyết - giả thuyết không (H0) và giả thuyết thay thế (H1).

Khi nhà nghiên cứu sử dụng phương pháp kiểm định trị số P, họ luôn muốn bác bỏ giả thuyết không.

Giá trị p-value của kiểm định bằng bao nhiêu năm 2024

Hình minh họa. Nguồn: Saylordotorg.github.io

- Giá trị p-value càng nhỏ (p-value < α) thì giả thuyết không càng nên bị bác bỏ và giả thuyết thay thế càng đáng tin cậy.

- Giá trị p-value càng lớn (p-value> α) thì cơ sở để bác bỏ giả thuyết không càng yếu và kiểm định không có kết luận.

Một điểm khác cần lưu ý là nếu kiểm định trị số P không từ chối giả thuyết không thì kiểm định được gọi là không có kết luận chứ nó không có nghĩa là chấp nhận giả thuyết không.

Nếu giá trị p-value bác bỏ giả thuyết không thì giả thuyết thay thế được chấp nhận.

Kiểm định Z và Kiểm định T

Kiểm định Z là một phương pháp kiểm định thống kê phổ biến kiểm tra ý nghĩa thống kê của giá trị trung bình mẫu so với giá trị trung bình giả định của tổng thể biết trước độ lệch chuẩn của tổng thể (thường rất khó xác định).

Kiểm định T là một một phương pháp kiểm định thống kê thực tế hơn kiểm định Z ở chỗ nó chỉ yêu cầu biết trước độ lệch chuẩn của mẫu.