Hypothesis testing là gì

     
vào Data Mining và Business Intelligence...Data Mining & Business Intelligence...(Entire Site)
kiếm tìm kiếm

putago.vn » Data Mining & Business Intelligence » Data Mining and Business Intelligence » kiểm tra giả thuyết (Hypothesis Testing)
*
*
*
gmail.com, putago.vnSơ lược về chu chỉnh giả thuyếtGiả thuyết thốngkê (statistical hypothesis): Một đưa thuyết thống kê là 1 trong những giả định về mộttham số của tổng thể (population parameter). Giả định này còn có thểđúng hoặc không đúng.Kiểm định giảthuyết (Hypothesis Testing): Là tập hợp các bước được thực hiện để gật đầu haybác bỏ các giả thuyết thống kê.

Bạn đang xem: Hypothesis testing là gì



Giả thuyết Null (Null Hypothesis), đưa thuyết đối(Alternative Hypothesis), sai lạc loại 1 (Type 1 Error), sai lầm loại 2 (Type 2 Error)Để giải thích các định nghĩa của chu chỉnh giảthuyết, xem trường hợp sau:Một fan bị đưara tòa xét xử, và tand phải giới thiệu phán quyết về vụ án. Tất cả 4 kĩ năng trongtrường đúng theo này:Khả năng máy 1:Người bị xét xử vô tội và tòa tuyên không có tội (khôngcó không nên lầm)Khả năng thiết bị 2:Người bị xét xử vô tội và tòa tuyên có tội (cósai lầm)Khả năng sản phẩm 3:Người bị xét xử gồm tội cùng tòa tuyên vô tội (cósai lầm)Khả năng thiết bị 4:Người bị xét xử tất cả tội và tòa tuyên tất cả tội (khôngcó sai lầm)

Vậy rất có thể có nhị loại sai trái khi tuyên án:

Sai lầm nhiều loại 1 (Type 1 Error): Ngườibị xét xử vô tội trong lúc tòa tuyên gồm tội. (Oan sai)

Sai lầm nhiều loại 2 (Type 2 Error): Người bị xét xử gồm tội và tòa tuyên vô tội.

Theo nguyên lý suy đoán vô tội vào xét xử, fan bị xét xử được xem là vô tội cho tới khi bị chứng tỏ là tất cả tội. Điều đó tức là tòa án yêu cầu tìm ra vật chứng thuyết phục để ra quyết định người bị xét xử bao gồm tội hoặc vô tội.với xác suất mắc sai lạc là nhỏ dại nhất.Giả thuyết không (Null Hypothesis): trả thuyết trái với trả thuyết nghiên cứu, ký hiệuH0Giả thuyết đối (Alternative Hypothesis): giả thuyết nghiên cứu, ký hiệu Ha

Bước 1: vạc biểu đưa thuyết ko (H0) vàđối thuyết (Ha)

Bước 2: xác định mức chân thành và ý nghĩa ( ): điều kiện để ra quyết định

Bước 3. đo lường thống kê bên trên mẫu

Bước 4. Ra quyết định dựa vào p value:Nếu p value ): chưng bỏH0; Nếu phường value > mức ýnghĩa ( ) khôngcó cơ sở để bác bỏ H0.


Thông thường,mức ý nghĩa sâu sắc được thiết lập là 10%, 5% hoặc 1% phụ thuộc vào bài toán. Nếu điểm kiểm tra(test score) tra bên trong vùng chấp nhận (cónghĩa là test score 0,ngược lại thì bác bỏ bỏ H0 và gật đầu đồng ý HaNhưng vì sao lại áp dụng p-value lúc ta rất có thể bácbỏ/chấp nhấn giả thuyết phụ thuộc vào test score với critical value.p-valuecó ích là họ chỉ đề nghị 1 quý giá (p) nhằm ra quyết định về mang thuyết, chúngta không nên tính 2 giá trị khác nhau là kiểm tra score với critical value.Các phương pháp kiểm định

Kiểm định Z (Z Test)

Kiểmđịnh Z khi:

Biết phương sai của toàn diện (population variance), hoặc băn khoăn phương sai toàn diện nhưng size mẫu (sample size) >= 30

One-Sample Z test

One-Sample Z demo được triển khai khi muốn so sánh trung bình mẫu(sample mean) với trung bình tổng thể (populationmean).


Ví dụ:

Để kiểmtra liệu điểm thi vừa phải của thí sinh người vợ có > 600 tốt không. Họ cóthông tin về độc lệch chuẩn điểm thi của cô bé là 100. Chúng ta thu thập dữ liệuđiểm thi của 20 sinh viên và thiết lập mức ý nghĩa sâu sắc ⍺ là 5%.


Trong lấy ví dụ này:

Mean Score của nữ: 641 size mẫu: đôi mươi Trung bình tổng thể và toàn diện (population mean): 600 Độ lệch chuẩn của tổng thể (Standard Deviation for Population): 100


Vì p-value 600.

Xem thêm: Top 5 Phần Mềm Sắp Xếp Icon Trên Desktop Miễn Phí, Tốt Nhất Hiện Nay

Two Sample Z Test

TwoSample Z Testđược triển khai khi muốn so sánh giá trị mức độ vừa phải của 2 mẫu


Vídụ:

Chúng ta mong biết rằng liệu điểm trung bìnhcủa nữ to hơn 10 điểm đối với điểm vừa phải của nam tốt không? bọn họ biếtđộ lệch chuẩn điểm của bạn nữ là 100 cùng của phái nam là 90. Tích lũy dữ liệu về điểm của20 đàn bà và nam giới như sau, cùng với mức ý nghĩa ⍺ là 0.05.


Trong ví dụ này:

Điểm mức độ vừa phải của chị em (Sample Mean): 641 Điểm trung bình của người vợ (Sample Mean): 613.3 Độ lệch chuẩn chỉnh tổng thể của nữ: 100 Độ lệch chuẩn tổng thể của Nam: 90 kích cỡ mẫu (Sample Size):20 (cho cả Nam với Nữ) Sự khác hoàn toàn giữa 2 vừa đủ của tổng thể: 10


p-value >0.05nên ta không có cơ sở để chưng bỏ H0 (Null Hypothesis).Có nghĩa là bọn họ không có đủ bằng chứng để tóm lại rằng điểm vừa phải củanữ cao hơn điểm vừa đủ của nam giới 10 điểm.

Kiểm định t (t-Test)

t-testđược áp dụng khi:

lưỡng lự phương sai tổng thể (population variance) kích cỡ mẫu nhỏ (n

One-Sample t-test

One-Samplet-test được thực hiện để so sánh trung bình mẫu (sample mean) vớitrung bình tổng thể và toàn diện (population mean). Khác với Z Test, t-test không đề xuất biếtphương không nên của tổng thể. Chúng ta sử dụng độ lệch chuẩn của chủng loại (samplestandard deviation) gắng cho độ lệch chuẩn của toàn diện (population standard deviation).


Ví dụ:


Trongví dụ này:

·Trung bình điểm thi của Nữ:606.8

·Kích thước mẫu: 10

·Trung bình toàn diện (populationmean): 600

·Độ lệch chuẩn chỉnh mẫu (StandardDeviation for the sample): 13.14


P-value > 0.05 vìvậy không tồn tại cơ sở để bác bỏ H0 (null hypothesis). không tồn tại đủ minh chứng để kết luận rằng điểm vừa phải của Nữlớn rộng 600.

Two-Sample t-Test

Two-Samplet-test được triển khai để đối chiếu trung bình của 2 mẫu.

Xem thêm: Ý Nghĩa Vh Là Gì ? Ý Nghĩa Của Từ Vh Là Gì


Ví dụ: Two-Sample t-Test

Chúngta ý muốn kiểm tra liệu điểm mức độ vừa phải của nam to hơn điểm trung bình của chị em là10 thế mạnh không. Bọn họ không có tin tức về phương không đúng (hay độ lệchchuẩn) về điểm thi của tất cả Nam cùng Nữ. Tích lũy dữ liệu về điểm thi của 10 nam và10 chị em một giải pháp ngầu nhiên như sau (với mức ý nghĩa sâu sắc ⍺ là 0.05 để kiểm nghiệm giả thuyết):


Trongví dụ này:

Điểm vừa phải của Nam: 630.1 Điểm mức độ vừa phải của Nữ: 606.8 khác hoàn toàn điểm mức độ vừa phải của Nam với Nữ: 10 Độ lệch chuẩn chỉnh điểm thi Nam: 13.42 Độ lệch chuẩn điểm thi Nữ:13.14


P-value 0 (chấp nhận H1)và tóm lại rằng điểm mức độ vừa phải của Nam cao hơn nữa điểm mức độ vừa phải của nữ giới 10 điểm.

kimsa88
cf68