F test là gì

  -  

Kiểm định F, Khi được áp dụng để phân tích hồi quy, có thể chấp nhận được chúng ta đối chiếu nhị mô hình hồi quy tuyên chiến đối đầu và cạnh tranh về kỹ năng “giải thích” pmùi hương không nên vào đổi mới phụ thuộc.

Bạn đang xem: F test là gì

Kiểm định F được thực hiện hầu hết trong ANOVA với trong đối chiếu hồi quy. Chúng tôi vẫn phân tích bài toán áp dụng nó trong hồi quy đường tính .

Tại sao sử dụng kiểm nghiệm F vào so với hồi quy

Trong hồi quy đường tính, kiểm tra F hoàn toàn có thể được sử dụng để trả lời các câu hỏi sau:

quý khách hàng sẽ rất có thể nâng cao quy mô hồi quy con đường tính của bản thân bằng phương pháp làm cho nó phức hợp hơn, có nghĩa là bằng cách thêm nhiều biến hóa hồi quy tuyến đường tính vào nó?Nếu bạn đã sở hữu một mô hình hồi quy tinh vi, liệu chúng ta gồm cần giao dịch quy mô phức hợp của chính bản thân mình cùng với quy mô chỉ tiến công ngăn (là mô hình hồi quy tuyến đường tính đơn giản và dễ dàng tuyệt nhất mà bạn có thể xây dựng) không?

Mô hình bị hạn chế được cho là được lồng vào quy mô không trở nên tinh giảm.


*
Mô hình hồi quy con đường tính: không tinh giảm, hạn chế còn chỉ giới hạn đánh ngăn (Bức Ảnh của Tác giả)

Hãy cùng tò mò bí quyết áp dụng F-test bởi ví dụ về chuỗi thời hạn trong thế giới thực. Chúng tôi sẽ bước đầu bằng cách xuất bản một quy mô chỉ đánh chặn — quy mô giảm bớt.

Một ánh nhìn ngắn thêm gọn gàng về mô hình chỉ tiến công chặn

Chuỗi thời gian dưới đây cho thấy thêm giá chỉ đóng cửa hàng ngày của Chỉ số Công nghiệp Dow Jones trong vòng thời gian 3 mon.


*
Giá tạm dừng hoạt động vừa phải công nghiệp của Dow Jones trong khoảng thời gian 3 mon (Hình ảnh của tác giả)

Giả sử bọn họ mong mỏi chế tác một quy mô hồi quy mang đến chuỗi thời gian này. Nhưng chúng tôi ngần ngừ đa số nhân tố làm sao ảnh hưởng đến Giá tạm dừng hoạt động. Chúng tôi cũng không thích mang định bất kỳ lạm phát kinh tế, Xu thế hoặc tính thời vụ làm sao trong tập tài liệu.

Trong ngôi trường vừa lòng không tồn tại ngẫu nhiên mang định nào về lạm phát kinh tế, xu hướng, tính thời vụ hoặc sự hiện diện của các biến chuyển lý giải, điều cực tốt chúng ta cũng có thể có tác dụng là quy mô chỉ tấn công chặn (thỉnh thoảng được điện thoại tư vấn là mô hình trung bình ). Nó tất cả dạng sau đến ví dụ chuỗi thời gian của chúng tôi:


*
Mô hình chỉ đánh chặn đến tập dữ liệu DJIA (Hình ảnh của Tác giả)

Trong quy mô chỉ ngăn, tất cả những dự đoán dấn quý giá của hệ số chặn Beta_0. Biểu đồ sau cho biết thêm mô hình chỉ tiến công chặn được máy vào bối cảnh của chuỗi thời gian thực tế:


*
Giá tạm dừng hoạt động thực tiễn với dự đoán thù của DJIA áp dụng mô hình mức độ vừa phải (Bức Ảnh của tác giả)

Đây là mã Pydong dỏng nhằm tạo nên những công dụng trên:

Nhập toàn bộ những gói được yêu thương cầu:

import pandas as pdimport numpy as npimport matplotlib.pyplot as plt

df = pd.read_csv("djia.csv", header=0, infer_datetime_format=True, parse_dates=<0>, index_col=<0>)

mean = round(df<"Closing Price">.mean(),2)y_pred = np.full(len(df<"Closing Price">), mean)

fig = plt.figure()fig.suptitle("DJIA Closing Price")actual, = plt.plot(df.index, df<"Closing Price">, "go-", label="Actual Closing Price")predicted, = plt.plot(df.index, y_pred, "ro-", label="Predicted Closing Price")plt.xlabel("Date")plt.ylabel("Closing Price (USD)")plt.legend(handles=)plt.show()

Một mô hình cạnh tranh

Giả sử bởi một số đối chiếu, Cửa Hàng chúng tôi đã suy luận rằng quý hiếm từ bây giờ của Giá ngừng hoạt động của DJIA rất có thể biến chuyển một dự đân oán tốt về Giá tạm dừng hoạt động ngày mai.

Để kiểm tra lý thuyết này, Shop chúng tôi đã cải tiến và phát triển một mô hình hồi quy tuyến tính gồm 1 đổi thay hồi quy duy nhất. Biến này sẽ là cực hiếm trễ thời hạn của chuỗi thời hạn. Đoạn mã Pybé nhỏ sau minc họa quy trình hồi quy:

Nhập các gói bắt buộc:

import pandas as pdimport numpy as npimport statsmodels.api as sm

df = pd.read_csv("djia.csv", header=0, infer_datetime_format=True, parse_dates=<0>, index_col=<0>)

df<"CP_LAGGED"> = df<"Closing Price">.shift(1)

df_lagged = df.drop(df.index<0>)

split_index = round(len(df_lagged)*0.8)split_date = df_lagged.indexdf_train = df_lagged.loc.copy()X_train = df_train<"CP_LAGGED">.values#Add a placeholder for the constant so that mã sản phẩm computes an intercept value. The OLS regression equation will take the form: y = Beta_0 + Beta_1*xX_train = sm.add_constant(X_train)y_train = df_train<"Closing Price">.valuesX_kiểm tra = df_test<"CP_LAGGED">.values#Add a placeholder for the constantX_test = sm.add_constant(X_test)y_thử nghiệm = df_test<"Closing Price">.values

ols_Model = sm.OLS(y_train,X_train)ols_results = ols_Mã Sản Phẩm.fit()

y_pred_train = ols_results.predict(X_train)y_pred_demo = ols_results.predict(X_test)

fig = plt.figure()fig.suptitle("DJIA Closing Price")actual, = plt.plot(df_thử nghiệm.index, y_kiểm tra, "go-", label="Actual Closing Price")predicted, = plt.plot(df_test.index, y_pred_demo, "ro-", label="Predicted Closing Price")plt.xlabel("Date")plt.ylabel("Closing Price (USD)")plt.legend(handles=)plt.show()


*
Dự đoán so với cái giá đóng cửa thực tiễn của DJIA bằng cách thực hiện quy mô hồi quy OLS trên tập tài liệu thử nghiệm (Hình ảnh của tác giả)

Thoạt quan sát, năng suất của mô hình này trông tốt rộng nhiều đối với những gì công ty chúng tôi nhận được từ quy mô vừa đủ. Nhưng chất vấn kỹ rộng cho thấy rằng trên từng bước một thời gian, mô hình chỉ dễ dàng và đơn giản là học phương pháp dự đân oán về cơ bản giá trị quan gần kề trước này được bù đắp vày một lượng nhất định.

Tuy nhiên, quy mô phát triển thành trễ này thể chuyển động tốt hơn về mặt những thống kê so với mô hình chỉ tấn công ngăn vào Việc phân tích và lý giải lượng phương thơm không nên vào Giá tạm dừng hoạt động. Chúng tôi vẫn thực hiện F-chạy thử nhằm khẳng định coi điều này có đúng không ạ.

Pmùi hương pháp demo nghiệm

Pmùi hương pháp thể nghiệm của Cửa Hàng chúng tôi đang nlỗi sau:

Chúng tôi bắt đầu với hai đưa thuyết:

H_0: Giả ttiết Null: Mô hình biến trễ không giải thích phương không đúng vào Giá tạm dừng hoạt động của DJIA xuất sắc rộng ngẫu nhiên mô hình chỉ đánh ngăn làm sao.H_1: Giả tngày tiết cố kỉnh thế: Mô hình biến trễ tiến hành quá trình tốt hơn (Theo phong cách bao gồm chân thành và ý nghĩa thống kê) vào câu hỏi giải thích phương thơm không đúng trong Giá đóng cửa của DJIA đối với quy mô chỉ chặn.Giả tmáu rỗng có thể bị chưng bỏ (và đưa ttiết sửa chữa được chấp nhận) vào phạm vi không nên số làm sao kia, HOẶCGiả ttiết loại bỏ đề xuất được chấp nhận.

Để kết thúc những phương châm bên trên, Cửa Hàng chúng tôi vẫn làm theo quá trình sau:

Xây dựng kiểm tra thống kê lại cho F-chạy thử còn gọi là F-statistic .Xác định tính khả vi P tài năng xảy ra D tính xác minh F của trở nên tình cờ mà lại thống kê lại F màn biểu diễn bên dưới giả thiết rằng đưa tngày tiết trống rỗng là đúng .Cắm những giá trị vào phương pháp mang đến F-statistic cùng tính toán thù quý giá Xác Suất tương xứng bằng phương pháp thực hiện P robability D ensity F quẹt kiếm tìm thấy trong bước 2. Đây là tài năng quan liêu ngay cạnh các quý giá F-statistic trả định rằng đưa tngày tiết là đúng .Nếu phần trăm tìm thấy sinh hoạt bước 3 bé dại hơn ngưỡng lỗi, chẳng hạn như 0,05, bác bỏ vứt giả ttiết rỗng và đồng ý trả tmáu sửa chữa thay thế ở mức tin cậy (1,0 - ngưỡng lỗi), ví dụ: 1–0,05 = 0,95 (Tức là độ tin tưởng 95% cấp độ). Nếu ko, hãy gật đầu đồng ý trả tmáu rỗng cùng với Tỷ Lệ không nên bằng không nên số ngưỡng, ví dụ: 0,05 hoặc 5%.

BƯỚC 1: Phát triển trực quan đến những thống kê test nghiệm

Nhớ lại rằng chu chỉnh F giám sát cường độ xuất sắc rộng của một quy mô phức tạp so với một phiên bạn dạng dễ dàng và đơn giản hơn của cùng một mô hình về năng lực lý giải pmùi hương không nên của biến đổi phụ thuộc.

Hãy lưu ý nhì quy mô hồi quy 1 cùng 2:

Cho Mô hình 1 gồm k_1 tmê say số. Mô hình 2 tất cả k_2 tham mê số.Cho k_1 bởi vậy, mô hình một là phiên bản dễ dàng và đơn giản rộng của quy mô 2. Có nghĩa là quy mô một là quy mô giảm bớt và quy mô 2 là quy mô ko giảm bớt. Mô hình 1 hoàn toàn có thể được lồng vào quy mô 2.Gọi RSS_1 với RSS_2 là tổng bình phương thơm của sai số dư sau thời điểm Mô hình 1 cùng Mô hình 2 được đính thêm vào và một tập tài liệu.Hotline n là số chủng loại dữ liệu.
*
Công thức mang lại thống kê lại F khi vận dụng cho so với hồi quy (Hình ảnh của Tác giả)

Công thức thống kê lại F cho phép các bạn tính tân oán bao nhiêu phương thơm không nên trong biến đổi nhờ vào, mô hình đơn giản và dễ dàng rộng không thể lý giải được so với quy mô phức tạp, được thể hiện dưới dạng một trong những phần của phương thơm không nên ko phân tích và lý giải được từ bỏ mô hình phức hợp.

Trong đối chiếu hồi quy, không đúng số bình pmùi hương vừa đủ của mô hình được điều chỉnh là một trong phép đo tuyệt đối hoàn hảo mang đến pmùi hương không nên không giải thích được. Trong số đó giải thích các luật pháp RSS sống tử số cùng chủng loại số.

Tử số cùng mẫu mã số được phân chia tỷ lệ phù hợp bằng cách thực hiện các bậc tự do gồm sẵn tương ứng.

Xem thêm: Canxi Nên Uống Trước Hay Sau Khi Uống Canxi Không Nên Ăn Gì ?

Thống kê F tự nó là 1 trong vươn lên là thiên nhiên.

Hãy xác minh P năng lực đổi khác D tính F nhưng thống kê lại F tuân thủ theo đúng.

BƯỚC 2: Xác định Hàm Mật độ Xác suất của những thống kê F

Chụ ý rằng cả tử số với mẫu mã số của những thống kê thể nghiệm rất nhiều đựng tổng bình pmùi hương sai số dư. Cũng lưu giữ lại rằng vào hồi quy, lỗi dư xảy ra là 1 trong những trở nên ngẫu nhiên với một vài hàm tỷ lệ tỷ lệ (hoặc khối lượng xác suất), nghĩa là PDF hoặc PMF tùy ở trong vào câu hỏi nó tiếp tục tuyệt tránh rạc. Trong trường hòa hợp này, Cửa Hàng chúng tôi quan tâm cho việc tìm và đào bới PDF của những thống kê F.

Nếu họ đưa định rằng những không nên số dư từ bỏ nhị mô hình là 1) tự do cùng 2) phân phối hận chuẩn chỉnh, bỗng nhiên xẩy ra là hưởng thụ của hồi quy O rdinary L đông S quares, thì rất có thể thấy rằng tử số và mẫu số của F- phương pháp thống kê lại chứa tổng bình phương của các phát triển thành thiên nhiên tự do, phân pân hận chuẩn.

cũng có thể chứng tỏ rằng tổng bình phương thơm của k biến chuyển thiên nhiên chuẩn, độc lập chuẩn theo đúng PDF của phân păn năn Chi bình phương thơm (k).


*

Do đó, tử số với mẫu số của cách làm thống kê lại F hoàn toàn có thể được hiển thị cho từng phiên phiên bản phần trăm tuân theo nhị phân pân hận bỏ ra bình pmùi hương.

Với một chút ít toán học, cũng hoàn toàn có thể chỉ ra rằng Xác Suất của nhì vươn lên là tự nhiên tất cả phân pân hận Chi-bình pmùi hương được chia xác suất tương thích, bản thân nó là 1 trong những biến hóa tình cờ tuân thủ theo đúng phân phối hận F , có PDF được hiển thị bên dưới.


*
*
(Bức Ảnh của Tác giả)

lúc đó, X có thể được biểu lộ bằng xác suất của nhì đổi mới tự dưng được phân chia Phần Trăm thích hợp X_1X_2 , mỗi vươn lên là gồm PDF của phân pân hận Chi bình phương. I E :


*
Biến tự dưng tất cả phân păn năn F X, được bộc lộ bởi tỷ lệ của nhị đổi mới bỗng nhiên phân phối hận Chi bình phương thơm được phân chia tỷ lệ X_1 và X_2 (Tấm hình của Tác giả)

Bây giờ đồng hồ hãy nhớ lại rằng k_1 cùng k_2 là số trở thành trong những mô hình đơn giản và tinh vi M1 với M2 đang giới thiệu trước đó, cùng n là con số chủng loại dữ liệu.

Thay cố gắng d_1 cùng d_2 nhỏng sau:

d_1 = (k_2 - k_1) là hiệu số bậc tự do của các phần dư của nhì phong cách M1 với M2 được so sánh, và

d_2 = (n - k_2) là bậc tự do thoải mái của các phần dư của quy mô phức hợp M2,

Với hồ hết sửa chữa này, chúng ta có thể viết lại phương pháp của phân păn năn F nlỗi sau:


*
Công thức thay thế sửa chữa cho tệp PDF của phân phối F (Bức Ảnh của tác giả)

Hãy đối chiếu phương pháp bên trên cùng với công thức đến thống kê lại F (được tái hiện mặt dưới), trong số ấy chúng ta hiểu được tử số với mẫu mã số chứa những tệp PDF được chia phần trăm tương thích của phân phối Chi bình phương:


So sánh hai công thức này, ví dụ là:

Bậc thoải mái " a" của phân phối hận Chi bình phương thơm vào tử số là (k1 - k2).Bậc tự do thoải mái " b" của phân phối hận Chi bình pmùi hương ngơi nghỉ chủng loại số là (n - k2).Thống kê kiểm định của kiểm tra F tất cả cùng PDF với thống kê của phân phối F.

BƯỚC 3: Tính cực hiếm của những thống kê F

Nếu các bạn áp dụng statsmodels" s OLS ước tính, công đoạn này là 1 trong vận động một mẫu. Tất cả những gì bạn cần làm là in OLSResults.summary () cùng bạn sẽ nhấn được:

Giá trị của thống kê lại F và,Giá trị "p" tương xứng, Tức là tỷ lệ chạm chán buộc phải giá trị này, trường đoản cú PDF của phân phối hận F.

print(ols_results.summary())


BƯỚC 4: Xác định xem mang thuyết loại bỏ rất có thể được đồng ý tuyệt không

OLSResults.summary () in ra tỷ lệ xuất hiện của những thống kê F theo mang định rằng trả ttiết trống rỗng là đúng, bọn họ chỉ việc so sánh Xác Suất này với mức giá trị alpha ngưỡng của họ. Trong ví dụ của chúng tôi, giá trị p được trả về vì .summary () là 4,84E-16, là một trong những cực kỳ bé dại. Nhỏ rộng nhiều so với thậm chí còn alpha = 0,01. Do kia, bao gồm ít hơn 1% kĩ năng những thống kê F là 136,7 hoàn toàn có thể xẩy ra một phương pháp tình cờ bên dưới trả thiết của một giả thuyết Null thích hợp lệ.

Do kia, Cửa Hàng chúng tôi bác quăng quật giả ttiết Null với đồng ý trả thuyết thay thế sửa chữa H_1 rằng mô hình phức tạp, tức là quy mô trở nên trễ, tuy vậy gồm có không nên sót rõ ràng, rất có thể phân tích và lý giải pmùi hương sai trong đổi mới dựa vào Giá đóng cửa giỏi rộng so với mô hình chỉ đánh chặn.

Đây là mã nguồn Pynhỏ bé hoàn chỉnh được hiển thị vào nội dung bài viết này:

Tệp dữ liệu cất giá chỉ tạm dừng hoạt động của DJIA tại chỗ này .

Phần kết luận

Kiểm định F rất có thể được sử dụng trong đối chiếu hồi quy nhằm khẳng định coi liệu một quy mô phức hợp có tốt rộng một phiên phiên bản dễ dàng hơn của và một quy mô vào bài toán phân tích và lý giải phương không nên trong trở thành nhờ vào hay là không.Thống kê kiểm định của phnghiền chu chỉnh F là một trong những biến hóa tự dưng bao gồm P khả năng khẳng định D độ phân giải F là phân phối hận F theo giả định rằng mang tngày tiết trống rỗng là đúng.Quy trình chất vấn so với kiểm tra F để hồi quy tương đương cùng với cấu tạo của chính nó về cấu tạo của các kiểm nghiệm tđê mê số không giống có ý nghĩa sâu sắc nhỏng chu chỉnh t.

Xem thêm: Top 10 Game Đá Bóng Hay Cho Android Và Ios Hay Nhất, Top 5 Game Bóng Đá Mobile Hay Nhất 2021

Nếu bạn thích nội dung bài viết này, hãy theo dõi và quan sát tôi tại Sachin Date để nhận các mẹo, trả lời cùng lời khuyên lập trình sẵn về những chủ đề giành riêng cho so với với dự đoán chuỗi thời gian.


Năm 1973, những nhà tân oán học tài thiết yếu Fischer Blachồng cùng Myron Scholes đang xuất phiên bản một bài bác báo học thuật tất cả tiêu đề "Định giá những quyền lựa chọn và nợ công ty", trong những số ấy có những gì sẽ biến một trong những phương trình quan trọng đặc biệt nhất trong tất cả tài thiết yếu tân oán học, mô hình Black-Scholes < 1>. Mô hình là một trong pmùi hương trình vi phân ngẫu nhiên-riêng phần được sử dụng để chỉ định và hướng dẫn quý giá cho 1 quyền lựa chọn giao diện châu Âu, một nhiều loại tài sản được cho phép tín đồ nắm giữ cài hoặc buôn bán cổ phiếu nghỉ ngơi mức giá bây giờ bất kỳ hành vi sau này của chính nó.