Exponential smoothing là gì

  -  
vào Data Mining and Business Intelligence...Data Mining và Business Intelligence...(Entire Site)
Tìm kiếm
saboten.vn » Data Mining và Business Intelligence » Data Mining & Business Intelligence » Phân tích hàng số thời gian (Time Series Analysis)
*

*

*

email.com, http://hetphái mạnh.vn

Sơlược về dãy số thời gian

Dãy số thời gian(Time Series) làhàng những trị số của chỉ tiêu thống kê được bố trí theo sản phẩm trường đoản cú thời hạn. Mộthàng số thời hạn bao gồm nhị nguyên tố đó là thời gian với tiêu chuẩn của hiện tượngnghiên cứu. Thời gian có thể là thời kì hoặc thờiđiểm. Độdài giữa hai thời gian ngay tức khắc nhau hotline là khoảng cách thời hạn. Trị số của chỉ tiêu có thể là số tuyệt vời và hoàn hảo nhất, số tương đối hoặc sốvừa đủ.

Dãy số xuất xắc đối: Lúc các mứcđộ (level) của dãy số là số xuất xắc đối(ex: bảng doanh thu (tỷ đồng) quan liêu những năm)

Dãy số tương đối: Khi các mứcđộ của dãy số là số tương đối (ex: vận tốc tăng lợi nhuận qua các năm)

Dãy số trung bình: Khi cácmức độ của dãy số là số mức độ vừa phải (ex: tiền lương mức độ vừa phải của lao hễ quanhững năm).quý khách hàng vẫn xem: Exponential smoothing là gì

Dãy số thời giancòn gọi làchuỗi thời hạn.

Bạn đang xem: Exponential smoothing là gì

Phân tích hàng số thời gian cho phépnghiên cứu xu hướng biến động của hiện tượng lạ qua thời hạn. Từ kia, tìm thấy tínhquy công cụ của sự việc biến đổi, bên cạnh đó dự đoán được các mức độ của hiện tại tượngtrong tương lai.

Phântích hàng số thời hạn tương quan mang lại các nguyên tố sau:

1.Level (mức độ của dữ liệu)

2.Trover (tính xu hướng)

3.Season (tính mùa vụ)

4.Random noise (nhiễu ngẫu nhiên)

Mối tình dục vị các yếu tố trên rất có thể biểudiễn bằng phương thơm trình sau:

Time series data (y) = function of (level,trkết thúc, seasonality) + random noise

Tùynằm trong vào thực chất của tài liệu, những yếu tố trên đang liên can cùng với nhautheo mô hình cộng (additive sầu model) hoặcnhân (multiplicative sầu model)

Additive model:

Y = level + trkết thúc + seasonality + noise

Multiplicative model:

Y = màn chơi * trkết thúc * seasonality * noise

Một số áp dụng điểnhình của Time Series

Ý tưởng chủ yếu của phân tích hàng số thời gianlà đối chiếu và quan sát và theo dõi tài liệu theo thời gian phải được vận dụng vào rấtcác lĩnh vực khác biệt nlỗi Sales Forecast (dự báo doanh số), Stoông chồng priceprediction (dự làm giá chứng khoán), Meteorology and Climate (dự báo, phân tíchhiện tượng vào khí tượng và khí hậu), Econometrics (tài chính lượng, phần lớnnhững chỉ số tài chính đông đảo thêm với thời hạn, bao gồm xu hướng với tính mùa vụ rất rõ, vídụ nlỗi GDP).

Bài viết này trình diễn phân tíchhàng số thời gian vào Tableau cùng với cỗ dữ liệu Superstore bao gồm những ngôn từ chínhsau:

1.Trực quan xu hướng doanh số bán sản phẩm (Sales) theothời gian (years, quarters, months, weeks, days)

2.Phân tích xu ráng của doanh thu bán hàng thực hiện đườngxu hướng (trend line)

3.Phân tích xu hướng áp dụng cách thức trung bìnhtrượt (moving average method)

4.Phân tích tính mùa vụ (seasonality) của tài liệu thờigian (seasonality)

5.Dự báo doanhsố bán sản phẩm (Forecast sales) thực hiện phương pháp làm cho trót lọt gàm mũ ( exponentialsmoothing method)

#1. Trực quan lại xu hướng doanh thu bán hàng (Sales) theo thờigian

Doanh số bán hàng theo Năm


*

*

Từ những biểu vật dụng lợi nhuận theo thời hạn (thường niên,quý, tháng, tuần ngày), bạn cũng có thể quan lại cạnh bên hầu như điều sau:

- Biểu đồ dùng doanh thu sản phẩm nămcho biết thêm tổng doanh số đã tăng mạnh theo những năm, xác minh sự hiện tại diệncủa Xu thế dài hạn.

- Biểu đồ lợi nhuận hàng quýcho biết thêm cả xu hướng cũng giống như tính mùa vụ. Tổng lợi nhuận tăng vọt theo năm,tổng lợi nhuận cao vào quý IV hàng năm với tốt vào quý 1 mặt hàng năm.

- Biểu thiết bị lợi nhuận hàngtháng cũng xác nhận tính chất giống như nhưng chúng tađang quan tiền tiếp giáp trong biểu đồ vật lợi nhuận mặt hàng quý.

- Doanh số bán hàng nhìn bao quát đãtăng theo năm cùng theo mùa: Tháng 11 cùng mon 12 là đông đảo mon bán hàng tốt, trong khi đótháng 1 với tháng 2 là đa số mon bán sản phẩm tệ.

- Xu phía bán sản phẩm hàngtuần cùng hằng ngày khó phát âm cụ thể do bao gồm rất nhiều điểm dữ liệu dịch chuyển. Nhữngbiểu trang bị này không giỏi cho bài toán đưa ra những nhận xét vềxu hướng.

- Vậy giả dụ buộc phải lựa chọn biểu thiết bị nhằm báocáo về tình hình lợi nhuận bán hàng theo thời hạn thìhãy lựa chọn biểu trang bị doanh thu hàng quý hoặc các tháng.

#2. Phân tích xu ráng của lợi nhuận bánsản phẩm thực hiện mặt đường Xu thế (trend line)

Chúng ta thấy rõ ràng sự hiện hữu của xuphía trong tài liệu chuỗi thời gian. Nhưng làm nạm nào để họ hội chứng minhrằng Xu thế đó thực sự đã hiện nay hữu?

Trong Tableau rất có thể hiển thị cáccon đường xu hướng(trover line), những mặt đường này vẫn hiển thị hướng nhưng cácquý hiếm dữ liệu digửi theo thời gian. Đường Xu thế cùng rất các tsi mê số thống kê lại của nó chobiết Xu thế quan lại gần cạnh được tất cả chân thành và ý nghĩa những thống kê hay không ( P-value .


Đường Xu thế trêncho thấy thêm công bố gì?

Đường xu hướng cho biết thêm rằng tổng doanh thu tăng lên theo thời hạn (độ dốc (slope) >0).Chỉ số R bình phương (R-Squared) càng nhỏCó nghĩa là ảnh hưởng tác động của thời gian càng ít đối với sự đổi khác của doanhsố bán sản phẩm. Nếu giá trị bình pmùi hương R ngay sát bằng 0, thì bạn có thể nói rằngkhông tồn tại xu hướng. Trong trường thích hợp này cực hiếm R-Squared không cao (=0.25)nhưng mà mặt khác nó cũng không cực thấp, vị vậy chúng ta cũng có thể kếtluận rằng gồm một Xu thế hiện nay cơ mà yếu ớt.

P-value = 0.000285(

Tóm lại, con đường Xu thế trên bao gồm những lên tiếng sau

1.Positive: Xu hướng tăng

2.Weak (R-squared = 0.25): Xu hướng tất cả nhưng yếu

3.Significant (P-value

Đường xu hướng rất hữu ích khi đối chiếu hàng số thời gian, giúpta trả lời các thắc mắc nhỏng hiện tượng lạ phát triển thành thiên có Xu thế ko, ví như có xuhướng thì tăng hay bớt, Xu thế kia bao gồm mạnh cùng tất cả chân thành và ý nghĩa thống kê lại không.

#3.Phân tích Xu thế áp dụng phương thức trung bình tđuổi (moving average method)

Tínhmùa vụ (seasonality)

Tính mùa vụ đã tác động bự cho xu hướng và R-squared do cách thức bình phương thơm nhỏ dại tuyệt nhất (least square method). Do đó giả dụ họ sa thải hoàn toàn tính mùa vụ hoặc loại bỏ những tác động cực đoan của tính mùa vụ thì bạn có thể thấy xu hướng trông rất nổi bật rộng.
Trong hình bên trên tathấy rằng R bình phương tương đối cao (0.86).Như vậy có nghĩa là xu hướng là bao gồm thiệt và trông rất nổi bật. Nhìn vào hệ số độ dốc của nămvào quy mô là 242.463 vấn đề đó Tức là doanhsố bán hàng đang tăng mức độ vừa phải 242 nghìn đô la sau mỗi năm.

Tuynhiên, tất cả một sự việc cùng với P-value của mô hình. Bây giờ nó đã tạo thêm 0.07 (P- value >0,05 tức là quy mô không tồn tại ý nghĩa). Như vậy là vì chúng tachỉ tất cả 4 điểm dữ liệu (4 năm) trong biểu thứ, quá không nhiều tài liệu đểhồi quy và môtả Xu thế của mô hình một phương pháp đúng mực.

Làm giải pháp làm sao họ cóthể thải trừ tính mùa vụ?

Câutrả lời là làm cho trơn tru dữ liệu (smoothing). Txuất xắc do áp dụng doanhsố bán hàng, chúng ta cũng có thể thực hiện trung bình tđuổi (moving average) của doanh số bán hàng,vấn đề này đã có tác dụng trơn tuột chuỗi thời gian.


Trungbình trượtchỉ dễ dàng là giá trị vừa đủ của n giá trị trước mỗi điểm tài liệu.Bạn rất có thể thấy rằng biểu đồ gia dụng hiển thị trung bình trượt của doanh thu bán hàng (panel trên)trơn tru hơn đối với biểu đồ gia dụng hiển thị doanh thu bán hàng thực tế (panel dưới).

Theomang định trong Tableau,vừa đủ trượtđược tính bằng phương pháp áp dụng n=2 (sử dụng lợi nhuận bán sản phẩm của 2 haimon trước trongngôi trường vừa lòng này),vấn đề này không được xuất sắc vì chưng tính mùa vụ được quan tiền ngay cạnh vào hơn một quý. Vì vậy, ta sẽthay đổi kíchthước của hành lang cửa số tđuổi (window size) thành 6mon.


Trướbị tiêu diệt, bạn có thể thấy rằng tất cả 48 quan lại gần kề, đủ to nhằm so với Xu thế sửdụng quy mô hồi quy.

Giátrị R bình phương thơm là 0.65, có nghĩa là tất cả quan hệ chặt chẽ thân con đường trungbình trượtcủa lợi nhuận cùng thời hạn. Nói một cách đơn giản, lợi nhuận bán sản phẩm trung bìnhđổi khác theo thời hạn.

Giátrị p hết sức thấp đề xuất rất có thể tin cẩn vào mô hình này.

Từ các đối chiếu bên trên,cóthể Tóm lại rằng cómột Xu thế tích cực vào dữ liệu: Doanh số bán sản phẩm tăngdần theo thời hạn.

Xem thêm: Tích Lũy Sinh Học Là Gì ? Nồng Độ Sinh Học (Sức Khỏe)

#4. Phân tích tính mùa vụ (seasonality) của hàng số thời gian

Chúngta vẫn quan tiền gần kề thấy rằng có một xu hướng tích cực và lành mạnh trong dữ liệu, bao gồm nghĩa làlợi nhuận bán sản phẩm đã tăng thêm trong những năm vừa qua. Chúng ta biết vấn đề này khôngchỉ đơn giản bằng cách quan sát vào biểu đồ, Ngoài ra tự những tmê man số thống kê lại nhưR-squaredvới P-value.

Chúngtacũng nhận biết tính mùa vụ trong Việc bán sản phẩm, tức là doanh sốbán sản phẩm đã được tái diễn qua các năm. Chúng ta quan liêu gần cạnh điều đó từ biểu vật xuhướng cùng cũng chúý rằng tính mùa vụ vẫn làm cho sút đáng chú ý quý hiếm R bìnhphương của đườngxuhướng.

Chúng ta rất có thể quan liêu sáttính mùa vụ một giải pháp giỏi rộng vào biểu đồ gia dụng tiếp sau đây.

Biểu vật dụng bên trên cho thấy sự khác hoàn toàn về tổng doanh thu giữa các tháng từ tháng 1 đến tháng 12 qua các năm (mỗi năm 1 đường). Từ biểu trang bị bên trên, bạn có thể thấy rằng lợi nhuận bán hàng đã tiếp tục tăng vọt vào tháng Ba so với khoảng tốt độc nhất vô nhị trong tháng Hai. Tương trường đoản cú, lợi nhuận bán hàng tăng vọt trong thời điểm tháng 9, tiếp nối tụt dốc mạnh vào thời điểm tháng 10 trước lúc tăng vọt quay trở về vào tháng 11. Đặc điểm này lặp lại mỗi năm.

#5. Dự báo doanh số (Forecasting) sử dụng cách thức làmtrơn hàm mũ (exponential smoothing method)

Phần này trình bày phương pháp thực hiện mô hình đoán trước time series dựa vào level, trkết thúc cùng season.Nhớ lại rằng quy mô Time series rất có thể trình diễn dưới dạng hàm số của level, trend với season: Time series data (y)= f(cấp độ, trover với season)Có một vài quy mô đoán trước chuỗi thời gian phổ biến nlỗi quy mô làm suôn sẻ hàm mũ (exponential smoothing models), ARIMA, ARIMAX, v.vCó cha biến hóa thể của phương pháp có tác dụng trơn tru hàm mũsử dụng tía yếu tố của tài liệu chuỗi thời hạn để tham gia báo:Single exponential smoothing uses the cấp độ component only

Double exponential smoothing a.k.a. Holt method uses both levelvà trend

Triple exponential smoothing a.k.a. Holt-Winter method uses allthree components cấp độ, trover, & seasonality khổng lồ forecast

Dự báo Time Seriesvào tableau


Từ hình trên cóthể thấy rằng dự báo cũng có thể có tính mùa vụ với nó tuân thủ theo đúng qui luậtbán sản phẩm phổ biến trong những năm vừa qua.

Nhưnglàm cho cầm làm sao để bọn họ hiểu được dự đoán cùng làm cho rứa như thế nào để tìm hiểu liệu đoán trước cógiỏi hay không?

Xemxét hiệu suất mô hình của quy mô dự báo chuỗi thời gian sẽ cho họ biếtmô hình kia giỏi thế nào.


Trong diễn đạt củaquy mô dự báobên trên, Tab Summary hiển thị bắt tắt mô hình và tab Modelshiển thị những thông số và công suất của mô hình.


Môhình dự đoán được xây cất dựa trên lợi nhuận hàng tháng trong giai đoạn từ bỏ thángmột năm 2014đếnmon 11năm 2017.

Môhình đoán trước 13 tháng tiếp sau, bắt đầu từ thời điểm tháng 12 năm 2017.Theo mang định, mô hình đang bỏ lỡ mon sau cuối vào tháng 12 năm 2017.

Môhình gồm tính mùa vụ theo chu kỳ 12 tháng.

Tiếptheo, họ coi các biết tin trong phần Sum of Sales: Sựbiến hóa so với các cực hiếm lúc đầu là 0 vì chưng mô hình mang định mang định không tồn tại xuhướng cùng tính mùa vụ. Giá trị Contribution, thấy rằng nhân tố xuhướng ko được xem xét cùng 100% tính mùa vụ được xem xét.

Với Tab Models

Môhình dự báo vẫn được xem toán thù bằng cách sử dụng có tác dụng suôn sẻ hàm nón.

Mô hình dựa trênadditive sầu Level, Season cùng không có Xu thế.

Để để mắt tới hóa học lượngcủa quy mô đoán trước, bọn họ sử dụng các chỉ số root mean square error (RMSE),mean absolute error (MAE), mean absolute scaled error (MASE) với mean absolutepercentage error (MAPE).

Chỉ sốđơn giản và dễ dàng nhất để phát âm quy mô vận động tốt ra làm sao là xem không đúng số phần trămhoàn hảo nhất vừa phải (MAPE). Trong quy mô nàycó MAPE là khoảng 18%. Như vậy tức là giá trị dự báo hiện đang có thể chênh lệch vừa đủ 18% so với cái giá trị thực tế.

Mộtchỉ sốkhác cũng thường đượcsử dụng Review hóa học lượngcủa quy mô dự đoán là RMSE. RMSE là căn bậc nhì của toàn bộ những tổnglỗi phân chia cho số điểm dữ liệu.

Cuốicùng, những thông số làm cho suôn sẻ hàm nón (smoothing coefficients)được áp dụng vào mô hình đoán trước. Mô hình làm làm trơn tru hàm mũsử dụng bố thông số altrộn (được áp dụng để gia công trơn thành phần Level),beta (làm trơn Season) vàgamma (có tác dụng trơn tuột trend).

Môhình khoác định được tạo thành vào trường vừa lòng này chỉ được sử dụng Levelvới Seasonchứ không áp dụng trend. Tuy nhiên, từ công việc trước, chúng tahiểu được gồm xu hướng vào tài liệu chuỗi thời gian này.

Tùy chỉnh quy mô dự báo:

Vìbọn chúng tabiết rằng cả thành phần Xu thế và mùa vụ đều có trong dữ liệu, đề nghị tùy chỉnh cấu hình mô hình đểsử dụng những yếu tắc này.

Xem thêm: Game Hội Pháp Sư Fairy Tail 0.9, Game One Piece Vs Fairy Tail 0


Hộp thoại tùy chỉnh mô hình xuất hiện

Mô hình cộng (additive) đơn giản và dễ dàng để phát âm với vận động tốt vào đa số các hiện tượng kỳ lạ tương quan mang lại marketing. Khi tài liệu đang phát triển theo cấp cho số nhân, bạn cũng có thể phải áp dụng những quy mô nhân (multiplicative). Trong trường phù hợp này ta chọn additive sầu trend cùng season nlỗi hình dưới.Kết quả sau khoản thời gian tùy chỉnh mô hình dự báonhư sau: