เฉลี่ย อัต เคลื่อนไหว Excel


ARMA Unplugged นี่เป็นรายการแรกในบทแนะนำ Unplugged ของเราซึ่งเราได้เจาะลึกรายละเอียดของแต่ละรุ่นของซีรีส์เวลาที่คุ้นเคยซึ่งเน้นย้ำถึงข้อสันนิษฐานและขับรถกลับไปที่สัญชาตญาณเบื้องหลังพวกเขา ในประเด็นนี้เราจะกล่าวถึงโมเดล ARMA เป็นรากฐานที่สำคัญในการสร้างแบบจำลองลำดับเวลา ซึ่งแตกต่างจากปัญหาการวิเคราะห์ก่อนหน้านี้เราจะเริ่มต้นด้วยคำจำกัดความของกระบวนการ ARMA ระบุปัจจัยการผลิตเอาท์พุทพารามิเตอร์ข้อ จำกัด ด้านเสถียรภาพข้อสันนิษฐานและสุดท้ายก็ได้วาดแนวทางสำหรับกระบวนการสร้างแบบจำลอง โดยพื้นฐานแล้วค่าเฉลี่ยเคลื่อนที่แบบถดถอยอัตโนมัติ (ARMA) เป็นกระบวนการ stochastic แบบคงที่ซึ่งประกอบด้วยผลรวมของ Excel แบบอัตถดถอยและส่วนประกอบเฉลี่ยที่เคลื่อนที่ได้ หรือในรูปแบบง่ายๆ: สมมติฐานให้ดูใกล้ชิดที่สูตร กระบวนการ ARMA เป็นเพียงผลรวมถ่วงน้ำหนักของการสังเกตและการกระแทกเอาท์พุทที่ผ่านมาซึ่งมีข้อสมมติฐานที่สำคัญเพียงเล็กน้อย: สมมติฐานเหล่านี้หมายถึงอะไรกระบวนการเชิงสุ่มคือกระบวนการของกระบวนการเชิงสุ่มที่อธิบายถึงวิวัฒนาการของตัวแปรสุ่มตามเวลา ในกรณีของเราตัวแปรแบบสุ่มคือกระบวนการ ARMA จะรวบรวมเฉพาะความสัมพันธ์แบบอนุกรม (เช่นความสัมพันธ์กันโดยอัตโนมัติ) ระหว่างข้อสังเกต ในคำพูดธรรมดากระบวนการ ARMA จะรวมค่าของการสังเกตที่ผ่านมาไม่ใช่ค่าที่เป็นรูปสี่เหลี่ยมจัตุรัสหรือลอการิทึมของพวกเขาเป็นต้นการพึ่งพาคำสั่งซื้อที่สูงขึ้นจะกำหนดขั้นตอนที่แตกต่างกัน (เช่น ARCHGARCH โมเดลที่ไม่ใช่แบบเส้นตรง ฯลฯ ) มีหลายตัวอย่างของกระบวนการ stochastic ที่ค่าผ่านมาส่งผลกระทบต่อปัจจุบัน ตัวอย่างเช่นในสำนักงานขายที่ได้รับ RFQs อย่างต่อเนื่องบางส่วนได้รับการยอมรับว่าเป็นยอดขายที่ชนะการขายบางส่วนเป็นยอดขายที่หายไปและมีเพียงไม่กี่รายที่เข้าสู่เดือนถัดไป เป็นผลให้ในเดือนใดก็ตามบางกรณีที่ได้รับรางวัลมาเป็น RFQs หรือขายซ้ำจากเดือนก่อนหน้า อะไรคือแรงกระแทกนวัตกรรมหรือข้อผิดพลาดข้อนี้เป็นคำถามที่ยากและคำตอบก็ไม่น้อยทำให้เกิดความสับสน ยังคงให้ลอง: ในคำง่ายๆคำที่ผิดพลาดในรูปแบบหนึ่ง ๆ คือเซ็ตอัพทั้งหมดสำหรับรูปแบบทั้งหมดที่โมเดลไม่ได้อธิบาย ยังคงสูญหายให้ใช้ตัวอย่าง สำหรับขั้นตอนราคาหุ้นอาจมีปัจจัยหลายร้อยอย่างที่ช่วยผลักดันการอัปเกรดราคา ได้แก่ : การจ่ายเงินปันผลและการแบ่งรายได้รายงานประจำไตรมาสรายงานการควบรวมกิจการ (MampA) กิจกรรมเหตุการณ์ทางกฎหมายเช่น ภัยคุกคามจากคดีการฟ้องร้องในชั้นเรียน อื่น ๆ รูปแบบโดยการออกแบบคือการทำให้เข้าใจง่ายของความเป็นจริงที่ซับซ้อนดังนั้นสิ่งที่เราออกนอกโมเดลจะถูกรวมไว้ในข้อผิดพลาดโดยอัตโนมัติ กระบวนการ ARMA สันนิษฐานว่าผลรวมของปัจจัยทั้งหมดเหล่านี้ทำหน้าที่มากหรือน้อยเช่นเสียง Gaussian เหตุใดเราจึงสนใจเรื่องการกระแทกที่ผ่านมาแตกต่างจากรูปแบบการถดถอยการเกิดมาตรการกระตุ้น (เช่นการช็อก) อาจส่งผลต่อระดับปัจจุบันและอาจเป็นไปได้ในอนาคต ตัวอย่างเช่นกิจกรรมขององค์กร (เช่นกิจกรรม MampA) มีผลต่อราคาหุ้นของ บริษัท แม่ แต่การเปลี่ยนแปลงอาจใช้เวลาสักครู่เพื่อให้มีผลกระทบเต็มที่เนื่องจากผู้เข้าร่วมตลาดดูดซับข้อมูลที่มีอยู่และทำปฏิกิริยาต่อไป นี่เป็นคำถามที่ถาม: ไม่ได้มีค่าที่ผ่านมาของข้อมูลผลลัพธ์มีการกระแทกข้อมูลที่ผ่านมาใช่หรือไม่ประวัติการช็อกจะมีการระบุไว้ในระดับเอาต์พุตที่ผ่านมาแล้ว แบบจำลอง ARMA สามารถแสดงได้เพียงอย่างเดียวว่าเป็นแบบจำลองการถดถอยแบบอัตโนมัติ (AR) แบบเดิม แต่ต้องการเก็บข้อมูลของระบบดังกล่าวในอนันต์ นี่เป็นเหตุผลเดียวที่จะรวมองค์ประกอบของ MA: เพื่อประหยัดการจัดเก็บและลดความซับซ้อนของสูตร อีกครั้งกระบวนการ ARMA ต้องคงที่สำหรับความแปรปรวน (ไม่มีเงื่อนไข) จะมีอยู่ หมายเหตุ: ในการอภิปรายข้างต้นฉันไม่ได้สร้างความแตกต่างระหว่างเพียงการไม่มีรากของหน่วยในสมการเฉพาะและความคงที่ของกระบวนการ พวกเขามีความเกี่ยวข้อง แต่การไม่มีรากฐานของหน่วยไม่ได้เป็นการรับประกันถึงการหยุดนิ่ง ยังคงรากหน่วยต้องอยู่ภายในวงกลมหน่วยให้ถูกต้อง ข้อสรุปช่วยให้สรุปสิ่งที่เราได้ทำเพื่อให้ห่างไกล ก่อนอื่นเราได้ตรวจสอบกระบวนการ ARMA แบบคงที่พร้อมด้วยสูตรปัจจัยการผลิตสมมติฐานและความต้องการในการจัดเก็บข้อมูล จากนั้นเราแสดงให้เห็นว่ากระบวนการของ ARMA รวมเอาค่าผลลัพธ์ (correlation อัตโนมัติ) และแรงกระแทกที่เกิดขึ้นก่อนหน้านี้ในผลลัพธ์ปัจจุบัน สุดท้ายเราพบว่ากระบวนการ ARMA แบบคงที่สร้างชุดข้อมูลเวลาที่มีค่าเฉลี่ยและความแปรปรวนระยะยาวที่มีเสถียรภาพ ในการวิเคราะห์ข้อมูลของเราก่อนที่เราจะเสนอแบบจำลอง ARMA เราควรตรวจสอบสมมติฐาน stationarity และความต้องการหน่วยความจำที่ จำกัด ในกรณีที่ชุดข้อมูลแสดงถึงแนวโน้มเชิง deterministic เราจำเป็นต้องลบ (de-trend) ออกก่อนและใช้ส่วนที่เหลือสำหรับ ARMA ในกรณีที่ชุดข้อมูลมีแนวโน้มแบบสุ่ม (เช่นการเดินแบบสุ่ม) หรือตามฤดูกาลเราจำเป็นต้องให้ความบันเทิงแก่ ARIMASARIMA ในที่สุด correlogram (เช่น ACFPACF) สามารถใช้เพื่อวัดความต้องการหน่วยความจำของโมเดลที่เราควรคาดหวังว่า ACF หรือ PACF จะสลายตัวได้อย่างรวดเร็วหลังจากไม่กี่ล่าช้า ถ้าไม่ใช่นี่อาจเป็นสัญญาณของการไม่หยุดนิ่งหรือรูปแบบระยะยาว (เช่น ARFIMA) RIMA หมายถึงแบบจำลองการเคลื่อนที่แบบบูรณาการแบบอัตถดถอย (single vector) ARIMA เป็นเทคนิคการพยากรณ์ที่คาดการณ์มูลค่าในอนาคตของชุดข้อมูลโดยอิงกับความเฉื่อยของตัวเอง การประยุกต์ใช้หลักของมันอยู่ในพื้นที่ของการคาดการณ์ในระยะสั้นที่ต้องใช้จุดข้อมูลทางประวัติศาสตร์อย่างน้อย 40 จุด ใช้งานได้ดีที่สุดเมื่อข้อมูลของคุณมีรูปแบบที่มั่นคงหรือสอดคล้องกันตลอดเวลาโดยมีจำนวนข้อผิดพลาดน้อยที่สุด บางครั้งเรียกว่า Box-Jenkins (หลังจากผู้เขียนต้นฉบับ) ARIMA มักจะดีกว่าเทคนิคการทำให้เกิดการชี้แจงเมื่อข้อมูลมีความยาวและความสัมพันธ์ระหว่างการสังเกตในอดีตมีเสถียรภาพ หากข้อมูลสั้นหรือมีความผันผวนสูงวิธีการปรับความเรียบบางวิธีอาจทำงานได้ดีขึ้น หากคุณไม่มีจุดข้อมูลอย่างน้อย 38 จุดคุณควรพิจารณาวิธีการอื่นนอกเหนือจาก ARIMA ขั้นตอนแรกในการใช้วิธีการ ARIMA คือการตรวจสอบ stationarity Stationarity แสดงให้เห็นว่าซีรีย์ยังคงอยู่ในระดับที่คงที่ตลอดเวลา หากมีแนวโน้มเช่นเดียวกับในแอปพลิเคชันทางเศรษฐกิจหรือธุรกิจส่วนใหญ่ข้อมูลของคุณจะยังคงอยู่ไม่หยุดนิ่ง ข้อมูลควรแสดงความแปรปรวนของความผันผวนตลอดเวลา นี่ดูได้อย่างง่ายดายด้วยชุดที่มีฤดูกาลมากและเติบโตขึ้นในอัตราที่รวดเร็วขึ้น ในกรณีเช่นนี้การขึ้นและการดาวน์ในฤดูกาลจะทวีความรุนแรงมากขึ้นเมื่อเวลาผ่านไป หากไม่พบเงื่อนไขการหยุดนิ่งเหล่านี้จะไม่สามารถคำนวณการคำนวณจำนวนมากที่เกี่ยวข้องกับกระบวนการนี้ได้ หากพล็อตข้อมูลแบบกราฟิกแสดงถึงความไม่เสถียรภาพคุณควรแตกต่างจากชุดข้อมูล Differencing เป็นวิธีที่ยอดเยี่ยมในการเปลี่ยนชุดแบบไม่ต่อเนื่องให้เป็นแบบคงที่ โดยการลบคำสังเกตในช่วงเวลาปัจจุบันออกจากข้อสังเกตก่อนหน้านี้ หากการแปลงนี้ทำเพียงครั้งเดียวกับชุดคุณจะกล่าวว่าข้อมูลนี้มีความแตกต่างกันเป็นครั้งแรก ขั้นตอนนี้เป็นหลักช่วยลดแนวโน้มหากชุดของคุณมีอัตราการเติบโตที่ค่อนข้างคงที่ หากอัตราการเติบโตเพิ่มขึ้นคุณสามารถใช้ขั้นตอนเดียวกันและทำให้ข้อมูลแตกต่างกันได้อีก จากนั้นข้อมูลของคุณจะแตกต่างกันไป Autocorrelations เป็นค่าตัวเลขที่ระบุว่าชุดข้อมูลเกี่ยวข้องกับตัวเองอย่างไรเมื่อเวลาผ่านไป อย่างแม่นยำมากขึ้นจะวัดว่าค่าข้อมูลอย่างมากที่ช่วงระยะเวลาที่ระบุเป็นจำนวนเท่าใดมีความสัมพันธ์กันเมื่อเวลาผ่านไป จำนวนรอบระยะเวลาโดยปกติจะเรียกว่าความล่าช้า ตัวอย่างเช่นค่าความสัมพันธ์ระหว่างความคลาดเคลื่อน 1 วัดค่าที่แตกต่างกันของช่วงเวลา 1 ช่วงเวลาที่มีความสัมพันธ์กันในชุดข้อมูล ความสัมพันธ์กันที่ความล่าช้า 2 วัดว่าข้อมูลสองช่วงเวลามีความสัมพันธ์กันอย่างไรในซีรี่ส์ Autocorrelations อาจอยู่ในช่วงตั้งแต่ 1 ถึง -1 ค่าใกล้เคียงกับ 1 แสดงถึงความสัมพันธ์ทางบวกที่สูงในขณะที่ค่าใกล้เคียงกับ -1 แสดงถึงความสัมพันธ์เชิงลบสูง มาตรการเหล่านี้มักได้รับการประเมินผ่านทางกราฟฟิกที่เรียกว่า correlagrams correlagram แปลงค่าความสัมพันธ์แบบอัตโนมัติสำหรับชุดข้อมูลหนึ่ง ๆ ที่มีความล่าช้าต่างกัน นี่เรียกว่าฟังก์ชัน autocorrelation และมีความสำคัญมากในวิธีการ ARIMA วิธีการ ARIMA พยายามที่จะอธิบายการเคลื่อนไหวในชุดเวลาแบบคงที่ในฐานะที่เป็นหน้าที่ของสิ่งที่เรียกว่าพารามิเตอร์อัตถิภาวนิยมและค่าเฉลี่ยเคลื่อนที่ พารามิเตอร์เหล่านี้เรียกว่าพารามิเตอร์ AR (autoregessive) และพารามิเตอร์ MA (ค่าเฉลี่ยเคลื่อนที่) อาจมีการเขียนแบบ AR ที่มีเพียง 1 พารามิเตอร์เท่านั้น X (t) A (1) X (t-1) E (t) โดยที่ X (t) เวลาชุดภายใต้การตรวจสอบ A (1) พารามิเตอร์ autoregressive ของลำดับ 1 X (t-1) ชุดเวลาล้าหลัง 1 ระยะเวลา E (t) ความผิดพลาดของรูปแบบนี้ก็หมายความว่าค่าใดก็ตาม X (t) สามารถอธิบายได้จากฟังก์ชันของค่าก่อนหน้าที่ X (t-1) รวมทั้งข้อผิดพลาดแบบสุ่มบางส่วนที่ไม่สามารถอธิบายได้ E (t) ถ้าค่าประมาณของ A (1) เท่ากับ. 30 มูลค่าปัจจุบันของชุดจะสัมพันธ์กับ 30 ค่าก่อนหน้า 1 แน่นอนว่าซีรีย์นี้อาจเกี่ยวข้องกับมากกว่าหนึ่งค่าที่ผ่านมา ตัวอย่างเช่น X (t) A (1) X (t-1) A (2) X (t-2) E (t) นี่แสดงว่าค่าปัจจุบันของชุดคือการรวมกันของสองค่าก่อนหน้านี้ทันที, X (t-1) และ X (t-2) รวมทั้งข้อผิดพลาดแบบสุ่ม E (t) แบบจำลองของเราตอนนี้เป็นโมเดลอัตรกรรรณ์ของคำสั่ง 2. การเคลื่อนที่แบบเฉลี่ย: แบบที่สองของแบบจำลอง Box-Jenkins เรียกว่าโมเดลเฉลี่ยเคลื่อนที่ แม้ว่ารูปแบบเหล่านี้มีลักษณะคล้ายกับรุ่น AR แต่แนวคิดที่อยู่เบื้องหลังพวกเขามีความแตกต่างกันออกไป การย้ายค่าเฉลี่ยจะสัมพันธ์กับสิ่งที่เกิดขึ้นในช่วง t เฉพาะกับข้อผิดพลาดแบบสุ่มที่เกิดขึ้นในช่วงเวลาที่ผ่านมาเช่น E (t-1), E (t-2) เป็นต้นแทนที่จะเป็น X (t-1), X ( t-2), (Xt-3) ตามแนวทาง autoregressive แบบเฉลี่ยถ่วงน้ำหนักโดยเฉลี่ยที่มีระยะ MA สามารถเขียนได้ดังนี้ X (t) - B (1) E (t-1) E (t) คําวา B (1) เรียกวา MA ของคําสั่ง 1. เครื่องหมายลบที่ดานหนาของพารามิเตอรใชสําหรับการประชุมเทานั้น ออกโดยอัตโนมัติโดยโปรแกรมคอมพิวเตอร์ส่วนใหญ่ แบบจำลองข้างต้นกล่าวง่ายๆว่าค่าที่กำหนดของ X (t) มีความสัมพันธ์โดยตรงกับความผิดพลาดแบบสุ่มในช่วงก่อนหน้า, E (t-1) และความผิดพลาดปัจจุบัน E (t) เช่นเดียวกับในกรณีของโมเดลอัตถิภาวนิยมโมเดลเฉลี่ยเคลื่อนที่สามารถขยายไปยังโครงสร้างการสั่งซื้อที่สูงขึ้นซึ่งครอบคลุมชุดค่าผสมต่างๆและความยาวเฉลี่ยที่เคลื่อนที่ได้ วิธีการ ARIMA ยังช่วยให้สามารถสร้างโมเดลที่มีทั้งค่าเฉลี่ยอัตรวจและเคลื่อนไหวโดยรวมเข้าด้วยกัน โมเดลเหล่านี้มักถูกเรียกว่าแบบผสม แม้ว่าสิ่งนี้จะทำให้เครื่องมือคาดการณ์ที่ซับซ้อนมากขึ้น แต่โครงสร้างอาจจำลองชุดข้อมูลได้ดีขึ้นและสร้างการคาดการณ์ที่แม่นยำขึ้น โมเดล Pure หมายความว่าโครงสร้างประกอบด้วยเฉพาะ AR หรือพารามิเตอร์ MA - ไม่ใช่ทั้งสองอย่าง โมเดลที่พัฒนาโดยวิธีนี้มักเรียกว่า ARIMA เนื่องจากใช้การผสมผสานของอัตมโนทัศน์ (AR), การผสมผสาน (I) - หมายถึงกระบวนการย้อนกลับของ differencing เพื่อสร้างการคาดการณ์และการดำเนินงานโดยเฉลี่ย (MA) แบบ ARIMA มักถูกระบุว่าเป็น ARIMA (p, d, q) นี่แสดงลำดับของคอมโพเนนต์ autoregressive (p) จำนวน operator ที่ต่างกัน (d) และคำสั่งที่สูงที่สุดของค่าเฉลี่ยเคลื่อนที่ ยกตัวอย่างเช่น ARIMA (2,1,1) หมายความว่าคุณมีแบบจำลองอัตถดถอยอันดับที่สองที่มีส่วนประกอบของค่าเฉลี่ยเคลื่อนที่อันดับแรกที่มีการจัดลำดับชุดหนึ่งครั้งเพื่อกระตุ้นให้เกิดการหยุดนิ่ง การเลือกข้อมูลจำเพาะที่ถูกต้อง: ปัญหาหลักในคลาสสิก Box-Jenkins กำลังพยายามตัดสินใจว่าจะใช้ ARIA ข้อกำหนดใดบ้างเพื่อใช้ - i. e. จำนวนอาร์เรย์และพารามิเตอร์ MA ที่รวมไว้ นี่คือสิ่งที่มากของ Box-Jenkings 1976 ได้ทุ่มเทให้กับกระบวนการระบุตัวตน ขึ้นอยู่กับการประเมินผลแบบกราฟิกและตัวเลขของการเชื่อมโยงความสัมพันธ์ระหว่างตัวอย่างและฟังก์ชันการเชื่อมโยงบางส่วน (autocorrelation) ดีสำหรับรุ่นพื้นฐานของคุณงานไม่ยากเกินไป แต่ละฟังก์ชันมีความสัมพันธ์กันโดยอัตโนมัติซึ่งมีลักษณะบางอย่าง อย่างไรก็ตามเมื่อคุณขึ้นไปอย่างซับซ้อนรูปแบบจะไม่สามารถตรวจพบได้ง่าย เพื่อให้เรื่องยากขึ้นข้อมูลของคุณเป็นเพียงตัวอย่างของกระบวนการอ้างอิงเท่านั้น ซึ่งหมายความว่าข้อผิดพลาดในการสุ่มตัวอย่าง (ข้อผิดพลาดค่าผิดพลาดในการวัด ฯลฯ ) อาจบิดเบือนกระบวนการระบุตัวตนทางทฤษฎี นั่นคือเหตุผลที่การสร้างแบบจำลอง ARIMA แบบดั้งเดิมเป็นศิลปะมากกว่าการทำนายทางวิทยาศาสตร์การพยากรณ์ล่วงหน้ากับ Excel และ RIM สวัสดีวันนี้ฉันจะแนะนำคุณเกี่ยวกับรูปแบบ ARIMA และส่วนประกอบรวมถึงคำอธิบายสั้น ๆ เกี่ยวกับ Box-Jenkins วิธีการระบุรูปแบบ ARIMA สุดท้ายฉันสร้างการใช้ Excel โดยใช้ R ซึ่ง I8217 จะแสดงวิธีการตั้งค่าและใช้งาน โมเดลเฉลี่ยเคลื่อนที่โดยอัตโนมัติ (ARMA) โมเดลการเคลื่อนที่อัตโนมัติแบบอัตถดถอยถูกใช้สำหรับการสร้างแบบจำลองและการพยากรณ์ความเคลื่อนไหวของกระบวนการชุดเวลาอนุกรม มันคือการรวมกันของสองเทคนิคทางสถิติที่พัฒนาขึ้นก่อนหน้านี้ Autoregressive (AR) และ Moving Average (MA) รุ่นและได้อธิบายเดิมโดย Peter Whittle ในปี 1951 George E. P. Box และ Gwilym Jenkins ได้ให้ความสำคัญกับโมเดลในปีพศ. 2514 โดยระบุขั้นตอนที่ไม่ต่อเนื่องเพื่อระบุตัวตนการประมาณและการตรวจสอบ กระบวนการนี้จะอธิบายในภายหลังเพื่อเป็นข้อมูลอ้างอิง เราจะเริ่มต้นด้วยการแนะนำโมเดล ARMA ด้วยส่วนประกอบต่างๆโมเดล AR และ MA จากนั้นจึงนำเสนอรูปแบบ ARMA (ค่าเฉลี่ยเคลื่อนที่แบบรวมอัตโนมัติ) และขั้นตอนการคาดการณ์และรูปแบบ สุดท้ายนี้ผมจะอธิบายเกี่ยวกับการใช้งาน Excel ที่ฉันสร้างไว้และวิธีการใช้งานเพื่อคาดการณ์ลำดับเวลาของคุณ โมเดล Autoregressive โมเดล Autoregressive ใช้สำหรับอธิบายกระบวนการสุ่มและกระบวนการที่เปลี่ยนแปลงตามเวลาและระบุตัวแปรเอาท์พุทจะขึ้นอยู่กับค่าก่อนหน้าที่เป็นเส้นตรง โมเดลนี้อธิบายว่า: Xt c sum vari, Xt-i varepsilont ในกรณีที่ varphi1, ldots, varphivarphi เป็นตัวแปรของโมเดล, C เป็นค่าคงที่และ varepsilont เป็นคำที่เป็นสีขาว โดยพื้นฐานแล้วสิ่งที่โมเดลอธิบายคือค่าใดก็ตาม X (t) มันสามารถอธิบายได้ด้วยหน้าที่ของค่าก่อนหน้านี้ สำหรับรูปแบบที่มีพารามิเตอร์หนึ่งตัว varphi 1. X (t) อธิบายโดยค่าที่ผ่านมา X (t-1) และความผิดพลาดแบบสุ่ม varepsilont สำหรับรูปแบบที่มีมากกว่าหนึ่งพารามิเตอร์เช่น varphi 2. X (t) ให้โดย X (t-1) X (t-2) และข้อผิดพลาดแบบสุ่ม varepsilont Moving Average Model ค่าเฉลี่ยเคลื่อนที่ (Moving Average - MA) ถูกใช้บ่อยๆสำหรับการสร้างแบบจำลองของชุดเวลาที่ไม่ได้ผันแปรและหมายถึง: Xt mu varepsilont theta1, varepsilon ldots thetaq, varepsilon mu เป็นค่าเฉลี่ยของชุดเวลา theta1, ldots, thetaq เป็นพารามิเตอร์ของแบบจำลอง varepsilont, varepsilon, ldots เป็นข้อผิดพลาดของสีขาว q คือลำดับของ Moving Average model แบบจำลอง Moving Average คือการถดถอยเชิงเส้นของค่าปัจจุบันของชุดเทียบกับเงื่อนไข varepsilont ในช่วงก่อนหน้า t varepsilon ตัวอย่างเช่นแบบจำลอง MA ของ q 1. X (t) อธิบายได้จากข้อผิดพลาด varepsilont ปัจจุบันในช่วงเวลาเดียวกันและค่าความผิดพลาดที่ผ่านมา varepsilon สำหรับรูปแบบของคำสั่งที่ 2 (q 2), X (t) อธิบายได้จากค่าผิดพลาดที่ผ่านมาทั้งสอง varepsilon และ varepsilon คำศัพท์ AR (p) และ MA (q) ใช้ในรูปแบบ ARMA ซึ่งจะนำมาใช้ โมเดลเฉลี่ยเคลื่อนที่แบบอัตถดถอยอัตโนมัติใช้แบบพหุนามสองตัว AR (p) และ MA (q) และอธิบายกระบวนการ stochastic แบบหยุดนิ่ง กระบวนการคงที่ไม่เปลี่ยนแปลงเมื่อเปลี่ยนในเวลาหรือพื้นที่ดังนั้นกระบวนการ stationary มีค่าเฉลี่ยคงที่และความแปรปรวน รูปแบบ ARMA มักถูกอ้างถึงในแง่ของชื่อย่อ ARMA (p, q) มีการเขียนสัญกรณ์ของรูปแบบดังนี้ Xt c varepsilont sum varphi1 X ผลรวมของการประเมินการประมาณและการยืนยันแบบจำลองจะอธิบายโดยกระบวนการ Box-Jenkins วิธี Box-Jenkins สำหรับการระบุรูปแบบด้านล่างเป็นโครงร่างของวิธี Box-Jenkins เนื่องจากกระบวนการที่แท้จริงในการหาค่าเหล่านี้สามารถครอบงำได้โดยไม่มีแพคเกจทางสถิติ แผ่นงาน Excel ที่รวมอยู่ในหน้านี้จะกำหนดรูปแบบที่เหมาะสมที่สุดโดยอัตโนมัติ ขั้นตอนแรกของวิธี Box-Jenkins คือการกำหนดรูปแบบ ขั้นตอนนี้รวมถึงการระบุฤดูกาล, differencing ถ้าจำเป็นและกำหนดลำดับของ p และ q โดยการวางแผนฟังก์ชัน autocorrelation และ autocorrelation บางส่วน หลังจากระบุรูปแบบแล้วขั้นตอนต่อไปคือการประมาณค่าพารามิเตอร์ การประมาณค่าพารามิเตอร์ใช้แพ็กเกจสถิติและอัลกอริทึมการคำนวณเพื่อหาพารามิเตอร์ที่เหมาะสมที่สุด เมื่อพารามิเตอร์ถูกเลือกแล้วขั้นตอนสุดท้ายคือการตรวจสอบโมเดล การตรวจสอบแบบจำลองทำได้โดยการทดสอบเพื่อดูว่ารูปแบบสอดคล้องกับชุดเวลาที่ไม่มีการผันแปร หนึ่งควรยืนยันส่วนที่เหลือเป็นอิสระจากกันและแสดงค่าเฉลี่ยคงที่และความแปรปรวนตลอดเวลาซึ่งสามารถทำได้โดยการทดสอบ Ljung-Box หรืออีกครั้งที่วางแผนความสัมพันธ์กันและความสัมพันธ์บางส่วนของส่วนที่เหลือ สังเกตขั้นตอนแรกเกี่ยวกับการตรวจสอบตามฤดูกาล หากข้อมูลที่คุณกำลังทำงานมีแนวโน้มตามฤดูกาลคุณจะต้อง 8220 ข้อมูลเพิ่มเติม 8221 เพื่อให้ข้อมูลคงที่ ขั้นตอน differencing นี้ generalizes รูปแบบ ARMA เป็นแบบ ARIMA หรือ Autoregressive Integrated Moving Average โดยที่ 8216Integrated8217 สอดคล้องกับขั้นตอน differencing โมเดล ARIMA มีพารามิเตอร์สามค่าคือ p, d, q เพื่อที่จะกำหนดรูปแบบ ARMA ให้รวมคำที่แตกต่างออกไปเราจะเริ่มต้นด้วยการจัดเรียงแบบจำลอง ARMA มาตรฐานเพื่อแยกน้ำยางมะตอยและน้ำยางออกจากยอดรวม (1 - sum alpha Li) Xt (1 sum thetai Li) varepsilont ในกรณีที่ L เป็นตัวดำเนินการล่าช้าและ alphai thetai varepsilont เป็นพารามิเตอร์เฉลี่ยแบบอัตถดถีและเคลื่อนที่และข้อผิดพลาดตามลำดับ ตอนนี้เราทำสมมติฐานว่าพหุนามแรกของฟังก์ชัน (1 - sum alpha Li) มีรากรวมกันของ multiplicity d. จากนั้นเราสามารถเขียนใหม่ได้ดังต่อไปนี้: รูปแบบ ARIMA เป็นการแสดงออกของพหุนามกับ pp - d และให้เรา: (1 - รวม phii Li) (1 - L) d Xt (1 รวม thete Li) varepsilont ท้ายสุดเราจะสรุป แบบจำลองเพิ่มเติมโดยการเพิ่มระยะเวลาลอยซึ่งกำหนดรูปแบบ ARIMA เป็น ARIMA (p, d, q) กับ drift frac (1 - L) (1 - L) d delta Xt (1 ผลรวม Li) varepsilont ด้วยรูปแบบที่กำหนดไว้ในตอนนี้เราสามารถดูรูปแบบ ARIMA เป็นสองส่วนแยกต่างหากหนึ่งที่ไม่ใช่ stationary และอื่น ๆ ความรู้สึกกว้างนิ่ง (การแจกแจงความเป็นไปได้ร่วมกันจะไม่เปลี่ยนแปลงเมื่อเปลี่ยนเวลาหรือช่องว่าง) รูปแบบที่ไม่อยู่นิ่ง: รูปแบบการเคลื่อนที่แบบกว้าง: (1 - sum ili Li) Yt (1 ผลรวมของ Li) varepsilont สามารถคาดการณ์การคาดการณ์ใน Yt โดยใช้วิธีการคาดการณ์อัตถิภาพอัตโนมัติ ตอนนี้เราได้พูดถึง ARMA และ ARIMA แล้วตอนนี้เราหันมาใช้วิธีการเหล่านี้ในการใช้งานจริงเพื่อให้การคาดการณ์ Ive สร้างการใช้งานด้วย Excel โดยใช้ R เพื่อให้ ARIMA คาดการณ์และตัวเลือกในการจำลอง Monte Carlo ในแบบจำลองเพื่อกำหนดโอกาสในการคาดการณ์ การใช้งาน Excel และวิธีการใช้ก่อนใช้แผ่นงานคุณต้องดาวน์โหลด R และ RExcel จากเว็บไซต์ Statconn หากคุณติดตั้ง R ไว้แล้วคุณก็สามารถดาวน์โหลด RExcel ได้ ถ้าคุณไม่มี R ติดตั้งอยู่คุณสามารถดาวน์โหลด RAndFriends ซึ่งมี R และ RExcel เวอร์ชั่นล่าสุดได้ โปรดทราบ RExcel จะทำงานเฉพาะกับ Excel 32bit สำหรับใบอนุญาตที่ไม่ใช่เชิงพาณิชย์เท่านั้น หากคุณติดตั้ง Excel 64bit ไว้คุณจะต้องได้รับใบอนุญาตเชิงพาณิชย์จาก Statconn ขอแนะนำให้ดาวน์โหลด RAndFriends เนื่องจากทำให้ติดตั้งได้รวดเร็วและง่ายที่สุด แต่ถ้าคุณมี R แล้วและต้องการติดตั้งด้วยตัวเองให้ทำตามขั้นตอนต่อไปนี้ การติดตั้ง RExcel ด้วยตนเองเมื่อต้องการติดตั้ง RExcel และแพคเกจอื่นเพื่อให้ R ทำงานใน Excel ก่อนเปิด R ในฐานะผู้ดูแลระบบโดยคลิกขวาที่. exe ในคอนโซล R ให้ติดตั้ง RExcel โดยพิมพ์คำสั่งต่อไปนี้: คำสั่งข้างต้นจะติดตั้ง RExcel บนเครื่องของคุณ ขั้นตอนต่อไปคือการติดตั้ง rcom ซึ่งเป็นแพคเกจอื่นจาก Statconn สำหรับแพคเกจ RExcel ในการติดตั้งนี้ให้พิมพ์คำสั่งต่อไปนี้ซึ่งจะติดตั้ง rscproxy โดยอัตโนมัติเช่นเดียวกับ R version 2.8.0 คุณสามารถย้ายไปยังการตั้งค่าการเชื่อมต่อระหว่าง R และ Excel กับแพคเกจเหล่านี้ได้ แม้ว่าจะไม่จำเป็นต้องติดตั้งแพคเกจที่มีประโยชน์สำหรับการดาวน์โหลดคือ Rcmdr ซึ่งพัฒนาขึ้นโดย John Fox Rcmdr สร้างเมนู R ซึ่งสามารถกลายเป็นเมนูใน Excel คุณลักษณะนี้มาโดยค่าเริ่มต้นด้วยการติดตั้ง RAndFriends และทำให้มีคำสั่ง R หลายคำใน Excel พิมพ์คำสั่งต่อไปนี้ลงใน R เพื่อติดตั้ง Rcmdr เราสามารถสร้างลิงค์ไปยัง R และ Excel ได้ หมายเหตุในเวอร์ชันล่าสุดของ RExcel การเชื่อมต่อนี้ทำได้ด้วยการคลิกสองครั้งที่ไฟล์. bat ที่ให้มา ActivateRExcel2010 ดังนั้นคุณควรทำตามขั้นตอนต่อไปนี้หากคุณติดตั้ง R และ RExcel ด้วยตนเองหรือหากเหตุผลที่เชื่อมต่อไม่ได้เกิดขึ้นระหว่าง การติดตั้ง RAndFriends สร้างการเชื่อมต่อระหว่าง R และ Excel เปิดหนังสือเล่มใหม่ใน Excel และไปที่หน้าจอตัวเลือก คลิกตัวเลือกแล้ว Add-Ins คุณควรเห็นรายการของส่วนขยายที่ใช้งานอยู่และไม่มีการใช้งานที่คุณมีในปัจจุบัน คลิกปุ่มไปที่ด้านล่าง ในกล่องโต้ตอบเพิ่มเติมคุณจะเห็นการอ้างอิงเพิ่มทั้งหมดที่คุณได้ทำ คลิกที่เรียกดู ไปที่โฟลเดอร์ RExcel โดยปกติจะอยู่ใน C: Program FilesRExcelxls หรือสิ่งที่คล้ายกัน ค้นหา RExcel. xla add-in และคลิก ขั้นตอนต่อไปคือการสร้างการอ้างอิงเพื่อให้แมโครใช้ R ทำงานได้อย่างถูกต้อง ในเอกสาร Excel ให้ป้อน Alt F11 ซึ่งจะเปิดตัวแก้ไข Excels VBA ไปที่ Tools - gt References แล้วหา RExcel reference, RExcelVBAlib ขณะนี้ RExcel พร้อมที่จะใช้งานแล้วการใช้แผ่นงาน Excel ตอนนี้ได้กำหนดค่า R และ RExcel ไว้อย่างถูกต้องแล้วเวลาในการทำข้อเสนอแนะบางส่วนให้เปิดแผ่นพยากรณ์อากาศแล้วคลิกโหลดเซิร์ฟเวอร์ นี่คือการเริ่มต้นเซิร์ฟเวอร์ RCom และโหลดฟังก์ชันที่จำเป็นในการทำนาย กล่องโต้ตอบจะเปิดขึ้น เลือกไฟล์ itall. R ที่มาพร้อมกับแผ่นงาน ไฟล์นี้มีฟังก์ชันที่เครื่องมือคาดการณ์ใช้ ส่วนใหญ่ของฟังก์ชันที่มีอยู่ได้รับการพัฒนาโดยศาสตราจารย์ Stoffer ที่มหาวิทยาลัยพิตส์เบิร์ก พวกเขาขยายขีดความสามารถของ R และให้เรามีกราฟการวินิจฉัยที่เป็นประโยชน์พร้อมกับข้อมูลการคาดการณ์ของเรา นอกจากนี้ยังมีฟังก์ชันในการกำหนดพารามิเตอร์ที่เหมาะสมที่สุดของรูปแบบ ARIMA โดยอัตโนมัติ หลังจากโหลดเซิร์ฟเวอร์ให้ป้อนข้อมูลของคุณลงในคอลัมน์ข้อมูล เลือกช่วงของข้อมูลคลิกขวาและเลือกช่วงชื่อ ตั้งชื่อช่วงเป็นข้อมูล จากนั้นตั้งความถี่ของข้อมูลในเซลล์ C6 ความถี่หมายถึงช่วงเวลาของข้อมูลของคุณ ถ้าเป็นรายสัปดาห์ความถี่จะเป็น 7 เดือนจะเป็น 12 ในขณะที่รายไตรมาสจะเป็น 4 และอื่น ๆ ป้อนช่วงเวลาที่จะคาดการณ์ล่วงหน้า โปรดทราบว่าโมเดล ARIMA กลายเป็นข้อมูลที่ไม่ถูกต้องหลังจากการคาดการณ์ความถี่ต่อเนื่องหลายครั้ง กฎง่ายๆไม่เกิน 30 ขั้นตอนเป็นอะไรที่ผ่านมาซึ่งอาจไม่น่าเชื่อถือมากนัก ทั้งนี้ขึ้นอยู่กับขนาดของชุดข้อมูลของคุณด้วย หากคุณมีข้อมูลที่ จำกัด อยู่ขอแนะนำให้เลือกขั้นตอนที่มีขนาดเล็กกว่านี้ หลังจากป้อนข้อมูลของคุณตั้งชื่อและตั้งค่าความถี่ที่ต้องการและทำตามขั้นตอนในการคาดการณ์ให้คลิกเรียกใช้ อาจใช้เวลาสักครู่ในการคาดการณ์การประมวลผล เมื่อเสร็จสิ้นแล้วคุณจะได้รับค่าที่คาดการณ์ไว้ตามจำนวนที่ระบุข้อผิดพลาดมาตรฐานของผลการค้นหาและสองแผนภูมิ ด้านซ้ายเป็นค่าที่คาดการณ์ไว้ที่วางแผนด้วยข้อมูลในขณะที่ด้านขวามีการวินิจฉัยที่มีประโยชน์ซึ่งมีส่วนที่เป็นมาตรฐานความสัมพันธ์กับความสัมพันธ์ของความสัมพันธ์ของส่วนที่เหลือแผนการตกค้างของเศษและกราฟทางสถิติของ Ljung-Box เพื่อดูว่าแบบจำลองนั้นเหมาะสมหรือไม่ ฉันไม่ได้เป็นรายละเอียดมากเกินไปเกี่ยวกับวิธีที่คุณมองหารูปแบบที่ติดตั้งอย่างดี แต่บนกราฟ ACF คุณไม่ต้องการใด ๆ (หรือมาก) ของ spikes ล่าช้าข้ามกับเส้นสีน้ำเงินประ ในพล็อต gg วงกลมที่ผ่านเส้นมากขึ้นจะทำให้มีรูปแบบที่เป็นปกติและดีขึ้นกว่าเดิม สำหรับชุดข้อมูลขนาดใหญ่อาจทำให้มีแวดวงจำนวนมาก สุดท้ายการทดสอบ Ljung-Box เป็นบทความในตัวเองอย่างไรก็ตามวงกลมที่อยู่เหนือเส้นสีน้ำเงินที่จุดสีน้ำเงินจะดีกว่า หากผลการวินิจฉัยไม่ดีคุณอาจลองเพิ่มข้อมูลมากขึ้นหรือเริ่มต้นที่จุดอื่นใกล้เคียงกับช่วงที่คุณต้องการคาดการณ์ คุณสามารถล้างผลลัพธ์ที่สร้างโดยคลิกปุ่มล้างค่าคาดการณ์ และ thats ปัจจุบันคอลัมน์วันที่ไม่ได้ทำอะไรอื่นนอกจากสำหรับการอ้างอิงของคุณ แต่ไม่จำเป็นสำหรับเครื่องมือ ถ้าฉันพบเวลาฉันกลับไปและเพิ่มที่ดังนั้นกราฟที่แสดงจะแสดงเวลาที่ถูกต้อง นอกจากนี้คุณอาจได้รับข้อผิดพลาดเมื่อเรียกใช้การคาดการณ์ นี่เป็นปกติเนื่องจากฟังก์ชันที่หาพารามิเตอร์ที่ดีที่สุดไม่สามารถกำหนดลำดับที่ถูกต้องได้ คุณสามารถปฏิบัติตามขั้นตอนด้านบนเพื่อลองจัดเรียงข้อมูลของคุณให้ดียิ่งขึ้นเพื่อให้ฟังก์ชันสามารถทำงานได้ ฉันหวังว่าคุณจะได้รับการใช้งานจากเครื่องมือช่วยประหยัดเวลาได้มากในที่ทำงานเนื่องจากตอนนี้สิ่งที่ฉันต้องทำก็คือป้อนข้อมูลโหลดเซิร์ฟเวอร์และเรียกใช้งาน ฉันยังหวังว่านี่จะแสดงให้เห็นว่า R น่ากลัวได้อย่างไรโดยเฉพาะเมื่อใช้กับส่วนหน้าเช่น Excel นอกจากนี้ยังมี GitHub ที่นี่ 8.3 โมเดลอัตถดถอยในรูปแบบการถดถอยพหุคูณหลายตัวแปรเราคาดการณ์ตัวแปรที่น่าสนใจโดยใช้การรวมกันเชิงเส้นของตัวทำนาย ในรูปแบบการอัตรกรณ์อัตโนมัติเราคาดการณ์ตัวแปรที่น่าสนใจโดยใช้การรวมกันเชิงเส้นของค่าในอดีตของตัวแปร การถดถอยอัตโนมัติระยะบ่งชี้ว่าเป็นการถดถอยของตัวแปรกับตัวเอง ดังนั้นแบบจำลองอัตนัยของ p เพื่อสามารถเขียนเป็นที่ c เป็นค่าคงที่และ et เป็นเสียงสีขาว นี้เป็นเหมือนการถดถอยหลาย แต่มีค่า laged ของ yt เป็นตัวพยากรณ์ เราอ้างถึงนี้เป็นแบบ AR (p) โมเดลอัตถดถอยมีความยืดหยุ่นอย่างน่าทึ่งในการจัดการกับรูปแบบชุดเวลาแบบต่างๆ ชุดข้อมูลสองชุดในรูปที่ 8.5 แสดงชุดข้อมูลจากแบบจำลอง AR (1) และแบบ AR (2) การเปลี่ยนพารามิเตอร์ phi1, จุด, phip ผลลัพธ์ในรูปแบบชุดเวลาที่แตกต่างกัน ความแปรปรวนของเทอมข้อผิดพลาด et จะเปลี่ยนขนาดของชุดไม่ใช่รูปแบบ รูปที่ 8.5: ตัวอย่างสองตัวอย่างของข้อมูลจากโมเดลอัตชีวประวัติที่มีพารามิเตอร์ต่างกัน ซ้าย: AR (1) ด้วย yt 18 -0.8y et. ขวา: AR (2) ด้วย yt 8 ​​1.3y -0.7y et. ในทั้งสองกรณีเอตจะกระจายเสียงสีขาวเป็นปกติโดยมีค่าเฉลี่ยศูนย์และค่าความแปรปรวน 1 สำหรับรูปแบบ AR (1): เมื่อ phi10, yt จะเทียบเท่ากับสัญญาณรบกวนสีขาว เมื่อ phi 11 และ c0 yt เทียบเท่ากับการเดินแบบสุ่ม เมื่อ phi11 และ cne0, yt เทียบเท่ากับการเดินสุ่มกับ drift เมื่อ phi1lt0, yt มีแนวโน้มที่จะแกว่งระหว่างค่าบวกและค่าลบ โดยทั่วไปเรา จำกัด โมเดลอัตถิภาวนาให้เป็นข้อมูลนิ่งแล้วต้องมีข้อ จำกัด บางประการเกี่ยวกับค่าของพารามิเตอร์ สำหรับรูปแบบ AR (1): -1 lt phi1 lt 1. สำหรับรุ่น AR (2): -1 phi phi2 lt1, phi1phi2 lt1, phi2-phi1 lt 1. เมื่อ pge3 ข้อ จำกัด มีความซับซ้อนมากขึ้น R ดูแลข้อ จำกัด เหล่านี้เมื่อประมาณแบบ

Comments

Popular Posts