بازدید: 0

مجله علوم آمار ی، بهار و تابستان ١٣٩٧
١۶٣ – ١۴٣ ص، ١ شماره، ١٢ جلد
DOI: 10.29252/jss.12.1.143
شناسایی انواع تغییرات تأثیر گذار بر رفتار مدل های سری زمانی
رضا ذبیحی مقدم، رحیم چینی پرداز و غلامعلی پرهام
گروه آمار، دانشگاه شهید چمران اهواز
١٣٩٧/١/٣٠ :بازنگری آخرین تاریخ ١٣٩۵/١٢/٢٢ :دریافت تاریخ
چکیده: در این مقاله روشی برای استفاده از خروجی های کالمن فیلتر برای شناسایی تغییرات تأثیر گذار
سری زمانی ارائه شده است. از آن جا که الگوریتم کالمن فیلتر برای تحلیل مدل های فضای حالت به کار
می رود که مدل های خطی ARMA را پوشش می دهد، استفاده از این روش می تواند برای شناسایی تغییرات
از جمله مقادیر پرت به کار رود. در این مقاله روش پیشنهاد شده برای شناسایی پنج تغییر: نقطه پرت جمع
پذیر، تغییر سطح، تغییرات فصلی، تغییر دوره و شیب ناگهانی سری زمانی استفاده شده است. توانایی
روش پیشنهادی در یافتن نقاط تأثیر گذار با استفاده شبیه سازی نشان داده شد. به عنوان یک مثال واقعی
داده های ازدواج در کشور انگلیس مورد بررسی قرار گرفت.
واژه های کلیدی: هموارکننده فیلتر کالمن، نقاط پرت، مدل های ساختاری، مدل فضای حالت، شکست
ساختاری.
١ مقدمه
از آن جا که تحلیل داده های سری زمانی در یک چارچوب پارامتری مطرح می شود، انتخاب مدل در تحلیل ها
نقش کلیدی دارد. گاهی داده های مشاهده شده سری زمانی تحت تأثیر یک رویداد خارجی یا عواملی دیگر
١ نامیده می شوند به وسیله
قرار می گیرند که موجب تغییر در رفتار سری می شوند. این تغییرات که مداخله
متغیرهای توضیحی قابل بیان هستند. تغییرات ساختاری در سری زمانی را می توان به عنوان مداخله ای در
آدرس الکترونیکی نویسنده مسئول مقاله: رضا ذبیحی مقدم، com.gmail@Rezazm63
کد موضوع بندی ریاضی (٢٠١٠ :(۶۲M10 ،۹۱B84
۱
Intervention
١۴۴ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . شناسایی تغییرات تأثیر گذار با فضای حالت
نظر گرفت که در مدل اصلی یک شوک٢ وارد می کند. چون حضور تغییرات ساختاری موجب اریبی جدی
در خود همبستگی و خود همبستگی جزئی می شود، شناسایی مدل را با مشکل روبرو می سازد و در نتیجه
بر برآورد پارامترها و هم بر پیش بینی ها اثر نموده و زمینه ساز بروز خطای آماری می گردد.
کار اصلی در زمینه مداخله ها نخستین بار توسط فاکس (١٩٧٢ (برای دو نقطه پرت نوساز و جمع پذیر
در مدل اتورگرسیو مطرح گردید. سپس باکس و تیائو (١٩٧۵ (با معرفی مدل های مداخله ای، یک روش
کلی را برای تعیین موقعیت و نوع نقاط پرت و اصلاح اثرات آن ها ارائه نموده اند. تسای (١٩٨۶ و ١٩٨٨(
از روش تکراری برای شناسایی نقاط پرت نوساز، جمع پذیر، تغییرات سطح و واریانس برای مدل های
اتورگرسیو میانگین متحرک استفاده کرده است. با توجه به این که بیشتر داده های سری زمانی معمولا˗ ناایستا
می باشند، مدل های کلاسیک سری زمانی برای یافتن مداخله ها و یا پیش بینی ها کافی نخواهد بود. یکی از
بهترین روش ها برای تحلیل چنین داده هایی استفاده از مدل فضای حالت است. در مدل فضای حالت که
پارامترها با الگوریتم فیلتر کالمن٣ برآورد می شوند، دیگر نیازی به ایستایی و وارون پذیری ندارد. استفاده از
مدل فضای حالت باعث می شود که مداخله های مدل به آسانی مدل بندی شده و از پیچیدگی روابط رگرسیونی
برای شناسایی مداخله ها کاسته شود.
مدل فضای حالت و فیلتر کالمن ابتدا توسط کالمن (١٩۶٠ (در سری های زمانی معرفی شد. از آن به بعد
کاربرد آن در زمینه های مختلف به وسیله آماردانان گسترش یافت. هاروی و تاد (١٩٨٣ (کلاسی از مدل های
سری زمانی پارامتری را تحت عنوان مدل های ساختاری۴ ارائه کردند که می توان آن را به صورت معادلات
فضای حالت نوشت و تحلیل کرد.
بررسی شوک ها در مدل فضای حالت نخستین بار توسط ویلاسکی و جونس (١٩٧۶ (مطرح شد.
سپس هاروی و داربین (١٩٨۶ (یک مثال عملی را در مدل های ساختاری با تحلیل مداخله ای مورد بررسی
قرار دادند. همچنین هاروی و کاپمن (١٩٩٢ (شناسایی نقاط پرت و تغییرات سطح را با روش خطای
هموار شده در مدل های ساختاری مورد بررسی قرار دادند. روش کلی تر در فضای حالت توسط دی جانگ و
پنزر (١٩٩٨ (مطرح گردید. آنان با استفاده از مداخله ای کردن مدل فضای حالت و با هموارکننده به دست
امده از فیلتر کالمن به بررسی حضور مداخله های نقطه پرت و تغییرات در روند پرداختند. پنزر (٢٠٠۶ (به
شناسایی تغییرات فصلی و شائو و همکاران (٢٠٠٩ (به شناسایی نقاط پرت با روش مطرح شده دی جانگ
و پنزر (١٩٩٨ (در سری های زمانی پرداخته اند. لازم به ذکر است که تا به حال تحقیقات انجام گرفته به
۲
Shock
۳Kalman Filter
۴
Structrual Models
رضا ذبیحی مقدم و همکاران . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ١۴۵
صورت یک متغیر توضیحی در نظر گرفته شده است. استفاده از مدل فضای حالت برای شناسایی مداخله
در دی جانگ و پنزر (١٩٩٨ (صورت گرفته اما مدل معرفی شده به صورت ساده همراه با مداخله بوده است.
در این مقاله مداخله در یک سری زمانی ساختاری شامل روند، اثرات فصلی و دوره در قالب فضای حالت
مورد بررسی قرار گرفته شده است.
در بخش ٢ معرفی مدل ساختاری و انواع مداخله ها معرفی شده اند. در بخش ٣ معرفی مدل فضای
حالت، فیلتر کالمن و هموارکننده کالمن پرداخته شده است. در بخش ۴ مقاله از الگوریتم فیلتر کالمن برای
شناسایی مداخله ها استفاده شده است به این صورت که روش دی جانگ و پنزر (١٩٩٨ (و پنزر (٢٠٠۶(
برای مدل های ساختاری شامل روند، اثرات فصلی و دوره به کار گرفته شده است. در بخش ۵ با استفاده
از شبیه سازی توانایی شناسایی مداخله ها نشان داده شده است.
٢ مدل های ساختاری و معرفی مداخله های مدل های ساختاری
در یک مدل ساختاری مجموعه ای از مؤلفه های مشاهده نشده در مدل سری زمانی قرار می گیرند که هر کدام
تفسیری خاص از عوامل تأثیرگذار را نشان می دهند. هاروی و همکاران (١٩٩٨ (کارایی این مدل ها را
در مقایسه با مدل های ARIMA مخصوصاً هنگامی که سری با اشکال نامنظمی روبه رو هست، بررسی
کردند. در مدل های ساختاری ویژگی های سری زمانی مانند: مؤلفه روند، فصل، دوره و تغییرات نامنظم
(اغتشاش ها) است که در مدل رگرسیونی با متغیرهای توضیحی مدل بندی می شود، به گونه ای که این مؤلفه ها
دارای انعطاف تغییر پذیری در طول زمان را دارا هستند. استفاده از مدل های ساختاری باعث می شود که
سری مشاهدات را به مؤلفه های غیر قابل مشاهده که باعث درک بهتر مشخصات دینامیکی سری می شوند،
تجزیه کرد و پایه ای مؤثر برای تعدیلات فصلی ایجاد کرد، همچنین پیش بینی های بهینه ای را با استفاده از
الگوریتم های خاص انجام داد.
yt {که به آن مدل
برای تحلیل داده ها فرض کنید مدل مناسب برای مشاهدات {n, …, ١ = t:
صفر گفته می شود به صورت مدل ساختاری پایه ای جمعی
yt = µt + ψt + γt + ϵt
, ϵt ∼ NID(٠, σ٢
ϵ
)
باشد، که در آن yt مشاهده در لحظه t ،µt مؤلفه روند، ψt مؤلفه دوره، γt مؤلفه اثرات فصلی و ϵt مؤلفه
١۴۶ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . شناسایی تغییرات تأثیر گذار با فضای حالت
تغییرات نامنظم هستند و داریم:
µt = µt−١ + βt−١ + ηt
, ηt ∼ NID(٠, σ٢
η
)
βt = βt−١ + ζt
, ζt ∼ NID(٠, σ٢
ζ
)


ψt
ψ

t

 = ρ


cos λc sin λc
− sin λc cos λc




ψt−١
ψ

t−١

 +


κt
κ

t


∑s−١
j=٠
γt−j = ωt
, ωt ∼ NID(٠, σ٢
ω
)
در معادلات فوق βt شیب، λc فرکانس مؤلفه دوره، ρ عامل میرایی دوره، s تعداد فصل ها در یک
κ و ωt عامل های اغتشاشی و این عامل های اغتشاشی مستقل از یکدیگر و همچنین

t
،κt ،ζt ،ηt ،دوره
مستقل از اغتشاش ϵt هستند. هم چنین مؤلفه های روند، دوره و اثرات فصلی مستقل از یکدیگرند. هرگاه
مداخله در مدل صفر قرار گیرد می توان مدل را به صورت مدل مداخله ای
yt = Dt(i)δi + µt + ψt + γt + ϵt
در نظر گرفت، که در آن δi یک مقدار حقیقی است که وزن مداخله iام را نشان می دهد و (i(Dt تابع
معرف۵ مداخله در زمان i است. تابع معرف مداخله ، شکل مداخله را نیز مشخص می کند. (i(Dt برداری
سطری است و مقدار آن قبل از رخ دادن شوک یعنی i < t برابر با صفر و برای لحظاتی که شوک در
مدل وجود دارد برابر با یک است. اگر پارامتر مقیاس δi در مدل مداخله ای صفر شود، مدل با مدل صفر
معادل خواهد بود. آزمون برای حضور انحراف در لحظه i = t ،معادل با آزمون ٠ = δi : H٠ می باشد.
برای آزمون این فرض با توجه به نامعلوم بودن پارامتر مقیاس به برآورد δi نیاز است که با استفاده از
۶ به دست می آید. دی جانگ و پنزر (١٩٩٨ (نشان داده اند که شبیه
برآورد کمترین توان های دوم تعمیم یافته
۵
Signature
۶Generalized Least Squares (GLS)
رضا ذبیحی مقدم و همکاران . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ١۴٧
آزمون های رگرسیون معمولی، آماره آزمون برای این فرض به صورت زیر است:
τi =
ˆδi
se(
ˆδi)
)se خطای استاندارد این برآورد را نشان می دهد و در نتیجه سطح معنی داری آماره به دست
که (δiˆ
آمده با توجه به توزیع t مشخص می شود.
مهمترین مداخله ها یا تغییرات که در مدل های ساختاری با توجه به مؤلفه ها به وجود می آیند و می توان با
استفاده از تعمیم روش مطرح شده ی دی جانگ و پنزر (١٩٩٨ (به شناسایی آن ها پرداخت، مداخله نقطه
٧ ،تغییر ناگهانی سطح٨ ،تغییر ناگهانی شیب٩ ،تغییر ناگهانی فصلی١٠ و تغییر ناگهانی دوره١١ هستند.
تنها
با توجه به این که به تغییراتی که تأثیر آن پایدار باشد مداخله های پایا و به تغییراتی که تأثیر آن موقت باشد
مداخله های گذرا گفته می شود، می توان با توجه به مؤلفه ها و تعاریفی از مداخله ها در مدل های کلاسیک،
مداخله ها را در مدل های ساختاری به صورت زیر بیان کرد:
مداخله نقطه تنها(پرت جمع پذیر): این نقطه حاصل تداخل ضربه ای است که تنها بر یک مشاهده
تأثیر می گذارد. تغییر ناگهانی سطح: این نقطه حاصل تداخل ضربه ای است که موجب انتقال سطح
سری به اندازه δ است و به صورت پایدار است. تغییر ناگهانی شیب: این نقطه حاصل تداخل
ضربه ای است که موجب انتقال شیب سری به اندازه δ است و به صورت پایدار است. تغییر ناگهانی
فصلی: این نقطه حاصل تداخل ضربه ای است که موجب تغییر ناگهانی الگوی فصلی به اندازه δ
است و به صورت پایدار است. تغییر ناگهانی دوره: این نقطه حاصل تداخل ضربه ای است که
موجب تغییر ناگهانی دوره به اندازه δ است و به صورت پایدار است.
از آنجا که مدل های ساختاری می توانند به صورت نامانا به کار روند. محاسبات شناسایی تغییرات ناگهانی
و شوک ها در چنین سری هایی کارایی بالایی خواهد داشت. بنابراین نوشتن مدل های ساختاری به صورت
مدل فضای حالت و استفاده از الگوریتم فیلتر کالمن برای برآورد پارامترها و پیش بینی آماری بسیار مهم
است.
۷
Single Outlying
۸Level Sudden Change
۹
Slope Sudden Change
۱۰Seasonal Sudden Shift
۱۱Period Sudden Shift
١۴٨ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . شناسایی تغییرات تأثیر گذار با فضای حالت
٣ مدل فضای حالت و الگوریتم فیلتر کالمن
مدل فضای حالت ضمن این که بسیاری از مدل های خطی و غیرخطی را در بر می گیرد، مهم ترین الگوریتم
آن یعنی الگوریتم پالایه کالمن برای برآورد پارامترها و پیش بینی نیازی به شرط ایستایی و وارون پذیری برای
yt به صورت
تحلیل های آماری ندارد. شکل کلی فضای حالت برای مشاهده
yt = Ztαt + dt + ϵt
, t = ١, . . . , n
yt متغیر مشاهده شده،
تعریف می شود، که معادله اندازه١٢ یا معادله مشاهده نامیده می شود. در این معادله
، dt یک ثابت و ϵt یک بردار ١ × ١
Zt یک بردار m × ١ ،αt یک بردار ١ × m با نام بردار حالت ١٣
yt با بردار حالت αt که معمولا˗
σ است. مشاهده
٢
از اغتشاش های هم توزیع با میانگین صفر و واریانس t
غیرقابل مشاهده هستند در ارتباط می باشد. این بردار حالت خود به صورت یک فرآیند مارکوف مرتبه اول
به صورت
αt = Ttαt−١ + ct + νt
, t = ١, . . . , n
تولید می شود، که معادله انتقال١۴ نامیده می شود. در این معادله Tt ماتریس انتقال با بعد ماتریسی m×m،
ct یک بردار ثابت ١ × m و νt بردار اغتشاش ها یک بردار ١ × m هستند. این اغتشاش ها از یکدیگر
مستقل و دارای بردار میانگین صفر و ماتریس کوواریانس Qt هستند و این فرآیند مارکوف با بردار حالت
اولیه α٠ شروع می شود و دارای میانگین و واریانس به صورت
E(α٠) = a٠, V ar(α٠) = p٠
است. در معادلات فضای حالت اغتشاش های ϵt و νt از یکدیگر مستقل هستند. این اغتشاش ها از بردار
حالت اولیه α٠ نیز ناهمبسته هستند. یعنی
E(ϵtν

s
) = ٠, E(νtα

٠
) = ٠, E(ϵtα

٠
) = ٠, s, t = ١, . . . , n
۱۲Measurement Equation
۱۳State Vector
۱۴Transition Equation
رضا ذبیحی مقدم و همکاران . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ١۴٩
در معادلات فضای حالت ماتریس های Tt ، Rt ،Qt و Zt ماتریس های سیستمی١۵ نامیده می شود. اگر این
ماتریس ها برحسب به زمان ثابت باشند، مدل زمان-همگن١۶ نامیده می شود که مدل های مانا را می پوشانند.
ماتریس های سیستمی شامل پارامترهای مدل هستند که در صورت نامعلوم بودن این پارامترها باید برآورد
شوند. پارامترهایی که در ماتریس های Zt ،Tt ،Rt و Qt هستند خواص تصادفی مدل را تعیین می کنند.
مثال ٧ :ساده ترین مدل ساختاری مدل روند خطی موضعی١٧ است که با استفاده از معادلات تعریف شده
به صورت
yt = µt + ϵt
, ϵt ∼ NID(٠, σ٢
ϵ
)
µt = µt−١ + βt−١ + ηt
, ηt ∼ NID(٠, σ٢
η
)
βt = βt−١ + ζt
, ζt ∼ NID(٠, σ٢
ζ
)
نوشته می شود، که در آن شکل مدل فضای حالت به صورت
αt =


µt
βt

 , Zt =
(
١ ٠ )
Tt =


١ ١
٠ ١

 , Qt =


σ
٢
η
٠
٠ σ
٢
ζ


yt است که نیاز به اطلاع از مشاهده
است. الگوریتم فیلتر کالمن یک فرآیند بازگشتی برای پیش بینی
yt و مشاهدات قبلی آن دارد و مبتنی بر هموارسازی است. بعد از هر مرحله که مشاهده جدید اضافه
می شود معادلات فیلتر کالمن بهنگام می گردند و به همین ترتیب مراحل بعدی انجام می شود. برای سادگی
در علامت گذاری فرض کنید {yt, . . . , y١ = {Yt و ١−at بهترین برآوردکننده بر اساس مشاهدات
صورت به αt−١ برای Yt−١
at−١ = at−١|t−١ = E(αt−١|Yt−١)
۱۵System Matrices
۱۶Time Invariant
۱۷locally linear trend
١۵٠ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . شناسایی تغییرات تأثیر گذار با فضای حالت
باشد و ١−pt نیز نشان دهنده ماتریس کوواریانس با بعد m × m از خطای این برآوردکننده باشد. یعنی
pt−١ = pt−١|t−١ = V ar [αt−١|Yt−١]
αt و ماتریس کوواریانس برآورد pt با توجه به
حال اگر ١−at و ١−pt در اختیار باشند، آنگاه برآورد
اطلاعات موجود تا زمان ١ − t به صورت
at|t−١ = E(αt
|Yt−١) = TtE(αt−١|Yt−١) + ct
pt|t−١ = V ar(αt
|Yt−١) = TtV ar(αt−١|Yt−١)T

t + Qt
به دست می آیند، که معادلات پیش بینی١٨ نامیده می شوند. پیش بینی yt در لحظه ١ − t به صورت
yˆt|t−١ = E(yt
|Yt−١) = Ztat|t−١ + dt
υt خطای پیش بینی یا نوساز١٩ در لحظه ١ − t عبارت است از:
به دست می آید. آن گاه
υt = yt − yˆt|t−١ = Zt(αt − at|t−١
) + ϵt
, t = ١, . . . , n
و ماتریس کوواریانس این نوسازهای متعامد به صورت
Ft = V ar(υt
|Yt−١) = Ztpt|t−١Z

t + σt
٢
به دست می آید.
وقتی مشاهدات yt در لحظه t مشاهده شود برآوردگر αt و ماتریس کوواریانس آن به صورت
at = at|t = E(αt
|Yt) = at|t−١ + pt|t−١Z

tF
−١
t υt (١)
pt = pt|t = pt|t−١ − pt|t−١Z

tF

t
−١Ztp

t|t−١
۱۸Prediction Equations
۱۹Innovation
رضا ذبیحی مقدم و همکاران . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ١۵١
به هنگام می شود، که معادلات به هنگام ٢٠ نامیده می شود. معادلات پیش بینی و معادلات به هنگام با هم
t|at می توان از معادلات کلی تری به صورت
به at|t−١
الگوریتم پالایه کالمن را می سازند. برای محاسبه
pt|t = pt|t−١ − صورت به آن کوواریانس-واریانس ماتریس که، کرد استفاده at|t = at|t−١ + Ktυt
١Z−t|pt است. که در آن

tK′
t
Kt = Cov(αt
, yt
|Yt−١)F
−١
t = pt|t−١Z

tF
−١
t
.
یکی دیگر از ویژگی های معادلات فضای حالت، الگوریتم های هموارکننده کالمن هستند که یک رابطه
بازگشتی پسرو بر اساس مجموعه کامل داده ها {yn, . . . , y١ = {Yn می باشند. دی جانگ (١٩٨٨)a و
کان و انسلی (١٩٨٩ (دو نتیجه ای که در محاسبات هموارکننده ها و در شناسایی شکست ساختاری بسیار
مؤثرند را به صورت
rt−١ = Z

tF
−١
t υt + L

trt t = n, . . . , ١
Nt−١ = V ar(rt−١) = Z

tF
−١
t Zt + L

tNtLt
ut = F
−١
t υt − K′
tT

trt t = n, . . . , ١
Mt = V ar(ut) = F
−١
t + K′
tT

tNtTtKt
مطرح کردند، که در آن ها
Lt = (Tt+١ − Tt+١KtZt).
معادله ١−rt را مقدار باقیمانده هموارکننده حالت٢١ و معادله ut را مقدار باقیمانده هموارکننده پاسخ٢٢
می نامند و ماتریس کوواریانس آن ها به ترتیب برابر معادلات ١−Nt و Mt هستند و همچنین Ft و Kt
نیز از معادلات فیلتر کالمن به دست می آیند. معادلات هموار کننده کالمن هم برای شروع الگوریتم مانند
معادلات فیلتر کالمن نیاز به مقادیر اولیه دارند که این مقادیر برابر ٠ = rn و ٠ = Nn فرض می شوند.
۲۰Updating Equations
۲۱State Smoothing Residuals
۲۲Response Smoothing Residuals
١۵٢ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . شناسایی تغییرات تأثیر گذار با فضای حالت
۴ مدل مداخله ای و آماره های هموارکننده هکالمن برای شناسایی مداخله ها
دو نوع مداخله گذرا و پایا با استفاده از تعمیم روش دی جانگ و پنزر (١٩٩٨ (مورد بررسی قرار میگیرد.
لازم به ذکر است که دی جانگ و پنزر (١٩٩٨ (تنها به روشی برای شناسایی مداخله ها پرداخته اند. مدل دی
جانگ و پنزر (١٩٩٨ (با اندک تفاوتی که برای شناسایی مداخله های گذرا و پایا مناسب هستند به صورت
yt = xt(i)δi + Ztαt + dt + ϵt
αt = wt−١(i)δi + Ttαt−١ + ct + νt
نوشته می شوند، که در آن ها (i(xt و (i(wt متغیرهای ساختگی مرتبط با شوک ها در زمان t هستند که
تنها در لحظه حضور شوک i = t برابر با یک هستند و به ترتیب برای مداخله های گذرا و پایا استفاده
می شوند و آن ها را ماتریس طرح شوک نیز می نامند. با جایگذاری بازگشتی معادله انتقال مدل مداخله ای
در معادله اندازه مداخله ای برای n, . . . , ١ = t تابع معرف مداخله ای برای هر دو متغیر ساختگی مرتبط
با شوک های xi و wi به صورت
Dt(i) =



٠, t = ١, . . . , i − ١
xi
, t = i
ZtTt,i+٢wi
, t = i + ١, . . . , n
به دست می آید، که در آن
Tj,i+٢ =



Tj · · · Ti+٢, j > i + ١
I, j = i + ١
٠, j < i + ١
رضا ذبیحی مقدم و همکاران . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ١۵٣
T محاسبه می شود. در لحظه
j−i−١ صورت به j > i + ١ برای Tj,i+٢ باشد همگن-زمان مدل اگر
i = t با در نظر گرفتن تابع معرف (i(Dt و ٢+j,Ti پارامتر وزن مداخله یعنی δi براورد می شود. با توجه
به این که الگوریتم کالمن فیلتر برای حل معادلات فضای حالت پارامترها را از طریق کمترین توان های دوم
)Se است
ˆδi) = S
−١
i
S = δi ˆبا انحراف استاندارد
−١
i
تعمیم یافته براورد می کند، براورد δi به صورت si
(ذبیحی، ١٣٩٢ ،(که در آن
si = x

iui + w

i
ri (٢)
Si = x

iF
−١
i
xi + J

iNiJi (٣)
Ji = wi − Ti+١kixi
و کمیت های ui، ri، Fi ،ki و Ni از الگوریتم فیلتر کالمن معرفی شده در بخش ٣ تحت مدل صفر محاسبه
τ به دست
٢
i = s

iS
−١
i
si و τi = S
− ١
٢
i
می شوند و آماره های مفیدی برای شناسایی مداخله ها به صورت si
می آید، که اگر پارامترهای مدل صفر معلوم باشند می توان توزیع این آماره ها را مشخص کرد. برای مثال
τ دارای
٢
وقتی δi اسکالر و پارامترها معلوم باشند آماره ی τi دارای توزیع تقریبی نرمال استاندارد و آماره ی i
توزیع کای دو است. برای تشخیص موقعیت مداخله ها باید ماتریس طرح شوک xi و wi مشخصی در
مدل استفاده شوند. برای شناسایی موقعیت مداخله های مطرح شده، مدل ساختاری با روند، اثرات فصلی،
دوره را در نظر بگیرید که این مدل به محقق اجازه می دهد به صورت همزمان روند، شیب، اثرات فصلی و
دوره را وارد مدل کند. شکل فضای حالت این مدل به صورت
Z =
[
١ ٠ ١ ٠ ٠ · · · ٠ ١ ٠]
١۵۴ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . شناسایی تغییرات تأثیر گذار با فضای حالت
T =






















١ ١ ٠ ٠ ٠ · · · ٠ ٠ ٠ ٠
٠ ١ ٠ ٠ ٠ · · · ٠ ٠ ٠ ٠
٠ ٠ −١ −١ −١ · · · −١ −١ ٠ ٠
٠ ٠ ١ ٠ ٠ · · · ٠ ٠ ٠ ٠
٠ ٠ ٠ ١ ٠ · · · ٠ ٠ ٠ ٠
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
٠ ٠ ٠ ٠ ٠ · · · ١ ٠ ٠ ٠
٠ ٠ ٠ ٠ ٠ · · · ٠ ٠ ρ cos λc ρ sin λc
٠ ٠ ٠ ٠ ٠ · · · ٠ ٠ − sin λc ρ cos λc






















αt =



















µt
βt
γt
γt−١
.
.
.
γt−s+٢
ψt
ψ

t



















, ν =






















ηt
ζt
ωt
٠
٠
.
.
.
٠
κt
κ

t






















, Q =



















σ
٢
η
٠ ٠ ٠ · · · ٠
٠ σ
٢
ζ
٠ ٠ · · · ٠
٠ ٠ σ
٢
ω
٠ · · · ٠
٠ ٠ ٠ ٠ · · · ٠
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
٠ ٠ ٠ ٠ · · · ٠
٠ ٠ · · · ٠ σ
٢
κ
٠
٠ ٠ · · · ٠ ٠ σ
٢
κ∗



















است، که بردار حالت از ٣ + s عنصر تشکیل شده است. برای بررسی موقعیت مداخله جمع پذیر با شوک
وارد کردن به معادله اندازه مدل بندی می شود که تابع معرف آن تنها در لحظه i برابر با یک است. آماره آزمون
τ به دست می آید (ذبیحی،
٢
i = u

iM−١
i
برای این مداخله با استفاده از هموارکننده های کالمن به صورت ui
١٣٩٢ .(برای مداخله هایی که دارای تغییرات پایدار هستند با شوک وارد کردن به معادله انتقال می توان
مدل بندی کرد. با شوک وارد کردن به هر یک از مؤلفه ها می توان موقعیت آن ها را شناسایی کرد. برای
رضا ذبیحی مقدم و همکاران . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ١۵۵
(٠, . . . , ٠, ١ = (wi که تنها در ردیف
مداخله تغییر سطح با شوک وارد کردن به بردار حالت به صورت ′
τ به دست
٢
i = r
٢
i,١
اول یک و در ٢ + s ردیف دیگر صفر باشد و آماره تشخیصی آن به صورت ١١,Ni/
می آید، که در آن ١,ri اولین عنصر از بردار ri و ١١,Ni اولین عنصر قطر ماتریس Ni هستند. آماره به دست
آمده از هموارکننده های کالمن برای شناسایی تغییرات شیب با شوک وارد کردن به بردار حالت به صورت
τ
٢
i = r
٢
i,٢
(٠, . . . , ٠, ١, ٠ = (wi که تنها از ٣ + s ردیف، ردیف دوم یک است، به صورت ٢٢,Ni/

است، که در آن ٢,ri دومین عنصر از بردار ri و ٢٢,Ni دومین عنصر قطر ماتریس Ni هستند.
برای تشخیص تغییرات فصلی به وسیله شوک دادن به هر یک از عناصر مؤلفه های فصلی بردار حالت
می توان موقعیت مداخله تغییر ناگهانی فصلی را شناسایی کرد. فرض کنید به kامین عنصر از ١ − s
شوک wi = (٠, ٠, . . . , ٠, ١, ٠, . . . , ٠)
مؤلفه فصلی بردار حالت بعد از دو ردیف اول به صورت ′
وارد شود، یعنی ردیف kام به جز دو ردیف اول، یک و بقیه صفر باشند. در نتیجه با توجه به روش
τ به دست می آید، که در آن
٢
i = r
٢
i,k+٢
مطرح شده پنزر (٢٠٠۶ (آماره تشخیصی به صورت ٢+k,٢+k,Ni/
.هستند Ni ماتریس قطر عنصر امینk + ٢ ،Ni,k+٢,k+٢ و ri بردار از عنصر امینk + ٢ ،ri,k+٢
این آماره در شناسایی موقعیت تغییرات فصلی در مشاهدات بسیار مؤثر است. آماره ای که در شناسایی
تغییرات دوره بسیار مؤثر می باشد با وارد کردن شوک به هر یک از مؤلفه های دوره از بردار حالت به صورت
wi = (٠, . . . , ٠, ١)

(٠, ١, ٠, . . . , ٠ = (wi که تنها در ردیف ٢ + sام یک و بقیه ردیف ها صفر و

که تنها در ردیف آخر یک و بقیه ردیف ها صفر هستند، به صورت
τ
٢
i = r
٢
i,s+٢
/Ni,s+٢,s+٢, τ ٢
i = r
٢
i,s+٣
/Ni,s+٣,s+٣
به دست می آید، که در آن ٢+s,ri و ٣+s,ri به ترتیب ٢+s و ٣+sامین عنصر از بردار ri و ٢+s,٢+s,Ni
و ٣+s,٣+s,Ni به ترتیب ٢ + s و ٣ + sامین عنصر قطر ماتریس Ni هستند. تحت فرض مدل صفر و
معلوم بودن پارامترها همه ی این آماره ها دارای توزیع تقریبی کای دو هستند.
۵ مطالعه شبیه سازی
برای بررسی توانایی روش مطرح شده در این مقاله، مطالعه ای شبیه سازی برای آماره های به دست آمده
از فیلتر کالمن فضای حالت برای شناسایی مداخله های مطرح شده در مدل مداخله ای ساختاری فصلی
١۵۶ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . شناسایی تغییرات تأثیر گذار با فضای حالت
ساختگی سه ماهه ۴ = s انجام گرفته است که ماتریس های سیستمی آن به صورت
Z =
[
١ ٠ ١ ٠ ٠]
αt =










µt
βt
γt
γt−١
γt−٢










ν =










ηt
ζt
ωt
٠
٠










T =










١ ١ ٠ ٠ ٠
٠ ١ ٠ ٠ ٠
٠ ٠ −١ −١ −١
٠ ٠ ١ ٠ ٠
٠ ٠ ٠ ١ ٠










تعریف می شوند. ابتدا برای رسیدن به مفهوم ساده تری از مداخله های مطرح شده نمودارهای مدل فصلی
ساختگی و مداخله ایی آن ها در شکل ١ در نظر گرفته شده است:

شکل ١ .مدل فصلی ساختگی بدون مداخله و با مداخله ها، الف- بدون مداخله، ب- آمیخته به مداخله نقطه پرت، ج- آمیخته
به مداخله تغییر سطح، د- آمیخته به مداخله تغییر شیب، ه- آمیخته به مداخله تغییر فصلی
رضا ذبیحی مقدم و همکاران . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ١۵٧
برای بررسی عملکرد آماره حاصل از فیلتر کالمن برای شناسایی مداخله ها برای ٢٠٠ مشاهده شبیه سازی
شده با ١٠٠٠ تکرار مدل آمیخته با مداخله ها شده است. لازم به ذکر است منظور از عملکرد در این مقاله
یافتن درست یک مداخله در سری زمانی است که معادل با توان یک آزمون است. برای عملکرد آماره
به دست آمده برای شناسایی مداخله جمع پذیر در مدل فصلی ساختگی سه ماهه در لحظه ١٨ = t مدل مانند
شکل ١-الف آمیخته با نقطه پرت جمع پذیر شده است و آماره حاصل از فیلتر کالمن برای شناسایی مداخله
جمع پذیر محاسبه شده است. در آخر دنباله ای از آماره ها در لحظه ١٨ = t به دست می آید و با توجه به
اینکه این آماره دارای توزیع تقریبی کای دو هستند نسبت احتمال بزرگتر بودن آماره ها در زمان ١٨ = t
در سطح های معنی داری مختلف برای هر تکرار بر ١٠٠٠ سری های شبیه سازی شده محاسبه شده است .
همچنین برای بررسی عملکرد آماره های شناسایی مداخله های تغییر سطح، تغییر ناگهانی شیب و تغییرات
فصلی مدل به صورت جداگانه به ترتیب در لحظه های ۵٠ = t ،١٢٠ = t و ١٠٠ = t مدل مانند شکل
١ با مداخله های تغییر سطح، تغییر ناگهانی شیب و تغییر ناگهانی فصلی آمیخته شده است.
آماره های تشخیصی مداخله های تغییر سطح، تغییر ناگهانی شیب و تغییرات فصلی پس از نوشتن مدل
به صورت فضای حالت و اجرای الگوریتم فیلتر کالمن و هموار کننده های کالمن معرفی شده در بخش ٣
به صورت روابط بخش ۴ قابل محاسبه هستند. برای بررسی عملکرد آماره های شناسایی مداخله های تغییرات
سطح، تغییر شیب و تغییر فصلی برای ٢٠٠ مشاهده شبیه سازی شده به صورت جداگانه با مداخله های
تغییرات سطح، شیب و فصلی در زمان های ذکر شده دنباله ای از آماره ها برای ١٠٠٠ تکرار به دست آمده
است و با توجه به اینکه آماره ها دارای توزیع تقریبی کای دو می باشند نسبت احتمال بزرگتر بودن آماره ها
در زمان های ١٢٠, ١٠٠, ۵٠, ١٨ = t در سطح های معنی داری مختلف برای هر تکرار بر ١٠٠٠ سری های
شبیه سازی شده محاسبه شده است.
جدول ١ نتایج به دست آمده از شبیه سازی برای کارایی آزمون در سطح های معنی داری مختلف برای
مداخله های مختلف جمع پذیر، تغییر سطح، تغییر فصلی و تغییر شیب در تکرار ١٠٠٠ را نشان می دهد.
جدول ١ .عملکرد آماره های آزمون شناسایی مداخله ها برای ١٠٠٠ تکرار
سطح معنی داری مداخله ها
١٠/٠ ٠۵/٠
پذیر جمع ٩٣٩/٠ ۶١١/٠
سطح تغییر ٨٨٨/٠ ۴٩۴/٠
فصلی تغییرات ٩٩٩/٠ ٩٩٢/٠
شیب ناگهانی تغییر ٩۶٢/٠ ٧۵٢/٠
١۵٨ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . شناسایی تغییرات تأثیر گذار با فضای حالت
همان طور که ملاحظه می شود کارایی آماره های حاصل از فیلتر کالمن فضای حالت در سطح ١٠/٠ برای
مداخله های مختلف بسیار بالا است و همچنین مدل فضای حالت قابلیت مدل بندی مداخله های مختلف را
دارد که می توان با استفاده از آماره های حاصل از فیلتر کالمن به شناسایی مداخله ها پرداخت.
۶ مثال کاربردی
شکل ٢ نمودار سری زمانی داده های ازدواج در انگلیس را که به صورت سه ماهه از سال ١٩۶۵ تا ١٩٧٠
جمع آوری شده است نشان می دهد. این داده ها در وست و هریسون (١٩٩٧ (برای بررسی روش های بیزی
سری زمانی مورد بررسی قرار گرفته اند.
شکل ٢ .نمودار سری زمانی تعداد ازدواج ها در انگلیس
همان طور که ملاحظه می شود سری مانا به نظر نمی رسد و مؤلفه فصلی آشکاری در رفتار سری وجود دارد.
برای برازش مدل صفر به این داده ها می توان با توجه به ویژگی آن ها از مدل ساختاری مدل فصلی ساختگی
زیر استفاده کرد:
yt = µt + γt + ϵt
, ϵt ∼ NID(٠, σ٢
ϵ
)
µt = µt−١ + βt−١ + ηt
, ηt ∼ NID(٠, σ٢
η
)
βt = βt−١ + ζt
, ζt ∼ NID(٠, σ٢
ζ
)
رضا ذبیحی مقدم و همکاران . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ١۵٩

٣
j=٠
γt−j = ωt
, ωt ∼ NID(٠, σ٢
ω
)
مدل فضای حالت برای این مدل ساختاری به صورت
Z =
[
١ ٠ ١ ٠ ٠]
, αt =










µt
βt
γt
γt−١
γt−٢










, ν =










ηt
ζt
ωt
٠
٠










, T =










١ ١ ٠ ٠ ٠
٠ ١ ٠ ٠ ٠
٠ ٠ −١ −١ −١
٠ ٠ ١ ٠ ٠
٠ ٠ ٠ ١ ٠










نوشته می شود، که برآورد پارامترها با الگوریتم EM به صورت
a٠ =
(
١٠۴٫۶۵, ٠٫۵٨, −١۵٫٢٧, ٣٣٫٣٧, −٧٫٩٢)′
p٠ = diag (
٢٫٢۶٩, ٠٫١٢٧, ٣٫١٧, ٣٫٣٣, ٣٫۶٨)
به دست آمده است.(شاموی و استوفر، ٢٠١١ و یا ذبیحی، ١٣٩٢ (با توجه به شناسایی مدل و برآورد
جدول ٢ .جدول برآورد پارامترها تحت فرض مدل صفر
برآورد پارامترها پارامترهای مدل
σ
٢
ϵ
٠
σ
٢
η
٧۶٧۴/١
σ
٢
ζ
٠٠٨/٠
σ
٢
ω
٢۵١/٧٧
پارامترها صورت گرفته، درست بودن تشخیص مدل مورد بررسی قرار می گیرد تا در صورت نامناسب بودن
مدل، اصلاح مدل انجام گیرد. شکل ٣ نمودار خودهمبستگی و خودهمبستگی جزئی مانده های استاندارد
شده را نشان می دهد.
١۶٠ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . شناسایی تغییرات تأثیر گذار با فضای حالت
شکل ٣ .نمودارهای خودهمبستگی و خودهمبستگی جزئی برای باقیمانده ها
همان طور که ملاحظه می شود مانده ها از هم مستقل هستند. برای اطمینان از نرمال بودن مانده ها،
آزمون های شاپیرو و کولموگورف-اسمیرنف استفاده شده است که p-مقدار این آماره ها به ترتیب برابر با
٠٠٠٢/٠ و ٠٢/٠ است، که نشان از غیر نرمال بودن مانده های استاندارد شده است در شکل ۴ نشان داده
شده است.
شکل ۴ .نمودار احتمال نرمال باقیمانده ها با استفاده از آزمون کولموگورف-اسمیرنف
با توجه به غیر نرمال بودن مانده ها و بزرگ بودن مؤلفه واریانس فصلی می توان به وجود احتمال یک
مداخله در مدل پی برد. با نوشتن مدل به صورت مداخله ای با مداخله ی فصلی و استفاده از روش مطرح
شده در این مقاله می توان آزمون های تشخیصی برای شناسایی موقعیت مداخله فصلی در این داده ها را به
کار برد. شکل ۵ نمودار آماره آزمون برای شناسایی مداخله فصلی را نشان می دهد.
رضا ذبیحی مقدم و همکاران . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ١۶١
شکل ۵ .نمودار آماره تشخیصی تغییرات فصلی
همان طور که ملاحظه می شود بزرگ بودن آماره تشخیصی برای تغییرات فصلی در سه ماهه آخر ١٩۶٨
حضور تغییر ناگهانی فصلی را تصدیق می کند. حضور این مداخله باعث تغییر الگوی فصلی از سه ماهه
اول ١٩۶٩ به بعد شده است و موجب کاهش بسیار زیاد ازدواج در سه ماهه اول و افزایش ازدواج در سه
ماهه دوم شده است. در بررسی این تغییر معلوم شد که این پدیده به سبب تغییر قوانین مالیاتی در انگلیس
صورت گرفته است که در سال ١٩۶٩ دولت انگلیس قانونی برای حذف مالیات ازدواج در سه ماهه دوم
سال که در سال های قبل از آن باعث رکود تعداد ازدواج در این سه ماهه بوده، به اجرا گذاشته است و این
مسأله باعث افزایش تعداد ازدواج ها در این سه ماهه شد.
بحث و نتیجه گیری
به دلیل حضور مداخله ها در بیشتر سری های زمانی لازم است در بررسی داده ها و انتخاب مدل وجود این
تغییرات مورد توجه قرار گیرند. در صورت عدم توجه به این تغییرات، اریبی جدی در برآورد پارامترها
مشاهده می شود و در نهایت موجب خطا در پیش بینی ها می گردد. با توجه به اینکه مدل فضای حالت در
بسیاری از مدل ها کاربرد دارد و مهم ترین الگوریتم آن، فیلتر کالمن در برآورد پارامترها نیازی به مانایی
ندارد در شناسایی مداخله ها بسیار کارا و دقیق است. همچنین با استفاده از روش فضای حالت آماره ها
پس از محاسبات هموار کننده های فیلتر کالمن در دسترس هستند و نیازی به روابط رگرسیونی پیچیده ندارند.
١۶٢ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . شناسایی تغییرات تأثیر گذار با فضای حالت
تقدیر و تشکر
نویسندگان مقاله از سردبیر محترم مجله علوم آماری و داوران محترم همچنین ویراستار گرامی که باعث
ارتقای مقاله شدند، کمال تشکر و قدردانی را دارند.
مراجع
ذبیحی مقدم، ر. (١٣٩٢ ،(تغییرات ناگهانی فصلی در سری های زمانی با استفاده از فضای حالت،
پایان نامه کارشناسی ارشد دانشگاه شهید چمران اهواز.
Box, G. E. P. and Tiao, G. C. (1975), Intervention Analysis with Applications to Environmental and Economic Problems, Journal of the
American Statistical Association, 70, pp 70-79.
Chow, S. M. , Hamaker, E. L. and Allaire, C. J. (2009), Using Innovative
Outlier to Detect Discrete Shift in Dynamiks in Group-Based State
Space Models. Multivariate Behavioral Research, 44, 465-496.
De Jong, P. (1988a), A Cross-Validation Filter for Time Series Models,
Biometrika, 75, 594-600.
De Jong, P. and J. R. Penzer (1998), Diagnosing Shocks in Time Series.
Journal of the American Statistical Association, 93, 796-806.
Fox, A. J. (1972), Outliers in Time Series, Journal of the Royal Statistical
Society, Series. B,34, pp 350-363.
Harvey, A. C. and Durbin, J. (1986), The Effects of Seat Belt Legislation
on British Road Casualties: A Case Study in Structural Time Aeries
Modelling. Journal of the Royal Statistical Society, Series A 149, 187-
۲۲۷٫
Harvey, A. C. and Koopman, S. J. (1992), Diagnostic Checking of Unobserved Component Time Series Models. Journal of Business and Economic Statistics 10, 377-389.
Harvey, A. C., S. J. Koopman, and J. Penzer (1998), Messy Time Series:
a Unified Approach. Advances in Econometrics 13, 103-144.
Harvey, A. C. and Todd, P. (1983), Forecasting Economic Time Series
with Structural and Box-Jenkins model: a Case Study with Comments,
Journal of Business and Economic Statistics, 1, 229-315.
Kalman, R. E. (1960), A New Approach to Linear Filtering and Prediction
Problems, Trans. ASME, Journal of Basic Engineering, 83, 35-45.
رضا ذبیحی مقدم و همکاران . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ١۶٣
Kohn, R. and C. F. Ansley (1989), A Fast Algorithm for Signal Extraction,
Influence and Cross-Validation in State Space Models. Biometrika 76,
۶۵–۷۹٫
Penzer, J. R. (2006), “Diagnosing Seasonal Shifts in Time Series Using
State Space Models”. Statistical Methodology 3,193-200
Shumway R. H. and Stoffer D. S. (2011), Time Series Analysis and Application, 3rd ed, Springer, New York.
Tsay, R.S. (1986), Time Series Model Specification in the Presence of Outliers, Journal of the American Statistical Association, 81, 132-141.
Tsay, R. S. (1988), Outliers, Level Shifts and Variances Changes in Time
Series, Journal of Forecasting 7, 1-20.
West, M. and P. J. Harrison (1997), Bayesian Forecasting and Dynamic
Models, 2nd edt., New York: Springer Verlag.
Willsky, A. S. and H. L. Jones (1976), A Generalized Likelihood Ratio
Approach to the Detection and Estimation of Jumps in Linear Systems.
IEEE Transactions on Automatic Control 21, 108–۱۱۲٫

(Visited 2 times, 1 visits today)

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

*

code