P = رابطه مثبت با تقاضای بیمه عمر، N = رابطه منفی، I = رابطه معنی دار نبوده است.
D= نتیجه متفاوت به دلیل پردازش داده و یا روش رگرسیونی مورد استفاده.
* نرخ افراد زیر پوشش که شامل اعضای خانواده و فرزندان هم میشود.
** اگر ضرایب در برخی از مدل ها معنی دار نبود و در بعضی دیگر مثبت نبود، P ثبت شده است. این امر درباره ی N هم صادق می باشد(مهدوی و ماجد، ۱۳۹۰).
فراغت شبکههای عصبی مصنوعی از مفروضات آماری موجب شده است تا برخی از پژوهشگران حوزه اقتصاد آن را همانند یک جعبه سیاه تلقی کنند که اطلاعات قابل توجهی درباره کم و کیف انفعالات درونی آن و رابطه بین ورودی و خروجی سیستم را بدست نیاورند و در این مدل ها مانند معادلات رگرسیونی تو ان بررسی کشش و ضرایب اهمیت هر متغیر در مدل را نداشته باشند . در این راستا ،کان و وایت برای محل این مساله سعی کردند که رابطه ای میان تئوری های آماری و اقتصاد سنجی با شبکههای عصبی بیابند (Kuan، ۱۹۹۴).
مشیری و نورمن نیز به این نتیجه رسیدند که بدون استفاده از تئورهای اقتصادی نمیتوان نتایج خوبی در پیشبینی بدست آورد. الگوهای شبکههای عصبی مصنوعی را میتوان در قالب الگوهای غیر تئوریک جای داد ولی میتوان متغیرهای ورودی را براساس پایههای تئوریک تعیین کرد(Moshiri & Norman، ۲۰۰۰).
پور کاظمی و اسدی در مقاله خود به منظور پیشبینی پویای قیمت نفت خام از دو روش غیر خطی شبکه عصبی و روش اقتصادسنجی سریهای زمانی استفاده کردند. در این مقاله ابتدا با یک شبکه عصبی تک متغیره ،بدون وارد کردن متغیرهای دیگر و تنها با بهره گرفتن از وقفه های خود قیمت، پیشبینی انجام شد و سپس متغیر توضیحی دیگری به مدلها اضافه کردند . نتایج تحقیق حاکی از عملکرد بهتر شبکه عصبی با دو متغیر ورودی بود که محققان دلیل آن را رفتار غیرخطی قیمت نفت عنوان کردند(اسدی و پورکاظمی ، ۱۳۸۸).
مشیری و قدیمی برای پیشبینی نرخ رشد اقتصادی ایران از دو مدل رگرسیون خطی و شبکه عصبی مصنوعی پرسپترون سه لایه با تابع فعال سازی لجستیک در لایه مخفی استفاده کردند. برای این منظور ابتدا با مطالعات تئوریک، رگرسورها را شناسایی کرده و یک مدل رگرسیون خطی برازش کردند و در ادامه همان رگرسورها به عنوان ورودی شبکه عصبی استفاده شدند. نتایج شبیه سازی ها حاکی از برتری مدل شبکه عصبی در معیارهای RMSE و MAE [۱۲] و MAPE [۱۳] و [۱۴]TIC و CR [۱۵] بود(قدیمی و مشیری ، ۱۳۸۱).
ابریشمی و همکاران با کاربست شبکههای عصبی [۱۶]GMDH ،[۱۷] MLFF (به عنوان مدلهای غیر خطی) به پیشبینی GDP با لحاظ وقفههای نفت و GDP و همچنین با لحاظ وقفههای GDP به تنهایی، پرداختند و نتایج را با ARIMA (به عنوان مدل غیر خطی) مقایسه کردند. نتایج مطالعه آنها نشان داد که شبکه عصبی GMDH هم از نظر وقفه های GDP به تنهایی و هم از نظری وقفه های GDP و نفت نسبت به سایر مدلها در مورد هر دو کشور آمریکا و انگلستان عملکرد بهتری داشت(ابریشمی و غنیمیفرد و احراری & رحیمی، ۱۳۸۹).
رضایی پور و همکاران در مقاله خود تحت عنوان مقایسه عملکرد مدلهای خطی و غیرخطی در توضیح سیستم تقاضای تقریبا ایدهآل به منظور بررسی عملکرد سیستم معادلات تقریبا ایدهآل خطی و غیر خطی از تکنیک های رگرسیون و شبکه عصبی استفاده کردند. ایشان جهت تخمین معادله تقاضا از مبانی تئوریک مربوط به مدل AIDS استفاده کرده و متغیرهای توضیحی را تعیین کرده و با بهره گرفتن از اطلاعات موجود در پایگاه دادههای مرکز ملی آمار ایران و اطلاعات مربوط به شاخص های قیمت موجود در بانک مرکزی برای گروه های مختلف کالاها و خدمات در هشت گروه کلی، مدل خود را برازش کرده و با روش آزمون و خطا شبکه عصبی خود را انتخاب کردند و در معیارهای ارزیابی عملکرد RMSE و MAE برای دو مدل رقیب مشاهده کردند که شبکه عصبی نسبت به روش رگرسیون خطی عملکرد بهتری در برآورد مدل [۱۸] AIDS دارد(پور و ذوالفقاری و دیندارلو & نجارزاده، ۱۳۹۲).
اینس و ترافالیس برای پیشبینی نرخ ارز از یک مدل ترکیبی متشکل از روشهای اقتصاد سنجی و شبکه عصبی استفاده کردند. به این ترتیب که ابتدا با بهره گرفتن از روشهای اقتصادسنجی، خواص آماری داده ها و داده های مناسب برای پیشبینی را انتخاب کردند. بعد از انجام شبیه سازی توسط شبکههای عصبی SVR [۱۹]و MLP و مقایسه عملکرد آنها متوجه عملکرد بهتر شبکههای SVR شدند و از آن به عنوان شبکه منتخب استفاده کردند. در انتها با استفاده ازروشهای میانگین متحرک انباشته خودهمبسته و خودرگرسیون برداری برای پیشبینی نرخ ارز به این نتیجه رسیدند که شبکه عصبی منتخب مورد استفاده آنها قدرت پیشبینی بهتری نسبت به سایر روشها دارد(Ince & Trafalis، ۲۰۰۵).
فلاحی و همکاران به منظور پیشبینی درآمدهای مالیات بر مشاغل در ایران به بررسی عملکرد شبکههای عصبی و رگرسیون خطی و سری زمانی پرداختند. شبکه عصبی مورد استفاده آنها یک شبکه پیشخور سه لایه با روش آموزشی پس انتشار خطا بود که در نهایت با توجه به معیارهای RMSE و MAE به این نتیجه رسیدند که شبکه عصبی مصنوعی نسبت به سایر مدل ها و روشهای پیشبینی برتری دارد(فلاحی، خالوزاده و حمیدی علمداری، ۲۰۰۶).
مالیک و ناصرالدین، به پیشبینیGDP با بهره گرفتن از قیمتهای نفت پرداختند. آنها با مطالعه بر روی بازار نفت در آمریکا یافتند که قیمت ها در بازار نفت از یک روند غیرخطی تبعیت میکند. روشهای مورد استفاده آنها گام تصادفی، اتورگرسیو، رگرسیون خطی، شبکه عصبی آبشاری[۲۰] و یک شبکه عصبی پرسپترون پیشخور چند لایه بود. در نهایت با معیارهای MAE و MSE به این نتیجه رسیدند که شبکه عصبی آبشاری دارای عملکرد بهتری می باشد(Malik & Nasereddin، ۲۰۰۶).
مرزبان و همکارن به منظور پیشبینی نرخ ارز از روشهای ساختاری اقتصاد سنجی، سری زمانی و شبکههای عصبی استفاده کردند. نتایج حاصل از پژوهش آنها نشان داد که شبکههای عصبی نسبت به دو مدل دیگر برتری دارند و سری زمانی با توجه به مشخصه های خود از روش ساختاری عملکرد بهتری دارد(مرزبان، اکبریان و جواهری، ۱۳۸۴).
مشیری و براون در پژوهشی با بهره گرفتن از شبکههای عصبی MLP و GRNN [۲۱] به پیشبینی نرخ بیکاری در پنج کشور صنعتی پرداختند و با بهره گرفتن از معیار MSPE یا درصد میانگین مربعات خطا نتیجه گرفتند که شبکه عصبی GRNN دارای عملکرد بهتری می باشد( Moshiri & Brown، ۲۰۰۴).
شکیبایی و همکاران برای پیشبینی عرضه نفت خام در یازده کشور تولید کننده نفت از رگرسیون خطی و شبکههای عصبی استفاده کردند. در مقایسه بین نتایج پیشبینی در معیار RMSE در ده مورد شبکه عصبی دارای عملکرد بهتر و تنها در یک مورد رگرسیون خطی دارای خطای کمتری بود و در معیار MAE مدل شبکه عصبی برای هفت کشور دارای عملکرد بهتر و چهار کشور در مدل رگرسیون خطی دارای دارای عملکرد بهتری بودند(شکیبایى، پور و حسینى، ۱۳۸۸).
طلوعی اشلقی و حق دوست در مقاله خود با عنوان مدل سازی پیشبینی قیمت سهام با بهره گرفتن از شبکههای عصبی مصنوعی و مقایسه آن با روشهای پیشبینی ریاضی، با بهره گرفتن از دو الگوی رگرسیونی و شبکه عصبی به پیشبینی قیمت سهام ایران خودرو پرداختند. در این مطالعه در تحلیل قیمت سهام ایران خودرو در الگوی رگرسیونی از متغیرهای قیمت بسته شدن سهم، میانگین قیمت، تعداد خرید و فروش، تعداد سهام معامله شده، پایینترین قیمت سهم، بالاترین قیمت سهم، تعداد افرادی که در یک روز سهم را خرید و فروش کردهاند، تعداد دفعات خرید و فروش یک سهم، قیمت قبلی سهم و ارزش معاملات در بازار استفاده شد. دادههای این تحقیق دادههای روزانه برای دوره ۸۲-۱۳۸۰ میباشد. در این تحقیق از یک شبکه عصبی پیشخور با سه لایه پنهان استفاده شد که در هر لایه به ترتیب ۶، ۴ و ۴ نرون استفاده گردید. یافتههای این پژوهش حاکی از این است که خطای پیشبینی در شبکه الگوی شبکه عصبی بالاتر از الگوی رگرسیونی میباشد (اشلقی&دوست، ۱۳۸۶).
مهدوی و بهمنش در کار پژوهشی خود تحت عنوان طراحی مدل پیشبینی قیمت سهام شرکتهای سرمایهگذاری با بهره گرفتن از شبکههای عصبی مصنوعی (تحقیق موردی: شرکت سرمایهگذاری البرز)، که متغیرهای ورودی شامل داراییها، درآمد ناشی از فروش سهام، درآمد ناشی از سرمایهگذاری، ارزش بازاری هرسهم و سود هر سهم بودند. دادههای مورد استفاده در این پژوهش عبارتند از دادههای ماهانه برای مدت ۳ سال (مهدوی و بهمنش، ۱۳۸۴).
حیدری زارع و کردلویی در پژوهش خود تحت عنوان پیشبینی قیمت سهام با بهره گرفتن از شبکه عصبی مصنوعی متغیرهای ورودی شبکه عبارتند از: قیمت سهام شرکت غدیر، نرخهای ارز و دلار و یورو و قیمت طلا و قیمت نفت. دادههای مورد استفاده در این شبکه به صورت روزانه و مربوط به سالهای ۸۴-۱۳۸۱ بود. نتیجهای که از این تحقیق گرفته شد بسیار قابلتوجه بود و در مطالعهی حاضر هم مورد آزمون قرار گرفت به این صورت که ابتدا دادهها به صورت غیر تصادفی و بر اساس یک الگوریتم ترتیبی به شبکه وارد شدند. در نوبت بعد داده ها به صورت تصادفی به مدل وارد شده و با همان تعداد مشاهده برای آموزش و اعتبار سنجی و آزمایش. در این حالت خطای پیشبینی با همان معیار تا سطح زیادی کاهش یافت(زارع و کردلویی، ۱۳۸۹).
۲-۸ شبکه های عصبی
شبکه های عصبی مصنوعی تکنیکهایی هستند که با تقلید از سیستم عصبی بیولوژیکی انسان، سعی در حل نمودن مسائل مینمایند. این شبکه ها در بسیاری از زمینه ها نظیر تجارت، صنعت، علوم تجربی و … کاربرد دارند. این شبکه ها نخستین بار در سال ۱۹۴۳ توسط مککولا (عصبشناس) و پیت (ریاضیدان) بوجود آمد. از آنجایی که مفاهیم پایهای مطرح شده در مباحث مربوط به آن از اساس ریاضی مستحکم و قابل اعتمادی برخوردار بود، بعدها بطور گستردهای مورد اقبال عمومی محققان در مدلسازی تجربی فرآیندهای غیرخطی قرار گرفت. شبکه های عصبی مصنوعی، اگرچه با سیستم عصبی طبیعی قابل مقایسه نیستند، اما وجود ویژگیهای مهمی مانند: قابلیت یادگیری، قابلیت تعمیم، قابلیت پردازش موازی و قابلیت ترمیم خطاها و …، این شبکه ها را در مواردی که نیاز به یک نگاشت خطی و یا غیرخطی باشد، متمایز میسازد (منجمعی و همکاران، ۱۳۸۸).بطور کلی سیستم عصبی انسانها از یک سری عناصر پردازش سادهای با نام نرون تشکیل شدهاست که مجموعه ای از این نرونها عصب را تشکیل می دهند. شیوه کار نرونها جهت پردازش اطلاعات بدینصورت است که هر کدام از این نرونها یک سیگنال اولیه که حاوی اطلاعات مهمی از یک نرون دیگر و یا محرک خارجی میباشد را دریافت نموده و آن را به کمک توابع فعالسازی یا تبدیل، پردازش مینماید. این ویژگی شبکه های عصبی (پردازش اطلاعات)، آن را به عنوان یک روش محاسباتی قدرتمند جهت یادگیری مثالها و تعمیم این یادگیری به مثالهایی که تا کنون مشاهده نشده است، تبدیل مینماید(رضایی، ۱۳۸۷ ).
۲-۸-۱ پرسپترون
پرسپترون سادهترین شکل از شبکههای عصبی است که برای طبقه بندی الگوهایی که با عنوان تفکیک پذیر خطی شناخته میشوند مورد استفاده قرار میگیرد. در واقع این مدل از یک نورون منفرد با وزنهای سیناپسی و یک بایاس[۲۲] تشکیل میگردد. برای اولین بار روزنبلات (۱۹۶۲ و ۱۹۵۸) یک الگوریتم را که پارامترهای آزاد این شبکه نورونی را تنظیم میکند به صورت یک فرایند یادگیری برای یک مدل پرسپترون مغز ارائه نمود. روزنبلات اثبات کرد که اگر الگوها (بردارها) ای که برای یادگیری پرسپترون مورد استفاده قرار میگیرند از دو دسته تفکیک پذیر خطی انتخاب شوند، الگوریتم پرسپترون همگرا میگردد و سطوح تصمیم گیری را در نقاطی قرار میدهد که یک ابر صفحه[۲۳] بین دو صفحه تشکیل دهند. اثبات همگرایی الگوریتم با عنوان قضیه همگرایی پرسپترون شناخته میشود. پرسپترونی که بر مبنای یک نورون منفرد ساخته میشود به الگوهای طبقه بندی با تنها دو طبقه (فرضیه) محدود میگردد.میتوان با بسط دادن لایه خروجی (محاسباتی) پرسپترون به نحوی که شامل تعداد بیشتری نورون باشد، تعداد کلاسهای بیشتری را طبقهبندی نمود. در هر حال طبقهها باید تفکیک پذیر خطی باشند تا شبکه پرسپترون بتواند به صورت صحیح عمل کند.نکته مهم آن است که تا انتهای این بخش که تئوری اساسی پرسپترون به عنوان یک طبقه بندی کننده الگو مورد توجه قرار می گیرد نیاز به آن داریم که حالت نورون منفرد را برای آن در نظر بگیریم. بسط این تئوری برای حالتهای شامل بیش از یک نورون در بخش های بعدی عنوان خواهد گردید. نورون منفرد اساس فیلتر تطبیقی[۲۴] را نیز تشکیل میدهد که یک بخش عملیاتی اساسی در زمینه گسترده پردازش سیگنال[۲۵] میباشد. پیشرفتهای حاصل شده در زمینه فیلترهای تطبیقی تا حدود زیادی به مقاله کلاسیک ویدرو[۲۶] و هوف[۲۷] (۱۹۶۰) وابسته است که پیشگام به کارگیری الگوریتم حداقل متوسط مربعات[۲۸] (LMS) (که به عنوان قانون دلتا[۲۹] نیز شناخته میشود) میباشد. الگوریتم LMS به سادگی قابل به کارگیری میباشد و در عین حال در اغلب کاربردها بسیار مؤثر و کارساز است. در واقع این روش قلب تپنده فیلتر تطبیقی خطی میباشد. از فیلترهای تطبیقی در زمینههای متنوعی نظیر آنتنها، سیستمهای مخابراتی، سیستمهای کنترلی، رادار، سونار، زمین شناسی و مهندسی پزشکی (ویدرو و استیرنز(۱۹۸۵) و هیکین (۱۹۹۶) استفاده میشود.الگوریتم LMS و پرسپترون دارای طبیعتی وابسته به یکدیگر میباشند. به همین دلیل در این بخش به بررسی همزمان آنها میپردازیم.
۲-۸-۲ مسأله فیلتر تطبیقی
یک سیستم دینامیک را در نظر بگیرید که مشخصات ریاضی آن ناشناخته باشد. تنها اطلاعاتی که راجع به این سیستم مشخص میباشد مجموعهای از دادههای ورودی-خروجی برچسب گذاری شده میباشد که توسط یک سیستم گسسته در زمانهای مشخص با نرخ ثابت تولید شدهاند. به بیان دقیقتر هنگامی که یک تحریک m بعدی با نام x(i) از طریق m نود ورودی سیستم به آن وارد شود، سیستم با تولید کردن یک خروجی اسکالر d(i) به آن پاسخ میدهد که i=1،۲،…،n،… میباشد (شکل ۱-۲). بنابراین رفتار بیرونی سیستم توسط مجموعه دادگان زیر توصیف می شود:
(۲-۱)
که در آن است. نمونههایی که مجموعهT را بوجود میآورند بر مبنای یک قانون احتمالی نامعین به صورت یکنواخت گسترده شدهاند. بعد m که اندازه بردار ورودی x(i) را نشان میدهد با نام ابعاد فضای ورودی یا به بیان سادهتر ابعاد شناخته میشود.
خروجی
ورودیها
d(i)
سیستم دینامیک ناشناخته
تصویر۱-۲ سیستم دینامیک ناشناخته
تحریک x(i) میتواند ناشی دو مسیر کاملاً متفاوت مکانی یا زمانی باشد:
-
- m المان x(i) نقاط مجزایی از فضا تولید میگردند. در این حالت x(i) را به عنوان یک ثبت لحظهای از دادهها در نظر میگیریم.
-
- m المان x(i) نمایانگر مجموعهای از مقادیر زمان حال حاضر و (m-1) مقدار گذشته یک تحریک میباشند که به صورت یکنواخت زمانی توزیع گردیدهاند.
مسئلهای که در اینجا طرح میشود این است که چگونه یک مدل چند ورودی – تک خروجی از سیستم دینامیک نامعلوم مورد نظر را بر مبنای یک نورون منفرد خطی ایجاد کنیم. مدل نورونی تحت تأثیر یک الگوریتم که وزنهای سیناپسی نورون را کنترل میکند عمل می کند به نحوی که نکات زیر در آن در نظر گرفته شده باشد:
-
- الگوریتم از یک مقدار دلخواه اولیه مجموعه وزنهای سیناپسی آغاز به کار میکند.
-
- تنظیمهایی که بر روی وزنهای سیناپسی انجام میشود بر مبنای تغییرات آماری رفتار سیستم وبه یک روش پیوسته صورت میپذیرد (یعنی زمان در الگوریتم فوق در نظر گرفته میشود).
(۲-۲)
که در آن عبارتند از m وزن سیناپسی نورون که در زمان i اندازهگیری شدهاند. می توان y(i) را به شکل ماتریسی به صورت حاصلضرب داخلی بردارهای x(i) و w(i) به صورت زیر بیان نمود:
(۲-۳)
که در آن