سرمایه گذاری در سهام مملو از خطرات طولانی است که مدیریت و پیش بینی انتخاب های موجود در آنجا را برای سرمایه گذار دشوار می کند. شبکه عصبی مصنوعی (ANN) روشی محبوب است که همچنین تجزیه و تحلیل فنی برای پیش بینی در بازارهای مالی را شامل می شود. هدف از این کار یک مطالعه کاربردی است که با استفاده از توضیحات بر اساس آزمایش به عنوان روش انجام می شود. بحث در مورد روشهای تحلیلی-محاسباتی ایجاد شده است. در این تحقیق از اسناد و آمار بورس اوراق بهادار تهران برای به دست آوردن متغیرهای مورد نظر استفاده می شود. از آمار توصیفی و آمار استنباطی و همچنین شبکه های عصبی چند لایه Perceptron برای تجزیه و تحلیل داده های این تحقیق استفاده می شود. نتایج این تحقیق تأیید صحت پیش بینی بالای شاخص بورس اوراق بهادار تهران در مقایسه با سایر روشهای تخمین توسط مدل ارائه شده ، که توانایی پیش بینی شاخص کل با خطای کمتر از 1. 7 ٪ را دارد.
کلید واژه ها
- شاخص کل سهام
- پیش بینی
- شبکه های عصبی مصنوعی
- بورس سهام تهران
20. 1001. 1. 23222301. 2022. 8. 4. 5. 3
متن کامل
چکیده:
سرمایه گذاری در سهام مملو از خطرات طولانی است که مدیریت و پیش بینی انتخاب های موجود در آنجا را برای سرمایه گذار دشوار می کند. شبکه عصبی مصنوعی (ANN) روشی محبوب است که همچنین تجزیه و تحلیل فنی برای پیش بینی در بازارهای مالی را شامل می شود. هدف از این کار یک مطالعه کاربردی است که با استفاده از توضیحات بر اساس آزمایش به عنوان روش انجام می شود. بحث در مورد روشهای تحلیلی-محاسباتی ایجاد شده است. در این تحقیق از اسناد و آمار بورس اوراق بهادار تهران برای به دست آوردن متغیرهای مورد نظر استفاده می شود. از آمار توصیفی و آمار استنباطی و همچنین شبکه های عصبی چند لایه Perceptron برای تجزیه و تحلیل داده های این تحقیق استفاده می شود. نتایج این تحقیق تأیید صحت پیش بینی بالای شاخص بورس اوراق بهادار تهران در مقایسه با سایر روشهای تخمین توسط مدل ارائه شده ، که توانایی پیش بینی شاخص کل با خطای کمتر از 1. 7 ٪ را دارد.
کلمات کلیدی: شاخص کل سهام ؛پیش بینی؛شبکه های عصبی مصنوعی ؛بورس اوراق بهادار تهران.
معرفی
سری های زمانی غیرخطی توسط معادلات دینامیکی غیرخطی تولید می شوند. آنها ویژگیهایی را نشان میدهند که نمیتوان با فرآیندهای خطی مدلسازی کرد: واریانس تغییر زمان، چرخههای نامتقارن، ساختارهای لحظهای بالاتر، آستانهها و شکستها (بهشتی و همکاران، 2022). یکی از بهترین مثالها برای سریهای زمانی غیرخطی، شاخص قیمت سهام است، بازار سهام وسیلهای برای خرید و فروش سهام و اوراق بهادار است. ستون فقرات هر اقتصادی است. اگرچه برخی معتقدند بازار سهام کاملا تصادفی است. پیش بینی قیمت سهام در بازار سهام یکی از مهمترین مسائل در حوزه مالی است. به بسیاری از محققان ایده داده شده است که چگونه قیمت بازار را پیشبینی کنند تا با استفاده از تکنیکهای مختلف، مانند تحلیل تکنیکال، تحلیل آماری، با روشهای مختلف سود کسب کنند. بسیاری از محققان در پیش بینی قیمت سهام تا حد زیادی موفق بوده اند (لوپز و همکاران، 2017). این به شرکت ها کمک می کند تا سرمایه ای را که جهان را قدرتمند می کند، افزایش دهند. بیش از 75 درصد از معاملات سهام در بورس های ایالات متحده و سایر کشورها توسط سیستم های معاملاتی خودکار انجام می شود. و اکنون در سال 2022، این تعداد حتی بیشتر شده است. سیستمهای پیشبینی سهام میتوانند به سرمایهگذاران در شناسایی سهام مناسب برای سرمایهگذاری کمک کنند. دلایلی که چرا پیشبینی سهام دشوار است عبارتند از، (1) حرکت قیمت سهام بسیار پر سر و صدا است، بنابراین ممکن است الگوریتم یادگیری ماشین بیش از حد مناسب باشد، (2) برخی غیرمستندرویداد همچنین ممکن است باعث تغییر ناگهانی قیمت سهام و (3) اطمینان در پیش بینی شود (خجسته و همکاران، 2019). امروزه از شبکه های عصبی مصنوعی (ANN) به منظور پیش بینی شاخص مبادله استفاده می شود. ANN یکی از تکنیک های داده کاوی است که توانایی یادگیری مغز انسان را دارد. الگوهای داده ممکن است به دلیل استفاده از داده های مالی پیچیده، پویا و غیرقابل پیش بینی باشند. شبکه های عصبی مصنوعی در طی دهه گذشته در پیش بینی بازار سهام مورد استفاده قرار گرفته اند. شبکههای عصبی مصنوعی از نظر ساختاری از دو بخش اصلی تشکیل شدهاند، ساختاری از لایههای پنهان شبکه و دو مجموعه داده ورودی، در این تحقیق تمرکز ما بر ساختار داخلی شبکه است و با توجه به اینکه عموماً در اکثر برآوردهای یک نوعاز شبکه عصبی مورد استفاده، در تلاش هستیم تا با ارائه مدلی بهینه، برآورد دقیق تری از حرکت شاخص بورس ارائه کنیم. انگیزه اصلی به کارگیری شبکه های عصبی در پیش بینی بازار سهام به شرح زیر است: (1) مدل سازی داده های سهام بسیار پیچیده و سخت است، بنابراین یک مدل غیر خطی سودمند است.
(2) مجموعه بزرگی از سری ورودی های متقابل اغلب برای توضیح یک سهام خاص ، که متناسب با شبکه عصبی است (Payar et al. ، 2021) لازم است. در این تحقیق ، ما قصد داریم با ایجاد یک ساختار جدید از لایه های مختلف محاسباتی برای یک شبکه عصبی مصنوعی ، یک مدل بهینه برای پیش بینی روند قیمت سهام ارائه دهیم و تمرکز می کنیم که شبکه های ادراک چند لایه (MLP) شبکه های تغذیه ای به جلو به طور معمول با پشت آموزش دیده اندتکثیر
مبنای نظری
1) پیش بینی
یکی از ابزارهای مهم مدیریت استفاده از روشهای مختلف پیش بینی است. برای تصمیم گیری ، مدیران باید با استفاده از اطلاعات گذشته ، رویدادهای آینده را تخمین بزنند. در پیش بینی ادبیات به عنوان محاسبه و حدس زدن شرایط و موقعیت های آینده تعریف شده است. شخصی که با این محاسبات روبرو است ، اغلب به آمار و اطلاعات فعلی متکی است و برای پیش بینی آینده به دید شخصی متکی است. پیش بینی آنچه را که ممکن است در آینده اتفاق بیفتد روشن می کند. بیشتر پیش بینی ها مبتنی بر تجربه یا دانش است. هیچ تضمینی وجود ندارد که پیش بینی ها دقیق باشند ، اما پیش بینی برای برنامه ریزی بسیار مهم است. هوارد استیونسون در مورد پیش بینی در تجارت می نویسد: ". پیش بینی حداقل دو ویژگی دارد: مهم و دشوار." (Ayodele ، Aderemi ، 2014)
2) شبکه عصبی مصنوعی
NN ها مدل های ساده ای از سیستم های عصبی واقعی هستند که در حل مشکلات مختلف در علم استفاده می شوند. دامنه کاربرد این شبکه ها بسیار گسترده است ، از جمله اما محدود به برنامه های طبقه بندی ، درون یابی ، تخمین ، تشخیص نیست. شاید مهمترین مزیت این شبکه ها با وجود استفاده آسان ، تطبیق پذیری آنها باشد (مارسل ، کریستجانپولر ، 2020).
NN مصنوعی یک سیستم پردازش داده است که مبتنی بر عملکرد مغز انسان است و داده ها را با بسیاری از پردازنده های کوچک که در شبکه های بهم پیوسته و موازی کار می کنند ، برای حل یک مشکل پردازش می کند. در این شبکه ها ، با کمک برنامه نویسی ، یک ساختار داده طراحی شده است که می تواند به عنوان یک نورون عمل کند. از این رو ، این ساختار داده نورون نامیده می شود. آنها پس از ایجاد شبکه بین این نورونها و استفاده از الگوریتم آموزشی برای آنها ، شبکه را آموزش می دهند (Raymundo ، Cuevas ، 2008).
3) کار با شبکه های عصبی مصنوعی
کار با هر NN مصنوعی از سه مرحله تشکیل شده است: آموزش ، تعمیم و اجرای. در مرحله آموزش ، شبکه الگوهای موجود در مجموعه داده های ورودی را می آموزد. هر NN از یک قانون خاص استفاده می کند. تعمیم توانایی شبکه عصبی در ایجاد پاسخ های قابل قبول به ورودی هایی است که اعضای مجموعه آموزش نیستند. در مرحله اجرای ، از NN برای عملکرد خاصی که برای آن طراحی شده است استفاده می شود (جون ژنگ ، 2010).
4) شبکه عصبی Perceptron
این NN بر روی یک واحد محاسباتی به نام Perceptron ساخته شده است. Perceptron یک بردار ورودی با شماره های واقعی می گیرد و ترکیبی خطی از داده های ورودی را محاسبه می کند. اگر نتیجه از مقدار آستانه 16 بیشتر باشد ، خروجی Perceptron برابر با 1 خواهد بود ، در غیر این صورت برابر ب ا-1 خواهد بود. Perceptron NNS ، به ویژه Perceptron چند لایه ، از کاربردی ترین NN ها هستند و با انتخاب تعداد مناسب لایه ها و نورون ها قادر به اجرای نقشه برداری غیرخطی با هرگونه دقت مشخص هستند (Ayodele ، Aderemi ، 2014).
بررسی ادبیات
Atsalikis و Valavanis (2009) با استفاده از روش های محاسبات نرم ، تحقیقات را در زمینه مالی جمع آوری و طبقه بندی کردند. این بررسی نشان می دهد که موضوع اصلی تحقیقات تجربی پیش بینی بازگشت شاخص بورس سهام در کشورهای مختلف است و بیشتر روشهای مورد استفاده در آنها تکنیک های محاسباتی نرم بوده است. این مطالعات را می توان به سه گروه طبقه بندی کرد. کلاس اول شامل تحقیقاتی است که از داده های کشورهای توسعه یافته مانند اروپا ، آمریکا و غیره استفاده می کند. کلاس دوم تحقیقاتی است که بر پیش بینی شاخص بازارهای نوظهور مانند یونان ، استانبول و غیره متمرکز است. دسته سوم تحقیقاتی است که متمرکز نیستدر یک بازار سهام خاص ، اما سهام مستقل یا اوراق بهادار را هدف قرار می دهد. بر این اساس ، بررسی تحقیق در زیر ارائه شده است. جدول 1 برخی از مهمترین تحقیقات در مورد شاخص بازار سهام را نشان می دهد.
جدول 1. کار مرتبط
تبادل
نویسندگان
تکنیک
عواقب
بورس سهام استانبول
یوملو ، گورگن و اوکای (2004 ، 2005)
پیش بینی تغییرات و مقایسه روشها
مدل ایگارچ عملکرد بهتری نسبت به MLP و RNN دارد.
بورس اوراق بهادار اندونزی
Situngkir and Surya (2005)
پیش بینی قیمت سهام
دستیابی به پیش بینی های دقیق تر
بورس اوراق بهادار آتن
Atsalikis و Valavanis (2006)
مشخصات بهتر مدل پیش بینی
بهترین عملکرد پیشنهادی Nero Fuzzes
بورس سهام تهران
بورس سهام تهران
جعفری و ایزدی (1390)
بررسی ویژگی های مقیاس فهرست
کل بورس سهام تهران
قیمت در بورس اوراق بهادار تهران
آنها همبستگی و حافظه دارند.
محمد و تاباسی (1391)
بررسی تغییرات ناهموار بورس
مدل CUSP در مقایسه با مدل جایگزین
توضیحی تر است.
عباسی و نادر (1391)
پیش بینی عملکرد شاخص قیمت و
برتری مدل های مبتنی بر MFNN و ANFIS
داده ها با استفاده از تجزیه و تحلیل موجک تجزیه و تحلیل شده است
در برابر استقرار سطح داده ها
بررسی رابطه بین نرخ تورم و شاخص
عملکرد بازار سهام
وجود رابطه نامتقارن بین متغیرها
بورس اوراق بهادار ترکیه
Celik and Ergin (2014)
یافتن بهترین مدل پیش بینی نوسانات
برتری مدلهای پیش بینی بر اساس
فرکانس بالا در مقایسه با مدل های GARCH
و Midas و Har-RV-CJ
بورس اوراق بهادار تورنتو
اولسون و ماسمان (2003)
مقایسه روشهای پیش بینی
برتری شبکه عصبی مصنوعی
بورس اوراق بهادار توکیو
هوانگ و ناکاموری (2005)
بررسی پیش بینی جهت حرکت
برتری مدل های SVM و ترکیبی
بورس اوراق بهادار قبرس
قسطنطنیو و کازندجیان
تجزیه و تحلیل پیش بینی بورس قبرس
رد فرض خطی
بورس اوراق بهادار نیویورک
ملینا و سوتو (2012)
به حداقل رساندن خطای پیش بینی ANFI
دستیابی به مدل ANFIS با خطای کمتر
در مقایسه با مدل های شبکه عصبی مصنوعی
حافظه کوتاه مدت کوتاه ترکیبی
پیش بینی قیمت سهام
مدل پیش بینی سهام ترکیبی توسط
حافظه کوتاه مدت کوتاه ترکیبی
پیش بینی قیمت سهام
مدل ترکیبی برای پیش بینی قیمت سهام
حافظه کوتاه مدت کوتاه ترکیبی
پیش بینی قیمت سهام
تعداد و نوع متغیرهای مورد استفاده در تحقیقات فوق متفاوت بوده است. متداولترین متغیرهایی که برای ورودی مدلهای پیشبینی در این مطالعات استفاده شدهاند عبارتند از: مقدار باز، مقدار بسته، حداقل مقدار و دادههای تاریخی. این متغیرهای ساده معمولاً منجر به روشهای محاسباتی نرم با زمان نسبتاً کم و هزینه محاسبه میشوند. پیشبینیهای درست را دریافت کنید. با وجود این، در بررسی هایی که شاخص های بورس یک کشور متغیر هدف بوده اند، به متغیرهای کلان مانند قیمت دلار، قیمت یورو و قیمت طلا نیز توجه شده است. به طور کلی تکنیک های پیش بینی در این تحقیقات بر روی روش های شبکه های عصبی مصنوعی متمرکز شده است. معیارهای مورد استفاده در تحقیقات تجربی برای ارزیابی عملکرد مدلهای پیشبینی به دو دسته زیر طبقهبندی میشوند: (1) معیارهای آماری (2) معیارهای غیرآماری. معیارهای آماری عبارتند از ریشه میانگین مربعات خطا، RMSE و میانگین مربع خطا MSE، مقدار میانگین خطای مطلق MAE است که معیار غیرآماری نرخ ضربه در اکثر تحقیقات است. معیار اصلی تصمیم گیری برای اندازه گیری جنبه اقتصادی نتایج مدل های پیش بینی است. همچنین در اکثر مطالعات مورد بررسی، تأثیر ساختار شبکه بر عملکرد مدل ها کمتر مورد بررسی قرار گرفته است. بنابراین به نظر می رسد با استفاده از روش های محاسباتی نرم، بتوان پیش بینی های قابل قبولی از شاخص بورس بازارهای مختلف از جمله بورس اوراق بهادار تهران ارائه داد.
مدل مفهومی تحقیق
1) مدل مفهومی شبکه عصبی مصنوعی
شکل 1. مدل مفهومی تحقیق برای NN مصنوعی.
شکل 2. استفاده از اطلاعات 30 سال پیش و تغذیه آن به شبکه برای پیش بینی.
روش
این پژوهش از نظر هدف، کاربردی و اکتشافی است و با توجه به ماهیت، اهداف، تعداد و نوع متغیرهای تحقیق حاضر، روش این تحقیق توصیفی و بر اساس پیمایش می باشد زیرا هدف محقق از انجام این تحقیقپیش بینی شاخص کل سهام بورس اوراق بهادار را شرح دهد. این تحقیق از نظر روش تحقیق، تحلیلی-ریاضی، از نظر آماری مدل سازی و از نظر روش گردآوری داده ها، یک تحقیق تجربی است که بر اساس تجزیه و تحلیل اطلاعات جمع آوری شده از جامعه آماری مورد نظر می باشد. برای پوشش بحث نظریه تحقیق، روش گردآوری دادهها در این تحقیق بر اساس کتابهای تخصصی و عمومی، مقالات و نشریات تخصصی بوده و دادههای مورد تجزیه و تحلیل از اسناد 30 سال گذشته (از 1990 تا 2020) در دسترس بهدست آمده است. در بانک مرکزی و مرکز آمار جمهوری اسلامی ایران. جامعه آماری و نمونه آماری این پژوهش، داده های آماری (سری های زمانی) مربوط به شاخص بورس اوراق بهادار بورس اوراق بهادار طی 30 سال اخیر (از سال 90 تا 2020) موجود در مرکز آمار و بانک مرکزی جمهوری اسلامی ایران می باشد. جمهوری ایران. از آمار توصیفی داده ها برای تجزیه و تحلیل داده ها و اطلاعات موجود در اسناد استفاده می شود. سپس یافته های تحقیق بر اساس تکنیک NN و هوش مصنوعی با توجه به مدل مفهومی ارائه شده برای پیش بینی ارائه می شود. سپس از آزمون دیکی فولر برای مقایسه نتایج خطی با نتایج غیرخطی NN و به دنبال آن آزمون فرضیه با استفاده از آزمون تی استودنت و همبستگی استفاده شده است. در این مقاله، آمار توصیفی و آمار استنباطی با استفاده از نرم افزارهای متلب و spss برای تجزیه و تحلیل داده ها انجام شده است.
پس از انقلاب سال پایه محاسبه شاخص کل سال 90 تعیین شد که در زمان رجایی سلماسی ایجاد شد و تا پایان آن سال در عدد 189 واحد بسته شد. در نهایت در دولت دوم آقای روحانی، شاخص بورس به رقم یک میلیون و 500 هزار واحد رسید و با افت شدید در سال 2020 به رقم یک میلیون و 265 هزار و 234 واحد در آذرماه 1399 (پایان دوره مطالعاتی پژوهشی) پس از نوسانات شدید رسید.
جدول 2. آمار توصیفی اطلاعات مربوط به شاخص کل TSE در 30 سال اخیر.
واحد
ارزش
متغیرها
شاخص کل سهام (دسامبر 2020)
نمودار 1. هیستوگرام شاخص کل TSE از سال 1990 تا 2020.
نمودار 2. پراکندگی شاخص کل بورس اوراق بهادار تهران از سال 90 تا 2020.
آمار توصیفی شاخص کل از سال 1990 تا 2020 (جدول 2) و نمودارهای پراکندگی و هیستوگرام (نمودارهای 1 و 2) نشان می دهد که شاخص کل در این مدت دارای نوسانات شدیدی بوده است زیرا انحراف معیار شاخص کل 454218 واحد بوده است. میانگین شاخص در این مدت برابر با 260158 واحد بوده است. همچنین فاصله زیاد بین حد پایین و بالای میانگین در 95 درصد مؤید این مورد است. نمودار پراکندگی (نمودار 2) معنیداری تغییرات (سطح معنیداری برابر 005/0 و کمتر از 5 درصد) را در طول سری زمانی نشان میدهد. در نهایت تغییرات ذکر شده نشان دهنده تلاطم های فراوان در اقتصاد کلان کشور طی سی سال گذشته است. در این تحقیق دو بخش مجزا وجود دارد که یکی مربوط به جامعه پیشبینی شاخص کلی مورد نظر و دیگری مربوط به تعیین الگوی پیشبینی شاخص کل در TSE است. بررسی آزمون کولموگروف-اسمیرنوف 23 بر روی دادههای شاخص کل واقعی از سال 1990 تا 2020 نشان میدهد که توزیع دادهها توزیع نرمال نیست زیرا سطح معنیداری برابر با 01/0 و کمتر از 05/0 است. به عبارت دیگر داده ها با توزیع نرمال تفاوت معنی داری دارند و این موضوع وجود پراکندگی بیش از حد شاخص کل در طول سری زمانی را مجدداً تأیید می کند.
نمودار 3. آزمون نرمال بودن شاخص کل واقعی TSE از سال 1990 تا 2020.
سوال پژوهشی
پیش بینی شاخص سهام TSE با استفاده از NN در چه سطحی است؟در این تحقیق از نتایج کمی مدلسازی NN مصنوعی با استفاده از متلب برای ایجاد NN پس از گزارش خطا و مدلسازی تغییرات شاخص کل استفاده شده است. با توجه به تعداد زیاد داده ها (11160 شاخص روزانه برای 16 سال)، پیش بینی شاخص TSE با استفاده از 6000 داده انجام شد که 80 درصد آن برای آموزش، 15 درصد برای ارزیابی و 5 درصد از داده ها برای آزمون مدل استفاده شد. معیار مورد استفاده برای تایید مدل ریشه میانگین مربعات خطا بر اساس داده های آزمون است. برای به دست آوردن بهترین مقادیر پارامترهای مدل، مراحل زیر اجرا شده است. ابتدا میزان یادگیری و تعداد جلسات آموزشی به ترتیب 3/0 و 8000 جلسه تعیین شد. سپس تأثیر مقادیر مختلف عناصر پردازش در لایه پنهان مورد تجزیه و تحلیل قرار گرفته است. بر اساس مقادیر عناصر پردازش مناسب بهدستآمده از مرحله اول، تأثیر نرخهای مختلف یادگیری بر نتایج مدل در مرحله دوم بررسی شده است. در مرحله سوم دو تست برای 1 و 2 لایه پنهان انجام شده است تا در مورد بهترین تعداد لایه های مخفی نتیجه گیری شود. در نهایت مدل انتخاب شده در مراحل فوق طی 8000 دوره آموزشی آموزش داده می شود تا احتمال گیرکردن فرآیند در حداقل نقاط محلی کاهش یابد. ابتدا مدل شبکه عصبی با نرخ یادگیری 0. 3 و تعداد دوره های آموزشی 8000 و شش مقدار عنصر پردازشی مختلف ایجاد شده است. نتایج در جدول 3 نشان داده شده است. با وارد کردن داده های متغیر اول، شبکه به طور تصادفی این داده ها را به سه گروه تقسیم می کند. اولین گروهی که برای آموزش استفاده می شود و از این رو گروه آموزشی نامیده می شود. شبکه با استفاده از اطلاعات این گروه آموزش می بیند و با آزمون و خطا خود را بهبود می بخشد، یعنی اگر خطایی رخ دهد به عقب برمی گردد (الگوریتم انتشار پس از خطا) و سپس به جلو (شبکه رو به جلو) حرکت می کند و این بار سعی می کنداز تکرار آن خطا اجتناب کنید. گروه دوم، گروه اعتبارسنجی است که در آن اطلاعات چند شرکت را به صورت تصادفی وارد شبکه می کنیم تا عملکرد شبکه طراحی شده را ارزیابی کنیم. گروه سوم گروه آزمایش نامیده می شود و برای آزمایش نتایج شبکه استفاده می شود.
جدول 3. تعداد آزمایش ها، عناصر پردازش و تعداد لایه های پنهان.
تعداد دوره های آموزشی: 8000، تعداد لایه های پنهان: 1
R 2
RMSE
MSE
داده ها
عناصر پردازش
آزمایش کنید
همانطور که در جدول 3 مشاهده می شود، حداقل ریشه میانگین مربعات خطا برابر با 311 است که با تعداد عناصر پردازش سه اتفاق می افتد. بنابراین در آزمایش سایر پارامترها باید از سه عنصر پردازشی استفاده شود. در مرحله دوم، با انجام شش آزمایش با میزان یادگیری متفاوت و سه عنصر آزمون، دقت مدل بررسی میشود.
جدول 4. مرحله دوم، تعداد آزمایش ها، عناصر پردازش و تعداد لایه های پنهان.
تعداد دوره های آموزشی: 8000، تعداد لایه های پنهان: 1
R 2
RMSE
MSE
داده ها
عناصر پردازش
آزمایش کنید
از جدول 4 می توان استنباط کرد که کمترین میانگین جذر خطا که 413 است با نرخ یادگیری 0. 0526 به دست آمده است. بنابراین در مرحله بعد از سه عنصر پردازشی، نرخ یادگیری 0. 05 و تعداد یک و دو لایه پنهان استفاده می شود. در این مرحله ابتدا مدل با سه عنصر پردازش، نرخ یادگیری 0. 05 و 8000 دور آموزشی تنظیم میشود.
جدول 5. مرحله سوم، تعداد آزمایش ها، عناصر پردازش و تعداد لایه های پنهان.
تعداد دوره های آموزشی: 8000، تعداد لایه های پنهان: 1
R 2
RMSE
MSE
داده ها
عناصر پردازش
آزمایش کنید
جدول 5 نشان می دهد که کمترین ریشه میانگین مربعات خطا که برابر با 413 است در مدل با یک لایه پنهان رخ می دهد. نتایج بررسی مدل NN با پارامترهای زیر در جدول 6 انجام شده است.
جدول 6. پارامترهای NN مصنوعی طراحی شده.
تعداد عناصر پردازش
تعداد لایه های پنهان
تعداد دوره های آموزشی
نمودار 4 و جدول 7 نتایج مدل NN پس از انتشار را با بهترین عملکرد به دست آمده با پارامترهای ذکر شده در جدول 6 خلاصه می کند.
نمودار 4. نمودار مقایسه ای شاخص کل واقعی و پیش بینی شده از سال 1990 تا 2020.
جدول 7. مقایسه شاخص کل واقعی و پیش بینی شده از سال 1990 تا 2020.
تعداد عناصر پردازش: 3، میزان یادگیری: 0. 05، تعداد لایه های پنهان: 1
ارزش پیش بینی شده برای دوره های بعدی (ماه)
تفاوت بین داده های واقعی و داده های پیش بینی شده توسط مدل طراحی شده
برای نشان دادن تفاوت بین داده های واقعی و داده های پیش بینی شده از آزمون های t زوجی و همبستگی استفاده می شود:
با توجه به اینکه سطح اهمیت بیش از 0. 05 (0. 109) است ، فرضیه H0 پذیرفته می شود ، به این معنی که بین مقادیر پیش بینی شده و مقادیر واقعی تفاوت معنی داری وجود ندارد. به عبارت دیگر ، مقادیر پیش بینی شده مطابق با مقادیر واقعی است که صحت آن در سوال یک تأیید شده است. همچنین ، با توجه به نتایج آزمون همبستگی پیرسون ، بین داده های واقعی و داده های پیش بینی شده همبستگی بالایی (992/0) وجود دارد ، و همچنین نشان می دهد که بین داده های واقعی و پیش بینی همبستگی معنی داری وجود دارد (سطح اهمیت 0. 000):
همبستگی های جفت شده
نمودار 5. تفاوت بین داده های واقعی و پیش بینی شده توسط مدل ارائه شده.
وابستگی شاخص TSE به یک فرآیند غیرخطی < SPAN> با توجه به اینکه سطح اهمیت بیش از 0. 05 (0. 109) است ، فرضیه H0 پذیرفته می شود ، به این معنی که بین مقادیر پیش بینی شده و مقادیر واقعی تفاوت معنی داری وجود ندارد. به عبارت دیگر ، مقادیر پیش بینی شده مطابق با مقادیر واقعی است که صحت آن در سوال یک تأیید شده است. همچنین ، با توجه به نتایج آزمون همبستگی پیرسون ، بین داده های واقعی و داده های پیش بینی شده همبستگی بالایی (992/0) وجود دارد ، و همچنین نشان می دهد که بین داده های واقعی و پیش بینی همبستگی معنی داری وجود دارد (سطح اهمیت 0. 000):
همبستگی های جفت شده
نمودار 5. تفاوت بین داده های واقعی و پیش بینی شده توسط مدل ارائه شده.
وابستگی شاخص TSE به یک فرآیند غیر خطی که سطح اهمیت بیش از 0. 05 (0. 109) است ، فرضیه H0 پذیرفته شده است ، به این معنی که بین مقادیر پیش بینی شده و مقادیر واقعی تفاوت معنی داری وجود ندارد. به عبارت دیگر ، مقادیر پیش بینی شده مطابق با مقادیر واقعی است که صحت آن در سوال یک تأیید شده است. همچنین ، با توجه به نتایج آزمون همبستگی پیرسون ، بین داده های واقعی و داده های پیش بینی شده همبستگی بالایی (992/0) وجود دارد ، و همچنین نشان می دهد که بین داده های واقعی و پیش بینی همبستگی معنی داری وجود دارد (سطح اهمیت 0. 000):
همبستگی های جفت شده
نمودار 5. تفاوت بین داده های واقعی و پیش بینی شده توسط مدل ارائه شده.
وابستگی شاخص TSE به یک فرآیند غیرخطی
از مدل NN مصنوعی می توان به عنوان یک آزمایش برای یافتن فرآیند غیرخطی پویا ، از جمله فرآیند هرج و مرج ، در داده ها استفاده کرد. مدل های NN مصنوعی مدل های غیر خطی انعطاف پذیر هستند که قادر به تخمین و پیش بینی سری زمانی پیچیده غیر خطی با دقت قابل قبول هستند. مدل های NN اغلب شامل سه لایه هستند. لایه های ورودی ، متوسط و خروجی. داده های ورودی مستقیم یا غیرمستقیم از طریق توابع انتقال در لایه میانی با لایه خروجی مرتبط هستند. اتصال مستقیم قسمت خطی و اتصال از طریق لایه میانی قسمت غیر خطی مدل را تعریف می کند. برخی از آزمایشات در ادبیات برای بررسی پیش بینی و غیرخطی بودن سری های زمانی ، که عبارتند از تست های تنظیم مجدد Kenen ، Tsai و Ramsey ، تست دو-طیف نیچه و تست دیکی فولر ارائه شده است. از آنجا که تست فولر دیکی دقیق تر است ، این آزمایش برای تشخیص خطی و غیر خطی داده ها انجام شده است. آزمایش دیکی فولر یکی از آزمایشات پرکاربرد برای بررسی ویژگی های ثابت در کار تجربی است. این روش براساس این فرض است که متغیرهای سری زمانی مورد استفاده ثابت هستند. اولین قدم برای تعیین اینکه آیا یک متغیر ثابت است ، مشاهده نمودار سری زمانی آن متغیر است. تشخیص وجود یک روند تصادفی در یک سری زمانی به سادگی از طریق تست ریشه واحد امکان پذیر است. نتیجه جدول 8 نشان می دهد که در سطح اهمیت 1 ٪ ، 5 ٪ و 10 ٪ با ارزش مطلق شماره آماری Dickey-Fuller برای رشد شاخص قیمت سهام TSE ، بیشتر از مقادیر مهم است وثابت استبنابراین ، فرضیه H0 بر اساس وجود یک ریشه واحد رد می شود. نتایج آزمایشات نشان می دهد که روند شاخص قیمت سهام در بازار TSE در دوره از 1990 تا 2020 محصول یک فرآیند خاص غیرخطی پویا است و می تواند در کوتاه مدت پیش بینی شود. پس از انجام آزمایشات و تأیید اینکه شاخص قیمت سهام تصادفی نیست و ساختار غیر خطی دارد و به دنبال آن توجیه حضور هرج و مرج در این سری (مقدار مطلق آمار آزمون بیشتر از مقادیر بحرانی است) ، NNاز مدل برای پیش بینی شاخص قیمت سهام در دوره های آینده استفاده می شود.
جدول 8. نتایج آزمایش ریشه واحد که به عدم خطی بودن سری زمانی شاخص بازار TSE گواهی می دهد
سطح اهمیت
ارزش بحرانی Mackinnon
آزمایش DFT آماری
پارامتر تحت مطالعه
شاخص قیمت سهام
ارزیابی مدل پیشنهادی
شکل 3 نشان می دهد که خروجی نرم افزار پس از وارد کردن آخرین متغیر به شبکه، نمونه آزمایشی 100% پیش بینی صحیح و 0% خطا در پیش بینی شاخص کل سهام و نمونه آموزشی نیز 100% پیش بینی صحیح و 0 را به دست می دهد.% خطانمونه اعتبارسنجی دارای 88. 9 درصد پیشبینی صحیح و 11. 1 درصد خطا است. نتیجه کلی پس از وارد کردن متغیر اول 0. 981% پیشبینی صحیح و 1. 7% خطا و ریشه میانگین مربعات خطای 489 در پیشبینی شاخص کل بورس اوراق بهادار میباشد. با توجه به نتایج خروجی های پرسپترون NN چند لایه در هر مرحله، می توان نتیجه گرفت که شبکه دارای حداکثر خطای 1. 7٪ در پیش بینی شاخص کل سهام TSE با استفاده از NN مصنوعی است که قدرت پیش بینی بالای مدل را برجسته می کند.. بنابراین، قدرت مدل ارائه شده ثابت می شود.
نمودار 6. تابع خطا.
شکل 3. خروجی نرم افزار مدل طراحی شده و عملکرد پیش بینی مربوطه.
جدول 9. رتبه بندی عملکرد پیش بینی.
قضاوت در مورد عملکرد پیش بینی
MAPE
تفاوت نتایج پیش بینی شده با داده های واقعی نشان می دهد که مدل ارائه شده قادر به پیش بینی شاخص کل بورس با 98. 1 درصد بوده و غیرخطی بودن شاخص قیمت بورس اوراق بهادار با محاسبات آماری تایید شده است. علاوه بر این، ارزیابی مدل با استفاده از توابع خطا به صورت شماتیک ارائه شد.
نتیجه
با تغییر ساختار لایههای شبکه عصبی مصنوعی و به حداقل رساندن مربعهای خطا، توانستیم مدلی بهینه ارائه کنیم تا تخمین دقیقتری از روند شاخص بورس تهران ارائه کنیم. نتایج بهدستآمده از آزمون کولموگروف-اسمیرنوف نشان میدهد که دادههای شاخص کل TSE از سال 1990 تا 2020 دارای توزیع نرمال نیستند زیرا سطح معنیداری برابر با 01/0 و کمتر از 05/0 است. به عبارت دیگر داده ها با توزیع نرمال تفاوت معناداری دارند و وجود پراکندگی بیش از حد در شاخص کل در طول سری زمانی را مجدداً تأیید می کند. در مرحله بعد با استفاده از 4800 داده آموزشی و 900 داده ارزیابی و با استفاده از تابع سیگموئید و تعداد سه عنصر پردازشی با نرخ یادگیری 05/0 و لایه پنهان با 8000 دوره آموزشی، نتایج حاصل از انتشار پس خطا مدل NN بدست آمده است. بهترین عملکرداین مدل منجر به حداقل ریشه میانگین مربعات خطای 413 محاسبه شده با پارامترهای فوق می شود. این نتایج با نتایج تحقیق پروخوف و ونچ (2000) که سیستمی را طراحی کردند که تغییرات کوتاه مدت قابل توجهی را در قیمت سهام برای تخمین فرصت های سود خوب پیش بینی می کند، مطابقت دارد. همچنین با نتایج تحقیق Ayodele Adebiyi (2014) که از روش ترکیبی با ترکیبی از متغیرهای تحلیل تکنیکال و بنیادی شاخصهای بازار سهام برای پیشبینی قیمتهای آتی سهام به منظور بهبود روشهای موجود استفاده کرده است، همخوانی دارد. در مرحله بعدی تحقیق با استفاده از آزمون t و آزمون همبستگی نشان داده شد که بین مقادیر پیشبینیشده و واقعی تفاوت معناداری وجود ندارد، بنابراین مقادیر پیشبینیشده با مقادیر واقعی همخوانی دارند.. همچنین با استفاده از آزمون دیکی فولر، نتایج آزمونها نشان داد که شاخص قیمت سهام بازار بورس اوراق بهادار بین سالهای 1990 تا 2020 محصول یک فرآیند غیرخطی پویا و در کوتاهمدت قابل پیشبینی است. پس از انجام آزمون ها و تایید غیرتصادفی بودن و ساختار غیرخطی شاخص قیمت سهام و وجود آشفتگی در این مجموعه با بزرگتر بودن قدر مطلق آماره آزمون از مقادیر بحرانی تایید شد.. به منظور پیش بینی شاخص قیمت سهام در آینده، از مدل NN استفاده شد. ارزیابی مدل پیشبینی با استفاده از نمودارهای تابع خطا بررسی شد و بر اساس نتایج توابع خطا،
نتیجه نهایی پس از ورود به متغیر اول نشان داد که 98. 1 ٪ از پیش بینی صحیح است و تنها 1. 7 ٪ خطای در پیش بینی شاخص کل سهام TSE وجود دارد. با توجه به نتایج خروجی های چند لایه Perceptron NN در هر مرحله ، می توان نتیجه گرفت که این شبکه در پیش بینی شاخص کل سهام TSE با استفاده از NN مصنوعی حداکثر خطای 1. 7 ٪ دارد ، که تأیید قدرت پیش بینی بالامدل.
پیشنهادات عملی
- محققان آینده برای ادامه این تحقیق در محیط فازی و مقایسه نتایج NN مصنوعی فازی با موارد غیر فازی توصیه می شود. علاوه بر این ، به منظور بررسی صحت نتایج این تحقیق ، می توان یک مطالعه مقایسه ای در مورد استفاده از الگوریتم ژنتیکی در مقایسه با NN مصنوعی انجام داد تا قضاوت دقیق تری در مورد بهترین روش پیش بینی شاخص کل سهام انجام دهد. با توجه به واریانس بالا و انحراف استاندارد از داده ها در طول 31 سال گذشته در شاخص کل بازار سرمایه و طبق نظریه هرج و مرج ، اگر داده ها از یک سیستم پویا غیرخطی هرج و مرج بدست آید ، می توان مدل سازی و پیش بینی دقیقرفتار آینده سیستم در کوتاه مدت از آنجا که رفتار نامنظم یک سیستم هرج و مرج نتیجه ای از غیرخطی بودن آن است. اگر ثابت شود که سیستم تولید داده هرج و مرج است ، ممکن است از مدل های پویا غیر خطی برای به دست آوردن پیش بینی های دقت بالا استفاده شود. انجام این تحقیق و مقایسه نتایج آن یکی از توصیه های محقق به سایر همکاران به عنوان یک مسیر آینده تحقیق برای پیش بینی دقیق شاخص بازار TSE است.
منابع
ayodele ariyo adebiyi ، aderemi oluyinka adewumi ، and Charles Korede Ayo ، "مقایسه مدل های شبکه های عصبی Arima و مصنوعی برای پیش بینی قیمت سهام" ، 2014 ، doi: 10. 1155/2014/614342
Apostolos ، Nicholas Refenes ، Achileas Zapranis ، Gavin Francis ، "مدل سازی عملکرد سهام با استفاده از شبکه های عصبی: یک مطالعه مقایسه ای با مدل های رگرسیون" ، 2014 ، doi: 10. 1016/0893-6080 (94) 90030-2
Atsalikis ، G. S. ، Valavanis ، K. P. (2009)."بررسی تکنیک های پیش بینی بازار سهام: روش های محاسبات نرم ، سیستم های متخصص با برنامه ها" ، ISS. 3 (جلد 36) ، قسمت 2 ، صص 5932-5941. doi: 10. 1016/j. eswa. 2008. 07. 006
Constantinou, E., Georgiades, R., Kazandjian A., Kouretas, G. (2006). سوئیچینگ رژیم و پیش بینی شبکه عصبی مصنوعی بازده روزانه بورس قبرس. مجله بین المللی مالی و اقتصاد». Iss. 4 (ج 11)، ص 371-383. DOI: 10. 1002/ijfe. 305
چلیک، اس.، ارگین، ح. (2014)."پیش بینی نوسانات با استفاده از داده های فرکانس بالا: شواهد از بازارهای سهام. مدلسازی اقتصادی»، 36، صص 176–190. DOI: 10. 1016/j. econmod. 2013. 09. 038
FranciscoPrado Marcel C. Minutolo Werne rKristjanpoller، "پیش بینی بر اساس یک گروه میانگین متحرک خودرگرسیون - عصبی تطبیقی - سیستم استنتاج فازی - شبکه عصبی - چارچوب الگوریتم ژنتیک"، 2020، DOI: 10. 1016/j. energy. 2020.
P. Zhang و M. Qi، "پیش بینی شبکه عصبی برای سری های زمانی فصلی و روند"، Eur. جی. اوپر. Res.، جلد160، شماره2، ص 501-514، 2005. DOI: 10. 1016/j. ejor. 2003. 08. 037
- قیومی محمد، موسویان م. «کاربرد روش یادگیری ماشین مبتنی بر شبکه عصبی برای طبقهبندی مقالات علمی».(2022)؛37 (4): 1244-1217، DOI: 10. 35050/JIPM010. 2022. 008
هوانگ، دبلیو، ناکاموری، ی.، وانگ، اس. ای.(2005)."پیش بینی جهت حرکت بازار سهام با ماشین بردار پشتیبان. کامپیوتر و تحقیقات عملیاتی، شماره. 10 (جلد 32)، صفحات 2513-2522، DOI: 10. 1016/j. cor. 2004. 03. 016
J. T. کانر، R. D. Martin، L. E. اطلس، "شبکه های عصبی مکرر و پیش بینی سری های زمانی قوی"، 1994، DOI: 10. 1109/72. 279188
JunZheng، "شبکه های عصبی تقویت کننده حساس به هزینه برای پیش بینی نقص نرم افزار"، 2010، DOI: 10. 1016/j. eswa. 2009. 12. 056