Εξώφυλλο

Πρόβλεψη τιμών spikes του West Texas Intermediate (WTI) με Μηχανική Μάθηση = Forecasting West Texas Intermediate (WTI) price spikes with machine learning.

Αντώνιος Γεώργιος Χρίστογλου

Περίληψη


Η ικανότητα πρόβλεψης της τιμής του αργού πετρελαίου (WTI crude oil) αποτελεί εργαλείο ύψιστης σημασίας για τους επενδυτές, τις κυβερνήσεις και τον εμπορικό – βιομηχανικό κλάδο. Έτσι, στην πτυχιακή αυτή επιχειρείται μια απόπειρα πρόβλεψης των ακραίων τιμών (spikes) του WTI με τη μέθοδο της Μηχανικής Μάθησης. Πιο συγκεκριμένα, χρησιμοποιούνται οι μεθοδολογίες SVM (με τους πυρήνες Linear, Cubic, Quadratic, Fine Gaussian, Medium Gaussian, Coarse Gaussian), Logistic Regression και Bagged Trees για ένα σετ ημερήσιων, εβδομαδιαίων και μηνιαίων δεδομένων. Τα δεδομένα προήλθαν από τα returns των spot prices του WTI Crude oil και καλύπτουν χρονολογικά το διάστημα από το 1986 έως το 2023. Τα όρια προσδιορισμού των spikes ορίστηκαν με τον υπολογισμό του αθροίσματος και της διαφοράς της τυπικής απόκλισης και του μέσου όρου για 30 ημέρες, 30 εβδομάδες και 24 μήνες αντίστοιχα για κάθε ομάδα δεδομένων. Ακολούθως το 90% των δεδομένων αποτέλεσε τα δεδομένα εκπαίδευσης ενώ το 10% αυτών χρησιμοποιήθηκαν ως δεδομένα ελέγχου. Το σύνολο των αποτελεσμάτων, δείχνει, ότι οι ακραίες τιμές του αργού πετρελαίου (WTI)  προβλέπονται επιτυχώς σε ποσοστό 8% με το μοντέλο Bagged Trees, 29% με το μοντέλο Cubic SVM και 37% με το μοντέλο Cubic SVM, για τα ημερήσια, εβδομαδιαία και μηνιαία δεδομένα αντίστοιχα. Έτσι, διαφαίνεται ότι οι τιμές του πετρελαίου προκύπτουν από εξαιρετικά περίπλοκες διεργασίες και δεν είναι εύκολο να προβλεφθούν σε ικανοποιητικό βαθμό λαμβάνοντας υπόψη μόνο τις παρελθοντικές τιμές, ακόμα και με την χρήση των εργαλείων Μηχανικής Μάθησης.

Τhe ability to predict the price of WTI crude oil is of utmost importance to investors, governments and the commercial – industrial sector. Thus, in this thesis, an attempt is made to predict the extreme values (spikes) of WTI with the Machine Learning approach. More specifically, are used methodologies such as SVM (with the kernels of Linear, Cubic, Quadratic, Fine Gaussian, Medium Gaussian, Coarse Gaussian), Logistic Regression and Bagged Trees. for a set of daily, weekly and monthly data. The data was derived from the WTI Crude Oil spot price returns and covers a period from 1986 to 2023. The limits for the spikes were determined by calculating the sum and difference of the standard deviation and the mean over 30 days, 30 weeks and 24 months respectively for each data group. Subsequently, 90% of the data was used as training data, while 10% was used as test data.   The set of results presented shows that the extreme crude oil prices (WTI) are successfully predicted by 8% with the Bagged Trees model, 29% with the Cubic SVM model and 37% with the Cubic SVM model for the daily, weekly and monthly data respectively. It thus, appears that values of WTI crude oil prices, arise from extremely complex processes and are not easy to be predicted satisfactorily by considering only past prices, even with the use of Machine Learning tool.

Πλήρες Κείμενο:

PDF

Αναφορές


• Adebayo Toniwa Sunday, Dervis Kirikkaleli, Ibrahim Adeshola, Dokum Oluwajana, Gbenga Daniel Akinsola, Oseyenbhin Sunday Osemeahon. (2021). Coal consumption and environmental sustainability in South Africa: the role of financial development and globalization.Int. Journal of Renewable Energy Development 10 (3) 2021: 527-536

• Bhoopesh Singh Bhati, C. R. Ral (2019). Analysis of Support Vector Machine-based Intrusion Detection Techniques. Arabian Jurnal for Science and Engineering.

• Chang L et al, Q. C. (2022). Nexus between financial development and renewable energy: empirical evidence from nonlinear autoregression distributed lag.

• Clifton D. Sutton, (2005). Classification and Regression Trees, Bagging, and Boosting.Handbook of Statistics, Vol. 24

• Dimitriadou Athanasia, Periklis Gogas, Theophilos Papadimitriou, Vasilios Plakandaras, 2018. Oil Market Efficiency under a Machine Learning Perspective.Forecasting 2018, 1, 157–168; doi:10.3390/forecast1010011

• Efthymios Stathakis, Theophilos Papadimitriou, Periklis Gogas (2017). Forecasting electricity price spikes using suport vector machines.

• Efthymios Stathakis, Theophilos Papadimitriou, Periklis Gogas, (2020). Forecasting Price Spikes in Electricity Markets. Rview of Economic Analysis forthcoming 12.

• Edeh Michael Onyema, Khalid K. Almuzaini, Fergus Uchenna Onu, Devvret Verma, Ugdoja Samuel Gregory, Monika Puttaramaiah, Rockson Kwasi Afriyie,(2022). Prospects and Challenges of Using Machine Learning for Academic Forecasting.Computational Intelligence and NeuroscienceVolume 2022, Article ID 5624475, 7 pages.

• Enke D et al,(2005). The use of data mining and neyral networks for forecasting stock market returns. Exprert systems with Application .

• Genpact. (2022). The evolution of forecasting techniques : Traditional versus machine learning methods.

• Gogas Periklis, Theophilos Papadimitriou, Emmanouil Sofianos, (2021). Forecasting unemployment in the euro area with machine learning.Journal of Forecasting. 2021;1–16.

• H. Hotelling, 1931. The economics of exhaustible resources, The Journal of Political Economy, Volume 39, Number 2 .

• J. D. Hamilton, 1983. Oil and the Macroeconomy since World War II, Journal of Political eonomy, Vol 91, No 2, University of Chicago Press.

• javatpoint.com. Major Kernel Functions in Support Vector Machine.

• Moting Su, Zongyi Zhang, Ye Zhu, Donglan Zha, Wenying Wen, (2019). Data Driven Natural Gas Spot Price Prediction Models Using Machine Learning Methods. energies

• M.T. Mitchell, M. I. Jordan. (2015). Machine learning: Trends, perspectives and prospects. Science VOL 349 ISSUE 6245

• Nasteski, Vladimir (2017). An overview of the supervised machine learning methods. neptune.ai.com

• Theophilos Papadimitriou, Periklis Gogas, Athanasios Fotios Athanasiou, (2020). Forecasting S&P 500 spikes: an SVM approach. Spiegel, Digital Finance (2020) 2:241–258

• Wang Jue, George Athanasopoulos, Rob J. Hyndman, Shouyang Wang, (2018). Crude oil price forecasting based on internet concern using extreme

learning machine.International Journal of Forecasting 34 (2018) 665–677.

• Yaoyuan V. Tan, Jason Roy (2019). Bayesian additive regression trees and the General BART model. Statistics in Medicine. 2019;1–22.https://doi.org/10.1002/sim.8347

• Yu L et al, W. S. (2008). Forcasting crude oil price with an EMD-based neural network ensemble learning paradigm.

• Zhang D et al, (2021). Public spending and green economic growth in BRI region: mediating role of green finance.

• Zhao Y et al, (2017). A deep learning ensemble approach for crude oil price forecasing.

• Zilin Xu,Muhammad Mohsin, Kaleem Ullah, Xiaoyu Ma, 2023. Using econometric and machine learning models to forecast crude oil prices: Insights from economic history. Resourse Policy, 83 (2023) 103614


Εισερχόμενη Αναφορά

  • Δεν υπάρχουν προς το παρόν εισερχόμενες αναφορές.