2014年8月26日 星期二

北角ETF投資日記 利用人工智能預測股巿 2014年08月26日

最近看了一篇國際性期刊Knowledge-Based Systems的學術文章,題目名為Integration of genetic fuzzy systems and artificial neural networks for stock price forecasting。起初,我只看了該篇文章的摘要,它講述作者發明了一個新的人工智能的模型應用於股價預測上,並與之前一些模型作出比較,實驗結果顯示他們的模型比前人的要好,能有效地預測股價。

看到這摘要我非常興奮,迫不及待就跳過內文,直接看實驗的部份。發現原來他們所指的預測,只是指預測第二天的股價,這已使我失望了一大半。另外他們只利用四隻股票作為實驗對象,分別是IBM,DELL,British airlines,Ryanair airlines,姑勿論數據太少,另外這些都是些大型企業,每天的股價變動不會很大。再看看實驗結果圖表,發現除了DELL外,其餘三家的預測很明顯的有滯後現象,感覺就好像畫了條一天平均線一樣。基於科學精神,我根劇文章所述,從YAHOO和GOOGLE找到原始數據,利用一天平均線(或稱Naïve approach,我譯作低B做法)來作預測,實驗結果如下:

平均絕對誤差百分比(MAPE) IBM DELL BRI RYAAY TOTAL
前人做法1(HMM) 1.219 1.012 2.629 1.928 6.788
前人做法2(HMM+ANN+GA) 0.849 0.699 1.646 1.377 4.571
前人做法3(HMM+FL) 0.779 0.405 1.529 1.356 4.069
前人做法4(ANIMA) 0.972 0.66 1.573 1.504 4.709
前人做法5(ANN) 0.972 0.66 2.283 1.504 5.419
文章建議的方法 0.63 0.534 1.413 1.241 3.818
一天平均線(低B做法) 0.651 0.804 0.71 1.453 3.618

沒想到低B做法的誤差百分比居然是所有方法中最低的,不禁令我懷疑作者在攪什麼。於是我看了一下內文,發現他的模型真是複雜得要命,居然還有臉說:The central idea to successful stock market prediction is achieving best results using minimum required input data and the least complex stock market model. 他們的模型首先用stepwise regression選擇Variables,簡單來說就是找出哪些變項跟要預測的東西關係最大;之後用self-organizing map為輸入的資料做分類(self-organizing map是類神經網絡的一種);最後用Fuzzy logic跟genetic algorithm去選擇一些合適的規則作出預測(這個有點複雜,中文就是模糊邏輯和遺傳算法,有興趣可以上維基慢慢看)。他們的模型比低B做法真的不知複雜上多少倍,他們的模型還要經過預先學習的階段才能應用,沒想到這樣的文章居然能登上Knowledge-Based Systems,實在令人失望。


沒有留言:

張貼留言