看到這摘要我非常興奮,迫不及待就跳過內文,直接看實驗的部份。發現原來他們所指的預測,只是指預測第二天的股價,這已使我失望了一大半。另外他們只利用四隻股票作為實驗對象,分別是IBM,DELL,British airlines,Ryanair airlines,姑勿論數據太少,另外這些都是些大型企業,每天的股價變動不會很大。再看看實驗結果圖表,發現除了DELL外,其餘三家的預測很明顯的有滯後現象,感覺就好像畫了條一天平均線一樣。基於科學精神,我根劇文章所述,從YAHOO和GOOGLE找到原始數據,利用一天平均線(或稱Naïve approach,我譯作低B做法)來作預測,實驗結果如下:
平均絕對誤差百分比(MAPE) | IBM | DELL | BRI | RYAAY | TOTAL |
前人做法1(HMM) | 1.219 | 1.012 | 2.629 | 1.928 | 6.788 |
前人做法2(HMM+ANN+GA) | 0.849 | 0.699 | 1.646 | 1.377 | 4.571 |
前人做法3(HMM+FL) | 0.779 | 0.405 | 1.529 | 1.356 | 4.069 |
前人做法4(ANIMA) | 0.972 | 0.66 | 1.573 | 1.504 | 4.709 |
前人做法5(ANN) | 0.972 | 0.66 | 2.283 | 1.504 | 5.419 |
文章建議的方法 | 0.63 | 0.534 | 1.413 | 1.241 | 3.818 |
一天平均線(低B做法) | 0.651 | 0.804 | 0.71 | 1.453 | 3.618 |
沒想到低B做法的誤差百分比居然是所有方法中最低的,不禁令我懷疑作者在攪什麼。於是我看了一下內文,發現他的模型真是複雜得要命,居然還有臉說:The central idea to successful stock market prediction is achieving best results using minimum required input data and the least complex stock market model. 他們的模型首先用stepwise regression選擇Variables,簡單來說就是找出哪些變項跟要預測的東西關係最大;之後用self-organizing map為輸入的資料做分類(self-organizing map是類神經網絡的一種);最後用Fuzzy logic跟genetic algorithm去選擇一些合適的規則作出預測(這個有點複雜,中文就是模糊邏輯和遺傳算法,有興趣可以上維基慢慢看)。他們的模型比低B做法真的不知複雜上多少倍,他們的模型還要經過預先學習的階段才能應用,沒想到這樣的文章居然能登上Knowledge-Based Systems,實在令人失望。
沒有留言:
張貼留言