雕蟲小技之數據分析小心D
福爾摩斯成日都係我耳邊同我講:“you see but you do not observe.”所以我成日都好記住呢句,搞到我成日都唔信人地講/寫出黎嘅野,永遠都係停一停諗一諗先,今次一見到某財經雜誌單純甘用恆指過去廿年的高低位波幅拉個average 出黎,之後話平均波幅係得6,490,就順手話今年低位22098,人生係咪甘簡單呢?
首先,第一樣要諗嘅係1995個時恆指幾多點,個時開市只係8,190點,而當年波幅係3,183點,真係可以就甘拉average? 當然唔係啦,個時3,183點的波幅已經係而家9,210點的波幅,如果就甘計,個平均值係會under estimate 左好多,所以第一步做的事係應該將D點數轉返做百分比先計,如果唔係同俾人呃左去買點數卡係無分別。略略一計,平均值係41.71%,轉返去點數係9,885點,如果假設今年高位已見,今年低位會係18,703左右,係咪好驚先?又唔好甘驚住,睇埋落去先啦。
有無諗過用平均值去估平均波幅合唔合理?就甘聽落好似ok,但用統計角度諗就有d奇怪。如果單用mean 去估,個前提係假設左波幅係會跟一個叫normal distribution 去行,甘個mean 就會係最常發生嘅事,而更好的估波幅方法當然係用Mean(平均值)加上standard deviation(標準差)去判斷波幅行完未,即係假設恆指一年波幅係10%,S.D. 係5%,甘如果今年已經做左25%波幅,甘即係已經超越平均3個標準差,甘應該有99.7%行完個波幅。但係係今次個case, 你地覺得如果個mean 係41.71%, 全年波幅係0%的機會大D定83.42%機會大D? 相信無人會覺得恆指全年波幅可以係0%, 甘所以今次波幅係唔跟normal distribution, 而係skewed左(傾斜, 我覺得用歪左好D),係甘嘅情況之下,用mean 去估,就會overstate 左個數,因為係skewed 的distribution 入面,Mean(平均數)>median(最中間個個)>mode(最多發生個個),所以用mode/median 去睇會比較好, 再去比較返佢不同的percentile會比較好。今次個median 係36.17%, 計返點數, 即係8,572點, 如果假設今年高位已見,今年低位會係20,015左右, 如果睇埋75th percentile, 要有成52.62%波幅, 即係12,470點波幅, 縱觀過去, 大多只有股災年先有呢種情況, 甘我又未去到甘悲觀, 到穿左20,000點先算啦。
P.S. 始終廿年年度數據唔係一個好大的population, 所以可以出現好多偏差



No comments:
Post a Comment