剛剛小組臨時online meeting,結果其中一個成員突然傳來喜訊,他台大商研所、台大財金所都正取。
他開心到話都說不好了,我們一陣大笑,讓他先好好下線去慶祝。
我呢,也感到榮幸和理所當然,因為我沒看錯人,我也認為當初拉他合作是明智的選擇。
稍早他還說感覺自己笨,認為「商科仔」機器學習底子不夠,程式碼看不懂。我說別妄自菲薄,其它人也說看不懂算正常。
「物以類聚,難道妳是在罵這邊的人都笨嗎?」我說。
「也不是,畢竟總會有幾個聰明的帶頭。」他回答。
這句話是真聰明,而我也喜歡聰明人 :)
話說回來,被打斷的話題,和因子投資與深度學習有關,大家想法不一樣。
路徑一,並行融合。
1. 取得約300個財報+價量+籌碼的原始資料,清洗。
2. 效法openFE的方式(也就是傳統金融的各種財報ratio),時序回歸後,組合出約100萬個「因子」,總共約有兩兆個數據組。(二次複合因子的話再乘100萬。)
3. 做成矩陣並標準化、正則化,放進CNN模型(或是RNN/GNN)。
4. MVO/最大散度組合優化。
路徑二,串接融合。
1. 取得價量+籌碼+財報因子並分類。
2. openFE,透過因子選股。
3. 畫成價量圖,包括K線、均線和成交量。
4. 丟入CNN
5. 組合優化。
路徑三,不融合。
1. 只取財報因子(就是台灣在說的因子)
2. 傳統方法選因子,例如排序。
3. 選股。
這些概念主要來自修大成/Kelly等人,融合了既有開源程式碼,大概是近期遇到最難的任務。聽說目前還沒有人成功復現,畢竟要兼顧IT/數學/金融/統計/機器學習等專業。
不過我們都覺得,既然論文這麼清楚了,代表作者很有誠意,該加油的是我們。
研究嘛,好玩和挑戰性都很重要。
#有人該請客了
#狂讀投資
#多因子