2. 相關工作 (Related Work)

本章探討了利用財務文本數據進行股票市場預測的相關研究工作。首先回顧了早期研究中采用的基于詞嵌入的技術,這些技術雖然能夠提取文本數據中的信息,但缺乏對語境的深入理解。例如,一些研究通過分析金融新聞流中的情感分數、社交媒體帖子來預測股票價格,但這些方法未能充分利用文本的上下文信息。

接著,本章介紹了大型語言模型(LLMs)的分類和它們在量化投資中的應用。LLMs通過在大量文本數據上進行預訓練,學習到了通用的語言模式。文中詳細討論了三種類型的LLMs:僅編碼器模型、僅解碼器模型和編碼器-解碼器混合模型,以及它們如何通過預訓練和微調來適應特定的下游任務。特別提到了參數高效的微調技術,如低秩適應(LoRA),這種技術通過在預訓練模型參數中引入低秩變化來減少計算和內存需求。

最后,本章還概述了近期的研究工作,這些工作利用LLMs作為特征提取器,直接從文本中提取預測信號。一些研究通過微調預訓練的LLMs來進行更準確的財務情感分析,而其他研究則通過在生成性LLMs上使用prompt來提取金融新聞和價格歷史中的關鍵因素。這些研究表明,LLMs在量化投資領域具有巨大的潛力,能夠提供從文本到股票未來表現的直接建模能力。

3. 從財務新聞流到股票組合的LLMs (From Financial Newsflow to Stock Portfolios through LLMs)

3.1 問題陳述

如何利用大型語言模型(LLMs)來預測股票回報以支持股票選擇。在這一部分中,作者設定了一個包含多只股票的投資宇宙,并解釋了量化投資者如何根據定量標準從這個宇宙中選擇股票來構建投資組合。隨著市場條件的不斷變化,投資者需要定期更新或重新平衡他們的投資組合,這就需要一個有效的股票選擇過程。

作者指出,傳統的股票選擇過程通常涉及多步驟的特征提取和驗證,這可能耗時且需要額外的標記數據和持續的改進。為了簡化這一過程,作者提出了利用LLMs直接從財務新聞文本中預測股票回報的方法。這種方法的核心是將文本數據轉換為數值向量,這些向量能夠捕捉文本的語義信息,并作為預測未來股票表現的特征。

在構建預測模型時,作者提出了一個由文本表示模塊和預測模塊組成的復合結構模型。文本表示模塊負責將輸入的文本序列編碼為數值向量,而預測模塊則基于這些向量來預測股票的n步未來回報。為了實現這一目標,作者使用了一種特殊的訓練方法,即聯合微調預訓練的LLM作為文本表示模塊,并訓練一個密集層作為預測模塊,以最小化預測值與真實值之間的均方誤差。

此外,作者還描述了如何構建用于訓練的數據實例集合。每個實例都是通過將投資宇宙中的股票標識符與相關新聞鏈接起來,并使用回顧時間窗口來選擇可用新聞。這種方法允許模型學習新聞文本與股票未來表現之間的關系。

3.2 方法論

探討了構建基于LLM的股票回報預測模型的方法論,這一模型由文本表示模塊和預測模塊組成,旨在將財務新聞文本轉化為股票回報的數值預測。文本表示模塊利用預訓練的LLM將輸入的文本序列轉換成高維向量表示,這些向量捕捉了文本的語義信息。具體來說,作者討論了編碼器-only和解碼器-only LLMs在文本表示上的差別,編碼器模型如BERT和DeBERTa通過遮蔽語言建模任務學習上下文嵌入,而解碼器模型如GPT-3和Mistral通過自回歸的下一個詞預測任務進行訓練。這些模型的不同預訓練目標導致它們在處理文本時采用不同的策略,從而影響最終的文本表示。

此外,本節還介紹了兩種將LLMs生成的token級向量整合到預測模塊的方法:瓶頸表示和聚合表示。瓶頸表示通過在輸入序列末尾添加一個特殊的結束序列(EOS)標記,利用其向量表示來壓縮整個序列的信息。這種方法對于編碼器模型在微調過程中與預訓練的一致性可能更為有利。相對地,聚合表示則是通過簡單平均或更復雜的機制(如注意力機制)將所有token的向量表示合并起來,以獲得整個序列的統一表示。作者選擇了簡單平均方法來實現聚合表示,因為它不需要額外的訓練參數,并且可以清晰地與瓶頸表示進行比較。

最后,第3.2節還討論了模型的實現細節,包括使用低秩適應(LoRA)技術對LLMs進行微調,以及其他技術如梯度檢查點、混合精度訓練和DeepSpeed來減少GPU內存使用。這些技術的運用使得模型能夠在有限的資源下進行有效的訓練。通過這些方法,研究者能夠在不同的投資宇宙上進行實驗,評估模型在股票回報預測任務上的性能,并探索不同類型LLMs在量化投資策略中的適用性。

4. 實驗 (Experiments)

本章詳細記錄了利用大型語言模型(LLMs)進行股票回報預測的實證研究過程和分析結果。研究使用了2003年至2019年間的公司級財務新聞流數據,這些數據包括了新聞內容和相關公司標識符。同時,研究涵蓋了北美、歐洲和新興市場的股票投資宇宙數據集,包含了股票標識符和對應日期的真實月度前向回報。

實驗中,每個數據實例是通過將投資宇宙數據中的股票標識符與相關新聞通過回溯時間窗口(例如一周)鏈接起來構建的。具體來說,北美市場的數據集包含了630只股票,平均每只股票有2.5條新聞,共有366011個訓練實例和241367個測試實例;歐洲市場的數據集包含了350只股票,平均每只股票有1.9條新聞,共有100403個訓練實例和121705個測試實例;新興市場的數據集則包含了370只股票,平均每只股票有2.6條新聞,共有71610個訓練實例和183608個測試實例。

模型訓練使用了批量大小為32,學習率為1e-5,并采用了100步的預熱階段后接線性衰減的策略。LLMs的微調采用了低秩適應(LoRA)技術,所有模型均在最大上下文長度為4k的情況下訓練了10個周期,并使用了2個A100 GPU。

在投資組合構建方面,Long-only投資組合是通過選擇基于回報預測排名位于頂部9/10的股票構建的,而long-short投資組合則包括了排名在頂部9/10和底部1/10的股票。所有投資組合中的股票均采用等權重。

回測評估采用了月度再平衡的方式,模擬了每月構建的投資組合的交易情況,并報告了累積回報圖表和測試期間的性能統計數據,如年化回報和夏普比率。

具體到評估指標,研究使用了分位數RMSE、分位數精確度和分位數回報三個指標來衡量預測模型的性能。分位數RMSE衡量了基于預測排名的分位數內實際回報與預測回報之間的誤差;分位數精確度表示了實際高回報股票被正確預測在高回報分位數的比例;分位數回報則是基于預測分位數的股票實際回報。

實驗結果顯示,在北美市場中,使用聚合表示的Mistral和Llama模型在long-only投資組合中實現了較高的年化回報,分別為25.15%和27.00%,夏普比率分別為1.20和1.32。在long-short投資組合中,使用聚合表示的DeBERTa和Mistral模型也展現出了較高的年化回報和夏普比率,分別為12.87%和1.49,以及18.30%和1.26。在歐洲市場中,Mistral的聚合表示在long-only投資組合中表現最佳,年化回報為15.12%,夏普比率為1.02;在long-short投資組合中,同樣使用聚合表示的Mistral模型年化回報為9.07%,夏普比率為1.04。新興市場的結果與北美和歐洲市場類似,其中Llama的聚合表示在long-only投資組合中年化回報最高,為12.76%,夏普比率為0.90。

與基于情感分析的投資組合相比,基于LLMs的預測投資組合在多數情況下表現更佳。例如,在北美市場中,基于FinBERT和FinVader情感分析的long-only投資組合年化回報分別為20.64%和12.26%,夏普比率分別為1.22和0.72,而基于DeBERTa聚合表示的預測投資組合年化回報為25.15%,夏普比率為1.20。在long-only投資組合中,基于情感分析的投資組合表現不佳,特別是FinBert,年化回報和夏普比率均為負值。

此外,研究還發現,雖然聚合表示在某些情況下提供了更高的分位數回報,但這并不總是意味著較低的分位數RMSE。例如,在北美市場中,DeBERTa和Mistral的聚合表示在頂部9/10分位數的分位數回報較高,但相應的分位數RMSE也較高。這表明,盡管預測可能不夠精確,但只要預測結果仍然落在正確的分位數內,投資組合的回報就不會受到影響。

5. 結論 (Conclusion)

本文證明了通過微調大型語言模型(LLMs)來直接建立財務新聞文本表示與股票未來回報之間的關系是可行的,并且能夠為量化投資組合構建提供有價值的信號。研究發現,使用LLMs的token級嵌入的聚合表示通常能夠提高僅多頭和多空投資組合的表現;在較大的投資宇宙中,基于解碼器的LLMs預測模型能夠產生更強的投資組合,而在較小的投資宇宙中,不同模型的表現則沒有一致性。在所研究的三種LLMs(DeBERTa、Mistral、Llama)中,Mistral在不同投資宇宙中表現更為穩健。此外,基于LLMs文本表示的回報預測相較于傳統情感分析方法,在投資組合構建中表現更佳。盡管如此,論文也指出了一些未解決的問題,例如需要進一步研究編碼器-only模型在大型投資宇宙中表現不佳的原因,以及不同小宇宙中性能變化的原因,為未來的研究提供了方向。

最后,為大家提供一下好用且高效的大語言模型API:

原文轉自 微信公眾號@QuantML

熱門推薦
一個賬號試用1000+ API
助力AI無縫鏈接物理世界 · 無需多次注冊
3000+提示詞助力AI大模型
和專業工程師共享工作效率翻倍的秘密
返回頂部
上一篇
輕松整合 ChatGPT 到您的網站:簡易步驟指導
下一篇
Relevance AI:打造一個AI智能體營銷團隊
国内精品久久久久影院日本,日本中文字幕视频,99久久精品99999久久,又粗又大又黄又硬又爽毛片
色综合网站在线| 成人精品免费视频| 婷婷中文字幕综合| 中文一区在线播放| 国产一区久久久| 亚洲国产成人一区二区三区| 国模套图日韩精品一区二区| 26uuu精品一区二区在线观看| 美美哒免费高清在线观看视频一区二区 | 色综合天天狠狠| 一区二区三区四区五区视频在线观看 | 狠狠色丁香久久婷婷综合_中 | 一本大道av一区二区在线播放| 最近中文字幕一区二区三区| 在线一区二区观看| 久久综合综合久久综合| 国产精品剧情在线亚洲| 欧美性色综合网| 精品一区二区在线视频| 亚洲欧美一区二区久久| 日韩精品一区在线| 99精品国产一区二区三区不卡| 亚洲综合在线电影| 精品91自产拍在线观看一区| 99国产精品一区| 狠狠色丁香婷婷综合| 宅男在线国产精品| 97久久精品人人做人人爽50路| 日本视频一区二区三区| 日韩理论在线观看| 久久久不卡影院| 91高清在线观看| 成人avav影音| 国产一区二区三区av电影| 亚洲日本在线a| 国产精品五月天| 久久免费午夜影院| 欧美一个色资源| 欧美人狂配大交3d怪物一区| 99精品视频在线观看免费| 蜜臀久久久久久久| 日韩二区在线观看| 石原莉奈一区二区三区在线观看| 久久蜜桃av一区二区天堂 | 自拍偷自拍亚洲精品播放| 精品国产一区二区三区久久影院| 91国产成人在线| 91在线看国产| 色婷婷av一区二区三区gif| 成人午夜在线视频| 成人免费va视频| 不卡一卡二卡三乱码免费网站| 国产一区 二区| 国产麻豆视频精品| 国产91精品精华液一区二区三区| 国产中文字幕一区| 国产在线日韩欧美| 国产一二三精品| 成人精品小蝌蚪| 一本久久精品一区二区| 91猫先生在线| 在线播放日韩导航| 精品久久一区二区| 中文字幕日韩精品一区 | 欧美午夜一区二区三区| 欧美日韩一区二区欧美激情| 欧美亚洲综合色| 日韩视频免费直播| 中文av字幕一区| 亚洲制服丝袜一区| 久色婷婷小香蕉久久| 国产精品一品二品| 91福利资源站| wwwwww.欧美系列| 亚洲免费av观看| 久久国产婷婷国产香蕉| 9色porny自拍视频一区二区| 欧美在线观看视频一区二区 | 欧美三级电影网站| 2021中文字幕一区亚洲| 亚洲人成在线播放网站岛国| 日韩不卡一区二区| 成人美女视频在线观看18| 欧美视频在线一区二区三区 | 国产曰批免费观看久久久| 色综合天天综合色综合av| 日韩亚洲欧美高清| 一区二区在线观看视频在线观看| 日本人妖一区二区| 色乱码一区二区三区88| 久久久精品中文字幕麻豆发布| 亚洲精品亚洲人成人网在线播放| 久久99久久99| 欧美一级高清片| 日韩电影在线免费观看| 色综合网站在线| 国产精品美女久久久久久久久久久 | 亚洲国产成人高清精品| 国产一区二区三区不卡在线观看| 免费亚洲电影在线| 欧美日韩高清不卡| 一卡二卡三卡日韩欧美| 成人免费视频免费观看| 亚洲精品一区二区精华| 日本不卡123| 欧美日韩一级大片网址| 亚洲一区二区三区四区在线免费观看 | 欧美久久久久久久久中文字幕| 国产精品进线69影院| 成人免费视频网站在线观看| 久久久国产精品午夜一区ai换脸| 国产做a爰片久久毛片| 精品国产乱码久久久久久1区2区 | 国产精品久久久久久久岛一牛影视| 久久精品国产在热久久| 欧美tk—视频vk| 精品一区二区三区免费| www一区二区| 99re成人在线| 亚洲一区成人在线| 777亚洲妇女| 韩国av一区二区三区四区| 久久精品一区二区三区四区| 国产成人精品一区二| 国产精品电影一区二区| 日本精品一区二区三区四区的功能| 一区二区免费在线播放| 欧美二区三区91| 麻豆国产91在线播放| 国产视频一区二区在线观看| 成人黄色国产精品网站大全在线免费观看| 中文幕一区二区三区久久蜜桃| 91在线视频网址| 男男视频亚洲欧美| 国产精品乱码久久久久久| 欧美视频一区二区| 黄页网站大全一区二区| 亚洲日本护士毛茸茸| 制服丝袜亚洲精品中文字幕| 国产电影精品久久禁18| 亚洲午夜av在线| 国产清纯白嫩初高生在线观看91 | 成人激情午夜影院| 无码av免费一区二区三区试看| 久久精子c满五个校花| 欧美视频日韩视频| 成人av电影在线网| 激情综合色播五月| 亚洲一区二区三区不卡国产欧美| 久久欧美一区二区| 日韩欧美国产综合| 欧美午夜免费电影| 91一区一区三区| 成人app在线| 福利电影一区二区| 精品制服美女丁香| 亚洲国产日韩a在线播放性色| 欧美国产欧美亚州国产日韩mv天天看完整| 欧美区在线观看| 91成人网在线| 色婷婷久久久久swag精品| 国产激情偷乱视频一区二区三区| 青青草国产成人av片免费| 亚洲精品免费在线播放| 中文字幕欧美一区| 国产精品卡一卡二| 国产精品久久久久影视| 国产精品网曝门| 在线亚洲欧美专区二区| 成人福利视频在线看| 国产黑丝在线一区二区三区| 日韩激情视频在线观看| 偷拍一区二区三区四区| 天堂影院一区二区| 久久激情五月婷婷| 韩国午夜理伦三级不卡影院| 激情综合色播五月| 成人激情图片网| 在线观看亚洲一区| 欧美一区在线视频| 2024国产精品| 国产精品系列在线| 亚洲午夜在线电影| 麻豆高清免费国产一区| 国产精品18久久久久| 一本大道久久精品懂色aⅴ| 欧美日韩在线不卡| 日韩一级二级三级| 亚洲国产高清aⅴ视频| 亚洲午夜精品17c| 韩日av一区二区| 91浏览器入口在线观看| 91麻豆精品国产91| 国产精品妹子av| 三级在线观看一区二区 | 亚洲线精品一区二区三区| 麻豆精品国产传媒mv男同| 丰满少妇在线播放bd日韩电影| 欧美中文字幕亚洲一区二区va在线| 日韩欧美黄色影院|