StarCoder代碼生成模型
通用API
【更新時間: 2024.03.26】
StarCoder 和 StarCoderBase 是針對代碼的大語言模型 (代碼 LLM),模型基于 GitHub 上的許可數據訓練而得,訓練數據中包括 80 多種編程語言、Git 提交、GitHub 問題和 Jupyter notebook。
|
瀏覽次數
59
采購人數
2
試用次數
0
收藏
×
完成
取消
×
書簽名稱
確定
|
- 詳情介紹
- 相關推薦

產品介紹

什么是StarCoder代碼生成模型?
StarCoder 和 StarCoderBase 是針對代碼的大語言模型 (代碼 LLM),模型基于 GitHub 上的許可數據訓練而得,訓練數據中包括 80 多種編程語言、Git 提交、GitHub 問題和 Jupyter notebook。與 LLaMA 類似,我們基于 1 萬億個詞元訓練了一個約 15B 參數的模型。此外,我們還針對一個 35B 詞元的 Python 數據集對 StarCoderBase 模型進行了微調,從而獲得了一個我們稱之為 StarCoder 的新模型。
StarCoder 的一個有趣方面是它是多語言的,因此我們在 MultiPL-E 上對其進行了評估,MultiPL-E 是 HumanEval 的多語言擴展版。我們觀察到 StarCoder 在許多編程語言上與 code-cushman-001
的表現相當甚至更優。在 DS-1000 數據科學基準測試中,它以明顯優勢擊敗了 code-cushman-001
以及所有其他開源模型。好了,我們來看看除了代碼補全之外,StarCoder 還能做些什么!
什么是StarCoder代碼生成模型接口?
由服務使用方的應用程序發起,以Restful風格為主、通過公網HTTP協議調用StarCoder代碼生成模型,從而實現程序的自動化交互,提高服務效率。
API接口列表

依賴服務
