StarCoder代碼生成模型

StarCoder代碼生成模型

通用API
【更新時(shí)間: 2024.03.26】 StarCoder 和 StarCoderBase 是針對(duì)代碼的大語言模型 (代碼 LLM),模型基于 GitHub 上的許可數(shù)據(jù)訓(xùn)練而得,訓(xùn)練數(shù)據(jù)中包括 80 多種編程語言、Git 提交、GitHub 問題和 Jupyter notebook。
瀏覽次數(shù)
73
采購(gòu)人數(shù)
2
試用次數(shù)
0
! 適用于個(gè)人&企業(yè)
收藏
×
完成
取消
×
書簽名稱
確定
StarCoder代碼生成模型
StarCoder 和 StarCoderBase 是針對(duì)代碼的大語言模型...
<
產(chǎn)品介紹
>

什么是StarCoder代碼生成模型?

StarCoder 和 StarCoderBase 是針對(duì)代碼的大語言模型 (代碼 LLM),模型基于 GitHub 上的許可數(shù)據(jù)訓(xùn)練而得,訓(xùn)練數(shù)據(jù)中包括 80 多種編程語言、Git 提交、GitHub 問題和 Jupyter notebook。與 LLaMA 類似,我們基于 1 萬億個(gè)詞元訓(xùn)練了一個(gè)約 15B 參數(shù)的模型。此外,我們還針對(duì)一個(gè) 35B 詞元的 Python 數(shù)據(jù)集對(duì) StarCoderBase 模型進(jìn)行了微調(diào),從而獲得了一個(gè)我們稱之為 StarCoder 的新模型。

StarCoder 的一個(gè)有趣方面是它是多語言的,因此我們?cè)?MultiPL-E 上對(duì)其進(jìn)行了評(píng)估,MultiPL-E 是 HumanEval 的多語言擴(kuò)展版。我們觀察到 StarCoder 在許多編程語言上與 code-cushman-001 的表現(xiàn)相當(dāng)甚至更優(yōu)。在 DS-1000 數(shù)據(jù)科學(xué)基準(zhǔn)測(cè)試中,它以明顯優(yōu)勢(shì)擊敗了 code-cushman-001 以及所有其他開源模型。好了,我們來看看除了代碼補(bǔ)全之外,StarCoder 還能做些什么!

什么是StarCoder代碼生成模型接口?

由服務(wù)使用方的應(yīng)用程序發(fā)起,以Restful風(fēng)格為主、通過公網(wǎng)HTTP協(xié)議調(diào)用StarCoder代碼生成模型 ,從而實(shí)現(xiàn)程序的自動(dòng)化交互,提高服務(wù)效率。
<
最可能同場(chǎng)景使用的其他API
>
API接口列表
<
依賴服務(wù)
>
<
最可能同場(chǎng)景使用的其他API
>