一、Seq2Seq工作原理

Seq2Seq(Sequence-to-sequence):輸入一個(gè)序列,輸出另一個(gè)序列。

在2014年,Cho等人首次在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)中提出了Seq2Seq(序列到序列)模型。與傳統(tǒng)的統(tǒng)計(jì)翻譯模型相比,Seq2Seq模型極大地簡(jiǎn)化了序列轉(zhuǎn)換任務(wù)的處理流程。

Seq2Seq模型通過(guò)端到端的訓(xùn)練方式,將輸入序列和目標(biāo)序列直接關(guān)聯(lián)起來(lái),避免了傳統(tǒng)方法中繁瑣的特征工程和手工設(shè)計(jì)的對(duì)齊步驟。這使得模型能夠自動(dòng)學(xué)習(xí)從輸入到輸出的映射關(guān)系,提高了序列轉(zhuǎn)換任務(wù)的性能和效率。

工作原理:Seq2Seq模型中的編碼器使用循環(huán)神經(jīng)網(wǎng)絡(luò)將輸入序列轉(zhuǎn)換為固定長(zhǎng)度的上下文向量,而解碼器則利用這個(gè)向量和另一個(gè)循環(huán)神經(jīng)網(wǎng)絡(luò)逐步生成輸出序列。

Encoder(編碼器):

Decoder(解碼器):

二、Attention工作原理

Attention Mechanism(注意力機(jī)制)Attention Mechanism是一種在深度學(xué)習(xí)模型中用于處理序列數(shù)據(jù)的技術(shù),尤其在處理長(zhǎng)序列時(shí)表現(xiàn)出色。最初引入注意力機(jī)制是為了解決機(jī)器翻譯中遇到的長(zhǎng)句子(超過(guò)50字)性能下降問(wèn)題。

傳統(tǒng)的機(jī)器翻譯在長(zhǎng)句子上的效果并不理想,因?yàn)楣潭ㄩL(zhǎng)度的向量難以包含句子的所有語(yǔ)義細(xì)節(jié)。注意力機(jī)制的核心思想是在生成每個(gè)輸出詞時(shí),模型都能夠關(guān)注到輸入序列中的相關(guān)部分。

核心邏輯:從關(guān)注全部到關(guān)注重點(diǎn)

工作原理:通過(guò)計(jì)算Decoder的隱藏狀態(tài)與Encoder輸出的每個(gè)詞的隱藏狀態(tài)的相似度(Score),進(jìn)而得到每個(gè)詞的Attention Weight,再將這些Weight與Encoder的隱藏狀態(tài)加權(quán)求和,生成一個(gè)Context Vector。

Encoder(編碼器):

Decoder(解碼器):

三、Transformer工作原理

Transformer:通常 Attention 會(huì)與傳統(tǒng)的模型配合起來(lái)使用,但 Google 的一篇論文《?Attention Is All You Need?》中提出只需要注意力就可以完成傳統(tǒng)模型所能完成的任務(wù),從而擺脫傳統(tǒng)模型對(duì)于長(zhǎng)程依賴無(wú)能為力的問(wèn)題并使得模型可以并行化,并基于此提出 Transformer 模型。

Transformer架構(gòu):主要由輸入部分(輸入輸出嵌入與位置編碼)、多層編碼器、多層解碼器以及輸出部分(輸出線性層與Softmax)四大部分組成。

工作原理:左邊是N個(gè)編碼器,右邊是N個(gè)解碼器,圖中Transformer的N為6。

Encoder(編碼器):

Decoder(解碼器):

文章轉(zhuǎn)自微信公眾號(hào)@架構(gòu)師帶你玩轉(zhuǎn)AI

上一篇:

大模型開(kāi)發(fā) - 一文搞懂Embedding工作原理

下一篇:

大模型開(kāi)發(fā) - 一文搞懂Transformer工作原理
#你可能也喜歡這些API文章!

我們有何不同?

API服務(wù)商零注冊(cè)

多API并行試用

數(shù)據(jù)驅(qū)動(dòng)選型,提升決策效率

查看全部API→
??

熱門(mén)場(chǎng)景實(shí)測(cè),選對(duì)API

#AI文本生成大模型API

對(duì)比大模型API的內(nèi)容創(chuàng)意新穎性、情感共鳴力、商業(yè)轉(zhuǎn)化潛力

25個(gè)渠道
一鍵對(duì)比試用API 限時(shí)免費(fèi)

#AI深度推理大模型API

對(duì)比大模型API的邏輯推理準(zhǔn)確性、分析深度、可視化建議合理性

10個(gè)渠道
一鍵對(duì)比試用API 限時(shí)免費(fèi)