一级片中文字幕,久久精品视频9,91精品视频在线免费观看

句子向量化：將整個句子轉換為一個數值向量。
- 簡單平均/加權平均：對句子中的詞向量進行平均或根據詞頻進行加權平均。
- 遞歸神經網絡（RNN）：通過遞歸地處理句子中的每個詞來生成句子表示。
- 卷積神經網絡（CNN）：使用卷積層來捕捉句子中的局部特征，然后生成句子表示。
- 自注意力機制（如Transformer）：如BERT模型，通過對句子中的每個詞進行自注意力計算來生成句子表示。

文檔向量化：將整個文檔（如一篇文章或一組句子）轉換為一個數值向量。
- 簡單平均/加權平均：對文檔中的句子向量進行平均或加權平均。

統計方法用TF-IDF和N-gram統計生成文本向量，而神經網絡方法如Word2Vec、GloVe等通過深度學習學習文本向量。

基于統計的方法
TF-IDF：通過統計詞頻和逆文檔頻率來生成詞向量或文檔向量。
N-gram：基于統計的n個連續詞的頻率來生成向量。

基于神經網絡的方法

詞嵌入：

Word2Vec：通過預測詞的上下文來學習詞向量。
????GloVe：通過全局詞共現統計來學習詞向量。
????FastText：考慮詞的n-gram特征來學習詞向量。

句子嵌入：

RNN：包括LSTM和GRU，可以處理變長句子并生成句子向量。
????Transformer：使用自注意力機制和位置編碼來處理句子，生成句子向量。

文檔嵌入：

? Doc2Vec：擴展了Word2Vec，可以生成整個文檔的向量表示。
????BERT：基于Transformer的預訓練模型，可以生成句子或短文檔的向量表示。

工作原理：將離散的文字信息（如單詞）轉換成連續的向量數據。這樣，語義相似的詞在向量空間中位置相近，并通過高維度捕捉語言的復雜性。

將離散信息（如單詞、符號）轉換為分布式連續值數據（向量）。
相似的項目（如語義上相近的單詞）在向量空間中被映射到相近的位置。
提供了更多的維度（如1536個維度）來表示人類語言的復雜度。

舉例來講，這里有三句話：

“The cat chases the mouse” 貓追逐老鼠。
“The kitten hunts rodents” 小貓捕獵老鼠。
“I like ham sandwiches” 我喜歡火腿三明治。

人類能理解句子1和句子2含義相近，盡管它們只有“The”這個單詞相同。但計算機需要Embedding技術來理解這種關系。Embedding將單詞轉換為向量，使得語義相似的句子在向量空間中位置相近。這樣，即使句子1和句子2沒有很多共同詞匯，計算機也能理解它們的相關性。

如果是人類來理解，句子 1 和句子 2 幾乎是同樣的含義，而句子 3 卻完全不同。但我們看到句子 1 和句子 2 只有“The”是相同的，沒有其他相同詞匯。計算機該如何理解前兩個句子的相關性？

Embedding將單詞轉換為向量，使得語義相似的句子在向量空間中位置相近。這樣，即使句子1和句子2沒有很多共同詞匯，計算機也能理解它們的相關性。

二、Image?Embedding工作原理

圖像向量化（Image?Embedding）：將圖像數據轉換為向量的過程。

卷積神經網絡和自編碼器都是用于圖像向量化的有效工具，前者通過訓練提取圖像特征并轉換為向量，后者則學習圖像的壓縮編碼以生成低維向量表示。

卷積神經網絡（CNN）：通過訓練卷積神經網絡模型，我們可以從原始圖像數據中提取特征，并將其表示為向量。例如，使用預訓練的模型（如VGG16, ResNet）的特定層作為特征提取器。
自編碼器（Autoencoders）：這是一種無監督的神經網絡，用于學習輸入數據的有效編碼。在圖像向量化中，自編碼器可以學習從圖像到低維向量的映射。

工作原理：通過算法提取圖像的關鍵特征點及其描述符，將這些特征轉換為高維向量表示，使得在向量空間中相似的圖像具有相近的向量表示，從而便于進行圖像檢索、分類和識別等任務。

特征提取：使用算法（如SIFT、SURF、HOG等）從圖像中提取關鍵特征點及其描述符。
高維空間：圖像向量通常在高維空間中表示，每個維度對應一個特征或特征描述符。
相似度度量：在向量空間中，可以使用距離度量（如歐氏距離、余弦相似度等）來比較不同圖像向量的相似度。

三、Vedio?Embedding工作原理

視頻向量化（Vedio Embedding）：OpenAI的Sora將視覺數據轉換為圖像塊（Turning visual data into patches）。

視覺塊的引入：為了將視覺數據轉換成適合生成模型處理的格式，研究者提出了視覺塊嵌入編碼（visual patches）的概念。這些視覺塊是圖像或視頻的小部分，類似于文本中的詞元。
處理高維數據：在處理高維視覺數據時（如視頻），首先將其壓縮到一個低維潛在空間。這樣做可以減少數據的復雜性，同時保留足夠的信息供模型學習。

工作原理：Sora 用visual patches 代表被壓縮后的視頻向量進行訓練，每個patches相當于GPT中的一個token。使用patches，可以對視頻、音頻、文字進行統一的向量化表示，和大模型中的 tokens 類似，Sora用 patches 表示視頻，把視頻壓縮到低維空間（latent space）后表示為Spacetime patches。

OpenAI大模型的核心架構：大力出奇跡。Embedding技術實現文本、圖像、視頻等數據向量化表示，為大型模型提供了豐富的特征輸入。只要模型規模足夠大，這些向量化數據就能驅動模型生成各種所需的內容，體現了“萬物皆可生成”的能力。

文章轉自微信公眾號@架構師帶你玩轉AI