一、特征值與特征向量的需求

數據降維:通過映射函數將高維數據轉換為低維表示,旨在去除冗余和噪音、提高計算效率和算法性能,同時增強數據的可視化和解釋性。

1. 本質:

數據降維的本質是一個映射函數,該函數可以將原始的高維數據映射到一個低維空間。降維過程中,數據的某些特征或屬性可能會被合并或舍棄,從而得到一個新的、維度更低的數據表示。

2. 原因:

3. 目的:

特征提取:特征提取是從原始數據中提煉出有意義、非冗余的信息,這一過程涉及特征構造和特征選擇兩個關鍵步驟。

一、特征構造

  1. 數據預處理:如標準化、歸一化等,以確保數據的一致性和可比性。
  2. 信號增強:應用濾波器或變換以增強數據中的有用信號并減少噪音。
  3. 局部特征提取:針對有序或結構化數據(如圖像、時間序列),提取局部模式或結構。

二、特征選擇

  1. 特征子集生成:使用搜索策略(如貪心搜索、遺傳算法等)從特征集中生成候選特征子集。
  2. 評估標準定義:確定用于評估特征子集質量的準則,如相關性、預測性能等。
  3. 評估標準估算:使用統(tǒng)計方法、機器學習模型等評估候選特征子集的性能。

二、特征值與特征向量的求解

構造特征多項式:當我們想要找出一個給定矩陣的特征值和特征向量時,首先需要構造特征多項式。

  1. 確定矩陣和變量
    假設我們有一個n×n的矩陣A,其元素為aij(其中i,j=1,2,…,n)。我們想要找到這個矩陣的特征值和特征向量。為此,我們引入一個變量λ,這個變量將代表特征值。
  2. 構造特征矩陣
    接下來,我們構造一個特殊的矩陣,稱為特征矩陣或特征多項式中的矩陣,記作A?λI。這里,I是n×n的單位矩陣,即對角線上元素為1,其余元素為0的矩陣。
  1. 形成特征多項式:特征多項式是一個關于λ的多項式,它是通過計算特征矩陣A?λI的行列式得到的。這個多項式記作f(λ),并定義為:f(λ)=det(A?λI)行列式det(A?λI)的計算涉及到對矩陣進行拉普拉斯展開,這會得到一個關于λ的n次多項式。

求解特征多項式:在構造了特征多項式之后,下一步是求解這個多項式以找出矩陣的特征值。

  1. 設置并求解特征方程:為了找到特征值,將特征多項式設置為零,即解方程 f(λ)=0。這個方程稱為矩陣 A 的特征方程。它的根就是 A 的特征值。求解特征方程可能涉及到使用代數方法(如因式分解、求根公式等)或數值方法(如牛頓法、二分法等),具體取決于多項式的復雜性和可解性。
  2. 找出特征值:特征方程的解,即特征多項式 f(λ)?的根,是矩陣 A 的特征值。特征值可能是實數或復數,這取決于特征多項式的具體形式。在某些情況下,特征值可能有重根,這意味著同一個特征值對應多個線性無關的特征向量
  3. 驗證特征值:在求得特征值后,可以通過將其代入原特征方程 (A?λI)x=0 來驗證它們的正確性。如果一個值使得方程有非零解,那么它就是特征值。

三、特征值與特征向量的應用

主成分分析(PCA):利用特征值與特征向量,將高維數據投影到低維空間,實現降維并保留主要特征。

核心思想:PCA使用原始數據的協(xié)方差矩陣的特征向量作為新的坐標軸(主成分),以降低數據維度并保留主要特征。

基本步驟

  1. 標準化數據,消除量綱差異。
  2. 計算協(xié)方差矩陣,衡量特征間的線性相關性。
  3. 求解特征值與特征向量:特征值代表數據方差的比例,特征向量是新坐標軸的方向。
  4. 選擇主成分:按特征值大小選擇前k個主成分。
  5. 數據投影:將原始數據投影到選定的主成分上,實現降維。

應用場景:降維、噪聲去除、特征提取、數據壓縮。

推薦系統(tǒng):特征值與特征向量在推薦系統(tǒng)中通過矩陣分解捕捉用戶偏好和項目特征,實現個性化推薦。

基本概念

推薦系統(tǒng)背景

特征值與特征向量的應用

推薦過程

  1. 數據準備:收集用戶歷史行為數據,構建用戶-項目矩陣。
  2. 矩陣分解:利用特征值與特征向量對用戶-項目矩陣進行分解。
  3. 隱因子提取:從分解后的矩陣中提取隱因子,表示用戶偏好和項目特征。
  4. 預測評分:基于隱因子模型預測用戶對未評分項目的評分。
  5. 生成推薦:根據預測評分排序,生成個性化推薦列表。

文章轉自微信公眾號@架構師帶你玩轉AI

上一篇:

神經網絡算法 - 一文搞懂Self-Attention和Multi-Head Attention

下一篇:

神經網絡算法 BERT是什么,一篇文章搞懂它
#你可能也喜歡這些API文章!

我們有何不同?

API服務商零注冊

多API并行試用

數據驅動選型,提升決策效率

查看全部API→
??

熱門場景實測,選對API

#AI文本生成大模型API

對比大模型API的內容創(chuàng)意新穎性、情感共鳴力、商業(yè)轉化潛力

25個渠道
一鍵對比試用API 限時免費

#AI深度推理大模型API

對比大模型API的邏輯推理準確性、分析深度、可視化建議合理性

10個渠道
一鍵對比試用API 限時免費