
LLM的預訓練任務有哪些
ChatGPT以廣泛的應用場景和快速響應著稱,其生成內容的準確性和邏輯性令人印象深刻。Claude則更加突出在復雜問題處理和查詢優化方面的表現,而Gemini則依賴Google的強大數據支持,在特定任務如搜索相關內容方面有獨特優勢。
在數據分析、代碼生成和業務邏輯處理等領域,選擇適合的AI助手至關重要。通過比較它們在SQL技能上的表現,我們可以更好地了解哪個模型最適合特定任務。
SQL是數據分析師和科學家必備的技能,其簡潔的語法使其成為評估大語言模型(LLMs)能力的理想工具。本次測試主要從查詢準確率、效率、格式化和可解釋性四個方面,對ChatGPT、Claude和Gemini進行對比分析。
測試分為三個類別:
為了保證測試數據的公平性,我們為三款AI生成了相同的合成數據集,并上傳至各自平臺,觀察其加載和處理能力。
這個問題需要對同一表進行兩次連接并對多個過濾器進行解釋。
SELECT Trips.Id AS TripId
FROM Users
JOIN Trips ON Users.Id = Trips.UserId
WHERE Users.Status = 'Active' AND Trips.Distance > 50;
這個問題需要使用窗口函數獲取每個部門的前三高薪員工。
SELECT DepartmentId, EmployeeId, Salary
FROM (
SELECT *, ROW_NUMBER() OVER(PARTITION BY DepartmentId ORDER BY Salary DESC) AS Rank
FROM Employees
) AS Ranked
WHERE Rank <= 3;
該問題需要合并兩次聚合的結果。
WITH MaxRatings AS (
SELECT MovieId, MAX(Rating) AS MaxRating
FROM Reviews
GROUP BY MovieId
)
SELECT Movies.Title, MaxRatings.MaxRating
FROM Movies
JOIN MaxRatings ON Movies.Id = MaxRatings.MovieId;
我們生成了四個合成數據集,并嘗試上傳到AI平臺。ChatGPT成功加載了所有數據集,Claude處理了部分縮減的數據,而Gemini未能正確加載數據。
我們要求AI編寫SQL查詢,計算美國用戶的每月訂單總金額。
SELECT DATE_TRUNC('month', OrderDate) AS Month, SUM(OrderAmount) AS TotalSales
FROM Orders
WHERE Country IN ('United States', 'US')
GROUP BY Month;
最后一輪測試對三款AI提出了較高的要求,需優化復雜SQL查詢以提高性能。Claude在代碼優化和效率提升上表現出色,ChatGPT次之,而Gemini的優化能力相對有限。
在問題解決能力上,Claude以出色的效率和準確性領先,ChatGPT緊隨其后,而Gemini因部分錯誤失分。
ChatGPT使用faker包生成了真實感極強的數據集,而Claude和Gemini分別在生成數據的真實性和數量上有所欠缺。
ChatGPT支持更大文件的上傳,Claude對文件大小和行數有所限制,Gemini無法直接上傳數據。
通過以上對比,我們可以發現,ChatGPT、Claude和Gemini各有優劣。在選擇AI助手時,需根據具體任務需求進行權衡。