
文心一言寫代碼:代碼生成力的探索
1月25日,賈揚清在推特上展示了他的對話式搜索引擎demo,這一使用Python實現的項目僅用了500行代碼。該項目的發布迅速引起了Perplexity公司的注意。Perplexity是一家估值5.2億美元的公司,其創始人Aravind Srinivas指責賈揚清抄襲其前端代碼。然而,Lepton Search以其簡潔和速度而受到用戶的高度評價。
面對Perplexity的指責,賈揚清迅速做出回應,并在一個周末內將代碼開源。這一舉動不僅展示了他的技術自信,也表明了他對開源社區的支持。開源后的代碼在短短一天內便登上了Github熱榜,獲得了4500顆星,并被多個開發者集成到他們的項目中,這進一步證明了其技術的價值。
對話式搜索引擎的實現看似復雜,但賈揚清的500行代碼卻揭示了其核心技術。代碼的基本流程包括:
在實現過程中,搜索的來源可以是Bing或Google的API,甚至是自建數據庫。大模型的選擇則可能是Mistral、Llama或OpenAI的API。通過這些技術的組合,賈揚清展現了如何高效地利用現有資源來實現創新。
賈揚清的項目被認為是RAG(檢索增強生成)技術的成功應用。在RAG技術中,檢索(R)與生成(G)的關系尤為重要。賈揚清指出,在實現過程中,R的重要性甚至超過了G,這一發現為未來對話式搜索引擎的開發提供了新的視角和思路。
賈揚清的項目與Perplexity的技術理念有相似之處,這種相似性可能源于Google和OpenAI合作的論文《FreshLLMs: Refreshing Large Language Models with Search Engine Augmentation》。該論文提出的新思路為如何結合實時搜索能力和預訓練模型提供了理論基礎。
盡管Perplexity對賈揚清的項目提出了抄襲指責,但事實上,這一指責反而揭示了對話式搜索引擎的技術門檻并不如想象中高。Perplexity在技術策略上的保留態度,可能是為了掩蓋其技術的普適性,而不是其獨特性。
Lepton Search在開源后迅速吸引了大量用戶的關注,這一現象表明其在用戶體驗上的優勢。賈揚清和團隊不斷進行功能迭代,增加了多語言支持和社交媒體分享功能,使其成為一個更具吸引力的產品。
在對話搜索之外,Perplexity和Lepton都在API推理服務領域展開競爭。賈揚清的公司在多個關鍵指標上表現優異,并在API推理榜單上取得了領先地位,這表明Lepton在這一領域具有強大的競爭力。
賈揚清通過500行代碼不僅展示了對話式搜索引擎的技術潛力,也揭示了開放和創新在技術發展中的重要性。盡管面臨指責和競爭,但他的項目為行業注入了新的活力,并為其他開發者提供了寶貴的參考。
問:賈揚清的500行代碼是如何實現對話式搜索引擎的?
問:Lepton Search與Perplexity的主要區別是什么?
問:RAG技術在對話式搜索引擎中的作用是什么?
問:賈揚清的開源策略對項目有什么影響?
問:Lepton在API推理服務領域的表現如何?