鍵.png)
使用這些基本 REST API 最佳實(shí)踐構(gòu)建出色的 API
本綜述旨在審查生成式人工智能研究的當(dāng)前趨勢(shì),特別是MoE、多模態(tài)和人工智能(AGI)的影響。研究方法包括使用關(guān)鍵詞進(jìn)行結(jié)構(gòu)化文獻(xiàn)搜索,定制識(shí)別2017年至2023年期間發(fā)表的相關(guān)文章。調(diào)查結(jié)果揭示了三個(gè)新興的研究領(lǐng)域——MoE、多模態(tài)和AGI,它們將深刻重塑生成式人工智能的研究格局。這項(xiàng)調(diào)查采用調(diào)查式方法,系統(tǒng)地繪制了一個(gè)研究路線圖,綜合并分析了生成式人工智能的當(dāng)前和新興趨勢(shì)。
生成式人工智能的里程碑式發(fā)展,從單用途算法到OpenAI的ChatGPT等多模式系統(tǒng),推動(dòng)了人工智能領(lǐng)域的變革,并對(duì)眾多領(lǐng)域產(chǎn)生了深遠(yuǎn)影響。
語(yǔ)言模型經(jīng)歷了一段變革之旅(圖3),從基礎(chǔ)統(tǒng)計(jì)發(fā)展到復(fù)雜神經(jīng)網(wǎng)絡(luò),支撐當(dāng)前LLM,追求更準(zhǔn)確地反映人類語(yǔ)言細(xì)微差別,推動(dòng)機(jī)器理解和生成界限。然而,能力增強(qiáng)的同時(shí),倫理和安全問題也出現(xiàn),促使人們重新評(píng)估其開發(fā)方式和使用目的。
LLM的進(jìn)步,包括GPT和BERT等模型的開發(fā),為Q的概念化鋪平了道路。具體而言,這些模型所特有的可擴(kuò)展架構(gòu)和廣泛的訓(xùn)練數(shù)據(jù)是Q提出的能力的基礎(chǔ)。例如,ChatGPT在情境理解和對(duì)話人工智能方面的成功為Q的設(shè)計(jì)原則提供了依據(jù),表明了朝著更復(fù)雜、情境感知和自適應(yīng)語(yǔ)言處理能力發(fā)展的軌跡。同樣,像Gemini這樣的多模式系統(tǒng)的出現(xiàn),能夠整合文本、圖像、音頻和視頻,反映了Q可以擴(kuò)展的進(jìn)化路徑,將LLM的多功能性與高級(jí)學(xué)習(xí)和路徑查找算法相結(jié)合,以獲得更全面的AI解決方案。
MoE雖然具有優(yōu)勢(shì),但也面臨技術(shù)挑戰(zhàn),如動(dòng)態(tài)路由復(fù)雜性和專家不平衡性。MoE可能提高性能,但不能解決AI倫理對(duì)齊問題。MoE的復(fù)雜性可能掩蓋決策過程,使得倫理合規(guī)性和價(jià)值觀對(duì)齊更加復(fù)雜。雖然MoE的轉(zhuǎn)變標(biāo)志著LLM的重大進(jìn)步,但安全性、倫理對(duì)齊和透明度仍是首要關(guān)注點(diǎn)。MoE架構(gòu)先進(jìn),但仍需跨學(xué)科研究和治理,以確保AI與社會(huì)價(jià)值觀和道德標(biāo)準(zhǔn)的一致性。
隨著多模態(tài)AI的誕生,人工智能發(fā)展迎來(lái)了變革時(shí)代,使機(jī)器對(duì)多種人類感官輸入和情境數(shù)據(jù)的解讀與互動(dòng)方式發(fā)生革命性變化。
在AI的快速演進(jìn)中,Q-star項(xiàng)目的投契能力,通過融合LLM、Q-learning和A(AStar算法),實(shí)現(xiàn)了重大突破。本節(jié)主要探討了AI系統(tǒng)從游戲中心化到Q*預(yù)期廣泛應(yīng)用的發(fā)展路徑。
生成式人工智能領(lǐng)域快速發(fā)展,需要全面分類。表1提供了該領(lǐng)域的綜合分類,涵蓋了關(guān)鍵研究領(lǐng)域和創(chuàng)新領(lǐng)域,作為理解現(xiàn)狀的基礎(chǔ)框架,幫助應(yīng)對(duì)模型架構(gòu)、訓(xùn)練方法、應(yīng)用領(lǐng)域、倫理影響和新興技術(shù)前沿的復(fù)雜性。
生成式人工智能模型架構(gòu)在Transformer、循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)、專家混合模型(MoE)和多模態(tài)模型四個(gè)關(guān)鍵領(lǐng)域取得重大發(fā)展。Transformer模型采用注意力機(jī)制實(shí)現(xiàn)增強(qiáng)的上下文處理,在NLP和計(jì)算機(jī)視覺領(lǐng)域表現(xiàn)優(yōu)異。RNN擅長(zhǎng)序列建模,在處理語(yǔ)言和時(shí)序數(shù)據(jù)任務(wù)中表現(xiàn)突出。MoE模型通過并行性提高效率,能夠處理大量參數(shù),處理復(fù)雜任務(wù)。多模態(tài)模型整合多種感官輸入,如文本、視覺和音頻,全面理解復(fù)雜數(shù)據(jù)集,特別是在醫(yī)學(xué)成像等領(lǐng)域具有變革性。
生成式人工智能模型的訓(xùn)練使用了四種關(guān)鍵技術(shù):監(jiān)督學(xué)習(xí)、無(wú)監(jiān)督學(xué)習(xí)、強(qiáng)化學(xué)習(xí)和遷移學(xué)習(xí)。監(jiān)督學(xué)習(xí)使用標(biāo)記數(shù)據(jù)集進(jìn)行準(zhǔn)確預(yù)測(cè),無(wú)監(jiān)督學(xué)習(xí)發(fā)現(xiàn)未標(biāo)記數(shù)據(jù)中的模式,強(qiáng)化學(xué)習(xí)在決策和自治系統(tǒng)中變得越來(lái)越重要,遷移學(xué)習(xí)強(qiáng)調(diào)多功能性和效率,允許模型將從一項(xiàng)任務(wù)獲取的知識(shí)應(yīng)用于不同但相關(guān)的任務(wù)。
人工智能的應(yīng)用領(lǐng)域廣泛,包括自然語(yǔ)言理解(NLU)、自然語(yǔ)言生成(NLG)、對(duì)話式人工智能和創(chuàng)意人工智能。NLU涉及語(yǔ)義分析、命名實(shí)體識(shí)別、情感分析等,對(duì)提高人工智能理解和分析語(yǔ)言的能力至關(guān)重要。NLG強(qiáng)調(diào)生成連貫、上下文相關(guān)的和創(chuàng)造性的文本響應(yīng),如聊天機(jī)器人、虛擬助手和自動(dòng)內(nèi)容創(chuàng)建工具。對(duì)話式人工智能致力于開發(fā)能夠平滑、自然和上下文感知人機(jī)交互的人工智能系統(tǒng)。創(chuàng)意人工智能跨越文本、藝術(shù)、音樂等領(lǐng)域,通過參與藝術(shù)內(nèi)容的生成,突破人工智能創(chuàng)意和創(chuàng)新潛力的界限。
隨著人工智能技術(shù)發(fā)展,道德考慮和法律合規(guī)性愈發(fā)重要,需開發(fā)“道德人工智能框架”,確保系統(tǒng)構(gòu)建強(qiáng)調(diào)道德、公平和透明度。人工智能系統(tǒng)中的偏差緩解是關(guān)鍵,包括平衡數(shù)據(jù)收集、實(shí)施算法調(diào)整和正則化技術(shù)以減少偏差。數(shù)據(jù)安全方面,需確保數(shù)據(jù)機(jī)密性、遵守同意規(guī)范以及防范漏洞。人工智能倫理關(guān)注公平、問責(zé)和社會(huì)影響,需倫理治理框架、多學(xué)科合作和技術(shù)解決方案。隱私保護(hù)方面,需維護(hù)數(shù)據(jù)機(jī)密性和完整性,采用匿名化和聯(lián)合學(xué)習(xí)等策略。
自監(jiān)督學(xué)習(xí)、元學(xué)習(xí)和微調(diào)等人工智能先進(jìn)技術(shù)增強(qiáng)了模型的自主性、效率和多功能性。自監(jiān)督學(xué)習(xí)使用未標(biāo)記數(shù)據(jù)訓(xùn)練模型,減少手動(dòng)標(biāo)記工作和模型偏差。元學(xué)習(xí)讓模型能快速適應(yīng)新任務(wù)和領(lǐng)域,適用于數(shù)據(jù)驅(qū)動(dòng)的環(huán)境。微調(diào)根據(jù)特定領(lǐng)域或用戶偏好定制預(yù)訓(xùn)練模型,提高準(zhǔn)確性和相關(guān)性。人類價(jià)值調(diào)整確保人工智能決策和行動(dòng)符合社會(huì)規(guī)范和道德標(biāo)準(zhǔn)。
生成式人工智能的新興趨勢(shì)包括多模態(tài)學(xué)習(xí)、交互式和協(xié)作式人工智能、AGI開發(fā)以及AGI遏制。多模態(tài)學(xué)習(xí)結(jié)合語(yǔ)言理解與計(jì)算機(jī)視覺和音頻處理,實(shí)現(xiàn)更豐富的多感官上下文感知。交互式和協(xié)作式人工智能旨在增強(qiáng)人工智能模型與人類協(xié)作的能力,改善用戶體驗(yàn)和效率。AGI開發(fā)專注于打造具有整體理解和復(fù)雜推理能力的人工智能系統(tǒng),而AGI遏制則關(guān)注確保這些系統(tǒng)在道德上符合人類價(jià)值觀和社會(huì)規(guī)范。
MoE模型架構(gòu)在Transformer語(yǔ)言模型上實(shí)現(xiàn)了突破,展示了卓越的可擴(kuò)展性和效率(圖 4)。Switch Transformer和Mixtra等最新模型證明了基于MoE的設(shè)計(jì)正在迅速改變跨語(yǔ)言任務(wù)的模型規(guī)模和性能。
MoE模型是一種神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)創(chuàng)新,通過稀疏驅(qū)動(dòng)的架構(gòu)提高可擴(kuò)展性和效率。它用多個(gè)專家網(wǎng)絡(luò)的稀疏MoE層替換密集層,每個(gè)專家處理特定子集,門控機(jī)制動(dòng)態(tài)分配輸入。MoE模型在預(yù)訓(xùn)練速度上優(yōu)于密集模型,但在微調(diào)上面臨挑戰(zhàn),需要大量?jī)?nèi)存進(jìn)行推理。MoE模型可以管理大型數(shù)據(jù)集,將模型容量放大一千倍以上,計(jì)算效率僅略有下降。其關(guān)鍵組件是稀疏門控專家混合層,促進(jìn)每個(gè)輸入實(shí)例的專家的動(dòng)態(tài)和稀疏激活,保持高計(jì)算效率。MoE模型的最新進(jìn)展凸顯了智能路由的優(yōu)勢(shì),使它們能夠擴(kuò)大模型大小,同時(shí)保持計(jì)算時(shí)間常數(shù)。MoE模型的核心概念和結(jié)構(gòu)在于其動(dòng)態(tài)路由和專業(yè)化能力,為擴(kuò)展神經(jīng)網(wǎng)絡(luò)并提高其在各種任務(wù)中的效率和適應(yīng)性提供了有前途的途徑。
MoE模型,特別是Mixtral 8x7B,預(yù)訓(xùn)練速度快,但微調(diào)困難,需要大量VRAM。最新技術(shù)顯著降低訓(xùn)練成本,最高節(jié)省五倍。DeepSpeedMoE優(yōu)化模型大小和推理,降低3.7倍模型大小,提高7.3倍的延遲和成本效率。分布式MoE訓(xùn)練和推理,如Lina,通過增強(qiáng)張量劃分優(yōu)化資源調(diào)度,大幅減少訓(xùn)練和推理時(shí)間。這些發(fā)展標(biāo)志著從密集到稀疏的MoE模型轉(zhuǎn)變,可擴(kuò)展AI應(yīng)用。
MoE模型中,負(fù)載平衡對(duì)于保證專家計(jì)算負(fù)載均勻分布至關(guān)重要,路由器網(wǎng)絡(luò)負(fù)責(zé)選擇專家處理令牌,影響模型穩(wěn)定性和性能。Zloss正則化技術(shù)通過微調(diào)門控機(jī)制,實(shí)現(xiàn)專家間更公平負(fù)載分配,提高模型性能,減少訓(xùn)練時(shí)間和計(jì)算量。專家容量管理策略通過設(shè)置專家處理代幣數(shù)量閾值,調(diào)節(jié)單個(gè)專家處理能力,避免瓶頸,確保模型運(yùn)行高效和精簡(jiǎn),改進(jìn)訓(xùn)練過程并提高復(fù)雜計(jì)算任務(wù)性能。
MoE模型的最新發(fā)展提高了大規(guī)模神經(jīng)網(wǎng)絡(luò)的效率,如DeepSpeed-MoE引入了高級(jí)并行模式,優(yōu)化了延遲和吞吐量,提高了模型效率。MoE模型在多語(yǔ)言任務(wù)和編碼等應(yīng)用中具有多種用途,表現(xiàn)出處理復(fù)雜任務(wù)的能力。Mixtral和Switch Transformer等模型受益于MoE計(jì)算與模型大小的次線性縮放,大幅提高精度。DeepSpeed-MoE包括模型壓縮技術(shù)和端到端MoE訓(xùn)練和推理解決方案,為大規(guī)模MoE提供服務(wù)。這些創(chuàng)新開辟了人工智能的新方向,用更少的資源訓(xùn)練和部署更高質(zhì)量的模型變得更廣泛。
MoE架構(gòu)的新研究旨在提升性能和效率,優(yōu)化超參數(shù),突破模型規(guī)模限制,保持遷移學(xué)習(xí)的專業(yè)化。自適應(yīng)稀疏訪問協(xié)調(diào)專家在推理到開放域?qū)υ挼娜蝿?wù)上合作。對(duì)路由機(jī)制的持續(xù)分析旨在平衡專家負(fù)載,減少冗余計(jì)算。MoE模型有望在語(yǔ)言、代碼生成、推理和多模式應(yīng)用方面取得新突破,對(duì)教育、醫(yī)療保健、財(cái)務(wù)分析等領(lǐng)域產(chǎn)生深遠(yuǎn)影響。
在新興的人工智能領(lǐng)域,令人期待的Q*項(xiàng)目是潛在突破的燈塔,預(yù)示著可能重新定義人工智能能力格局的進(jìn)步(圖5)。
Q*代表了從專業(yè)AI到整體AI的轉(zhuǎn)變,類似于人類智能。它集成了多種神經(jīng)網(wǎng)絡(luò)和機(jī)器學(xué)習(xí)技術(shù),能處理和合成多方面信息。通用適配器和其他模型讓Q*快速學(xué)習(xí)各領(lǐng)域知識(shí),并適應(yīng)新數(shù)據(jù)類型。Q*形成了全面、自適應(yīng)和多功能的人工智能模型。種智能可能超越人類認(rèn)知靈活性,對(duì)跨學(xué)科創(chuàng)新和復(fù)雜問題解決有深遠(yuǎn)影響。然而,Q*的能力也帶來(lái)了復(fù)雜的倫理和治理挑戰(zhàn),需要建立強(qiáng)有力的倫理框架和治理結(jié)構(gòu)來(lái)確保負(fù)責(zé)任和透明的人工智能發(fā)展。相應(yīng)的準(zhǔn)數(shù)學(xué)公式可以表示為:
其中,EGI:“增強(qiáng)通用智能”;NNi:一組多樣化的神經(jīng)網(wǎng)絡(luò)架構(gòu);MLTi:各種機(jī)器學(xué)習(xí)技術(shù);L :這些組件的集成;⊙:神經(jīng)網(wǎng)絡(luò)和機(jī)器學(xué)習(xí)技術(shù)之間的功能交互。
Q*是一種自學(xué)習(xí)和探索能力的重大演變,利用復(fù)雜的策略神經(jīng)網(wǎng)絡(luò)處理語(yǔ)言和推理任務(wù),增強(qiáng)自主學(xué)習(xí)能力。它采用強(qiáng)化學(xué)習(xí)技術(shù)如近端策略優(yōu)化(PPO),集成神經(jīng)網(wǎng)絡(luò)和尖端搜索算法,實(shí)現(xiàn)自主導(dǎo)航和吸收復(fù)雜信息。圖神經(jīng)網(wǎng)絡(luò)增強(qiáng)元學(xué)習(xí)能力,使Q*快速適應(yīng)新任務(wù)和環(huán)境,同時(shí)保留已學(xué)知識(shí)。Q*不僅能理解現(xiàn)有數(shù)據(jù),還能主動(dòng)尋求和綜合新知識(shí),有效適應(yīng)不斷變化的場(chǎng)景,無(wú)需頻繁再訓(xùn)練,實(shí)現(xiàn)了前所未有的自主性和效率。相應(yīng)的準(zhǔn)數(shù)學(xué)公式可以表示為:
其中,ASLE:“高級(jí)自學(xué)習(xí)和探索”;RL:強(qiáng)化學(xué)習(xí)算法,特別是近端策略優(yōu)化(PPO);PNN:策略神經(jīng)網(wǎng)絡(luò),適用于語(yǔ)言和推理任務(wù);SA:復(fù)雜的搜索算法,如樹或 Graph of Thought;GNN:將圖神經(jīng)網(wǎng)絡(luò)納入元學(xué)習(xí);×:RL 與 GNN 的跨功能增強(qiáng)。
Q*期望通過高級(jí)集成多個(gè)神經(jīng)網(wǎng)絡(luò),如價(jià)值神經(jīng)網(wǎng)絡(luò) (VNN),實(shí)現(xiàn)卓越的人類理解水平。它將深入研究人類交流的微妙之處,并通過先進(jìn)的自然語(yǔ)言處理算法和技術(shù),如 DeBERTa 等,增強(qiáng)其深度理解能力。這些算法使 Q*不僅能解釋文本,還能理解微妙的社會(huì)情感方面,如意圖、情感和潛在含義。結(jié)合情感分析和自然語(yǔ)言推理,Q*可以探索社會(huì)情感洞察的各個(gè)層面,包括同理心、諷刺和態(tài)度。這種超越當(dāng)前語(yǔ)言模型的理解水平將使Q在同理心、上下文感知交互方面表現(xiàn)出色,實(shí)現(xiàn)人工智能應(yīng)用程序中個(gè)性化和用戶參與的新梯隊(duì)。相應(yīng)的準(zhǔn)數(shù)學(xué)公式可以表示為:
其中,SHLU:“高級(jí)人類水平的理解”;V NN:價(jià)值神經(jīng)網(wǎng)絡(luò),類似于 AlphaGo 等系統(tǒng)中的評(píng)估組件;NLP:一組先進(jìn)的NLP算法;⊕:VNN評(píng)估與NLP算法的結(jié)合;alg:NLP 集中的各個(gè)算法。
Q*的高級(jí)常識(shí)推理發(fā)展將結(jié)合復(fù)雜邏輯和決策算法,可能融合符號(hào)人工智能和概率推理。目標(biāo)是使Q*具備人類常識(shí)理解,縮小人工智能與自然智能差距。Q*可能利用圖形結(jié)構(gòu)世界知識(shí),結(jié)合物理和社會(huì)引擎。通過大規(guī)模知識(shí)庫(kù)和語(yǔ)義網(wǎng)絡(luò),Q*可以有效應(yīng)對(duì)復(fù)雜社會(huì)和實(shí)際場(chǎng)景,使決策更接近人類期望。相應(yīng)的準(zhǔn)數(shù)學(xué)公式可以表示為:
其中,ACSR:“高級(jí)常識(shí)推理”;LogicAI 和ProbAI:分別是符號(hào)AI 和概率推理組件;WorldK:圖結(jié)構(gòu)世界知識(shí)的整合;⊙:這些要素的綜合運(yùn)算,進(jìn)行常識(shí)推理。
Q*整合現(xiàn)實(shí)世界知識(shí),使用先進(jìn)形式驗(yàn)證系統(tǒng),結(jié)合復(fù)雜神經(jīng)網(wǎng)絡(luò)和動(dòng)態(tài)學(xué)習(xí)算法,深入理解現(xiàn)實(shí)復(fù)雜性,超越傳統(tǒng)AI限制。可能采用數(shù)學(xué)定理證明技術(shù)確保推理準(zhǔn)確且有道德基礎(chǔ),通過道德分類器增強(qiáng)與現(xiàn)實(shí)世界交互的可靠性和責(zé)任感。相應(yīng)的準(zhǔn)數(shù)學(xué)公式可以表示為:
其中,ERWKI:“廣泛的現(xiàn)實(shí)世界知識(shí)整合”;FVS:形式驗(yàn)證系統(tǒng);NN:神經(jīng)網(wǎng)絡(luò)架構(gòu);LTP:數(shù)學(xué)定理證明邏輯和事實(shí)的有效性;EC:道德分類器的合并;?:知識(shí)綜合和道德統(tǒng)一的全面整合。
此外,Q*的推測(cè)能力可能重塑就業(yè)市場(chǎng)和勞動(dòng)力動(dòng)態(tài),其先進(jìn)功能可自動(dòng)執(zhí)行復(fù)雜任務(wù),導(dǎo)致工作要求轉(zhuǎn)變和新技能需求。這要求重新評(píng)估勞動(dòng)力戰(zhàn)略和教育模式,以適應(yīng)技術(shù)環(huán)境,確保勞動(dòng)力能與先進(jìn)AI系統(tǒng)互動(dòng)和補(bǔ)充。
AGI是人工智能的革命性飛躍,旨在軟件中體現(xiàn)人類認(rèn)知能力(圖6)。其發(fā)展基于先進(jìn)的自學(xué)習(xí)能力,使用策略神經(jīng)網(wǎng)絡(luò)和復(fù)雜強(qiáng)化學(xué)習(xí)技術(shù)進(jìn)行自主適應(yīng)。思想樹/思維圖等算法與這些網(wǎng)絡(luò)的集成,預(yù)示著未來(lái)AGI能獨(dú)立獲取和應(yīng)用跨領(lǐng)域知識(shí)。
AGI預(yù)計(jì)將改變自學(xué)和探索,通過結(jié)合PPO等方法,實(shí)現(xiàn)自主學(xué)習(xí)和解決問題的水平,超越當(dāng)前AI模型對(duì)訓(xùn)練數(shù)據(jù)的依賴,減少再訓(xùn)練需求,促進(jìn)動(dòng)態(tài)適應(yīng),對(duì)不斷變化的場(chǎng)景響應(yīng)。
AGI集成多種架構(gòu),復(fù)制人類認(rèn)知,通用適配器方法促進(jìn)信息同化,使AGI成為跨領(lǐng)域執(zhí)行任務(wù)的系統(tǒng),具有人類智力的適應(yīng)性。盡管AGI全部功能尚在推測(cè),但先進(jìn)醫(yī)療保健診斷的潛在應(yīng)用已顯現(xiàn),人工智能驅(qū)動(dòng)的預(yù)測(cè)醫(yī)學(xué)模型突破證明了AGI改變醫(yī)療診斷和治療的潛力。?
AGI預(yù)計(jì)將利用Transformer架構(gòu)算法,理解人類語(yǔ)言和社會(huì)情感的微妙之處,實(shí)現(xiàn)復(fù)雜、有同理心、上下文感知的交互,潛在應(yīng)用包括改變?nèi)斯ぶ悄芟到y(tǒng)通信方式和相互作用。?
符號(hào)AI和概率推理的集成,使AGI系統(tǒng)掌握常識(shí),縮小AI與自然智能的差距,增強(qiáng)AGI在現(xiàn)實(shí)世界的導(dǎo)航和響應(yīng)能力,實(shí)現(xiàn)與人類思維過程的緊密結(jié)合。?
AGI在形式驗(yàn)證系統(tǒng)指導(dǎo)下,整合現(xiàn)實(shí)世界知識(shí),具有準(zhǔn)確、有道德的輸出,能與現(xiàn)實(shí)世界復(fù)雜性進(jìn)行負(fù)責(zé)任互動(dòng)。預(yù)計(jì)AGI將應(yīng)對(duì)氣候變化等全球挑戰(zhàn),通過先進(jìn)數(shù)據(jù)分析和預(yù)測(cè)建模,在環(huán)境監(jiān)測(cè)、氣候預(yù)測(cè)和制定可持續(xù)解決方案方面發(fā)揮關(guān)鍵作用,助力全球生態(tài)努力。?
AGI的發(fā)展既帶來(lái)機(jī)遇,也面臨挑戰(zhàn)。雖然AGI有望提高創(chuàng)意生產(chǎn)力和創(chuàng)新跨模式生成技術(shù),但數(shù)據(jù)偏差、計(jì)算效率和道德影響等挑戰(zhàn)依然存在。在AGI開發(fā)中,需要采取平衡方法,重點(diǎn)關(guān)注數(shù)據(jù)管理、高效系統(tǒng)和社會(huì)影響。在AGI發(fā)展的背景下,專家警告不要高估當(dāng)前AI能力,強(qiáng)調(diào)AGI理論與實(shí)際差距。AGI設(shè)想的自主性和認(rèn)知能力使其區(qū)別于現(xiàn)有模型,未來(lái)AI系統(tǒng)可跨領(lǐng)域執(zhí)行任務(wù)。道德和技術(shù)突破對(duì)AGI成為社會(huì)變革力量至關(guān)重要。預(yù)測(cè)實(shí)現(xiàn)通用AI的時(shí)間表仍不確定,但認(rèn)識(shí)到障礙如計(jì)算能力限制和復(fù)制類人認(rèn)知的復(fù)雜性至關(guān)重要。追求通用AI過程中需要持續(xù)研究和倫理考慮,確保負(fù)責(zé)任和認(rèn)真的發(fā)展。
隨著 MoE、多模態(tài)和AGI等先進(jìn)人工智能發(fā)展的出現(xiàn),生成式人工智能研究的格局正在發(fā)生重大轉(zhuǎn)變。本節(jié)分析這些發(fā)展如何重塑生成人工智能的研究分類。
生成式AI的進(jìn)步引發(fā)了研究領(lǐng)域的變革,為此我們建立了一套標(biāo)準(zhǔn)來(lái)評(píng)估其影響(如表2)。這套標(biāo)準(zhǔn)深深植根于技術(shù)進(jìn)步與研究重點(diǎn)領(lǐng)域之間的動(dòng)態(tài)相互作用。我們的分析框架是在從新興到過時(shí)的梯度尺度上構(gòu)建的,反映了生成AI研究領(lǐng)域正在重塑的程度。我們將其分為五個(gè)不同的類別,進(jìn)行復(fù)雜的評(píng)估,同時(shí)承認(rèn)并非所有領(lǐng)域都會(huì)受到一致的影響。這種多層次的方法是基于技術(shù)顛覆的歷史模式和科學(xué)探究的適應(yīng)性。
本文討論了人工智能發(fā)展對(duì)科學(xué)研究的影響,將研究領(lǐng)域分為五類:新興方向、需要轉(zhuǎn)變方向的領(lǐng)域、仍然相關(guān)、可能變得冗余和本質(zhì)上無(wú)法解決。新興方向基于人工智能發(fā)展歷史,揭示新科學(xué)之謎和途徑。需要轉(zhuǎn)變方向的領(lǐng)域需吸收新興AI范式,全面改革傳統(tǒng)方法。仍然相關(guān)領(lǐng)域通過解決持久探究或固有適應(yīng)性,抵御AI創(chuàng)新浪潮。可能變得冗余領(lǐng)域面臨過時(shí),需前瞻性戰(zhàn)略和資源重新分配。本質(zhì)上無(wú)法解決挑戰(zhàn)提醒我們,AI追求受制于人類倫理和文化多樣性的復(fù)雜網(wǎng)絡(luò)。
本節(jié)概述了生成人工智能領(lǐng)域最新進(jìn)展,如MoE、多模態(tài)和AGI,對(duì)研究分類的影響。評(píng)估了模型架構(gòu)、學(xué)習(xí)方法等,揭示了各領(lǐng)域受技術(shù)進(jìn)步影響的程度。考慮了新研究方向、現(xiàn)有領(lǐng)域調(diào)整、方法論持續(xù)相關(guān)性和冗余等因素,概括在表3中。
隨著我們接近以Q*的出現(xiàn)為標(biāo)志的新時(shí)代,生成式 AI 的研究格局正在經(jīng)歷一場(chǎng)關(guān)鍵的轉(zhuǎn)變。教育部和多模態(tài)領(lǐng)域的新興研究重點(diǎn)主要集中于模型架構(gòu)中的多模態(tài)模型、新興趨勢(shì)中的多模態(tài)學(xué)習(xí)、AGI領(lǐng)域的多模態(tài)模型以及元學(xué)習(xí)等方面。隨著生成式人工智能的興起,多模態(tài) AI 技術(shù)正成為教育課程和技能發(fā)展的關(guān)鍵。同時(shí),人們?cè)絹?lái)越需要更新學(xué)術(shù)課程,以納入全面的人工智能素養(yǎng),并重點(diǎn)關(guān)注多模態(tài)人工智能技術(shù)。這種教育的演變旨在幫助未來(lái)的專業(yè)人士做好準(zhǔn)備,有效地參與和利用人工智能的進(jìn)步。AGI的新興研究重點(diǎn)在于強(qiáng)化學(xué)習(xí)、自然語(yǔ)言理解和生成、對(duì)話式人工智能和創(chuàng)意人工智能、偏見緩解以及類人適應(yīng)性等方面的研究。與AGI的這些發(fā)展相一致,人工智能研究資金和投資模式的顯著趨勢(shì)顯而易見。這種趨勢(shì)反映出人們對(duì)通用人工智能日益濃厚的興趣,同時(shí)也指導(dǎo)了未來(lái)研究的軌跡。
生成式人工智能技術(shù),包括 MoE、多模態(tài)和AGI,提出了獨(dú)特的計(jì)算挑戰(zhàn)。本節(jié)探討這些高級(jí)人工智能模型固有的處理能力要求、內(nèi)存使用和可擴(kuò)展性問題。
1)計(jì)算復(fù)雜性:生成式人工智能技術(shù),包括 MoE、多模態(tài)和AGI,提出了獨(dú)特的計(jì)算挑戰(zhàn)。本節(jié)探討這些高級(jí)人工智能模型固有的處理能力要求、內(nèi)存使用和可擴(kuò)展性問題。
2)生成式人工智能技術(shù)的現(xiàn)實(shí)應(yīng)用示例:生成式人工智能模型在現(xiàn)實(shí)場(chǎng)景中的應(yīng)用展示了其在醫(yī)療保健、金融、教育的變革潛力和挑戰(zhàn)。
1) 市場(chǎng)準(zhǔn)備情況:評(píng)估生成式人工智能技術(shù)的市場(chǎng)準(zhǔn)備情況涉及分析成本、可訪問性、部署挑戰(zhàn)和用戶采用趨勢(shì)。
2)現(xiàn)有行業(yè)解決方案:生成式人工智能正在通過提供創(chuàng)新解決方案和改變市場(chǎng)動(dòng)態(tài)來(lái)重塑各個(gè)行業(yè)。
1)技術(shù)限制:識(shí)別和解決生成人工智能模型的技術(shù)限制對(duì)于其先進(jìn)性和可靠性至關(guān)重要。
2)增強(qiáng)生成式人工智能實(shí)用性的未來(lái)研究方向:生成式人工智能的未來(lái)研究應(yīng)側(cè)重于解決當(dāng)前的局限性并擴(kuò)展其實(shí)際應(yīng)用。
ChatGPT等AI工具的快速商業(yè)化和采用,推動(dòng)了人工智能領(lǐng)域預(yù)印本的激增(圖 7),帶來(lái)了學(xué)術(shù)挑戰(zhàn)。這種快速發(fā)展導(dǎo)致學(xué)術(shù)交流出現(xiàn)瓶頸,而由AI工具生成的手稿和預(yù)印本已從計(jì)算機(jī)科學(xué)擴(kuò)展到其他學(xué)科,對(duì)傳統(tǒng)的同行評(píng)審過程和預(yù)印本生態(tài)系統(tǒng)構(gòu)成挑戰(zhàn)。當(dāng)前研究時(shí)代,知識(shí)呈指數(shù)級(jí)增長(zhǎng),學(xué)術(shù)文獻(xiàn)快速擴(kuò)展,對(duì)研究人員進(jìn)行證據(jù)綜合提出挑戰(zhàn)。學(xué)術(shù)界面臨人工智能研究快速發(fā)展帶來(lái)的“混亂”,需緊急討論應(yīng)對(duì)策略。需探索新的同行評(píng)審和研究傳播模式,如社區(qū)驅(qū)動(dòng)審查流程、增強(qiáng)可重復(fù)性檢查、出版后審查和糾正,以及整合自動(dòng)化工具和人工智能輔助審查流程。在快速發(fā)展的科研領(lǐng)域,預(yù)印本生態(tài)系統(tǒng)與傳統(tǒng)同行評(píng)審系統(tǒng)相結(jié)合是必要的,可以創(chuàng)建一個(gè)混合模型(圖8),確保學(xué)術(shù)嚴(yán)謹(jǐn)性和質(zhì)量保證。
參考文獻(xiàn):《From Google Gemini to OpenAI Q* (Q-Star): A?Survey of Reshaping the Generative Artificial?Intelligence (AI) Research Landscape》
文章轉(zhuǎn)自微信公眾號(hào)@算法進(jìn)階
對(duì)比大模型API的內(nèi)容創(chuàng)意新穎性、情感共鳴力、商業(yè)轉(zhuǎn)化潛力
一鍵對(duì)比試用API 限時(shí)免費(fèi)