各國(guó)政府正在加強(qiáng)對(duì)AI的監(jiān)管和投資。
由李飛飛聯(lián)合領(lǐng)導(dǎo)的斯坦福大學(xué)以人為本人工智能研究所(Stanford HAI)發(fā)布《2025年人工智能指數(shù)報(bào)告》(Artificial Intelligence Index Report 2025)。這份長(zhǎng)達(dá)456頁(yè)的報(bào)告,深入剖析了2024年全球人工智能行業(yè)的發(fā)展態(tài)勢(shì),揭示了12大關(guān)鍵趨勢(shì)。
李飛飛被譽(yù)為“AI教母”,現(xiàn)為斯坦福大學(xué)計(jì)算機(jī)科學(xué)教授,美國(guó)工程院院士,美國(guó)國(guó)家醫(yī)學(xué)院院士。她的專業(yè)領(lǐng)域是計(jì)算機(jī)視覺(jué)和認(rèn)知神經(jīng)科學(xué)。李飛飛倡導(dǎo)以人為本的AI理念。其團(tuán)隊(duì)匯聚了來(lái)自多學(xué)科領(lǐng)域的頂尖專家,長(zhǎng)期專注于跟蹤、研究AI發(fā)展動(dòng)態(tài)。
最新報(bào)告的12大趨勢(shì)中,涉及AI基準(zhǔn)測(cè)試成績(jī)的變化、AI應(yīng)用加速與投資增長(zhǎng)、中美AI模型差距、公眾對(duì)AI的態(tài)度轉(zhuǎn)變、AI硬件發(fā)展?fàn)顩r分析等內(nèi)容。
報(bào)告提到,人工智能在高要求基準(zhǔn)測(cè)試中的表現(xiàn)持續(xù)提升。2023 年,研究人員推出了新的基準(zhǔn)——MMMU、GPQA 和 SWE-bench——來(lái)測(cè)試高級(jí) AI 系統(tǒng)的極限。僅僅一年后,性能就大幅提升:MMMU、GPQA 和 SWE-bench 上的得分分別上升了 18.8、48.9 和 67.3 個(gè)百分點(diǎn)。除了基準(zhǔn)之外,AI 系統(tǒng)在生成高質(zhì)量視頻方面取得了重大進(jìn)展,在某些情況下,語(yǔ)言模型代理甚至在時(shí)間預(yù)算有限的編程任務(wù)中勝過(guò)人類。
人工智能商業(yè)應(yīng)用在加速:78% 的組織報(bào)告稱 2024 年使用人工智能,高于前一年的 55%。與此同時(shí),越來(lái)越多的研究證實(shí),人工智能可以提高生產(chǎn)力,并且在大多數(shù)情況下有助于縮小勞動(dòng)力隊(duì)伍的技能差距。
美國(guó)私營(yíng)部門(mén)對(duì)AI的資金投入依然占據(jù)領(lǐng)先地位。2024年,美國(guó)私營(yíng)部門(mén)對(duì)AI的投資增長(zhǎng)到1091億美元,生成式AI吸引全球私營(yíng)投資339億美元,比2023年增長(zhǎng)18.7%。78%的組織報(bào)告稱在使用AI,比前一年增長(zhǎng)55%。
中國(guó)大模型正在加速發(fā)展,與美國(guó)的差距縮小。2024 年,美國(guó)機(jī)構(gòu)開(kāi)發(fā)了 40 個(gè)值得關(guān)注的 AI 模型,遠(yuǎn)遠(yuǎn)超過(guò)中國(guó)的 15 個(gè)和歐洲的 3 個(gè)。雖然美國(guó)在數(shù)量上保持領(lǐng)先,但中國(guó)模型已迅速縮小質(zhì)量差距,在MMLU和HumanEval等主要基準(zhǔn)上的性能差異從2023年的兩位數(shù)縮小到2024年的接近相等。與此同時(shí),中國(guó)在 AI 出版物和專利方面繼續(xù)保持領(lǐng)先地位。
各國(guó)政府正在加強(qiáng)對(duì)AI的監(jiān)管和投資,2024年,美國(guó)聯(lián)邦機(jī)構(gòu)出臺(tái)了59項(xiàng)與AI相關(guān)的法規(guī),是2023年的兩倍多。全球范圍內(nèi),自2023年以來(lái),75個(gè)國(guó)家的AI立法提及率上升了21.3%,自2016年以來(lái)增長(zhǎng)了9倍。各國(guó)政府也在進(jìn)行大規(guī)模投資,如加拿大承諾投資24億美元,中國(guó)啟動(dòng)了475億美元的半導(dǎo)體基金。
全球AI樂(lè)觀情緒上升,但地區(qū)間有所差異。在中國(guó)(83%)、印度尼西亞(80%)和泰國(guó)(77%)等國(guó)家,大多數(shù)人認(rèn)為人工智能產(chǎn)品和服務(wù)是利大于弊的。相比之下,加拿大(40%)、美國(guó)(39%)和荷蘭(36%)等地的樂(lè)觀情緒較低。不過(guò),自2022年以來(lái),包括德國(guó)(+10%)、法國(guó)(+10%)、加拿大(+8%)、英國(guó)(+8%)和美國(guó)(+4%)在內(nèi)的幾個(gè)先前持懷疑態(tài)度的國(guó)家,樂(lè)觀情緒有所提升。
人工智能變得更加高效、經(jīng)濟(jì)實(shí)惠且易于獲取。由越來(lái)越強(qiáng)大的小型模型驅(qū)動(dòng),在達(dá)到GPT-3.5水平上的系統(tǒng)推理成本在2022年11月到2024年10月間下降了280倍。在硬件層面,成本每年下降30%,而能效每年提高40%。開(kāi)放權(quán)重模型也在縮小與封閉模型的差距。
在AI教育方面,AI和計(jì)算機(jī)科學(xué)教育正在擴(kuò)大,但普及程度仍不夠。如今,已有2/3的國(guó)家提供或計(jì)劃提供K-12計(jì)算機(jī)科學(xué)教育,是2019年的兩倍,其中非洲和拉丁美洲取得的進(jìn)展最大。在美國(guó),擁有計(jì)算機(jī)學(xué)士學(xué)位的畢業(yè)生人數(shù)在過(guò)去10年中增加了22%。然而,在許多非洲國(guó)家,由于電力等基礎(chǔ)設(shè)施的不足,獲得計(jì)算機(jī)學(xué)位的機(jī)會(huì)仍然有限。
工業(yè)界依然是研發(fā)AI最重要的領(lǐng)域,2024年,近90%的著名人工智能模型來(lái)自工業(yè)界,高于2023年的60%,而學(xué)術(shù)界仍然是高引用率研究的首要來(lái)源。模型規(guī)模持續(xù)快速增長(zhǎng)——訓(xùn)練計(jì)算每5個(gè)月翻一番,數(shù)據(jù)集每8個(gè)月翻一番,耗電量每年翻一番。
AI對(duì)科學(xué)界的影響與日俱增,兩項(xiàng)諾貝爾獎(jiǎng)表彰了AI在深度學(xué)習(xí)(物理學(xué))和蛋白質(zhì)折疊(化學(xué))中的應(yīng)用,圖靈獎(jiǎng)則表彰了AI在強(qiáng)化學(xué)習(xí)方面的開(kāi)創(chuàng)性貢獻(xiàn)。
復(fù)雜推理依然存在挑戰(zhàn)。人工智能模型擅長(zhǎng)解決國(guó)際數(shù)學(xué)奧林匹克等問(wèn)題,但在 PlanBench 等復(fù)雜推理基準(zhǔn)測(cè)試中仍舉步維艱。即使存在可證明的正確解決方案,它們也常常無(wú)法可靠地解決邏輯任務(wù),這限制了它們?cè)诰戎陵P(guān)重要的高風(fēng)險(xiǎn)環(huán)境中的有效性。