ChatGPT的迷人之處在于,它使得OpenAI變成消費AI產品的領銜者。
來源|多知網
作者|多知網
圖片來源|Pexels
11月30日, OpenAI發(fā)布了“網紅AI”對話模型ChatGPT。在過去的兩周,席卷了整個互聯(lián)網科技圈。
起因是美國人工智能公司OpenAI發(fā)布免費機器人對話模型ChatGPT(GPT-3.5系列),模型中首次采用RLHF(從人類反饋中強化學習)方式。模型目前處于測試階段,用戶與ChatGPT之間的對話互動包括普通聊天、信息咨詢、撰寫詩詞作文、修改代碼等。
ChatGPT功能看起來非常全面,被稱作“最強AI(人工智能)”,面世5天已有超過100萬用戶注冊。
ChatGPT到底是怎么回事?ChatGPT的很多功能看似可以跟教育領域結合,未來是否可以落地呢?對此,多知網對話了好未來AI團隊負責人。
以下為對話實錄:
多知網:ChatGPT的出現(xiàn)是否是AI技術一個質的突破?
好未來AI團隊負責人:ChatGPT主要有兩個亮點:
1)ChatGPT跟它的諸多前輩相比,針對用戶的提問已經可以做出讓人眼前一亮的回答,其中的部分回答是能夠實質性地幫到用戶。
比如,為打工人生成一份體面的周報;為程序員的代碼定位bug,并給出修復建議等。
2)ChatGPT的另一個亮點是它可以和用戶進行多輪對話,對話過程非常絲滑,這也是現(xiàn)有的聊天機器人做不到的。
與其他的使用大數據量訓練出來的大語言模型一樣,ChatGPT同樣也是經過先預訓練,后微調的過程訓練得到的對話模型。模型的訓練采用強化學習 RLHF(從人類反饋中強化學習)方式進行訓練,但是OpenAI這次在數據收集策略上與以往的大模型不同。RLHF的學習方式類似于Google search的人工反饋迭代機制,但是顯然這種更新方式長遠看更加直接有效。
首先,采用有監(jiān)督學習訓練得到一個初始模型。人類、AI培訓員分別作為用戶和AI,模擬人類和AI之間的對話。
此外,還創(chuàng)建了一個reward模型,將機器生成的回復由人類培訓員進行篩選,按照質量排序,挑出質量最優(yōu)的那個。
多知網:如何看待有關ChatGPT的討論?它目前有哪些想象空間和不足?
好未來AI團隊負責人: ChatGPT的問世,讓AIGC(AI-generated content,即AI生產內容))再次火爆。僅5天時間,ChatGPT就有100多萬用戶注冊。這些用戶紛紛在社交網絡等媒體上曬出"調戲"聊天機器人的互動,這已經成為了互聯(lián)網日常更新的熱梗,他們用它來寫“小學生”風格的作文、問奇怪的問題,這是在瘋狂探索它的功能“邊界”。
但作為底層模型的GPT-3,其實已經誕生兩年了,基于GPT-3的初創(chuàng)公司Jasper新獲得1.25億美元的融資,估值達到15億美元。與之不同的是,ChatGPT既免費,又好用。AIGC的革命早已掀起,當AI生成的藝術變得簡單、免費時,人類對此的興趣和意識也就出現(xiàn)了爆炸式的增長。
ChatGPT是免費的,這很關鍵。ChatGPT的迷人之處在于,它使得OpenAI變成消費AI產品的領銜者。另外,英語學習平臺「Speak」獲OpenAI領投2700萬美元B輪融資,為對話式口語練習提供了新的想象空間。
關于ChatGPT的一些想象空間:
ChatGPT的出現(xiàn),基本宣布了人工智能的對話模型開始在大范圍、細粒度問題上給出普遍穩(wěn)妥的答案,簡單地說,人工智能的大對話模型可以達到基本不犯錯誤的水平了。
現(xiàn)在,研究人員每天都在以飛速的方式向全世界提供著大量新功能,而企業(yè)和產品人員才剛剛開始消化這些新功能。
再往前想一步,當AI在現(xiàn)實世界中不再匱乏的時候,人類是否會被AI取代?
就像馬斯克說的那樣,“我們離強大到危險的AI不遠了”。OpenAI明年會推出更強大的GPT-4模型,據說可以通過圖靈測試。
多知網:ChatGPT完美嗎?
好未來AI團隊負責人:答案當然是:不。
ChatGPT有幾個致命缺陷:
1)輸入不能有錯。
在使用ChatGPT時,必須要精確,哪怕是一個詞的改變,答案都會完全不同。當輸入問題,有時會得不到答案,修改輸入后,就會得到答案。
2)無法推理,也無法思考。
對此,OpenAI坦承,由于ChatGPT學習到的知識只來自訓練數據中的統(tǒng)計規(guī)律,而不是任何類似人類對世界復雜和抽象系統(tǒng)的理解,因此該系統(tǒng)可能偶爾會產生不正確或誤導性的信息,并可能產生攻擊性或有偏見的內容。
3)此外,該機器人對2021年之后的世界知識“有限”,對于某些特定人群的問題也“知之甚少”。(訓練數據截止到2021年)。
多知網:ChatGPT未來有可能會開源使用嗎?中國大陸能夠使用嗎?
好未來AI團隊負責人:ChatGPT 的背后離不開大模型、大數據、大算力。ChatGPT 成為AIGC 里程碑的背后,是算力發(fā)展和數字時代形成的大數據所共同支持的大模型訓練,才能實現(xiàn)目前的效果。GPT系列的大模型訓練基本已經形成了算力,數據,模型的壟斷趨勢。要知道,在OpenAI的API上,最大的限制因素就是成本?;贠penAI的收費API構建的GPT-3系列應用在國外已經有300+,國內無法訪問OpenAI的GPT3服務,目前中國大陸用戶無法注冊ChatGPT服務賬號,對于OpenAI將來的開源,持悲觀態(tài)度。
不過,Meta(原Facebook)、Google等將來是可能會開源同類型模型的。
多知網:如果能使用,ChatGPT的一些技術是否可以應用在教育場景中?
好未來AI團隊負責人:個人認為,ChatGPT可以應用在教育的一些場景。教育的場景是多元化的,有語文、歷史等文科,數理化等理科,編程、科學等素質教育學科。ChatGPT在文科和素質學科場景下有著不錯的應用場景,例如語文中的作文素材生成、歷史事件的描述、編程的代碼示例等。然而,數理化這種需要嚴密的邏輯推理的學科,對對話的質量有著比較苛刻的要求,不然ChatGPT生成的內容會對學生的學習起到一定的反作用。近期,由于ChatGPT的低質量答案,已經遭Stack Overflow封禁。因此,在理科方面ChatGPT因為自身準確率的原因,發(fā)揮的空間不大。
目前,由于老師本身具體知識對錯的分辨能力,ChatGPT可能對于老師的工作的效率有提升,特別在備課的素材整理環(huán)節(jié),取其精華,去其糟粕。對于學生,個人能力的仍有限,ChatGPT對其是把雙刃劍。
多知網:ChatGPT是否有可能取代教育場景的某個場景?
好未來AI團隊負責人:以目前ChatGPT的能力,可以融入教育的一些場景,特別是學生的表達能力的鍛煉,例如低年級的寫作等。將ChatGPT與圖像、語音的能力結合,可以有更好的應用場景,例如口語表達能力練習,將ChatGPT于語音合成、語音評測結合,和學生展開多輪對話,并對發(fā)音和內容作出回饋和點評。
未來,隨著技術的不斷突破,ChatGPT的系列進階版本,完全可以進化成為一個學習中的助教角色,輔助學生方方面面的學習。
多知網:當前好未來AI技術的應用已經實現(xiàn)了哪些突破?
好未來AI團隊負責人:1)智慧教育AI開放平臺已經形成,科技部2030重大專項中,智慧教育平臺的建設已經形成。
2) 在線虛擬助教樣例
體驗鏈接:https://ai.100tal.com/virtual-assistant
多知網:如果AI在教育領域要有質的突破 需要邁過哪幾個檻?是數據?(有效、精準)還是其他?
好未來AI團隊負責人:AI在教育領域要有質的突破,還需要邁過很多個門檻,算法、算力、數據都需要有若干次突破才能達到所謂的質的突破。以算法為例,雖然目前AI算法在各個領域經常取得比較亮眼的結果,然而,更多的是大力出奇跡的結果,實質性的算法突破并未走向一條類似“摩爾定律”一樣的可預測持續(xù)提升軌道。像ChatGPT使用的Transformer是2017年提出的結構,經過了5年在各個領域遍地開花。單從序列長度視角來看,Transformer擅長搞定3位數token(0~999),至多4位數token(0~9999),更高位數的顯然需要更多的技術突破。另外,目前AI算法僅僅是數據驅動的,是統(tǒng)計機器學習的分支,是歸納法的集大成者。內置演繹邏輯的AI模型,能夠進行類人推理的突破尚未出現(xiàn)。