二級市場剛冷靜了一點,ChatGPT的風暴又開始席卷創投圈了。
2月10日晚,原美團聯合創始人王慧文的一條朋友圈在網絡上熱傳,這條朋友圈的截圖顯示王慧文提出的“人工智能宣言”如下:5000萬美元,帶資入組,不在意崗位、薪資和title,求組隊。
(資料圖片僅供參考)
網傳原美團聯合創始人王慧文的朋友圈截圖
兩天后,王慧文本人在社交平臺“即刻”上正式發文宣布,雖然目前還處在學習AI的階段,但計劃出資5千萬美元,設立北京光年之外科技有限公司,打造中國的OpenAI。王慧文在博文中稱,目前公司估值2億美元,下輪融資已有頂級VC認購2.3億美金。
“一石激起千層浪”,王慧文發布“AI英雄榜”后,2月14日,真格基金官方微信也發布了一則 “AI英雄帖”,稱正在尋找有能力引領新一代創業公司的創始人。
源碼資本創始合伙人曹毅在朋友圈也表示,行業也等到了老王出山。
而對于王慧文的這次AI創業,坊間議論最多的莫過于2億多美金要撬動中國版OpenAI這么大的項目,可行嗎?有哪些坑?又有哪些可能的商業化方向?
ChatGPT是怎么做出來的?
要做中國版的OpenAI,或許先要了解,OpenAI是怎么來的?它的“頭牌”ChatGPT又是如何做出來的。
從現在來看,通用大模型的研究是一個燒錢的游戲,2億美金可能不太夠。OpenAI成立于2015年,從可以查到的融資紀錄看,2016年-2022年,OpenAI的融資額可能超過30億美元。
與多數創業公司一樣,OpenAI在這些年中不太賺錢。甚至一開始完全是以非盈利機構的身份在開展AI研究。不賺錢的同時,OpenAI在研發方面還持續燒錢。有統計顯示,GPT-3的一次模型訓練費用可能超過百萬美元,上線之后的ChatGPT每天回答問題的成本也是百萬美元規模。
從研發的資金上來看,要在短時間內,用有限的資金復制OpenAI的成功恐怕并不容易。事實上,即便是資金量夠大,AI大模型也不是說做就能做的?!斑@玩意兒不是屯點錢然后花點時間就能干成的?!币晃籄I行業專家如是說。
通用大模型的研究需要海量數據和技術創新的積累。要做一款像ChatGPT一樣紅到爆炸的產品,起碼要分四步。
第一步,數據收集,通過爬取互聯網上的大量語料數據來訓練模型,語料數據包括了文本、對話和問答數據等。
第二步則是模型設計和數據預處理,OpenAI選擇了Transformer模型作為ChatGPT的模型結構,并對其進行了許多改進,以提高模型的語言生成能力。對語料數據進行預處理,包括語料的清洗、分詞和標注等步驟。
再之后是模型訓練和模型評估,使用大量的計算資源和高性能的訓練算法,對模型進行訓練,使其能夠生成高質量的語言文本。對模型的語言生成效果進行評估,并不斷對模型進行調整和優化,以保證生成的語言文本具有足夠的質量。
最后則是模型部署,將訓練完成的模型部署到生產環境,供用戶使用。
“如果你手里掌握著幾十篇大模型領域頂會論文的技術積累,能夠接受5年,甚至更長的時間,沒有盈利,并耐心完成幾百次AI試驗。同時,有微軟的Azure這樣實力雄厚的公司提供幾乎免費的云服務?!币晃籄I大模型專家向虎嗅表示,“(如果是這樣的話)要做出ChatGPT,或者成為OpenAI其實并不難?!?/p>
從頭做AI大模型道阻且長,需要耐心和長期投入。那么在資金量有限的情況下,能否先做一些能夠較為快速實現商業化的產品?
不做中國OpenAI,AI領域創業還有幾條路
如果不做OpenAI的話,筆者認為,以王慧文現有的資金量,5000萬美元的起步資金和未來2.3億美元的投資,在AI領域做出點事兒來,可能另外有幾條路徑可以嘗試。
最簡單的方法就是投資已有的大模型公司。不過,在技術和模型訓練方面的積累是這類公司的核心。目前,不論國內還是國外,在通用大模型研究方面技術實力較強的公司多數是隸屬于互聯網巨頭的AI部門或研究實驗室。在這方面,優秀的初創公司不多,處于投融資早期的好標的更是鳳毛麟角。
以5000萬美元的資金量,其實可以嘗試找一找在“文本生成模型、方法及裝置”技術方面專利較多的,或是在Transformer大模型研究方面論文較多的AI公司,參與他們的中后期融資。不過,要做早期投資或是自己創業的話,這種方式應該是不在考慮范圍內。
第二條路就是基于ChatGPT類的大模型產品做上層應用,目前這種模式可以說是通用大模型或是類ChatGPT產品方向比較靠譜的創業路徑了。畢竟在美國,已經有一些通用大模型的SaaS服務商,跑出了成功的商業落地模式。
成立于2020年的AI獨角獸Jasper的業務,就是通過調用OpenAI的GPT-3模型為用戶提供文生文寫作服務。雖然Jasper成立時間不長,但估值已達15億美元。
在API調用方面,OpenAI最近也被爆出可能會增強這項業務,給調用API的用戶提供更多優化和拓展空間。近期CNBC曾報道稱,有知情人士透露,OpenAI可能在未來針對ChatGPT推出類似SDK的服務,可以讓用戶自己開發基于大模型的聊天機器人,用戶可以根據需要引用特定來源的信息,以改進自己的聊天機器人。
OpenAI的官方公告中曾提到“正在積極探索低成本計劃、業務計劃和數據包的選項,以提高可用性?!?/p>
通用大模型正在逐步形成PaaS形式的平臺能力,基于平臺的SaaS服務,自然是一條很好的創業路徑。不過目前,這條路最大的問題是,在通用大模型領域可以提供體驗良好,且商業化成熟的API服務公司太少,且多為美國公司。而AI領域涉及大量創新科技和敏感數據,AI技術方面的跨國商務合作難免會收到數據安全,技術出口等方面的限制。
不過,國內公司在這方面也一直沒有落后,目前北京智源人工智能研究院的悟道大模型、百度文心大模型等在API服務方面均已開展了相關的實驗和探索工作。
最后,還有一條比較著眼未來的路徑,那就是做大模型應用的外延拓展。
“ChatGPT最好的應用場景肯定不會局限在搜索引擎,而是更個性化的智能語音助手?!币晃籒LP(自然語言識別)研發工程師告訴虎嗅,不管是Bing還是谷歌,在搜索領域的AI探索應該都處在試水階段。而基于大模型和自然語音、語意理解的語音助手肯定是未來的大方向。
目前,亞馬遜的人工智能助手Alexa就正在引入基于Transformer的大規模多語言模型AlexaTM(Alexa Teacher Models)。百度即將推出的“文心一言”則計劃與小度深度整合,打造針對智能設備場景的人工智能模型「小度靈機」。
除了生活需求,基于通用大模型的AI語音助手,更加適合做成專業領域的智能助理,比如給制造業、工程建設行業提供技術支持,或是在醫療專業知識方面,給醫生提供參考建議。
一位工業領域專家給虎嗅舉了這樣一個例子:你想在家里掛一幅壁畫,需要在墻上打個釘子。當施工工人拿著沖擊鉆,準備打眼兒的時候,他需要了解面前這堵墻的一些信息,例如墻里是否預埋了電路?是否有水管?要打眼的位置有沒有鋼筋?
這些信息要如何得知?要么問記得管線位置的主人,要么問裝修的工長,要么看裝修的圖紙。這時,如果前面的三個選項都不可用,那么有一個對你家里信息了如指掌的智能AI,提供這種信息查詢服務,不就大幅簡化這個過程了嗎?
雖然現在市面上不乏各種類型的語音助手,且它們已經能給人類提供很多幫助了,但多數此類產品只能理解預設的問題,回答預設的答案,很難提供通用性的幫助。
“ChatGPT還真是挺神奇的,什么都知道?!币晃缓娇疹I域的技術專家對虎嗅表示,他曾嘗試向ChatGPT詢問了一些航空領域的技術問題,比如:基于點云重構曲面的方法,飛機隱身特性和外形參數的關系。都沒能難倒ChatGPT,且得到的回答非常專業。
ChatGPT雖然知道的多,但是要真用它給專業技術領域提供支持還有個很大的問題,就是準確性。很多人在與ChatGPT對話過程中都遇到過“AI編造事實”的現象,中文互聯網上流傳比較廣泛的例子包括“林黛玉倒拔垂楊柳”“賈寶玉最應該與賈母在一起”等,在專業領域的應用很難容忍這種錯誤。
因此,類似ChatGPT的產品要想應用在專業領域,還需要解決穩定性和可靠性的問題,在優化AI、增強AI準確性方面或許可以給新的AI創業公司提供方向。
給通用大模型,或是類ChatGPT產品提供適合AI訓練的高質量行業知識庫,以及持續的知識更新服務,或許會成為未來的一項AI行業服務。在強化學習、自監督學習和行業數據包(知識庫)等方面做技術升級,幫助大模型公司對AI進行強化學習訓練,從而提高ChatGPT的準確性和可靠性。
順著這個方向再向下延展,在自動駕駛,生物制藥等領域也有很多基于通用大模型的創新機會。目前,百度文心、毫末智行、小鵬等國內公司已經開始在自動駕駛研究方面引入大模型技術,其中包括通過圖文弱監督預訓練模型,利用大模型數千種物體識別能力,擴充自動駕駛語義識別數據。以及利用ChatGPT的“人類反饋強化學習(RLHF)”技術改進自動駕駛決策等。
寫在最后
AI創業,尤其是大模型創業,從現在開始干,或許已經有些晚了。
從資本市場角度看,中國二級市場注意到ChatGPT的速度已經比一級市場和整個AI圈子晚了2個月。
如果技術方面看,OpenAI在2015年成立,谷歌在2017年發布Transformer,2018年OpenAI推出了GPT的第一個版本,2022年底,現在的ChatGPT才第一次上線。即使一家公司已經具備了OpenAI在2020年推出的大模型GPT-3的水平,現在開始也要3年的時間才能追上ChatGPT。
目前OpenAI的估值達290億美元,2019年微軟就對OpenAI投資了10億美元,并為之提供了大量基于Azure的云服務支持。
而在今天,對于沒有微軟這樣一棵大樹可以依靠的初創公司來說,最好的情況或許是,用2.3億美元給“中國的OpenAI”打開一個起步的局面,不過這個起步積累的階段,可能會非常長。
在ChatGPT之前,中國整體的AI創業并聚焦到大模型研究方面。多數公司都是在做實際場景落地的小模型,而大模型似乎更需要在沉寂中爆發,需要技術積累到一定程度的涌現?;⑿峤佑|過的國內的大模型初創公司的創始人都有一個共性的特點,他們普遍傾向于在技術實現了重大突破,或是找到典型應用場景之后再去講技術,講產品。
“大模型研究需要耐得住寂寞,厚積薄發?!币晃籄I公司創始人告訴虎嗅。