2023 年,OpenAI 引領了科技圈久違的興奮,創業者感到有奔頭的同時,卻也隨著 AI 模型的一再進化,感受到了壓力。
在春節前夕,算力、模型、應用等領域的大模型創業者,齊聚在一場創業者社群的活動上,切磋各自在不斷進化的大模型中找到的空間。面對呼之欲出的 GPT-5 和 Llama3,他們也有新的思考。
站在模型層面,差異化很難,方向幾乎是明確的——增強推理能力和多模態。也有技術路線的分野,比如阿里云通義實驗室智能對話負責人李永彬透露,目前在思考是否能把搜索增強這樣的外掛能力,做到模型里,進一步提升模型的可用性。
但站在應用層,多的是非共識和機會。比如,跑得最快的一批創業者,已經實現了一定程度的商業閉環,得出的結論甚至有些意外:「大模型含量」不宜過高。
這群下場做大模型的實干家也談到了行業內最真實的情況。智譜 AI COO 張帆道出,今天的榜單其實不反映真實問題,GPT-4 可能連榜單前 10 名都進不了。他認為,這種情況下,2024 年一定會發生從模型為王到價值為王的變化。
百川智能聯合創始人洪濤則更關心成本,他表示,一年下來苦哈哈做各種私有化項目,到底掙多少錢,其實內心沒把握。在這一點上,大家也探討了云計算廠商能否在整個行業沒有商業模式之前,降低算力成本的路徑,讓該花的錢少一點。
近日,阿里云創業者社群在北京舉辦創業者之夜活動|阿里云
在「創業者之夜」,各位大模型的先行者分享了各自對行業的「預言」;AI 應用的創業者們,也分享了對于大模型的「焦慮」。
2024,大模型往哪走?
2023 年,阿里云李永彬游走于大模型業務一線。一整年忙活下來,他發現:最初,大模型讓「AI 解決問題」這件事的效果從 20 分提高到 60 分,就能夠驚艷所有人,但是對于很多問題,60 分和 0 分差不多。因為在一些應用場景,沒辦法拿 60 分的產品上線,效果到不了 90 分,客戶可能也不會買單。
這也是 2023 年大模型創業者們共同的體感。從興奮回歸到理性,背后是共同的困惑——大模型還不夠通用,它會不會像上一波 AI 一樣,盡管展現出驚人的能力,但落到場景時仍舊需要逐個項目定制化?
大家自然就產生了 2024 年對大模型的第一個期待——通用能力進一步提升,甚至期待模型在一些復雜場景能直接做到 90 分。
這種可能性不是無跡可尋。IDEA 研究院講席科學家張家興認為,從目前 OpenAI、谷歌等大廠對下一代大模型的判斷,大模型能解決復雜問題會成為接下來進化的方向。
就在兩周前,谷歌 DeepMind 推出的 AlphaGeometry(阿爾法幾何)AI 系統,已經能在 30 道國際奧數題中做對 25 道,接近人類水平(人類金牌得主平均做對 25.9 道)。像這樣能解決奧數級別的幾何問題,被視為邁向更先進、更通用 AI 的重要里程碑。在 IDEA 研究院張家興看來,「奧數就是復雜問題,問題的描述很復雜,求解過程、證明過程也很復雜」,能解決復雜問題是模型變得更通用的表現之一。
阿里云創業孵化事業部總經理李中雨認為,從 GPT-5 目前釋放的信息看,模型的泛化能力在提升,解決復雜任務的能力也在提升,甚至接下來 GPT-5 可以解決 15%-20% 人類的任務。
在提升模型的通用性上,也有新思路。
一位來自模型廠商的與會者分享,最近絕大多數企業落地大模型時都會用到 RAG(搜索增強),從而將大模型和私有數據結合起來,提升模型可用性。但作為模型側的開發者,也在探索算法創新,通過算法創新提高模型的學習能力,把像 RAG 這樣的外掛知識庫囊括進去,從而減少對模型數據訓練的依賴。換言之,通過算法創新,以期讓模型像人類學習一樣,看一本書就可以理解知識,而不需要看所有書來理解一個問題。
在這一點上,GPT-5 提供了很好的示范。智譜 AI 張帆認為,更強大的推理能力讓處理復雜任務成為可能,同時也帶來了非常強的泛化能力。模型會在各個行業場景都能有很好的 Zero-Shot、One-Shot 能力(給模型一個例子甚至不給例子,它就可以涌現出對應的能力),從而減少對訓練數據的依賴。通過小數據集的訓練,就可以把模型引入到更多更垂直的領域。如此一來,可以降低客戶使用模型的門檻,增加其可用性。
除了通用性,多模態能力也被期待在 2024 年能有更大突破。
去年底,從 GPT-4 到谷歌 Gemini,已經充分展現了大模型的演進,拓展以大語言模型為核心的更大體系的 AI,必然會涉及多模態能力。
張家興預判,就像 2022 年底 ChatGPT 的出現,導致 2023 年所有人都在做大語言模型一樣,2024 年整個業界可能會聚焦多模態。這并不只是因為多模態能帶來更強的能力,更因為多模態的應用場景多,在端側比如車和機器人的場景,多模態非常重要。
在多模態的技術實現上,也有一些技術融合的新視角。
在多模態領域做探索,中科深智創始人成維忠注意到前段時間圖靈獎得主 Lecun 的一個采訪,他并不認同現在大家做多模態的技術路線——把圖片視頻還原為像素,Lecun 認為未來的多模態訓練是應該以表征事件為主。
在這一話題的討論上,與會者一方面認為,ChatGPT 也不是規劃出來的,技術路線可能是干出來的,能用今天的技術落地往前走、不斷改進是前提。另一方面,盡管路線之爭的存在,但也不是不能調和的,有很多中間的路線可以走,是連續的。比如,張家興分享了 IDEA 內部的實踐,稱稱目標識別等計算機視覺特征是可以作為多模態大模型的輸?,實踐下來的效果?常好。
從左到右分別是阿里云創業孵化事業部總經理李中雨;智譜 AICOO 張帆;百川智能聯合創始人、總裁洪濤;元璟資本管理合伙人劉毅然;IDEA 研究院認知計算與自然語言講席科學家張家興、通義實驗室對話智能負責人李永彬 | 阿里云
2024,大模型如何落地?
如前所述,對于大模型接下來的趨勢預判,推理能力和多模態能力的提升成為清晰、明確的目標。但談到 AI 應用,更多是非共識的思考,創業者一致認為需要在非共識中尋找機會。
就拿大模型落地應用要考慮的第一件事——模型選型來說,目前也還沒有達成共識。智譜 AI 張帆笑稱,以現在模型評測卷出天際的背景下,「OpenAI 的 GPT-4 都排不到模型評測榜單的前兩頁」。
的確,幾個月以來,不少模型創業者都向極客公園表達了類似的觀察:模型評測榜單不反映真實情況。在「模型為王」的愿景下,的確會出現提前讓模型「看題」、「背題」來獲得高分的情況。但更重要的是,當涉及到千行百業的不同場景,很難用一套標準來評價模型的可用性。
實踐過后,大家更認同在一個個真實的具體場景里不斷測試評估。比如,獵聘在+大模型的探索上,最大的研發成本就花在測試不同的模型上。獵聘 CEO 戴科彬表示,對于什么場景用什么模型、多大尺寸的模型最高效,沒有標準答案,就連評價標準也要根據情況調整。
除了模型選型,模型落地也開始出現一些可操作的判斷標準。無論是在原有應用里+大模型,還是一些 AI Native 應用的探索,都出現了能形成商業閉環的可能性。
這里首先要考慮大模型技術分布的獨特性。元璟資本管理合伙人劉毅然認為,AI 應用存在巨大的不確定和非共識機會,這與這一波 AI 技術的特點有關。
移動互聯網時代,應用的底層基礎設施是一樣的,都是基于蘋果 iOS 和 LBS 定位來做產品。相比之下,大模型應用則是一個個垂直優化的過程,底層模型哪部分用開源版、哪部分微調、調整哪些問題,再視情況優化功能和應用。創業者需要充分懂技術,再做產品的封裝,這個過程存在很大優化空間和機會。
這就提出了探索 AI 應用的第一條原則——TPF(技術產品匹配),百川智能創始人王小川在極客公園創新大會 2024 大會上曾提到過這個名詞,指的是在現有大模型技術不完美時,先明確「這樣一個技術適合什么樣的產品」,而不是產品經理洞察市場有什么需求,回來就開始做。
因為從大模型到 AI 應用,「今天最大的挑戰不是找到『什么不行』,這件事不難,人人都能夠做到。難的是能找到它『什么行』,找到模型能力和業務的最大公約數,變成正向循環。」智譜 AI 張帆認為,這會成為 2024 年大模型落地的重點。
盡管這樣的實踐可能不是投資人尋找的 AI Native 應用,但是務實地看,通過在可用場景里,基于模型和工程化手段把大模型應用產品化,數據和客戶反饋的飛輪會推著 AI 應用向前迭代。百川智能聯合創始人洪濤提到了一個有趣的觀察,做 AI 應用的創業者甚至覺得以當前大模型技術成熟度,AI 應用「含大模型量」不宜過高。
在游戲領域,昆侖萬維集團董事長兼 CEO 方漢有類似的觀察。通過純 AI 大模型直接生成 3D 游戲內容,會造成面數特別多、規格不匹配等問題。這時如果換一個思路,把傳統的一些簡單動畫工具,融合進 AI 大模型的工作流之后,產品的可用性就大大提高。
在他看來,什么好用就用什么,拼出對用戶最有價值的工作流,這是作為 AI 應用開發商的價值所在。
看得出,在原有應用里+大模型、探索更好的工作流,是把大模型智力變成生產力最直接的方式。智譜 AI 張帆認為,這也是 2024 年產業關注的重點。
與此同時,一些令人驚艷的 AI Native 應用也開始出現。
就像移動互聯網技術下,出現隨時隨地刷短視頻的用戶需求一樣,大模型技術下也開始出現一些獨有的場景。比如一位 AI 應用投資人現場分享了一款還在定向邀測的海外應用 Can of Soup,一款想象力社交軟件。用戶利用 AI 生成虛擬圖像,發布在網站上,互相評論,還可以邀請朋友進行「想象力」共創、點評,這款產品可以類比為「想象力版 Instagram」。
「這款應用在海外 DAU 增長非常快,不知道最后能不能成,但是非常有意義的探索,代表不僅現實的生活可以分享、可以社交,你的想象力也可以被社交,這就是非常典型的 AI 原生的應用,發現了新的行為模式」,他補充說。
除了像 Can of Soup 這樣捕捉新技術下的人類新需求,新技術也給熟悉的場景帶來了更好的解決方案,為用戶帶來更易用、好用的體驗。
就拿現在最火熱的智能體來說,智譜 AI 張帆認為,很多 GPTs 能做的事情非常淺,很難用作生產工具。這些 GPTs 背后的流程大體是按照人的理解邏輯來執行,先做分類、再做模型、再做任務,但是這種智能體運行的方式是受限的,他認為,「嚴格來講,這種外掛工程的方式不算是 agent,只是大號的模型應用」。
相比之下,他發現字節跳動在海外推出的 Coze 玩法不一樣,同樣是 GPTs 類應用,Coze 的模式是利用背后大模型的遞歸和迭代的能力和表達力,這是更加原生的智能體,效果也更好。
張帆稱,這是他看到比較興奮的方向,能夠用更簡單的方式、更通用的方式,不需要微調,僅僅用基礎的表述就能夠解決真正的復雜問題,把從模型到應用之間的 100 公里降到 100 米。但也有前提,像 Coze 這樣的原生模式,高度依賴背后的模型能力,模型強大到足夠通用,才可以實現。
智譜 AI COO 張帆在活動上做分享|阿里云
除了軟件類 AI 應用,結合端側場景的應用也值得期待,尤其機器人領域。說起 2023 年最眼前一亮的應用,張家興認為是谷歌的 RT-2(Robotics Transformer 2,一款機器人大模型),看到了??然語?定義任意機器人任務的曙光。他認為,?模型在機器?領域正在期待 ChatGPT 時刻。
元璟資本劉毅然舉了一個例子,過去機器人領域有一些常規,比如用數學規律來描述復雜動態體的運動,現在,大模型對于像這樣的數學描述過程有放大作用,但距離大模型真正進入機器人或者手機、車、AI Pin 等硬件,可能還需要些時間。
「天上的大模型能否落在地上的設備上面,是值得期待的」他說道。盡管通用的物理世界大模型的價值最大,是科學家夢寐以求的,但在前面加合適的定語,是創業者今天就可以做、也可以有收獲的。難點在于,前面怎么加定語,能符合今天的技術階段,也能把商業化和產品結合在一起,不停向前進。
2024,大模型
「基建」的意義
有了對 AI 應用百花齊放的期待和判斷,創業者也對整個大模型的技術體系寄予新期待,尤其是數據、算力和開源算法。
數據被視為模型訓練、微調等動作產生效果最重要的因素之一。在獲取高質量數據上,方漢提出了不同的思考。在他看來,很多大模型有更快的方法獲取數據,比如通過用 GPT-4 做「教練」來獲得,但是在數據獲取方面,團隊應該有「長期主義」精神,不然「很難走遠」。
昆侖萬維董事長、CEO 方漢在交流環節分享昆侖萬維+大模型的實踐|圖片來源:阿里云
在對比了全球市場后,昆侖萬維方漢認為,垂類數據是中國公司上場和發力的方向。有了垂類高質量數據,才有機會在垂直場景里面做到 SOTA(指前沿、第一梯隊的模型),率先獲得垂直場景的紅利。
在算力層,成本成為主要的關注點。
百川智能洪濤坦言,大模型商業模式的探索有相對長期的試錯過程,云計算層面繼續突破、攤薄創新成本,是眼下比較關注的方向。
在這一點上,阿里云公共云總裁劉偉光認為云和 AI 的結合會逐漸解決這個問題。
云計算對傳統 IT 的意義,和融合AI的意義完全不同。AI 和云是魚和水,密不可分,二者的結合是 AI 應用的催化劑。同時,云計算能力的不斷演進,包括 GPU 算力、配套的計算存儲、網絡能力的演進,會對 AI 產生非常大的支撐。
「在談AI原生應用之前,其實有一點被忽略了——AI 是云的原生應用。二者的結合還有很大優化空間」他說道。隨著大模型包括 AIGC(應用)更加細分,對算力的需求也會逐漸細分化,而不是簡單粗暴地購買算力,這也是阿里云不斷探索的事情。
在這一點上,云、端結合的方式也被寄予厚望,昆侖萬維方漢認為,降低模型推理成本,要結合端側推理,手機側可以做小參數量模型的推理,和云端大參數量模型推理結合起來。
算法層面,Meta 開源的 LLaMA 和 Llama2 為產業模型發展提速,帶來了繁榮的開發者生態。不久前,Mistral 創始人也袒露借鑒了 Llama2 的開源模型,但開發者普遍稱,Mistral 的效果實際用下來要比 Llama2 更好。
國內模型廠商也越來越多地選擇開源模型,但也有創業者表示,不確定國內尤其是大廠開源模型背后的考量,會不會只是一時的。比如,獵聘戴科彬就認為,阿里云開源的 72B 大模型效果非常好,但也好奇其背后的思考。
在創業者之夜上,阿里云市場總裁劉湘雯直面這一提問。她表示,阿里云會持續開源,這并非僅僅為了公益,而是基于對商業的判斷。
阿里云創業者之夜活動現場|阿里云
在這場創業者活動中,極客公園看到了共識,也看到了更多共識的觀點在嘉賓之中激烈碰撞。而這恰恰代表了由大模型引發的新一波 AI 浪潮中所蘊含的機遇。你可以想象,在 20 年前移動互聯網剛剛興起的時候,在類似活動,同樣充滿了相同的爭論和見解。
不同的是,變革的「基建」從運營商,變成了現在以阿里云為代表的云計算廠商。在大模型時代,阿里云不僅要自己下場「摸清」大模型上下游的真實情況,更需要在這樣的創業者之夜活動中,和大模型行業的「玩家」共同找到行業發展的方向,根據后者不斷變化的需求,增加阿里云「AI 基建」的各種能力,來和創業者們一起成長、成功。
大模型時代,「計算,為了無法計算的價值」有新的內涵,在阿里云舉辦的創業者之夜活動上,這群先行者率先開始探索最開放的技術體系里,新的變化。
寫在最后:
創業者之夜活動由阿里云創業者社群舉辦。社群聚集中國最前沿的技術創新者,聚焦云與 AI 技術方向、以及 AI 在產業中的落地應用等核心主題,發起各類技術及產業閉門活動與研討,與社群成員形成長期共創體系,與技術創新者們共同成長。
【免責聲明】【廣告】本文僅代表作者本人觀點,與和訊網無關。和訊網站對文中陳述、觀點判斷保持中立,不對所包含內容的準確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔全部責任。郵箱:news_center@staff.hexun.com
最新評論