AI原生時代,大模型創業有“捷徑”

0 評論 2857 瀏覽 3 收藏 15 分鐘

近年來,我國的科技變革有很大的進步,似乎國內的科技技術水平與國外相比,不相上下。下面這篇文章是筆者整理分析關于應用大模型等的相關內容,大家一起來看看吧!

一年前ChatGPT橫空出世的時候,它之所以能引發圍觀人群的驚嘆,乃至把這輪已經跌入情緒和現實雙重深淵的人工智能行業搶救過來,是因為它相比此前的人工智能產品跨越式地產生了智能的“涌現”。

所謂“涌現”是指構成復雜系統的多個個體組件,在相互作用的過程中,于系統層面產生了這些個體所不具有的新特性。

例如像螞蟻這樣的生物,單個的個體表現不出任何高等的意識,但蟻群這個系統卻可以建造巨大的巢穴,在巢穴里塞滿食物,并通過明確的分工合作完成復雜的任務。有研究人員認為,由神經元構成的大腦也是這樣通過這類局部作用,在個體層面“涌現”出意識的。

ChatGPT所涌現出的能力令OpenAI自身的開發者都感到意外,冥冥中似乎人類已經隱約觸摸到了通向AGI的終極道路。這樣的前景很難不令從業者感到心潮澎湃,對于中國的互聯網企業尤其如此。

一個保守的估計是,目前國內研發的大模型總數已經超過了200個。這個現象當然首先反映出在人工智能領域,以及更廣泛的計算機科學和IT產業方面,我們已經處于或者起碼非常接近世界領先水平。

然而,與制造大模型的狂熱相比,國內對于在大模型之上構建AI原生應用的熱情似乎要冷淡得多。百度創始人李彥宏10月15日在西麗湖論壇上提到,中國目前的AI原生應用很難說出個一二來,而國外除了幾十個基礎大模型之外,已經有上千個AI原生應用,這是現在中國市場上所沒有的。

在《深渡》看來,基于大模型本身的特征和可能的發展路徑來說,上述這種“爭模型輕應用”的現象其實并不合理。更恰當的行業模式應該轉過來:制造大模型需要理性慎重,而業界參與大模型浪潮的激情和狂熱,應該導向尋找應用大模型這個出口上來。

一、制造大模型需“冷靜”

國內的大模型從數量上講,應該已經確定性地超過了美國。

促成這個現實的最重要原因,是很多企業選擇建造專有大模型,這些專有大模型通常宣稱基于各自所在的行業,因而在特定場景下有著更好的表現。

然而實際情況是,這些專有大模型在智能“涌現”上往往跟頭部產品相差甚遠,它們基本談不上創造多少真實價值,更多的作用體現在企業對自身技術實力的PR宣傳上面。

這些專有模型面臨的障礙主要就在大模型的“大”上面。

OpenAI在ChatGPT上取得成功的根本原因,并非理論上有重大突破,比如作為大模型關鍵支撐的Transformer架構,早在2017年就由谷歌的科研團隊提出了。

ChatGPT的成功歸根結底是“暴力美學”的勝利,是量變引發的質變。

這也意味著只有當參數規模足夠大,訓練的語料足夠多,模型才會在超過某個門檻后涌現出智能。但是對于今天國內很多自制大模型的科技企業來說,他們的技術實力和所能支配的資源,其實并不足以幫助他們邁過這個門檻。

比如,我們可以從最直觀的參數規模來考慮問題。在今年五月底的中關村論壇上,有業內機構發布了《中國人工智能大模型地圖研究報告》。這份報告提到中國當時有超過79個大模型,但使用的標準是“參數規模在10億以上”。一個自然的疑問是,“10億參數”能達到智能涌現的門檻嗎?

合理的猜測,大概是不能的。

因為早在2019年OpenAI開源的GPT-2就使用了15億個參數,但當時這個模型的最大用途是用來生成fake news。作為對比,去年底首次亮相的GPT-3.5,參數規模達到了1750億。也就是說,在超過100倍的量變過后,GPT-3.5才真正產生了令人驚艷的“智能涌現”。

而從GPT-3.5到GPT-4,模型的參數規模甚至進一步擴張。七月份的一篇論文提到,GPT-4包含了1.8萬億參數,相比GPT-3.5又增長了一個數量級。對應的,GPT-4的單次訓練成本也從GPT-3的460萬美元大幅增加到6300萬美元。

即便是阿爾特曼,也曾在接受采訪時表示:“我們要成功完成任務所需的資金比我最初想象的要多得多”。根據《財富》的報道,去年OpenAI收入為3000萬美元,但凈虧損總額超過5億美元。

在ChatGPT發布后,與大部分普通人的驚訝和雀躍相反,很多高校實驗室里搞自然語言處理(NLP)的研究人員發出了“NLP已死”的感嘆。

一方面,ChatGPT的問世代表著NLP領域的突破性成果。但另一方面,大模型訓練所需要的龐大開銷,也意味著大部分實驗室今后不再有能力跟進這個前沿領域的很多最新進展。

毫無疑問,對于絕大部分企業來說,這個邏輯同樣成立,既沒有能力也沒有必要去“重復造大模型的輪子”。

從PC時代到移動互聯網時代,再到如今由生成式大模型引領的AI時代,每個時代都有作為支撐的基礎技術底座。而一個越來越顯著的趨勢是,大模型正在取代Windows和后來的iOS/Android,成為AI時代的操作系統。

從商業模式上講,這的確又是一個締造世界上最偉大科技公司的絕妙機會。只是這一次的勝利者,絕對不會像當初Apple起步一樣,從喬布斯的車庫里冒出來。

對于那些希望抓住大模型浪潮的絕大部分公司而言,登上這列火車的最好機會一定不是“買卡、囤芯片、建智算中心,從頭訓練自己的專用大模型”。而是應該像李彥宏說的,將基礎大模型的通用能力和行業領域的專有能力相結合。這種“大模型套小模型”的產業化模式,能夠很好結合兩方面的優點:專用的小模型反應快,成本低;大模型更智能,可以用來兜底。

從行業發展態勢看,目前其實已經有大批嗅覺靈敏的公司在這么做了

。李彥宏在15日的演講中就提到,8月31號開放以來,文心大模型的API調用量,呈現指數級的增長趨勢:“國內有200多個大模型,很多上了這個榜單、那個排名,其實都沒有什么使用量。文心大模型一家的調用量恐怕比所有那200家加起來的調用量還大”。

二、AI原生應用大模型要“狂熱”

在大模型出現之前的十年里,科技行業其實已經經歷過好幾輪的技術熱潮。盡管沒有像黃仁勛把大模型出現稱為人工智能行業的“iPhone時刻”這么夸張,但在每一輪這樣的技術浪潮中,總會有大批的投資人和創業者因為某一個新奇的概念,蜂擁而入賭上自己的金錢和時間。

當然,這些浪潮來得快退得更快,最后留下一地雞毛,區塊鏈、元宇宙、云計算和各種花樣的O2O都是些典型的例子。某種程度上說,無論投資人還是從業者在這次大模型到來后,明顯吸取了過去的經驗教訓,從一開始就對大模型的落地給予了更多的關注。

但需要注意的是,如我們在上面一章闡述過的,在追求大模型落地的過程中,我們不應該走制造一堆行業專用大模型的路子,因為這些不夠大因而不夠智能的“專用大模型”,并不能實現名實相符的價值創造。更優的落地路徑是在一個強大的基礎大模型上面,去調用它的各項能力,開發出豐富的AI原生應用。

不過相較于制造大模型的熱情,國內從業者對于應用大模型的氛圍似乎要低一些,后面這項事業是需要加一把火的。這跟國外的情況恰恰相反,因為即便是微軟這個量級的公司也沒有自己另起爐灶蓋大模型,而是在努力把OpenAI的大模型吸納進Office這一套生產力工具里。

其實,我們國內是有領先的基礎大模型的,而且如李彥宏所說,強大的基礎大模型,一定能驅動AI原生應用爆發。

今年3 月16日,百度率先發布了基于文心大模型3.0的文心一言產品。而在一個月前的2023百度世界大會上,文心大模型4.0也正式問世。當時,李彥宏以《手把手教你做AI原生應用》為主題發表演講,現場開啟邀請測試,實地展現百度在AI領域實現多維度的持續突破。憑借參數規模全球第一,文心大模型4.0的綜合能力“與GPT-4相比毫不遜色”,全面領跑全球AI行業。

基于迄今為止最強大的文心大模型,在理解、生成、邏輯和記憶四大能力上,文心4.0都有明顯提升。比如,在生成能力上,文心一言除了生成文字內容,更包括了圖片、視頻、數字人等多模態內容,可實現的創作體裁超過200種,涵蓋了幾乎所有寫作需求。在邏輯和記憶能力上,相比之前的版本也有了成倍提升。

大模型在智能涌現后出現的理解、生成、邏輯和記憶四大能力,是AI時代到來后最本質的生產力革新。而與制造大模型本身的高門檻不同,今天的創業者同樣可以極其容易地通過接入文心一言這樣的大模型,通過應用這四大能力徹底重構自身產品的用戶體驗。

事實上,為了幫助各行各業的客戶盡早用上大模型,百度在文心一言正式亮相的同一個月,就推出了文心千帆。文心千帆是全球首款一站式企業級大模型平臺,既提供像文心一言這樣領先的基礎大模型,也包含了開發大模型需要的工具鏈和配套環境。在隨后不到半年的時間里,千帆大模型平臺上月活企業數已近萬家,覆蓋金融、制造、能源、政務、交通等行業的400多個場景。

大模型和生成式人工智能作為堪比工業革命的巨大機遇,已經成為公眾共識。但目前來說,無論國內國外都還沒有出現跨時代的AI原生應用,這是一塊急需填補的“權力真空”。李彥宏在今天的演講中表達了同樣的遺憾和期待:

就像移動時代誕生了像微信、抖音、Uber這樣的“mobile-native”的應用一樣,AI原生時代一定會有優秀的AI原生應用是基于這些大模型開發出來的。

記住,是基于最好的基礎大模型去開發應用,這是比制造大模型更容易成功的“捷徑”。

三、結語

在《深渡》看來,大模型掀起的這輪AI革命來得再恰當不過。因為相較于過去那些科技變革,以文心一言為代表的國內基礎大模型,表明國內的技術水平已經站到了跟國外頂尖同行并駕齊驅的位置。對于那些腦袋靈光夢想遠大的龐大創業者群體而言,這在某種程度上是從未有過的“幸運”。

當然,前提是他們要選對切入這條賽道的方向,在制造大模型上多一點冷靜,而在應用大模型上不妨狂熱一些。

本文由 @深渡Cross 原創發布于人人都是產品經理,未經作者許可,禁止轉載。

題圖來自Unsplash,基于CC0協議。

該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發揮!