OpenAI o1與人工智能的過去與未來
經濟觀察報 楊蔚/文 2024年9月13日,人工智能研究公司OpenAI發布了最新版本的o1模型預覽。令人意外的是,這個號稱能夠解決大模型在數理邏輯方面缺陷和幻覺問題的重大更新,卻并沒能延續ChatGPT-4和Sora(人工智能文生視頻大模型)的矚目,公眾的關注中多了一份謹慎和審視。
為什么不是GPT-5?性能是否真的達到了宣傳中的效果?OpenAI的著名法則,“算”力出奇跡的Scaling Law(縮放定律)是否已走到極限?相比ChatGPT推出伊始的勢如破竹,一次次OpenAI新品發布不斷發酵的卻是逐步積累的質疑和猜想。經歷最初的驚艷和狂熱后,公眾對于大模型技術和應用的潛力和未來了更多不同的聲音。
與其他技術創新相比,人工智能技術似乎展現出更為明顯的周期性,常常在公眾和資本熱度過后引發爭議,甚至陷入沉寂。然而,歷史證明,社會輿論和投資者預期的劇烈波動并不能真實反映人工智能技術的發展軌跡和內在價值。人工智能技術及其應用的突破,往往是在沉寂與質疑中醞釀并最終爆發的。
AlphaGo的前塵往事
時間回到2010年。當時的人工智能技術發展可以說正處于黎明前最后的黑暗時刻。彼時還是助理教授的李飛飛剛剛發布了Imagenet——世界首個大型的非結構化圖片數據庫。
直到兩年后,當今人工智能的主流技術卷積神經網絡,才在基于這個數據庫的視覺識別比賽中,超越其他技術路徑異軍突起。而人工智能對于高度模糊、變動性不確定性極大的語言文本分析處理能力,更是無從談起——基于卷積神經網絡的注意力機制改進,也就是我們現在大語言模型的基礎,更是直到2017年才初具雛形。
在這樣的技術混沌期,一個名不見經傳的人工智能初創企業悄然在英國倫敦誕生了。回顧這家企業當時網站上簡略模糊的信息,我們很難想象它會在日后成長為巨大影響力的獨角獸,并在人工智能發展中引起軒然大波。企業由一個沒有任何人工智能經驗的神經外科博士和他的同事創辦,沒有產品,沒有技術專利,也沒有收入。網站上僅有的信息,顯示這家公司是在探索和游戲、機器學習、電子商務算法相關的人工智能。
令人意外的是,這家大西洋彼岸的初創企業DeepMind引起了馬斯克的注意。在特斯拉業務初見起色的2011年,他以天使投資人的身份參與到了DeepMind的發展中。
有趣的是,馬斯后來說起對Deep-Mind的投資,是出于對電影《終結者》的恐懼,這與5年后他成立OpenAI的初衷如出一轍。值得注意的是,馬斯克早期的經營重點更多還是放在了特斯拉上,對于外部初創企業的投資,其實并不頻繁。但這兩家有著馬斯克身影的初創型組織,雖然沒有像馬斯克希望的那樣去真正解決人工智能的倫理和風險問題,卻兩度成為推動這一技術從低谷走向高峰的最重要力量。
DeepMind的真正轉機出現在馬斯克投資之后,即谷歌的收購要約。谷歌在2014年以6.6億美元的超高溢價,打敗了同為硅谷巨頭的競爭對手臉書,收購了DeepMind及其團隊。至此,這家一直尋覓技術路徑和應用場景的初創企業,似乎找到了別具一格的探索方向——研究用人工智能下圍棋。
對計算機對弈算法的研究其實并不鮮見,最早可以追述至人工智能誕生伊始。IBM的深藍在1997年就在國際象棋的競技中打敗了人類選手。但圍棋的難度是空前巨大的,圍棋棋盤中兩子對奕所衍生出來的棋路可能性,甚至超過整個宇宙中原子的數量總和。圍棋戰略對抗中高度的復雜性,意味著優秀的圍棋選手不僅依靠大強度的訓練,更是在經驗積累中不斷強化的天賦和直覺。傳統的計算機程序依靠窮舉或暴力演算搜尋,顯然無法復制頂尖棋手對弈決策中罕見的天賦型能力,超越更是無從談起。在DeepMind之前的數十年,計算機的圍棋水平僅能勉強對戰業余選手。
當DeepMind宣布要用其開發的人工智能圍棋程序AlphaGo挑戰世界頂尖的九段圍棋高手、已經拿下18個冠軍頭銜的李世石時,無論是計算機科學家還是圍棋界都普遍都認為人類的勝利在這樣的挑戰中幾乎毫無懸念。李世石本人在賽前曾預測,“5盤棋不應該是3/2,也許是4/1或5/0,但我一定會贏”。
這場發生在2016年3月的結果卻出乎所有人意料,AlphaGo以4:1的成績戰勝了李世石,震驚世界。當代人工智能技術通過圍棋,這一古老且家喻戶曉且具有社會驗證屬性的策略競技方式,空前直白地展現出驚人潛力。AlphaGo勝利所帶來的軒然大波與7年后ChatGPT的火爆如出一轍,都深刻地塑造了其后人工智能技術的發展。
AlphaGo的影響首先出現在相關的開發者社區當中。我和美國杜蘭大學的張吉印通教授2022年發表于《戰略管理期刊》(StrategicManagementJour-nal)的研究中,通過分析開發者問答社區Stackoverflow和世界上最大的開源代碼平臺GitHub的開發者行為數據發現,AlphaGo使得開發者在人工智能創新中,能夠更好的運用平移、類比等思維認知模式提出更為復雜的問題。而復雜問題的求解,是新興技術突破后進一步創新的關鍵。
AlphaGo通過圍棋挑戰所得到的社會范圍的關注、認可和性能驗證,不僅進一步確定了其選擇的深度學習的技術潛力,更激勵和影響了人工智能領域的投資活動和人才儲備。正是這些微觀基礎層面的悄然變革奠定了日后整體人工智能技術發展的基礎。
技術成功之后
AlphaGo出人意料的成功,背后離不開母公司谷歌的支持。早在2004年上市時,谷歌就擁有硅谷最大的服務器集群之一,更是在2015年就推出了自己的專有算力芯片TPU,其計算能力甚至超過了當時的主流運算芯片英偉達。強大的算力是深度學習人工智能算法發展不可或缺的配套資產。
值得注意的是,DeepMind在被收購后,不再需要直接應對大部分營收壓力。作為谷歌子公司,DeepMind在人工智能上取得的科研成果,更多是面向谷歌內部的轉化,被應用到其搜索、視頻推薦和數據中心能源系統管理等業務,這使得DeepMind在很大程度上可以不計成本地專注研發,不斷推進技術本身的性能潛力。
新興技術的突破,往往是初創企業與技術巨頭通力合作的結果,這樣的互動還會進一步塑造技術的發展。
初創企業通常被視作顛覆性技術的來源,具有極大的創造力和探索精神,但商業化過程中,卻面臨缺乏市場經驗、客戶資源和配套資產的挑戰。巨頭和成熟企業往往具備很強的商業化能力以及相關資源,但因路徑依賴和長期發展積累的組織惰性,往往在研發過程中只能基于現有的成功產品進行漸進式創新搜尋。
因此,初創企業和巨頭通過并購、戰略投資等合作,不僅能推動初創企業的技術創新,也成為技術巨頭獲取新技術的重要窗口和通道。
我在與美國得克薩斯大學奧斯汀分校 McCombs商學院的 FranciscoPolidoro教授的合作研究中發現,生物制藥領域的重大創新同樣離不開大型藥廠戰略投資的參與,這樣的戰略投資和并購也會影響新興技術其后的發展。為了更好的利用巨頭的配套資產,初創企業的技術路徑會向巨頭逐漸靠攏。
在人工智能領域,AlphaGo對于谷歌人工智能算法和服務器的利用,同樣展現出這樣的特點,并直接影響技術性能的發展,進而決定AlphaGo與李世石對決中的勝利。
然而,AlphaGo所引發的熱潮并未能一直持續。圍棋的復雜性、競技性和對抗性與典型可變現的商業化應用場景具有很大的區別。熱度散去后,深度學習的商業前景開始受到質疑。DeepMind選擇蛋白質解析這個在生物學中看似極為專業聚焦的領域作為商業化的第一個嘗試,似乎也驗證了公眾對于深度學習商業化潛力的質疑。
在AlphaGo基礎上的AlphaFold展示出同樣驚人的性能潛力,通過預測蛋白質內極大的數量的氨基酸形態解析蛋白質結構,2年內完成了超過15萬個人類蛋白質解析,超過生物學家過去50年通過傳統方法完成工作量的3倍。然而,社會卻因為這一基礎領域探索在應用廣度上的局限,對技術整體的商業化前景產生了質疑,寄予深度學習的關注和期望在這個期間逐漸降溫,風險投資的增長也逐步趨緩。
但實際上,深度學習技術真正蛻變成具有更為廣闊應用潛力的通用性技術,卻是在這樣的社會驗證引發的關注高潮過后、在公眾熱情退卻的冷靜期悄然實現的。
2020年,AlphaFold2推出,在其后的2年內完成超過100萬個物種2.14億中蛋白質結構的預測解析,幾乎涵蓋了世界上全部的“蛋白質宇宙”。這一成果在很大程度上解決了傳統蛋白質解析面臨的因人力資源和儀器資金高投入所面臨的效率問題,為下游相關的生物制藥和醫療應用領域研發打開了新的大門。蛋白質解析領域的領軍人物施一公曾經評價到,“AlphaFold蛋白質解析是本世紀最重要的科學突破之一”。
2024年5月,AlphaFold3推出,在原有的卷積神經網絡和增強學習技術上,AlphaFold3運用了大模型中廣泛運用的注意力機制加擴散算法。在不斷的迭代發展中,AlphaFold3已經可以蛋白質以外的幾乎所有的生物分子結構。
這意味著,這一技術可以更為廣泛地應用在生物學、高科技甚至是部分傳統的生產制造領域。從分子結構層面對于材料、配方和生產流程的進一步理解,能夠極大拓寬這些領域的技術以及應用機會,而對于這樣技術的應用所帶來的知識變革,也將會對這些行業的競爭藍圖產生深刻甚至是顛覆性的影響。
未來之路
縱觀從AlphaGo到AlphaFold3的發展過程,我們看到的是過去9年間,從技術爆發到應用的迷茫,再到特定領域聚焦的探索,最后在不斷向外擴展的應用邊界中呈現出更為確定的通用潛力。這個歷程無疑驗證了比爾蓋茨的名言,“我們總是高估未來兩年內發生的變化,低估未來十年內發生的變化”。
面對ChatGPT和更為新興的大模型技術,也許在不遠的未來,我們仍會看到AlphaGo所經歷過的風口沉寂。盡管性能驚人,大模型的真正應用還要攻克技術、應用場景、商業模式等眾多挑戰。
首先,創新的商業化應用是高性能技術的成功組合,而不是單一技術的延展。目前,大模型基于表征關聯產生的幻覺問題,也許需要輔助技術的加持,而不是單一在技術內尋求性能突破。如何通過技術的疊加和組合,讓大模型能夠更為有效地在預訓練的基礎上學習和理解世界,也許成為未來技術突破和從技術上競爭優勢的關鍵之一。
第二,大模型本身性能的提升和商業化,也有賴于人工智能技術之外多維度的創新突破。技術的成功商業化離不開與技術相匹配的配套資產的發展。尤其是大模型的Scaling Law,指數級極大參數疊加才能帶來語義理解性能的倍數提升,這使得當前人工智能的訓練和推理從本質上就無法避免極大的算力消耗。如何能夠提高大模型的效率降低能耗,從算法上用更小的參數實現相同的性能,從數據上提高訓練效率。這些都是大模型進一步發展亟待解決的問題。
第三,大模型的不確定性還來自于人工智能基礎科研層面面臨的挑戰。縱觀美國信息技術以及其他高新技術的發展史,由政府資助、高校主導的基礎科研一直發揮著至關重要的基礎知識生產、篩選和初步轉化的的職責。包括互聯網等當代至關重要的技術發明,最初都誕生于高校科研。但大模型的超高的算力需求以及相應的資本投入,已經超出了目前美國學校的經費承受能力,這使得人工智能領域的基礎科研向企業轉移——李飛飛和前谷歌首席科學家辛頓在2023年10月的一次對話訪談中如是說。
在很大程度上,任何以單一應用導向的基礎研究都具有很高的風險。在新興技術發展的早期,實現盡可能大的技術多樣性,才能夠保證最優的創新組合在充分的技術競爭中得以留存,最終成為主導。企業以商業應用和利潤為導向的本質,有可能會導致其基礎科研過早偏于保守和單一,錯過更為激進但有效的遠程技術機會。
中國的人工智能技術同樣面臨這樣的風險。如何從高校科研、通過企業合作和政府支持的雙重模式,尋求多樣的技術可能性,或許能在一定程度上縮短AlphaGo由企業主導的技術探索期,成為未來人工智能技術更為快速破局的關鍵。
在應用層面,AlphaGo的發展歷程,對于我們理解人工智能的未來,也具有啟示意義。新技術應用層面的成功商業化,起始于與技術特點和路徑最為適配的相關領域,隨著應用的逐漸成熟,才會在這些領域的臨近區域尋求延展機會,最后在更為廣闊的層面延展泛化。
在人工智能的發展中,公眾熱情和投資所呈現的周期性,也源于技術早期的真實適用范圍與外界預期的錯配。而過早投資在應用領域,在新興技術性能無法適配的情況下強行尋求應用甚至人為制造風口,并不能真正加速技術的成熟,反而會導致稀缺資源的浪費和錯配。
喧囂過后,對于挑戰的直面和努力,對于風險下的契機識別和把握,對于制度的不斷完善和資源配置的悉心規劃,也許是當下實現從ChatGPT到通用人工智能蛻變的基礎和關鍵,讓這一備受關注的技術,在更長遠的未來真正賦能各個應用領域的產業升級和變革。
(作者系中歐國際工商學院管理學副教授)