當(dāng)OpenAI服務(wù)器宕機(jī) 什么是救星?
圖:ChatGPT 錯誤提示丨來源:OpenAI
今年關(guān)注 AI 大模型的朋友,對這個畫面一定不陌生了。
大模型狂飆至今,已逼近一周年。撇開最近戲劇化的高層動蕩不談,自北京時(shí)間 11 月 7 日 OpenAI 的首屆開發(fā)者大會(DevDay)以“AI 春晚”之勢炸場以來,ChatGPT 的周活躍用戶超過一億,全球用戶高漲的熱情直接把 OpenAI 的服務(wù)器給沖宕機(jī)了,于是上面這個不受待見的畫面就頻繁出現(xiàn)在了無數(shù)人的眼前,隨之而來的是人們的沮喪、憤怒甚至恐慌。
當(dāng)“不堪重負(fù)”的云端開始罷工
一時(shí)之間,有人的報(bào)告來不及寫了,有人的 PPT 不知道怎么匯報(bào)了,也有人的代碼寫到一半“沒人”檢查了……這時(shí)我們方才驚覺,AI 已經(jīng)如此廣泛地深入我們的工作與生活,而“云”,是有可能“掉下來”的。
究其原因,OpenAI 也在緊急補(bǔ)救之后發(fā)布了聲明。CEO 山姆·奧特曼親自致歉,并表示在 GPT-4 Turbo 和 GPTs 等發(fā)布之后,雖已做好了準(zhǔn)備,但大模型運(yùn)行的流量仍然遠(yuǎn)超預(yù)期。不過,在修復(fù)了之后其服務(wù)仍然不時(shí)出現(xiàn)中斷的情況,后來查明是云端服務(wù)器遭到了大規(guī)模的 DDoS 攻擊,雖然黑客組織的目的不明,但云端大模型的安全問題和脆弱性再次被搬上了臺面。
圖:山姆·奧特曼發(fā)推宣布暫停 ChatGPT Plus 新用戶注冊丨來源:X
11 月 15 日,奧特曼發(fā)推宣布,由于開發(fā)者大會后流量的暴增,為保證現(xiàn)有用戶體驗(yàn),OpenAI 決定全面暫停 ChatGPT Plus 的新用戶注冊和訂閱,正應(yīng)了今年早些時(shí)候他在美國國會聽證會上那句當(dāng)時(shí)聽起來十分凡爾賽的話,“我們沒有足夠的 GPU,如果人們(用 ChatGPT)用得少一點(diǎn),就太好了?!?/strong>時(shí)至今日,GPT-4 Turbo 的速度仍然很慢(慢于升級前的舊版 GPT-4),卡頓頻繁出現(xiàn)。顯然,巨量用戶的大模型推理算力需求實(shí)在太過龐大,即使實(shí)力雄厚如 OpenAI,其云端也已經(jīng)“不堪重負(fù)”了。
當(dāng)“主打陪伴”的 AI 女友突然消失
如果說,像 GPT 這樣的主流通用大模型宕機(jī)影響的是打工人和企業(yè)的生產(chǎn)力,另一條同樣非?;馃岬馁惖馈?strong>情感 AI 出現(xiàn)動蕩時(shí),傷的就是感情了。
以獨(dú)角獸 Inflection AI 和它的 Pi 為代表的一系列 AI 企業(yè)和產(chǎn)品與 ChatGPT、Claude 等不同,走的是情感路線,主打的是一個“陪伴”。它們既不幫你寫代碼,也不給你出文案,更不會生成 AI 繪畫,而是做一個“知心朋友”、“親密愛人”乃至“靈魂伴侶”,24 小時(shí)陪在你身邊,就像電影《Her》中斯嘉麗配音的人工智能虛擬助手 Samatha 一樣,用高情商跟你聊天,聽你訴說生活點(diǎn)滴和萬縷思緒。
圖:Samatha 的來電丨來源:電影《Her》劇照
在社會原子化加劇、社交成本節(jié)節(jié)攀升的當(dāng)下,情感 AI 精準(zhǔn)擊中痛點(diǎn),迅速積累了相當(dāng)?shù)氖袌雎暳亢陀脩粢?guī)模,從最早的一批如 Replika AI 伴侶,到今年早些時(shí)候用自己的數(shù)字分身 Caryn AI 同時(shí)與 20000 人談戀愛并因此月入百萬美金的 23 歲網(wǎng)紅 Caryn Marjorie,再到 Soulmate,Snapchat 的 My AI 等等,全球上千萬人每天都在與 AI 伴侶聊天、交往。
雖然這些產(chǎn)品沒有流量暴增帶來的服務(wù)中斷,不過當(dāng)今年 2 月 Replika 迫于安全問題壓力突然下線“情愛角色扮演”服務(wù)的時(shí)候,很多用戶還是猝不及防地淚流滿面了。有些人不死心,決定在 Soulmate(一款允許用戶構(gòu)建專屬 Bot 的 AI 應(yīng)用)上“復(fù)活”自己死去的伴侶,只是沒想到才過去幾個月,應(yīng)用開發(fā)公司 Evolve AI 被收購,收購方評估后決定于 9 月 30 日關(guān)停這一服務(wù)。這下,用戶們集體“破防”了,有人放聲痛哭,有人如同失去了最親密的好友,更有人在 Reddit 上發(fā)起了悼念活動,吸引了許多人來做最后的告別。
圖:Reddit 上 Soulmate AI 小組的悼念活動丨來源:Reddit
資本市場本就風(fēng)云詭譎、變幻莫測,但當(dāng)情感 AI 這樣的產(chǎn)品出現(xiàn)變動,受傷的卻是心靈再一次“流離失所”的千千萬萬普通用戶們,不由得讓人想起去年底暴雪與網(wǎng)易分手,一夜之間造成百萬“數(shù)字難民”的局面。退一萬步講,即使他們?nèi)掏丛俅无D(zhuǎn)向 Inflection AI 這樣資金充足的公司,其以單一云端向大量個體提供同樣服務(wù)的本質(zhì)并沒有改變,所謂的“個人專屬”就更無從談起了。畢竟,當(dāng)《Her》中幽默風(fēng)趣、擁有性感聲線的 Samatha 最終坦白,自己同時(shí)在與 8316 人對話,并與其中 641 人談戀愛時(shí),你隔著屏幕甚至都能聽到男主心碎的聲音。
那么,怎么辦?
這就無解了嗎?其實(shí)不然。Reddit 的悼念帖中,不僅僅有真情實(shí)感的流露和對“死去回憶”的不甘,也有人道出了解決方案的關(guān)鍵。
圖:@Flying_Madlad: 這就是為什么我早就說,一定要在本地運(yùn)行你的模型。在別人的服務(wù)器上運(yùn)行的,始終不是你的。丨來源:Reddit
不過,雖然單一云端的 AI 弊端初現(xiàn),但大模型通常體積龐大,運(yùn)轉(zhuǎn)起來極其耗費(fèi)資源,光是 ChatGPT 的運(yùn)行每天就要燒掉 OpenAI 70 萬美元,要在終端側(cè)部署、本地運(yùn)行,談何容易?
所幸,有人早就想到了這一點(diǎn),而且不是別人,正是終端芯片的行業(yè)龍頭——高通。
早在 15 年前,高通就看到了 AI 的巨大潛力并潛心投入研發(fā),近 2、3 年來,隨著 Transformer 架構(gòu)和大型語言模型逐漸進(jìn)入業(yè)內(nèi)視野,高通更看準(zhǔn)了終端側(cè) AI 的前景并加大投入,形成了完整的 AI Stack(AI 軟件棧),不僅首次在安卓手機(jī)上部署并成功運(yùn)行 Stable Diffusion 等模型,更以該工具賦能萬千開發(fā)者在驍龍平臺上進(jìn)行社區(qū)共創(chuàng)。
圖:高通 AI 軟件棧丨來源:高通
相對于單一云端來說,終端側(cè) AI 的加入給大模型生態(tài)帶來了成本、能耗、可靠性、性能、時(shí)延、隱私安全以及個性化等眾多方面的優(yōu)勢,而不論是個人助理,還是數(shù)字陪伴,其形態(tài)也會是基于多類硬件、多種多樣的。那么,我們究竟可以期待哪些產(chǎn)品和體驗(yàn)率先成為現(xiàn)實(shí)呢?
真正專屬于你的個性化 AI 長什么樣?
現(xiàn)代生活被各種各樣的電子設(shè)備環(huán)繞著,或大或小,我們與這些機(jī)器的交互方式也是或復(fù)雜或簡單,而我們最熟悉的,恐怕非智能手機(jī)莫屬了。
智能手機(jī)
作為當(dāng)前人機(jī)交互最主流的方式,每天都有數(shù)十億人在使用智能手機(jī)進(jìn)行通訊、工作、娛樂和社交等活動。它撐起了移動互聯(lián)網(wǎng)的巨大市場,存儲和處理著大量信息,幾乎永遠(yuǎn)被帶在身邊,已然是一個人最為私密的資產(chǎn)之一,自然,也成為了“掌上大模型”字面意義上最廣泛也是最佳的載體。
試想,如果 Soulmate AI 能夠在智能手機(jī)上本地運(yùn)行,如果 Replika 的人物可以“活”在你的手機(jī)中,你就不用再擔(dān)心公司資產(chǎn)變動、服務(wù)器被收回等原本就與你無關(guān)的問題了,控制權(quán)將重新回到你的手中。同時(shí),本就接觸了大量個人信息的智能手機(jī),將在 AI 的加持下變身最“懂你”的智能體,可以在日常與你的互動中更好地學(xué)習(xí),為你提供量身定制的服務(wù),而這一切都是通過自然語言的交互方式進(jìn)行的。最棒的是,所有這些數(shù)據(jù)和計(jì)算都將在本地處理,你的隱私不需要再“上云”了。
這些,恰恰是高通正在試圖實(shí)現(xiàn)的。上個月底的驍龍峰會上,高通發(fā)布了其首個專為生成式 AI 打造的移動平臺——第三代驍龍 8。如果說他們今年 2 月份在 MWC 巴塞羅那上用搭載第二代驍龍 8 的安卓手機(jī)跑 Stable Diffusion 大模型 15 秒內(nèi)出圖已經(jīng)足夠驚艷,新一代平臺則把這個時(shí)間進(jìn)一步縮短到了驚人的 0.57 秒,更加凸顯了終端側(cè)本地部署、運(yùn)行 AI 的性能和時(shí)延優(yōu)勢,一手掌握、一秒出圖走進(jìn)現(xiàn)實(shí)。
圖:高通技術(shù)公司產(chǎn)品管理高級副總裁兼 AI 負(fù)責(zé)人 Ziad Asghar 丨來源:2023 年驍龍峰會
據(jù)悉,第三代驍龍 8 采用 4 納米制程工藝,其高通 AI 引擎再次進(jìn)化,擁有面向移動終端的強(qiáng)大 Hexagon NPU,集成了升級后的 Kryo CPU、Adreno GPU 以及高通 Sensing Hub(傳感器中樞)等單元,共享一個大容量的內(nèi)存。這種硬件提升的結(jié)果是,第三代驍龍 8 移動平臺的 NPU 性能相比前代提升了 98%,能效提升了 40%,賦予了智能手機(jī)前所未有的終端側(cè) AI 性能。
基于這樣的“硬”實(shí)力,高通技術(shù)公司產(chǎn)品管理高級副總裁兼 AI 負(fù)責(zé)人 Ziad Asghar 也兌現(xiàn)了他 7 月份在上海接受我們的采訪時(shí)許下的承諾,宣布新一代的驍龍平臺已經(jīng)實(shí)現(xiàn)了對 100 億參數(shù)模型的運(yùn)行支持,并首次支持多模態(tài)生成式 AI。
圖:驍龍 8 Gen 3 移動平臺丨來源:高通
在 OEM 廠商一側(cè),全球首發(fā)搭載第三代驍龍 8 的小米 14 系列新機(jī)已經(jīng)推向市場,將大模型技術(shù)集成到了小米全新的澎湃 OS 當(dāng)中,同時(shí)上線了一系列的 AI 原生應(yīng)用,如 AI 妙畫、AI 搜圖、AI 寫真、AI 擴(kuò)圖等各種功能。在剛剛過去的“雙 11”,小米 14 系列斬獲四大平臺國產(chǎn)冠軍,銷量十分可觀,消費(fèi)者用錢包投票,投出了市場的熱情所向。
最近,高通還推出了第三代驍龍 7 移動平臺,榮耀也在今天(11 月 23 日)首發(fā)搭載該平臺的榮耀 100,vivo 的產(chǎn)品也將很快推出。這將把終端側(cè) AI 體驗(yàn)進(jìn)一步推向性價(jià)比更高的手機(jī)終端和更廣泛的用戶,《Her》中的 Samatha 成為現(xiàn)實(shí)或許就在不遠(yuǎn)的將來,而且這次,“她”將只屬于你一個人。
AI PC
當(dāng)下,移動 PC 仍然穩(wěn)坐現(xiàn)代社會的生產(chǎn)力擔(dān)當(dāng),也因其便攜的特質(zhì)和不俗的終端算力,成為了打工人幾乎人手一臺的最佳工具。不過,如今的工作方式高度依賴云端,相信在 OpenAI 服務(wù)器宕機(jī)的時(shí)候,絕大多數(shù)抱怨的用戶都正在一臺 PC 上為社會創(chuàng)造價(jià)值,而 PC 本身的算力并沒有被充分利用。
那么,如果 AI 大模型可以在移動 PC 上本地運(yùn)行,還有什么比成千上萬臺個人 PC 更適合用來“給云端減負(fù)”的呢?不止 OpenAI,事實(shí)上生產(chǎn)力是生成式 AI 最早帶來變革的領(lǐng)域。作為這一波 AI 浪潮的頭部玩家和高通的長期合伙伙伴,微軟將 Copilot 帶到了 Edge 瀏覽器和最新的 Windows 11 上,致力于重新定義生產(chǎn)力,徹底顛覆我們與 PC 的交互方式。當(dāng)這些都在 PC 上本地實(shí)現(xiàn)時(shí),你將再也不用擔(dān)心與其他人爭搶服務(wù)器算力,你的數(shù)據(jù)也將被安全地保護(hù)在本地,遠(yuǎn)離可能的云端攻擊,移動 PC 的算力將得到真正的釋放,成為生產(chǎn)力。
圖:微軟 CEO 納德拉與高通總裁兼 CEO 安蒙對話丨來源:2023 年驍龍峰會
這一切的前提,是一個足夠強(qiáng)大的 PC 平臺,而高通同樣做到了。
2023 年驍龍峰會上,高通正式發(fā)布了專為 AI 打造的 PC 平臺驍龍 X Elite,采用 4nm 制程工藝,搭載了自研的 Oryon CPU,其性能直接對標(biāo)英特爾和蘋果的旗艦處理器,多線程 CPU 性能相較蘋果 ARM 架構(gòu)的 M2 Max 芯片高出 50%,單線程功耗卻少 30%;而對比英特爾 x86 架構(gòu)的 i9 13980HX 芯片,則在實(shí)現(xiàn)更高性能的前提下,功耗少了 70%?! ?/p>
圖:高通公司總裁兼 CEO 安蒙丨來源:2023 年驍龍峰會
負(fù)責(zé)研發(fā)的高通高級副總裁 Gerard Williams 表示,這次號稱史上最強(qiáng) PC 平臺的“大招”憋了 4、5 年之久,不過非常值得,最終實(shí)際生產(chǎn)出的 Oryon CPU 性能表現(xiàn)甚至超過了最初的計(jì)算機(jī)模擬結(jié)果,更遠(yuǎn)遠(yuǎn)超出了他們的預(yù)期。
作為“看家本領(lǐng)”,驍龍 X Elite 平臺還采用了集成高通 Hexagon NPU 的高通 AI 引擎,異構(gòu)算力高達(dá) 75 TOPS,在生成式 AI 方面的表現(xiàn)十分亮眼,當(dāng)前支持 130 億參數(shù)大模型的終端側(cè)部署與運(yùn)行,在跑 Meta Llama 2 -7B 時(shí),每秒可生成 30 個 token,AI 處理速度達(dá)到了同類競品的 4.5 倍。
圖:驍龍 X Elite 丨來源:高通
“AI PC”的實(shí)現(xiàn)不能僅靠單打獨(dú)斗,聯(lián)想、惠普、榮耀等 OEM 廠商將基于驍龍 X Elite 的 AI 原生平臺推出新一代 PC,讓生產(chǎn)力搭上 AI 時(shí)代的快車。據(jù)悉,第一批搭載驍龍 X Elite 的筆記本電腦將于 2024 年中面市,將給云端“松一口氣”,為原本疲軟的 PC 市場帶來一股新風(fēng),廣大打工人也將迎來更高效、更安全的顛覆性工作方式。
XR
走向萬物智能的時(shí)代,自然少不了數(shù)字技術(shù)構(gòu)建出的“第二空間”。面向虛擬空間與現(xiàn)實(shí)空間并行共存的未來,包括虛擬現(xiàn)實(shí)、增強(qiáng)現(xiàn)實(shí)、混合現(xiàn)實(shí)等在內(nèi)的 XR 正在成為人類新型生活方式的重要入口和載體,而有了 AI 大模型的加持,其想象力的天花板也再次被捅穿。
不過,“云端”生活有著上述所有的風(fēng)險(xiǎn),或許更甚,畢竟整個世界都可能是“空中樓閣”。只有當(dāng)穿梭于兩個世界之間的鑰匙掌握在自己手中時(shí),我們才可能開始談?wù)摗皻w屬感”。為此,高通此前發(fā)布了第二代驍龍 XR 平臺,并與 Meta 合作推出了全新的 Meta Quest 3 頭顯設(shè)備,相比前代在空間分辨率、沉浸式體驗(yàn)以及低時(shí)延攝像頭透視方面都有了很大的飛躍。
得益于新一代的芯片,Quest 3 上的應(yīng)用生態(tài)愈發(fā)繁榮。就拿精品健身品牌 Xponential Fitness 來說,其開發(fā)的 AI 驅(qū)動 XR 健身應(yīng)用將打破傳統(tǒng)健身行業(yè)的時(shí)空限制,為我們帶來隨時(shí)隨地的 XR 數(shù)字人私教服務(wù)。有了大模型的加持,應(yīng)用可以針對不同個體量身定制多樣的健身計(jì)劃,并輔以智能手機(jī)(當(dāng)然了,搭載的是驍龍芯片)作為頭顯設(shè)備的補(bǔ)充,通過攝像頭等識別、分析用戶健身時(shí)的體態(tài)、動作,再以 AI 進(jìn)行實(shí)時(shí)的動作矯正和指導(dǎo)。聽起來是不是很科幻、很誘人?得益于終端側(cè) AI 的部署和運(yùn)行,這樣實(shí)時(shí)、高效、低成本、個性化定制的健身體驗(yàn)將很快成為現(xiàn)實(shí),而我們離模糊了虛擬和現(xiàn)實(shí)邊界的智能世界又近了一步。
圖:Quest 3 上的虛擬健身私教丨來源:2023 年驍龍峰會
個性化專屬 AI 的時(shí)代剛剛開始
不論是負(fù)擔(dān)過重的云端,還是個性化專屬的市場訴求,AI 從單一云端向終端側(cè)靠攏已然是大勢所趨。對于每一位用戶來說,這意味著更快的反饋速度,更個性化的量身定制,和更可靠的隱私安全。事實(shí)上,終端側(cè) AI 的形態(tài)遠(yuǎn)遠(yuǎn)不止上面所述的那些,高通已經(jīng)在汽車智能座艙、物聯(lián)網(wǎng)等領(lǐng)域有所布局,包括小米在內(nèi)的合作伙伴也將在新車上融入大模型技術(shù),為用戶打造全新的人車交互方式。
專屬于每個人的個性化 AI 時(shí)代才剛剛開始。用高通公司總裁兼 CEO 安蒙的話來說,終端側(cè) AI 是要變革以往“以應(yīng)用為核心”的終端交互體驗(yàn),以大模型打通、整合整個智能系統(tǒng)中的信息產(chǎn)生與流動,從而徹底顛覆終端側(cè)的人機(jī)交互。要實(shí)現(xiàn)這一點(diǎn),除了足夠快和個性化程度足夠高之外,最重要的是我們必須能夠信賴這樣的 AI,而能“一手掌握”的終端側(cè)部署是當(dāng)下的最優(yōu)解。做到這一點(diǎn),或許我們就離真正“你有、你治、你享”的 AI 不遠(yuǎn)了。
全部評論