創(chuàng)業(yè)投資服務(wù)平臺(tái)

創(chuàng)投時(shí)報(bào)LOGO

「C位觀察」AI 2.0革命:產(chǎn)業(yè)視角下生成式AI如何落地

850人瀏覽 / 0人評(píng)論

生成式AI在過(guò)去2年吸引了全球目光,ChatGPT用破紀(jì)錄的5天時(shí)間達(dá)到百萬(wàn)用戶(hù),2個(gè)月破億,Sora可生成最長(zhǎng)1分鐘的模擬真實(shí)世界的視頻,Suno創(chuàng)作出讓用戶(hù)驚艷的音樂(lè)作品,我們看到AI在文本、圖像、視頻、音頻生成等領(lǐng)域取得了重大突破,OpenAI和Anthropic為代表的公司完成了數(shù)十億到百億美金的融資。大家在經(jīng)歷AI技術(shù)日新月異的突破的同時(shí),也關(guān)注生成式AI如何應(yīng)用落地,如何產(chǎn)生商業(yè)價(jià)值。

CMC資本投資了快手(1024.HK)、B站(NASDAQ: BILI、9626.HK)、快看漫畫(huà)、網(wǎng)易云音樂(lè)(9899.HK)、愛(ài)奇藝(NASDAQ:IQ)等互聯(lián)網(wǎng)平臺(tái),兄弟企業(yè)“華人文化集團(tuán)公司”控股電視廣播有限公司(00511.HK,香港TVB)、正午陽(yáng)光、紫龍游戲、華人影業(yè)、東方夢(mèng)工廠、日月星光等具有領(lǐng)先優(yōu)勢(shì)的頭部?jī)?nèi)容集群和綜合協(xié)同生態(tài),以上都是生成式AI的天然應(yīng)用和落地場(chǎng)景,因此我們?cè)谏疃雀采w技術(shù)供給端的科技公司進(jìn)展的同時(shí),也關(guān)注到產(chǎn)業(yè)端有強(qiáng)烈的AI需求,互聯(lián)網(wǎng)平臺(tái)公司在積極嘗試AI,用AI制作了不錯(cuò)的作品,但還在尋找好的商業(yè)模式。在產(chǎn)業(yè)端大規(guī)模的有效商業(yè)落地更是處于早期階段,也存在著各種挑戰(zhàn)。

本期「C位觀察」由CMC資本管理合伙人陳弦指導(dǎo),投資副總裁王鶴宇執(zhí)筆,將帶著產(chǎn)業(yè)視角,談一談我們對(duì)生成式AI在B端產(chǎn)業(yè)落地的思考。2C和2B在模型能力要求上有差異,思路和場(chǎng)景亦有不同,CMC資本在過(guò)往投資了很多2C的產(chǎn)品,經(jīng)歷了科技范式的變化帶來(lái)C端消費(fèi)方式變化的階段,C端落地將不在本篇幅中重點(diǎn)展開(kāi),請(qǐng)期待陸續(xù)推出的系列分享。

1.AI2.0時(shí)代和新型生產(chǎn)關(guān)系

AI1.0時(shí)代

大家過(guò)往接觸的AI,即所謂AI1.0,是判別式AI,機(jī)器可以在計(jì)算機(jī)視覺(jué)、自然語(yǔ)言理解等領(lǐng)域超越人類(lèi),常見(jiàn)的智能內(nèi)容推薦、智慧安防攝像頭、貨架識(shí)別等都是AI1.0時(shí)代的應(yīng)用,誕生了商湯為代表的“AI四小龍”和字節(jié)這樣的超級(jí)獨(dú)角獸。

模型架構(gòu)上,AI1.0時(shí)代主要基于RNN等網(wǎng)絡(luò),RNN的數(shù)據(jù)處理使用的是串行,導(dǎo)致處理長(zhǎng)序列數(shù)據(jù)能力有限;訓(xùn)練方法上,主要使用有監(jiān)督學(xué)習(xí),需要大量的標(biāo)注數(shù)據(jù)和專(zhuān)業(yè)的編程人員,以上都導(dǎo)致其Scalability有限,往往一個(gè)模型對(duì)應(yīng)單一的任務(wù),其自身的泛化能力也有限。模型的參數(shù)通常在百萬(wàn)-千萬(wàn)級(jí)別,因此在算力上,部分模型使用消費(fèi)級(jí)顯卡即可。

 

   

圖:判別式AI的模型、數(shù)據(jù)、任務(wù)關(guān)系

AI2.0時(shí)代

模型架構(gòu)上,2017年谷歌提出了Transformer架構(gòu),引入自注意力機(jī)制,如在自然語(yǔ)言處理時(shí),它能讓模型評(píng)估句子中各個(gè)詞的重要性,從而根據(jù)上下文鎖定關(guān)鍵信息,提高下一階段的文本預(yù)測(cè)與建模能力。Diffusion模型,模仿物質(zhì)在氣體或液體中擴(kuò)散的過(guò)程(如墨水在水中的擴(kuò)散過(guò)程),通過(guò)前向擴(kuò)散(加噪)和反向擴(kuò)散(去噪)不斷修正訓(xùn)練自己,在圖像、視頻、音頻領(lǐng)域展現(xiàn)了良好的生成能力,超越了GAN的地位,模型本身的Scalability較AI1.0時(shí)代取得重大進(jìn)步。

訓(xùn)練方法上,Transformer主要使用自監(jiān)督學(xué)習(xí),無(wú)需人工標(biāo)注數(shù)據(jù)和專(zhuān)業(yè)編程人員,可以自動(dòng)適配和執(zhí)行各種任務(wù),大幅提高了模型的Scalability。

近些年GPU計(jì)算能力的進(jìn)步,使得早在2017年就提出的Transformer架構(gòu)成為可能,Transformer為代表的大模型的參數(shù)量在百億以上,在當(dāng)時(shí)的GPU能力下無(wú)法進(jìn)行有效訓(xùn)練。但英偉達(dá)代表的GPU不斷進(jìn)步,其制程從28納米進(jìn)步到5納米,NVLink技術(shù)增加了GPU間通信的效率,GPU的調(diào)度能力也獲得提升,千卡GPU集群并行計(jì)算成為可能,促進(jìn)了算力能力大幅度綜合提高,為大模型的訓(xùn)練提供了基礎(chǔ)。

以上的模型架構(gòu)的突破、訓(xùn)練方法的優(yōu)化、GPU能力的提升,共同驅(qū)動(dòng)了生成式AI開(kāi)啟AI2.0時(shí)代?;诔?jí)海量數(shù)據(jù)訓(xùn)練的大模型,可以生成文本、圖像、視頻、音頻和3D等各類(lèi)媒介的內(nèi)容,具有更強(qiáng)的理解、推理和創(chuàng)造能力,也解鎖了AI1.0時(shí)代(安防和智能推薦為主)以外更豐富的場(chǎng)景和更大的市場(chǎng)空間。預(yù)訓(xùn)練的模型,本質(zhì)集成壓縮了豐富的世界知識(shí),在泛化性上有極大的提升,如果將AI1.0的模型能力類(lèi)比于只能完成特定任務(wù)的學(xué)前班學(xué)生,大模型是高中生,具備可以完成多個(gè)任務(wù)的能力。

圖:生成式AI的模型、數(shù)據(jù)、任務(wù)關(guān)系

如前所述,生成式AI在模型架構(gòu)、訓(xùn)練方法上具備良好的Scalability,展現(xiàn)出了Scaling Law,即越多的訓(xùn)練數(shù)據(jù),越多的模型參數(shù),就會(huì)獲得越強(qiáng)的AI模型能力。目前Scaling Law還在發(fā)揮作用,因此也有部分業(yè)界把生成式AI當(dāng)作未來(lái)有可能實(shí)現(xiàn)AGI(通用人工智能)的方法之一。

新型生產(chǎn)關(guān)系

我們看好生成式AI的新范式,不僅是其遠(yuǎn)大于AI1.0的市場(chǎng)空間,更是看好其所代表的新型生產(chǎn)關(guān)系。過(guò)去的生產(chǎn)過(guò)程中,工廠消耗能源和基礎(chǔ)材料,制造出實(shí)體的產(chǎn)品。未來(lái)的核心生產(chǎn)關(guān)系將圍繞著電力、AI模型和token(數(shù)據(jù))展開(kāi)。數(shù)據(jù)中心作為AI工廠,在電力供能下,結(jié)合AI模型,通過(guò)token不斷生產(chǎn)信息化的內(nèi)容(語(yǔ)言、圖形、視頻、音樂(lè)等),也即是新的成產(chǎn)出來(lái)的產(chǎn)品,圍繞token的新型生產(chǎn)關(guān)系正在形成,構(gòu)筑新一輪的信息工業(yè)革命。當(dāng)然以上是我們認(rèn)為的遠(yuǎn)期狀態(tài),當(dāng)前也僅僅是生成式AI取得大的影響力突破的第二年,該新型生產(chǎn)關(guān)系還在構(gòu)建和發(fā)展中。

2.生成式AI并非完美,也給應(yīng)用落地帶來(lái)了挑戰(zhàn)

在語(yǔ)言、視覺(jué)和音頻領(lǐng)域,我們看到了過(guò)去一段時(shí)間生成式AI日新月異的發(fā)展,這離不開(kāi)Transformer和Diffusion模型的突破。但與此同時(shí),我們也看到了大語(yǔ)言模型存在幻覺(jué)的問(wèn)題,AI生成的視頻和圖像也并不穩(wěn)定,我們?cè)诳吹骄薮鬂摿Φ耐瑫r(shí),也不能忽視其不完美的現(xiàn)狀。

B端對(duì)內(nèi)容的精準(zhǔn)、可控、一致性、可靠性、穩(wěn)定性有著極高的要求,C端雖然相對(duì)要求更包容,但也存在著來(lái)自合規(guī)性的監(jiān)管,這些要求給尚不滿(mǎn)完美的生成式AI如何落地帶來(lái)了挑戰(zhàn)。

Transformer模型,1)缺乏可解釋性,神經(jīng)網(wǎng)絡(luò)本質(zhì)上是黑箱模型,輸入和輸出之間的關(guān)系是通過(guò)訓(xùn)練數(shù)據(jù)和復(fù)雜的計(jì)算學(xué)習(xí)到的,而非通過(guò)明確的規(guī)則編碼,在金融、醫(yī)療等復(fù)雜、專(zhuān)業(yè)或者高度監(jiān)管的行業(yè)中,模型的決策過(guò)程需要符合特定的法規(guī)和標(biāo)準(zhǔn),不可解釋性可能導(dǎo)致合規(guī)性問(wèn)題;2)會(huì)出現(xiàn)幻覺(jué),產(chǎn)生邏輯謬誤、捏造事實(shí)以及數(shù)據(jù)驅(qū)動(dòng)的偏見(jiàn),也就是通俗說(shuō)的大模型“一本正經(jīng)的胡說(shuō)八道”,客戶(hù)可能對(duì)模型的輸出結(jié)果持懷疑態(tài)度,難以建立信任,如用AI檢索的結(jié)果,為了保證真實(shí),需要復(fù)查,特別是在安全性和嚴(yán)肅性要求較高的場(chǎng)合此問(wèn)題更加突出;3)除此之外,計(jì)算和內(nèi)存消耗大,特別是在處理大規(guī)模數(shù)據(jù)集時(shí),需要大規(guī)模并行計(jì)算能力;4)優(yōu)化難度大,模型的復(fù)雜性和參數(shù)量大增加了優(yōu)化難度。

Diffusion模型,1)擴(kuò)散模型可以生成圖像和文本,但它們還難以同時(shí)理解和生成涉及多種類(lèi)型數(shù)據(jù)的復(fù)雜多模態(tài)內(nèi)容。比如目前用擴(kuò)散模型生成一張“紅色衣服”的圖片較為簡(jiǎn)單,但讓其生成一張胸前印著“明天總是美好的”紅色衣服圖像,生成的衣服上的文字往往出錯(cuò);2)擴(kuò)散模型仍是隨機(jī)采樣,導(dǎo)致其生成內(nèi)容的精準(zhǔn)、可控、一致性等方面仍然不足,比如同樣的prompt下,AI生成的2個(gè)漫畫(huà)男孩不是同一人,這就導(dǎo)致了應(yīng)用前后不對(duì)應(yīng)的問(wèn)題,使得商業(yè)落地困難。雖然業(yè)界在積極探索,ControlNet,LoRA,Dreambooth等技術(shù)的出現(xiàn)對(duì)局部?jī)?nèi)容實(shí)現(xiàn)了控制,如人臉、畫(huà)風(fēng)、動(dòng)作等,但仍有較大的進(jìn)步空間;3)其基于高斯求和的方式會(huì)帶來(lái)求解難度的提高,尤其隨著維度的上升會(huì)帶來(lái)顯存占用的幾何級(jí)別的增長(zhǎng)。這種架構(gòu)下,顯卡的顯存大小限制了視頻的時(shí)長(zhǎng),目前最長(zhǎng)的AI生成的視頻時(shí)長(zhǎng)在1分鐘左右,仍無(wú)法在長(zhǎng)視頻應(yīng)用場(chǎng)景呈現(xiàn)。

雖然目前的模型能力還有不足,但我們也注意到模型架構(gòu)也在迭代。工程上,如融合了Transformer和Diffusion的DiT,使用Transformer替換U-Net主干,并在潛在空間訓(xùn)練,展現(xiàn)出了比單純Diffusion更好的訓(xùn)練效率和生成效果。再如Mamba架構(gòu),可進(jìn)行“線性時(shí)間序列”建模,隨序列長(zhǎng)度增長(zhǎng)其計(jì)算保持線性增長(zhǎng),而非Transformer的指數(shù)級(jí)膨脹,同時(shí)改善了注意力機(jī)制,減少了處理序列數(shù)據(jù)所需的計(jì)算量,加快了數(shù)據(jù)處理速度。同時(shí)學(xué)術(shù)界也在對(duì)模型底層的數(shù)學(xué)、人腦科學(xué)做更深層次的研究,希望能找到更多樣化的實(shí)現(xiàn)AGI的通路。

3.落地思路:“End to End” vs “Step by Step”

目前生成式AI的產(chǎn)業(yè)落地,大致分為2種思路,即“End to End/端到端”和“Step by Step/按步驟拆解”,相應(yīng)特點(diǎn)也有不同。

End to End

?           方法:跳過(guò)現(xiàn)有專(zhuān)業(yè)制作流程,直接一步生成最終的內(nèi)容

?           代表產(chǎn)品:ChatGPT, Midjourney, Suno

?           落地場(chǎng)景:主要在C端大眾用戶(hù),用于泛娛樂(lè)的場(chǎng)景,或者非嚴(yán)肅場(chǎng)景,如編程,信息檢索等

?           特點(diǎn):1)簡(jiǎn)單直接,通常輸入文字prompt描述,直接產(chǎn)出最終的內(nèi)容;2)“黑盒”狀態(tài),過(guò)程不透明,生成的結(jié)果具備隨機(jī)性;3)生成的內(nèi)容往往不精準(zhǔn)和不可控;4)基本上通過(guò)多次生成,選擇最滿(mǎn)意的方式進(jìn)行生產(chǎn)

以漫畫(huà)創(chuàng)作為例,漫畫(huà)工具“AI Comic Factory”,提供了簡(jiǎn)單易用的用戶(hù)界面和使用步驟

 

輸入Prompt:A boy is walking along an old Asian Street, thinking about what to do back home

 

優(yōu)點(diǎn)

簡(jiǎn)單:只輸入“一個(gè)男孩在古老的亞洲街道走著,思考回家做什么”,自動(dòng)生成4格漫畫(huà)

不足

人物不一致:4個(gè)男孩的發(fā)型、身高、服裝都不相同

無(wú)法精準(zhǔn)得到創(chuàng)作者想要的具體街道背景、男孩畫(huà)像和動(dòng)作等

無(wú)法精準(zhǔn)的對(duì)背景、局部顏色、動(dòng)作姿態(tài)進(jìn)行控制和二次修改

圖:AI Comic Factory的創(chuàng)作案例

以上可見(jiàn),目前端到端的產(chǎn)品易于上手,但同時(shí)因?yàn)闊o(wú)法對(duì)過(guò)程進(jìn)行控制,且目前AI技術(shù)又不能一步到位生成高質(zhì)量的內(nèi)容,所以局限了出品的作品品質(zhì),更多的還是在用在for fun或者專(zhuān)業(yè)制作workflow中各步驟的第一步創(chuàng)意環(huán)節(jié),如動(dòng)畫(huà)美工/畫(huà)師或影視劇導(dǎo)演,在創(chuàng)作過(guò)程中將腦中的想法迅速通過(guò)AI畫(huà)圖展現(xiàn)出來(lái),高效呈現(xiàn)預(yù)覽效果,方便團(tuán)隊(duì)內(nèi)部溝通及靈感碰撞。

Step by Step

?           方法:盡量沿用現(xiàn)有的工作流,不追求一步到位,AI專(zhuān)注于每一步工作的提效

?           代表產(chǎn)品:Adobe Firefly,ComicsMaker.AI

?           落地場(chǎng)景:主要用于B端的專(zhuān)業(yè)工作者,用在高質(zhì)量工業(yè)級(jí)的生產(chǎn)制作流中

?           特點(diǎn):1)對(duì)每個(gè)環(huán)節(jié)的生成內(nèi)容相對(duì)更精準(zhǔn)、更可控,2)往往和現(xiàn)有工作流和制作工具融合,更易于流程管理

以專(zhuān)業(yè)的動(dòng)畫(huà)創(chuàng)作為例,以下是國(guó)內(nèi)某2B定制化AI內(nèi)容創(chuàng)作公司的案例,專(zhuān)業(yè)的動(dòng)畫(huà)制作環(huán)節(jié)包括“人設(shè)圖-分鏡-排版-草稿-線稿-上色-動(dòng)畫(huà)”,其創(chuàng)作工具依照現(xiàn)有專(zhuān)業(yè)workflow設(shè)計(jì),目標(biāo)在創(chuàng)作過(guò)程中降本增效,目前在一些案例中可以得到40%的人力成本節(jié)省。雖然AI的能力看似無(wú)所不能,多方面都可以覆蓋,但實(shí)操上每個(gè)環(huán)節(jié)涉及到眾多的細(xì)節(jié),如何反哺AI的產(chǎn)品能力,甚至進(jìn)階的精簡(jiǎn)/重塑專(zhuān)業(yè)的工作流,這都需要和產(chǎn)業(yè)方共建。

圖:某國(guó)內(nèi)公司的AIGC動(dòng)畫(huà)制作step by step賦能案例

我們認(rèn)為,雖然生成式AI在過(guò)去2年取得了快速發(fā)展,但今天行業(yè)仍在早期,長(zhǎng)期我們確信AI會(huì)顛覆現(xiàn)有的工作流,甚至企業(yè)的管理學(xué),但從務(wù)實(shí)的角度,B端的AI落地,會(huì)經(jīng)歷1)短期先Step by Step在可能的環(huán)節(jié)部分落地,降本增效;2)行業(yè)公司效仿,滲透率提升;3)技術(shù)進(jìn)步,更多環(huán)節(jié)可以被AI賦能,滲透率再次提升;4)技術(shù)迭代,workflow開(kāi)始合并縮短,甚至出現(xiàn)全新的成產(chǎn)方式;5)理論上最終極的方式可能是一步端到端。


圖:B端AI落地趨勢(shì)

4.行業(yè)know-how和專(zhuān)有數(shù)據(jù)對(duì)B端落地不可或缺

根據(jù)上文,按照步驟拆解的思路在B端產(chǎn)業(yè)落地,需要更多的行業(yè)know-how和專(zhuān)有數(shù)據(jù)。如上文的動(dòng)畫(huà)制作案例,第一步就是拆解工作流,如“人設(shè)圖-分鏡-排版-草稿-線稿-上色-動(dòng)畫(huà)”,本身就是know-how。然后每個(gè)環(huán)節(jié)如何和AI結(jié)合,如何高質(zhì)量打標(biāo)簽,如何實(shí)現(xiàn)美學(xué)對(duì)齊(比如創(chuàng)作端什么內(nèi)容才是“美”,什么才是“好”等),哪些功能和模塊更符合使用需求,也是需要與行業(yè)know-how結(jié)合打磨,也是PMF的過(guò)程。

專(zhuān)業(yè)制作內(nèi)容,有大量的數(shù)據(jù)1)本身很難或者無(wú)法進(jìn)行數(shù)字化沉淀,如電影/漫畫(huà)的分鏡設(shè)計(jì),其構(gòu)思往往在導(dǎo)演/創(chuàng)作者腦中,無(wú)法有效沉淀;2)在制作方手中,特別是制作環(huán)節(jié)過(guò)程中產(chǎn)生的高質(zhì)量結(jié)構(gòu)化數(shù)據(jù),對(duì)模型訓(xùn)練有巨大幫助,但往往這些數(shù)據(jù)并不是公開(kāi)的。相關(guān)數(shù)據(jù)的缺乏導(dǎo)致了AI模型本身無(wú)法有效獲得訓(xùn)練而不具備對(duì)應(yīng)能力,這也是上文案例動(dòng)畫(huà)制作環(huán)節(jié)中,分鏡設(shè)計(jì)的AI滲透率極低,但上色環(huán)節(jié)(公開(kāi)數(shù)據(jù)較多)有較好效果和滲透率的原因。

預(yù)訓(xùn)練模型的本質(zhì)是歷史數(shù)據(jù)和知識(shí)的壓縮,數(shù)據(jù)的質(zhì)和量極大程度決定了AI能力。專(zhuān)有數(shù)據(jù)對(duì)于提升模型能力,滿(mǎn)足企業(yè)的特定需求(調(diào)性風(fēng)格、品牌特點(diǎn)、行業(yè)知識(shí)等)至關(guān)重要。

 

公開(kāi)數(shù)據(jù)

專(zhuān)有數(shù)據(jù)

?    AI大模型訓(xùn)練的基礎(chǔ),構(gòu)建整體的AI能力

?    公開(kāi)數(shù)據(jù)訓(xùn)練的模型關(guān)注內(nèi)容生成的多樣性,而非精準(zhǔn)性

?    有潛在的IP風(fēng)險(xiǎn)

?    可訓(xùn)練出能夠解決特定問(wèn)題或滿(mǎn)足特定需求的AI模型,且此等模型是其他企業(yè)很難復(fù)制的

?    在專(zhuān)業(yè)內(nèi)容制作、法律、醫(yī)療、金融等領(lǐng)域尤其重要

?    數(shù)據(jù)多在產(chǎn)業(yè)方手中,且多高度重視自有數(shù)據(jù)的價(jià)值和安全性

表:訓(xùn)練數(shù)據(jù)對(duì)比

因此我們也期待產(chǎn)業(yè)方更開(kāi)放的同科技公司合作,目前雖然中國(guó)底層大模型的發(fā)展和學(xué)術(shù)研究暫時(shí)還處于追趕國(guó)外的狀態(tài),但中國(guó)的產(chǎn)業(yè)更豐富,我們對(duì)應(yīng)用的落地有著更強(qiáng)的人才和資源投入,我們?cè)贏I2.0的商業(yè)化應(yīng)用上有機(jī)會(huì)復(fù)現(xiàn)中國(guó)在AI1.0時(shí)代的引領(lǐng)地位。

5.B端需要的并非單一的AI產(chǎn)品和工具

對(duì)企業(yè)客戶(hù)來(lái)說(shuō),經(jīng)過(guò)我們的調(diào)研,相比于底層技術(shù)和實(shí)現(xiàn)方式,其往往更關(guān)注交付的效果,所以生成式AI的落地,除了行業(yè)know-how和專(zhuān)有數(shù)據(jù)以外,我們認(rèn)為需要滿(mǎn)足以下幾點(diǎn):

首先,是多個(gè)模態(tài)的組合

圖:某3D游戲開(kāi)發(fā)中AI的應(yīng)用

生成式AI的落地在眾多的行業(yè)和場(chǎng)景,但從介質(zhì)的角度來(lái)看,主要是文本/圖像/視頻/3D/音頻。真的在產(chǎn)業(yè)落地,單一的模態(tài)往往是不充分的。其中,文本往往被廣泛用作跨模態(tài)(和圖像/視頻/3D/音頻)交互的自然語(yǔ)言,連接著多模態(tài)的組合。如AI制作3D游戲,就涉及到文本、圖像和3D等模態(tài),文本可用于編程和對(duì)話,以及其他模態(tài)的交互,圖像用于人物設(shè)計(jì)的美術(shù)環(huán)節(jié),3D用于建模環(huán)節(jié)。

其次,還會(huì)是多個(gè)模型構(gòu)建的系統(tǒng)

大模型和小模型的組合:大模型泛化和通用性強(qiáng),但對(duì)于很多AI1.0時(shí)代已經(jīng)解決的標(biāo)準(zhǔn)化的場(chǎng)景,用小模型更具備經(jīng)濟(jì)性(算力消耗少),因此可以組合大模型和小模型搭配,分別完成復(fù)雜和標(biāo)準(zhǔn)場(chǎng)景。

通用和垂直模型組合:通用模型覆蓋大部分業(yè)務(wù),但對(duì)特定的垂直領(lǐng)域,調(diào)用對(duì)應(yīng)的垂直模型,如法律翻譯和文學(xué)翻譯,AI翻譯系統(tǒng)可以是不垂直模型的組合。

圖:翻譯場(chǎng)景通用+垂類(lèi)模型

除此之外,為了實(shí)現(xiàn)特定的目標(biāo),還會(huì)包含眾多的嵌入的模塊來(lái)擴(kuò)展模型能力的邊界,從而構(gòu)成一個(gè)系統(tǒng)。比如會(huì)在Stable Diffusion模型中加入Control Net的神經(jīng)網(wǎng)絡(luò)架構(gòu),通過(guò)選擇不同的輸入條件,生成滿(mǎn)足特定需求的圖像來(lái)實(shí)現(xiàn)內(nèi)容控制?;蛘咴谀P椭屑尤胛谋咎卣鞒槿∧K,多層映射網(wǎng)絡(luò)實(shí)現(xiàn)關(guān)鍵詞解耦,從而提升理解能力等,使得AI能真正落地使用。

最后,還會(huì)是AI能力+現(xiàn)有業(yè)務(wù)系統(tǒng)和管理流程的結(jié)合

很多AI公司都可以做到前述2點(diǎn),但最終在企業(yè)的落地效果不佳,究其原因還是在于1)要么沒(méi)有和現(xiàn)有的業(yè)務(wù)系統(tǒng)結(jié)合,導(dǎo)致雖然局部環(huán)節(jié)提效,但和現(xiàn)有業(yè)務(wù)系統(tǒng)的融合中額外增加成本,總效率更低,或者2)目前大模型無(wú)法嵌入企業(yè)的工作體系里,也無(wú)法解決企業(yè)的管理邏輯,所以往往都是設(shè)計(jì)師/員工自行使用,AI和管理體系需要協(xié)同和融合。

我們觀察到國(guó)內(nèi)某新型主流全媒體集團(tuán)旗下的“生成式人工智能媒體融合創(chuàng)新工作室”取得了不錯(cuò)的落地,內(nèi)部結(jié)合自身的工作管理和業(yè)務(wù)流程,疊加AI能力,開(kāi)發(fā)了一套全棧的AI+業(yè)務(wù)+管理系統(tǒng)。其1)在AI制作上,涵蓋了多個(gè)功能,涉及文本、圖像、視頻、音頻等多個(gè)模態(tài);2)現(xiàn)有的媒體集團(tuán)的業(yè)務(wù)和管理,涉及“媒資庫(kù)入檢索-內(nèi)容制作-內(nèi)容審核-內(nèi)容分發(fā)-媒資入庫(kù)”等環(huán)節(jié)和系統(tǒng)。所開(kāi)發(fā)的AI系統(tǒng)和公司媒資管理系統(tǒng)、專(zhuān)屬(新聞采編等)業(yè)務(wù)系統(tǒng)有連接,同時(shí)也是與安全播出的多重審核機(jī)制管理權(quán)限藕合。不僅僅是單純的內(nèi)容制作工具,其也集成AI媒資管理、安全審核結(jié)合等業(yè)務(wù)和監(jiān)管環(huán)節(jié),形成一套綜合的系統(tǒng)。3)同時(shí)制作全流程不需要切換系統(tǒng),方便管理和流程轉(zhuǎn)移。這是我們看到的目前較好的B端的綜合AI落地,結(jié)合了多個(gè)模態(tài),多個(gè)模型,同時(shí)和企業(yè)的業(yè)務(wù)和管理流程系統(tǒng)融合,具備較高的使用率,也表現(xiàn)出較好的提效結(jié)果。

圖:某媒體龍頭公司的AI系統(tǒng)

6.AI 2B發(fā)展路徑:Native生成式AI公司vs Non-native生成式AI公司

我們觀察到在AI 2B賽道有2類(lèi)公司。一類(lèi)是Native生成式AI公司,從0-1利用AI的模型能力為企業(yè)客戶(hù)提供服務(wù)。另一類(lèi)是Non-native生成式AI服務(wù)公司,比如數(shù)字化時(shí)代的企業(yè)服務(wù)公司,他們通常已在一些2B場(chǎng)景里取得了不錯(cuò)的結(jié)果,如今把生成式AI能力融合到現(xiàn)有場(chǎng)景中,謀求更好的實(shí)現(xiàn)效果。

第一類(lèi)路徑

比如在視頻制作領(lǐng)域有眾多的Native生成式AI創(chuàng)業(yè)公司,他們致力于通過(guò)AI模型,輸入文字或者圖像直接產(chǎn)出視頻。隨著Sora的推出,我們觀察到眾多相關(guān)創(chuàng)業(yè)公司當(dāng)前的努力重點(diǎn)還是提升模型能力,盡快復(fù)刻Sora展現(xiàn)出來(lái)的效果。我們認(rèn)為如果想要將其做成一個(gè)企業(yè)級(jí)的應(yīng)用產(chǎn)品,合理的路徑除了進(jìn)一步提高模型本身之外,還需要1)產(chǎn)品的功能設(shè)計(jì)和工作流相結(jié)合,如增加分鏡的順序組合搭配工具,使得生成的視頻具備故事性;2)增加編輯和控制工具,如局部?jī)?nèi)容的特定顏色,特效的編輯功能,或者關(guān)鍵幀的控制工具等。通過(guò)和產(chǎn)業(yè)需求和know-how結(jié)合,才能將模型能力變成產(chǎn)品,且其符合使用習(xí)慣從而取得很好的落地效果。

第二類(lèi)路徑

智能化的基礎(chǔ)是數(shù)字化,很多場(chǎng)景已經(jīng)在AI1.0時(shí)代被企業(yè)服務(wù)公司覆蓋,如智能客服、AI營(yíng)銷(xiāo)、翻譯等。在已經(jīng)被數(shù)字化改造的行業(yè)的提供企業(yè)服務(wù)公司,其有沉淀的場(chǎng)景數(shù)據(jù),有業(yè)務(wù)的落地,有現(xiàn)成的客戶(hù)access,如果疊加生成式AI的能力,如把大模型應(yīng)用到客服系統(tǒng)和營(yíng)銷(xiāo)對(duì)話場(chǎng)景,對(duì)話效果比AI1.0的模型更加自然,從而獲得更高的用戶(hù)滿(mǎn)意度和付費(fèi)轉(zhuǎn)化率。再如大模型對(duì)商業(yè)運(yùn)營(yíng)表現(xiàn)和市場(chǎng)商機(jī)進(jìn)行分析,進(jìn)一步完善BI(商業(yè)智能)的功能,這些都可以加深對(duì)客戶(hù)的服務(wù)深度和拓寬服務(wù)邊界,增加企業(yè)客戶(hù)對(duì)產(chǎn)品的價(jià)值感。我們觀察到在AI電商營(yíng)銷(xiāo)領(lǐng)域,隨著生成式AI技術(shù)的普及,原本處于不同環(huán)節(jié)分工的企業(yè),都在拓寬服務(wù)邊界,彼此滲透,例如提供AI客服的公司,使用大模型能力,不僅提升了客戶(hù)對(duì)話能力,也拓展到AI蓄客、營(yíng)銷(xiāo)文案制作、數(shù)字人、智能營(yíng)銷(xiāo)切片等。因此我們認(rèn)為以上也是一個(gè)生成式AI 2B有機(jī)會(huì)的發(fā)展路徑。

7.結(jié)語(yǔ)

生成式AI技術(shù)解鎖了巨大的市場(chǎng)空間和可能性,但當(dāng)前技術(shù)并不完美,特別在對(duì)精準(zhǔn)性、可控性、一致性要求較高的B端產(chǎn)業(yè)落地面臨較多挑戰(zhàn)。End to End思路更直接,但想要取得更好的結(jié)果更依賴(lài)底層技術(shù)的突破,Step by Step思路在當(dāng)前的技術(shù)棧下短期更加務(wù)實(shí),追求降本增效。但無(wú)論哪種思路,行業(yè)的know-how,專(zhuān)有數(shù)據(jù),AI與業(yè)務(wù)和管理系統(tǒng)的耦合,都在產(chǎn)業(yè)端落地中都至關(guān)重要。

此外,生成式AI也是設(shè)計(jì)和生產(chǎn)范式的變化,年輕的創(chuàng)作者對(duì)新技術(shù)的擁抱度更高,AI科技公司可以參與培育新一批的AI Native的創(chuàng)作者,在大學(xué)共創(chuàng)課程體系,隨著相關(guān)學(xué)生畢業(yè)進(jìn)入產(chǎn)業(yè)界,將促成新的創(chuàng)作范式的行業(yè)落地,同時(shí)也形成了產(chǎn)品的隱性的護(hù)城河。

全部評(píng)論