亚洲欧州色色免费AV,啊~这么大会很痛的

「C位觀察」AI 2.0革命：產(chǎn)業(yè)視角下生成式AI如何落地

850人瀏覽 / 0人評(píng)論

生成式AI在過(guò)去2年吸引了全球目光，ChatGPT用破紀(jì)錄的5天時(shí)間達(dá)到百萬(wàn)用戶(hù)，2個(gè)月破億，Sora可生成最長(zhǎng)1分鐘的模擬真實(shí)世界的視頻，Suno創(chuàng)作出讓用戶(hù)驚艷的音樂(lè)作品，我們看到AI在文本、圖像、視頻、音頻生成等領(lǐng)域取得了重大突破，OpenAI和Anthropic為代表的公司完成了數(shù)十億到百億美金的融資。大家在經(jīng)歷AI技術(shù)日新月異的突破的同時(shí)，也關(guān)注生成式AI如何應(yīng)用落地，如何產(chǎn)生商業(yè)價(jià)值。

CMC資本投資了快手（1024.HK）、B站(NASDAQ: BILI、9626.HK)、快看漫畫(huà)、網(wǎng)易云音樂(lè)（9899.HK）、愛(ài)奇藝（NASDAQ:IQ）等互聯(lián)網(wǎng)平臺(tái)，兄弟企業(yè)“華人文化集團(tuán)公司”控股電視廣播有限公司（00511.HK，香港TVB）、正午陽(yáng)光、紫龍游戲、華人影業(yè)、東方夢(mèng)工廠、日月星光等具有領(lǐng)先優(yōu)勢(shì)的頭部?jī)?nèi)容集群和綜合協(xié)同生態(tài)，以上都是生成式AI的天然應(yīng)用和落地場(chǎng)景，因此我們?cè)谏疃雀采w技術(shù)供給端的科技公司進(jìn)展的同時(shí)，也關(guān)注到產(chǎn)業(yè)端有強(qiáng)烈的AI需求，互聯(lián)網(wǎng)平臺(tái)公司在積極嘗試AI，用AI制作了不錯(cuò)的作品，但還在尋找好的商業(yè)模式。在產(chǎn)業(yè)端大規(guī)模的有效商業(yè)落地更是處于早期階段，也存在著各種挑戰(zhàn)。

本期「C位觀察」由CMC資本管理合伙人陳弦指導(dǎo)，投資副總裁王鶴宇執(zhí)筆，將帶著產(chǎn)業(yè)視角，談一談我們對(duì)生成式AI在B端產(chǎn)業(yè)落地的思考。2C和2B在模型能力要求上有差異，思路和場(chǎng)景亦有不同，CMC資本在過(guò)往投資了很多2C的產(chǎn)品，經(jīng)歷了科技范式的變化帶來(lái)C端消費(fèi)方式變化的階段，C端落地將不在本篇幅中重點(diǎn)展開(kāi)，請(qǐng)期待陸續(xù)推出的系列分享。

1.AI2.0時(shí)代和新型生產(chǎn)關(guān)系

AI1.0時(shí)代

大家過(guò)往接觸的AI，即所謂AI1.0，是判別式AI，機(jī)器可以在計(jì)算機(jī)視覺(jué)、自然語(yǔ)言理解等領(lǐng)域超越人類(lèi)，常見(jiàn)的智能內(nèi)容推薦、智慧安防攝像頭、貨架識(shí)別等都是AI1.0時(shí)代的應(yīng)用，誕生了商湯為代表的“AI四小龍”和字節(jié)這樣的超級(jí)獨(dú)角獸。

模型架構(gòu)上，AI1.0時(shí)代主要基于RNN等網(wǎng)絡(luò)，RNN的數(shù)據(jù)處理使用的是串行，導(dǎo)致處理長(zhǎng)序列數(shù)據(jù)能力有限；訓(xùn)練方法上，主要使用有監(jiān)督學(xué)習(xí)，需要大量的標(biāo)注數(shù)據(jù)和專(zhuān)業(yè)的編程人員，以上都導(dǎo)致其Scalability有限，往往一個(gè)模型對(duì)應(yīng)單一的任務(wù)，其自身的泛化能力也有限。模型的參數(shù)通常在百萬(wàn)-千萬(wàn)級(jí)別，因此在算力上，部分模型使用消費(fèi)級(jí)顯卡即可。

圖：判別式AI的模型、數(shù)據(jù)、任務(wù)關(guān)系

AI2.0時(shí)代

模型架構(gòu)上，2017年谷歌提出了Transformer架構(gòu)，引入自注意力機(jī)制，如在自然語(yǔ)言處理時(shí)，它能讓模型評(píng)估句子中各個(gè)詞的重要性，從而根據(jù)上下文鎖定關(guān)鍵信息，提高下一階段的文本預(yù)測(cè)與建模能力。Diffusion模型，模仿物質(zhì)在氣體或液體中擴(kuò)散的過(guò)程（如墨水在水中的擴(kuò)散過(guò)程），通過(guò)前向擴(kuò)散（加噪）和反向擴(kuò)散（去噪）不斷修正訓(xùn)練自己，在圖像、視頻、音頻領(lǐng)域展現(xiàn)了良好的生成能力，超越了GAN的地位，模型本身的Scalability較AI1.0時(shí)代取得重大進(jìn)步。

訓(xùn)練方法上，Transformer主要使用自監(jiān)督學(xué)習(xí)，無(wú)需人工標(biāo)注數(shù)據(jù)和專(zhuān)業(yè)編程人員，可以自動(dòng)適配和執(zhí)行各種任務(wù)，大幅提高了模型的Scalability。

近些年GPU計(jì)算能力的進(jìn)步，使得早在2017年就提出的Transformer架構(gòu)成為可能，Transformer為代表的大模型的參數(shù)量在百億以上，在當(dāng)時(shí)的GPU能力下無(wú)法進(jìn)行有效訓(xùn)練。但英偉達(dá)代表的GPU不斷進(jìn)步，其制程從28納米進(jìn)步到5納米，NVLink技術(shù)增加了GPU間通信的效率，GPU的調(diào)度能力也獲得提升，千卡GPU集群并行計(jì)算成為可能，促進(jìn)了算力能力大幅度綜合提高，為大模型的訓(xùn)練提供了基礎(chǔ)。

以上的模型架構(gòu)的突破、訓(xùn)練方法的優(yōu)化、GPU能力的提升，共同驅(qū)動(dòng)了生成式AI開(kāi)啟AI2.0時(shí)代?；诔?jí)海量數(shù)據(jù)訓(xùn)練的大模型，可以生成文本、圖像、視頻、音頻和3D等各類(lèi)媒介的內(nèi)容，具有更強(qiáng)的理解、推理和創(chuàng)造能力，也解鎖了AI1.0時(shí)代（安防和智能推薦為主）以外更豐富的場(chǎng)景和更大的市場(chǎng)空間。預(yù)訓(xùn)練的模型，本質(zhì)集成壓縮了豐富的世界知識(shí)，在泛化性上有極大的提升，如果將AI1.0的模型能力類(lèi)比于只能完成特定任務(wù)的學(xué)前班學(xué)生，大模型是高中生，具備可以完成多個(gè)任務(wù)的能力。

圖：生成式AI的模型、數(shù)據(jù)、任務(wù)關(guān)系

如前所述，生成式AI在模型架構(gòu)、訓(xùn)練方法上具備良好的Scalability，展現(xiàn)出了Scaling Law，即越多的訓(xùn)練數(shù)據(jù)，越多的模型參數(shù)，就會(huì)獲得越強(qiáng)的AI模型能力。目前Scaling Law還在發(fā)揮作用，因此也有部分業(yè)界把生成式AI當(dāng)作未來(lái)有可能實(shí)現(xiàn)AGI（通用人工智能）的方法之一。

新型生產(chǎn)關(guān)系

我們看好生成式AI的新范式，不僅是其遠(yuǎn)大于AI1.0的市場(chǎng)空間，更是看好其所代表的新型生產(chǎn)關(guān)系。過(guò)去的生產(chǎn)過(guò)程中，工廠消耗能源和基礎(chǔ)材料，制造出實(shí)體的產(chǎn)品。未來(lái)的核心生產(chǎn)關(guān)系將圍繞著電力、AI模型和token（數(shù)據(jù)）展開(kāi)。數(shù)據(jù)中心作為AI工廠，在電力供能下，結(jié)合AI模型，通過(guò)token不斷生產(chǎn)信息化的內(nèi)容（語(yǔ)言、圖形、視頻、音樂(lè)等），也即是新的成產(chǎn)出來(lái)的產(chǎn)品，圍繞token的新型生產(chǎn)關(guān)系正在形成，構(gòu)筑新一輪的信息工業(yè)革命。當(dāng)然以上是我們認(rèn)為的遠(yuǎn)期狀態(tài)，當(dāng)前也僅僅是生成式AI取得大的影響力突破的第二年，該新型生產(chǎn)關(guān)系還在構(gòu)建和發(fā)展中。

2.生成式AI并非完美，也給應(yīng)用落地帶來(lái)了挑戰(zhàn)

在語(yǔ)言、視覺(jué)和音頻領(lǐng)域，我們看到了過(guò)去一段時(shí)間生成式AI日新月異的發(fā)展，這離不開(kāi)Transformer和Diffusion模型的突破。但與此同時(shí)，我們也看到了大語(yǔ)言模型存在幻覺(jué)的問(wèn)題，AI生成的視頻和圖像也并不穩(wěn)定，我們?cè)诳吹骄薮鬂摿Φ耐瑫r(shí)，也不能忽視其不完美的現(xiàn)狀。

B端對(duì)內(nèi)容的精準(zhǔn)、可控、一致性、可靠性、穩(wěn)定性有著極高的要求，C端雖然相對(duì)要求更包容，但也存在著來(lái)自合規(guī)性的監(jiān)管，這些要求給尚不滿(mǎn)完美的生成式AI如何落地帶來(lái)了挑戰(zhàn)。

Transformer模型，1）缺乏可解釋性，神經(jīng)網(wǎng)絡(luò)本質(zhì)上是黑箱模型，輸入和輸出之間的關(guān)系是通過(guò)訓(xùn)練數(shù)據(jù)和復(fù)雜的計(jì)算學(xué)習(xí)到的，而非通過(guò)明確的規(guī)則編碼，在金融、醫(yī)療等復(fù)雜、專(zhuān)業(yè)或者高度監(jiān)管的行業(yè)中，模型的決策過(guò)程需要符合特定的法規(guī)和標(biāo)準(zhǔn)，不可解釋性可能導(dǎo)致合規(guī)性問(wèn)題；2）會(huì)出現(xiàn)幻覺(jué)，產(chǎn)生邏輯謬誤、捏造事實(shí)以及數(shù)據(jù)驅(qū)動(dòng)的偏見(jiàn)，也就是通俗說(shuō)的大模型“一本正經(jīng)的胡說(shuō)八道”，客戶(hù)可能對(duì)模型的輸出結(jié)果持懷疑態(tài)度，難以建立信任，如用AI檢索的結(jié)果，為了保證真實(shí)，需要復(fù)查，特別是在安全性和嚴(yán)肅性要求較高的場(chǎng)合此問(wèn)題更加突出；3）除此之外，計(jì)算和內(nèi)存消耗大，特別是在處理大規(guī)模數(shù)據(jù)集時(shí)，需要大規(guī)模并行計(jì)算能力；4）優(yōu)化難度大，模型的復(fù)雜性和參數(shù)量大增加了優(yōu)化難度。

Diffusion模型，1）擴(kuò)散模型可以生成圖像和文本，但它們還難以同時(shí)理解和生成涉及多種類(lèi)型數(shù)據(jù)的復(fù)雜多模態(tài)內(nèi)容。比如目前用擴(kuò)散模型生成一張“紅色衣服”的圖片較為簡(jiǎn)單，但讓其生成一張胸前印著“明天總是美好的”紅色衣服圖像，生成的衣服上的文字往往出錯(cuò)；2）擴(kuò)散模型仍是隨機(jī)采樣，導(dǎo)致其生成內(nèi)容的精準(zhǔn)、可控、一致性等方面仍然不足，比如同樣的prompt下，AI生成的2個(gè)漫畫(huà)男孩不是同一人，這就導(dǎo)致了應(yīng)用前后不對(duì)應(yīng)的問(wèn)題，使得商業(yè)落地困難。雖然業(yè)界在積極探索，ControlNet，LoRA，Dreambooth等技術(shù)的出現(xiàn)對(duì)局部?jī)?nèi)容實(shí)現(xiàn)了控制，如人臉、畫(huà)風(fēng)、動(dòng)作等，但仍有較大的進(jìn)步空間；3）其基于高斯求和的方式會(huì)帶來(lái)求解難度的提高，尤其隨著維度的上升會(huì)帶來(lái)顯存占用的幾何級(jí)別的增長(zhǎng)。這種架構(gòu)下，顯卡的顯存大小限制了視頻的時(shí)長(zhǎng)，目前最長(zhǎng)的AI生成的視頻時(shí)長(zhǎng)在1分鐘左右，仍無(wú)法在長(zhǎng)視頻應(yīng)用場(chǎng)景呈現(xiàn)。

雖然目前的模型能力還有不足，但我們也注意到模型架構(gòu)也在迭代。工程上，如融合了Transformer和Diffusion的DiT，使用Transformer替換U-Net主干，并在潛在空間訓(xùn)練，展現(xiàn)出了比單純Diffusion更好的訓(xùn)練效率和生成效果。再如Mamba架構(gòu)，可進(jìn)行“線性時(shí)間序列”建模，隨序列長(zhǎng)度增長(zhǎng)其計(jì)算保持線性增長(zhǎng)，而非Transformer的指數(shù)級(jí)膨脹，同時(shí)改善了注意力機(jī)制，減少了處理序列數(shù)據(jù)所需的計(jì)算量，加快了數(shù)據(jù)處理速度。同時(shí)學(xué)術(shù)界也在對(duì)模型底層的數(shù)學(xué)、人腦科學(xué)做更深層次的研究，希望能找到更多樣化的實(shí)現(xiàn)AGI的通路。

3.落地思路：“End to End” vs “Step by Step”

目前生成式AI的產(chǎn)業(yè)落地，大致分為2種思路，即“End to End/端到端”和“Step by Step/按步驟拆解”，相應(yīng)特點(diǎn)也有不同。

End to End

? 方法：跳過(guò)現(xiàn)有專(zhuān)業(yè)制作流程，直接一步生成最終的內(nèi)容

? 代表產(chǎn)品：ChatGPT, Midjourney, Suno

? 落地場(chǎng)景：主要在C端大眾用戶(hù)，用于泛娛樂(lè)的場(chǎng)景，或者非嚴(yán)肅場(chǎng)景，如編程，信息檢索等

? 特點(diǎn)：1）簡(jiǎn)單直接，通常輸入文字prompt描述，直接產(chǎn)出最終的內(nèi)容；2）“黑盒”狀態(tài)，過(guò)程不透明，生成的結(jié)果具備隨機(jī)性；3）生成的內(nèi)容往往不精準(zhǔn)和不可控；4）基本上通過(guò)多次生成，選擇最滿(mǎn)意的方式進(jìn)行生產(chǎn)

以漫畫(huà)創(chuàng)作為例，漫畫(huà)工具“AI Comic Factory”，提供了簡(jiǎn)單易用的用戶(hù)界面和使用步驟

圖：AI Comic Factory的創(chuàng)作案例

以上可見(jiàn)，目前端到端的產(chǎn)品易于上手，但同時(shí)因?yàn)闊o(wú)法對(duì)過(guò)程進(jìn)行控制，且目前AI技術(shù)又不能一步到位生成高質(zhì)量的內(nèi)容，所以局限了出品的作品品質(zhì)，更多的還是在用在for fun或者專(zhuān)業(yè)制作workflow中各步驟的第一步創(chuàng)意環(huán)節(jié)，如動(dòng)畫(huà)美工/畫(huà)師或影視劇導(dǎo)演，在創(chuàng)作過(guò)程中將腦中的想法迅速通過(guò)AI畫(huà)圖展現(xiàn)出來(lái)，高效呈現(xiàn)預(yù)覽效果，方便團(tuán)隊(duì)內(nèi)部溝通及靈感碰撞。

Step by Step

? 方法：盡量沿用現(xiàn)有的工作流，不追求一步到位，AI專(zhuān)注于每一步工作的提效

? 代表產(chǎn)品：Adobe Firefly，ComicsMaker.AI

? 落地場(chǎng)景：主要用于B端的專(zhuān)業(yè)工作者，用在高質(zhì)量工業(yè)級(jí)的生產(chǎn)制作流中

? 特點(diǎn)：1）對(duì)每個(gè)環(huán)節(jié)的生成內(nèi)容相對(duì)更精準(zhǔn)、更可控，2）往往和現(xiàn)有工作流和制作工具融合，更易于流程管理

以專(zhuān)業(yè)的動(dòng)畫(huà)創(chuàng)作為例，以下是國(guó)內(nèi)某2B定制化AI內(nèi)容創(chuàng)作公司的案例，專(zhuān)業(yè)的動(dòng)畫(huà)制作環(huán)節(jié)包括“人設(shè)圖-分鏡-排版-草稿-線稿-上色-動(dòng)畫(huà)”，其創(chuàng)作工具依照現(xiàn)有專(zhuān)業(yè)workflow設(shè)計(jì)，目標(biāo)在創(chuàng)作過(guò)程中降本增效，目前在一些案例中可以得到40%的人力成本節(jié)省。雖然AI的能力看似無(wú)所不能，多方面都可以覆蓋，但實(shí)操上每個(gè)環(huán)節(jié)涉及到眾多的細(xì)節(jié)，如何反哺AI的產(chǎn)品能力，甚至進(jìn)階的精簡(jiǎn)/重塑專(zhuān)業(yè)的工作流，這都需要和產(chǎn)業(yè)方共建。

圖：某國(guó)內(nèi)公司的AIGC動(dòng)畫(huà)制作step by step賦能案例

我們認(rèn)為，雖然生成式AI在過(guò)去2年取得了快速發(fā)展，但今天行業(yè)仍在早期，長(zhǎng)期我們確信AI會(huì)顛覆現(xiàn)有的工作流，甚至企業(yè)的管理學(xué)，但從務(wù)實(shí)的角度，B端的AI落地，會(huì)經(jīng)歷1）短期先Step by Step在可能的環(huán)節(jié)部分落地，降本增效；2）行業(yè)公司效仿，滲透率提升；3）技術(shù)進(jìn)步，更多環(huán)節(jié)可以被AI賦能，滲透率再次提升；4）技術(shù)迭代，workflow開(kāi)始合并縮短，甚至出現(xiàn)全新的成產(chǎn)方式；5）理論上最終極的方式可能是一步端到端。

圖：B端AI落地趨勢(shì)

4.行業(yè)know-how和專(zhuān)有數(shù)據(jù)對(duì)B端落地不可或缺

根據(jù)上文，按照步驟拆解的思路在B端產(chǎn)業(yè)落地，需要更多的行業(yè)know-how和專(zhuān)有數(shù)據(jù)。如上文的動(dòng)畫(huà)制作案例，第一步就是拆解工作流，如“人設(shè)圖-分鏡-排版-草稿-線稿-上色-動(dòng)畫(huà)”，本身就是know-how。然后每個(gè)環(huán)節(jié)如何和AI結(jié)合，如何高質(zhì)量打標(biāo)簽，如何實(shí)現(xiàn)美學(xué)對(duì)齊（比如創(chuàng)作端什么內(nèi)容才是“美”，什么才是“好”等），哪些功能和模塊更符合使用需求，也是需要與行業(yè)know-how結(jié)合打磨，也是PMF的過(guò)程。

專(zhuān)業(yè)制作內(nèi)容，有大量的數(shù)據(jù)1）本身很難或者無(wú)法進(jìn)行數(shù)字化沉淀，如電影/漫畫(huà)的分鏡設(shè)計(jì)，其構(gòu)思往往在導(dǎo)演/創(chuàng)作者腦中，無(wú)法有效沉淀；2）在制作方手中，特別是制作環(huán)節(jié)過(guò)程中產(chǎn)生的高質(zhì)量結(jié)構(gòu)化數(shù)據(jù)，對(duì)模型訓(xùn)練有巨大幫助，但往往這些數(shù)據(jù)并不是公開(kāi)的。相關(guān)數(shù)據(jù)的缺乏導(dǎo)致了AI模型本身無(wú)法有效獲得訓(xùn)練而不具備對(duì)應(yīng)能力，這也是上文案例動(dòng)畫(huà)制作環(huán)節(jié)中，分鏡設(shè)計(jì)的AI滲透率極低，但上色環(huán)節(jié)（公開(kāi)數(shù)據(jù)較多）有較好效果和滲透率的原因。

預(yù)訓(xùn)練模型的本質(zhì)是歷史數(shù)據(jù)和知識(shí)的壓縮，數(shù)據(jù)的質(zhì)和量極大程度決定了AI能力。專(zhuān)有數(shù)據(jù)對(duì)于提升模型能力，滿(mǎn)足企業(yè)的特定需求（調(diào)性風(fēng)格、品牌特點(diǎn)、行業(yè)知識(shí)等）至關(guān)重要。

公開(kāi)數(shù)據(jù)

專(zhuān)有數(shù)據(jù)

? AI大模型訓(xùn)練的基礎(chǔ)，構(gòu)建整體的AI能力

? 公開(kāi)數(shù)據(jù)訓(xùn)練的模型關(guān)注內(nèi)容生成的多樣性，而非精準(zhǔn)性

? 有潛在的IP風(fēng)險(xiǎn)

? 可訓(xùn)練出能夠解決特定問(wèn)題或滿(mǎn)足特定需求的AI模型，且此等模型是其他企業(yè)很難復(fù)制的

? 在專(zhuān)業(yè)內(nèi)容制作、法律、醫(yī)療、金融等領(lǐng)域尤其重要

? 數(shù)據(jù)多在產(chǎn)業(yè)方手中，且多高度重視自有數(shù)據(jù)的價(jià)值和安全性

表：訓(xùn)練數(shù)據(jù)對(duì)比

因此我們也期待產(chǎn)業(yè)方更開(kāi)放的同科技公司合作，目前雖然中國(guó)底層大模型的發(fā)展和學(xué)術(shù)研究暫時(shí)還處于追趕國(guó)外的狀態(tài)，但中國(guó)的產(chǎn)業(yè)更豐富，我們對(duì)應(yīng)用的落地有著更強(qiáng)的人才和資源投入，我們?cè)贏I2.0的商業(yè)化應(yīng)用上有機(jī)會(huì)復(fù)現(xiàn)中國(guó)在AI1.0時(shí)代的引領(lǐng)地位。

5.B端需要的并非單一的AI產(chǎn)品和工具

對(duì)企業(yè)客戶(hù)來(lái)說(shuō)，經(jīng)過(guò)我們的調(diào)研，相比于底層技術(shù)和實(shí)現(xiàn)方式，其往往更關(guān)注交付的效果，所以生成式AI的落地，除了行業(yè)know-how和專(zhuān)有數(shù)據(jù)以外，我們認(rèn)為需要滿(mǎn)足以下幾點(diǎn)：

首先，是多個(gè)模態(tài)的組合

圖：某3D游戲開(kāi)發(fā)中AI的應(yīng)用

生成式AI的落地在眾多的行業(yè)和場(chǎng)景，但從介質(zhì)的角度來(lái)看，主要是文本/圖像/視頻/3D/音頻。真的在產(chǎn)業(yè)落地，單一的模態(tài)往往是不充分的。其中，文本往往被廣泛用作跨模態(tài)（和圖像/視頻/3D/音頻）交互的自然語(yǔ)言，連接著多模態(tài)的組合。如AI制作3D游戲，就涉及到文本、圖像和3D等模態(tài)，文本可用于編程和對(duì)話，以及其他模態(tài)的交互，圖像用于人物設(shè)計(jì)的美術(shù)環(huán)節(jié)，3D用于建模環(huán)節(jié)。

其次，還會(huì)是多個(gè)模型構(gòu)建的系統(tǒng)

大模型和小模型的組合：大模型泛化和通用性強(qiáng)，但對(duì)于很多AI1.0時(shí)代已經(jīng)解決的標(biāo)準(zhǔn)化的場(chǎng)景，用小模型更具備經(jīng)濟(jì)性（算力消耗少），因此可以組合大模型和小模型搭配，分別完成復(fù)雜和標(biāo)準(zhǔn)場(chǎng)景。

通用和垂直模型組合：通用模型覆蓋大部分業(yè)務(wù)，但對(duì)特定的垂直領(lǐng)域，調(diào)用對(duì)應(yīng)的垂直模型，如法律翻譯和文學(xué)翻譯，AI翻譯系統(tǒng)可以是不垂直模型的組合。

圖：翻譯場(chǎng)景通用+垂類(lèi)模型

除此之外，為了實(shí)現(xiàn)特定的目標(biāo)，還會(huì)包含眾多的嵌入的模塊來(lái)擴(kuò)展模型能力的邊界，從而構(gòu)成一個(gè)系統(tǒng)。比如會(huì)在Stable Diffusion模型中加入Control Net的神經(jīng)網(wǎng)絡(luò)架構(gòu)，通過(guò)選擇不同的輸入條件，生成滿(mǎn)足特定需求的圖像來(lái)實(shí)現(xiàn)內(nèi)容控制?；蛘咴谀Ｐ椭屑尤胛谋咎卣鞒槿∧K，多層映射網(wǎng)絡(luò)實(shí)現(xiàn)關(guān)鍵詞解耦，從而提升理解能力等，使得AI能真正落地使用。

最后，還會(huì)是AI能力+現(xiàn)有業(yè)務(wù)系統(tǒng)和管理流程的結(jié)合

很多AI公司都可以做到前述2點(diǎn)，但最終在企業(yè)的落地效果不佳，究其原因還是在于1）要么沒(méi)有和現(xiàn)有的業(yè)務(wù)系統(tǒng)結(jié)合，導(dǎo)致雖然局部環(huán)節(jié)提效，但和現(xiàn)有業(yè)務(wù)系統(tǒng)的融合中額外增加成本，總效率更低，或者2）目前大模型無(wú)法嵌入企業(yè)的工作體系里，也無(wú)法解決企業(yè)的管理邏輯，所以往往都是設(shè)計(jì)師/員工自行使用，AI和管理體系需要協(xié)同和融合。

我們觀察到國(guó)內(nèi)某新型主流全媒體集團(tuán)旗下的“生成式人工智能媒體融合創(chuàng)新工作室”取得了不錯(cuò)的落地，內(nèi)部結(jié)合自身的工作管理和業(yè)務(wù)流程，疊加AI能力，開(kāi)發(fā)了一套全棧的AI+業(yè)務(wù)+管理系統(tǒng)。其1）在AI制作上，涵蓋了多個(gè)功能，涉及文本、圖像、視頻、音頻等多個(gè)模態(tài)；2）現(xiàn)有的媒體集團(tuán)的業(yè)務(wù)和管理，涉及“媒資庫(kù)入檢索-內(nèi)容制作-內(nèi)容審核-內(nèi)容分發(fā)-媒資入庫(kù)”等環(huán)節(jié)和系統(tǒng)。所開(kāi)發(fā)的AI系統(tǒng)和公司媒資管理系統(tǒng)、專(zhuān)屬（新聞采編等）業(yè)務(wù)系統(tǒng)有連接，同時(shí)也是與安全播出的多重審核機(jī)制管理權(quán)限藕合。不僅僅是單純的內(nèi)容制作工具，其也集成AI媒資管理、安全審核結(jié)合等業(yè)務(wù)和監(jiān)管環(huán)節(jié)，形成一套綜合的系統(tǒng)。3）同時(shí)制作全流程不需要切換系統(tǒng)，方便管理和流程轉(zhuǎn)移。這是我們看到的目前較好的B端的綜合AI落地，結(jié)合了多個(gè)模態(tài)，多個(gè)模型，同時(shí)和企業(yè)的業(yè)務(wù)和管理流程系統(tǒng)融合，具備較高的使用率，也表現(xiàn)出較好的提效結(jié)果。

圖：某媒體龍頭公司的AI系統(tǒng)

6.AI 2B發(fā)展路徑：Native生成式AI公司vs Non-native生成式AI公司

我們觀察到在AI 2B賽道有2類(lèi)公司。一類(lèi)是Native生成式AI公司，從0-1利用AI的模型能力為企業(yè)客戶(hù)提供服務(wù)。另一類(lèi)是Non-native生成式AI服務(wù)公司，比如數(shù)字化時(shí)代的企業(yè)服務(wù)公司，他們通常已在一些2B場(chǎng)景里取得了不錯(cuò)的結(jié)果，如今把生成式AI能力融合到現(xiàn)有場(chǎng)景中，謀求更好的實(shí)現(xiàn)效果。

第一類(lèi)路徑

比如在視頻制作領(lǐng)域有眾多的Native生成式AI創(chuàng)業(yè)公司，他們致力于通過(guò)AI模型，輸入文字或者圖像直接產(chǎn)出視頻。隨著Sora的推出，我們觀察到眾多相關(guān)創(chuàng)業(yè)公司當(dāng)前的努力重點(diǎn)還是提升模型能力，盡快復(fù)刻Sora展現(xiàn)出來(lái)的效果。我們認(rèn)為如果想要將其做成一個(gè)企業(yè)級(jí)的應(yīng)用產(chǎn)品，合理的路徑除了進(jìn)一步提高模型本身之外，還需要1）產(chǎn)品的功能設(shè)計(jì)和工作流相結(jié)合，如增加分鏡的順序組合搭配工具，使得生成的視頻具備故事性；2）增加編輯和控制工具，如局部?jī)?nèi)容的特定顏色，特效的編輯功能，或者關(guān)鍵幀的控制工具等。通過(guò)和產(chǎn)業(yè)需求和know-how結(jié)合，才能將模型能力變成產(chǎn)品，且其符合使用習(xí)慣從而取得很好的落地效果。

第二類(lèi)路徑

智能化的基礎(chǔ)是數(shù)字化，很多場(chǎng)景已經(jīng)在AI1.0時(shí)代被企業(yè)服務(wù)公司覆蓋，如智能客服、AI營(yíng)銷(xiāo)、翻譯等。在已經(jīng)被數(shù)字化改造的行業(yè)的提供企業(yè)服務(wù)公司，其有沉淀的場(chǎng)景數(shù)據(jù)，有業(yè)務(wù)的落地，有現(xiàn)成的客戶(hù)access，如果疊加生成式AI的能力，如把大模型應(yīng)用到客服系統(tǒng)和營(yíng)銷(xiāo)對(duì)話場(chǎng)景，對(duì)話效果比AI1.0的模型更加自然，從而獲得更高的用戶(hù)滿(mǎn)意度和付費(fèi)轉(zhuǎn)化率。再如大模型對(duì)商業(yè)運(yùn)營(yíng)表現(xiàn)和市場(chǎng)商機(jī)進(jìn)行分析，進(jìn)一步完善BI（商業(yè)智能）的功能，這些都可以加深對(duì)客戶(hù)的服務(wù)深度和拓寬服務(wù)邊界，增加企業(yè)客戶(hù)對(duì)產(chǎn)品的價(jià)值感。我們觀察到在AI電商營(yíng)銷(xiāo)領(lǐng)域，隨著生成式AI技術(shù)的普及，原本處于不同環(huán)節(jié)分工的企業(yè)，都在拓寬服務(wù)邊界，彼此滲透，例如提供AI客服的公司，使用大模型能力，不僅提升了客戶(hù)對(duì)話能力，也拓展到AI蓄客、營(yíng)銷(xiāo)文案制作、數(shù)字人、智能營(yíng)銷(xiāo)切片等。因此我們認(rèn)為以上也是一個(gè)生成式AI 2B有機(jī)會(huì)的發(fā)展路徑。

7.結(jié)語(yǔ)

生成式AI技術(shù)解鎖了巨大的市場(chǎng)空間和可能性，但當(dāng)前技術(shù)并不完美，特別在對(duì)精準(zhǔn)性、可控性、一致性要求較高的B端產(chǎn)業(yè)落地面臨較多挑戰(zhàn)。End to End思路更直接，但想要取得更好的結(jié)果更依賴(lài)底層技術(shù)的突破，Step by Step思路在當(dāng)前的技術(shù)棧下短期更加務(wù)實(shí)，追求降本增效。但無(wú)論哪種思路，行業(yè)的know-how，專(zhuān)有數(shù)據(jù)，AI與業(yè)務(wù)和管理系統(tǒng)的耦合，都在產(chǎn)業(yè)端落地中都至關(guān)重要。

此外，生成式AI也是設(shè)計(jì)和生產(chǎn)范式的變化，年輕的創(chuàng)作者對(duì)新技術(shù)的擁抱度更高，AI科技公司可以參與培育新一批的AI Native的創(chuàng)作者，在大學(xué)共創(chuàng)課程體系，隨著相關(guān)學(xué)生畢業(yè)進(jìn)入產(chǎn)業(yè)界，將促成新的創(chuàng)作范式的行業(yè)落地，同時(shí)也形成了產(chǎn)品的隱性的護(hù)城河。

「C位觀察」AI 2.0革命：產(chǎn)業(yè)視角下生成式AI如何落地

全部評(píng)論

友情鏈接