霄云科技:敢捅窗戶紙 不懼浪淘沙
“感覺捅破了窗戶紙。”
李小勇看了一眼實驗室中搭建的原型系統(tǒng),又仔細(xì)核對一遍各項實測性能數(shù)據(jù)。他感覺捅破了窗戶紙,感覺時機已經(jīng)成熟,“是時候,將‘PB級海量存儲技術(shù)’進行產(chǎn)業(yè)化推廣了?!?/span>
2015年,李小勇作為創(chuàng)始人兼CEO,正式創(chuàng)辦上海霄云信息科技有限公司,篤定完全自研、不基于開源的高性能分布式存儲。
霄云科技 創(chuàng)始人兼CEO 李小勇博士
“系統(tǒng)架構(gòu)”成為突破口
李小勇的內(nèi)心一直有個IT人的夢想,“我們使用的核心IT系統(tǒng)和各類基礎(chǔ)軟件,幾乎都是國外的。我們的研究不能只停留在論文上,我們不但要能說能寫更要能做,才能迎頭趕上與國外IT技術(shù)的差距。”教書育人十余載,李小勇無數(shù)次向?qū)W生講授分布式存儲技術(shù)原理,但他深知“將原理轉(zhuǎn)化為產(chǎn)品,需要解決諸多技術(shù)挑戰(zhàn)。例如,可擴展架構(gòu)、連接與請求的超時處理、I/O的并發(fā)性、讀寫過程中進行擴容而I/O不能中斷等,諸多原理、架構(gòu)、關(guān)鍵技術(shù)問題堆積在一起時,就感覺無從下手。”
“系統(tǒng)架構(gòu)”成為了霄云科技的第一突破口。
時間回到2003年,Google發(fā)布Google File System論文,正式為分布式軟件定義存儲奠定了理論基石。當(dāng)時還在讀博士的李小勇敏銳感覺到是次機會,“為存儲產(chǎn)業(yè)打開了一扇新的窗口?!?/span>
但也僅是一扇窗口。
因為在諸多分布式存儲實現(xiàn)方式中,“集中式元數(shù)據(jù)管理”最早被提出應(yīng)用,GFS和Hadoop HDFS等經(jīng)典系統(tǒng),均是依據(jù)此模式設(shè)計。其優(yōu)點是系統(tǒng)架構(gòu)簡單,元數(shù)據(jù)操作性高,但缺點也很明顯,元數(shù)據(jù)服務(wù)器就是系統(tǒng)瓶頸,它所能管理的文件數(shù)量上限很難突破10億。
到了2010年,分布式存儲又迎來一場巨大的技術(shù)進步。隨著OpenStack技術(shù)的發(fā)展,“去中心化”的Ceph成為分布式存儲的明星。不夸張的說,國內(nèi)的大多數(shù)分布式存儲企業(yè),都在基于Ceph開源軟件設(shè)計產(chǎn)品。但Ceph起步之初就缺乏工程經(jīng)驗,差強人意的代碼質(zhì)量也確實會影響系統(tǒng)穩(wěn)定性。
霄云科技學(xué)習(xí)了開源技術(shù),但又忘掉開源技術(shù),沒有選擇Ceph,當(dāng)然也沒有選擇此前的“集中式元數(shù)據(jù)管理”。“以復(fù)雜的方法去解決復(fù)雜的問題,正確性和效率都難以保證,用簡單方式解決復(fù)雜問題才是正確的方法?!崩钚∮抡f:“借鑒NoSQL數(shù)據(jù)庫理念,霄云科技完全自研系統(tǒng)架構(gòu),以“集中決策、分布執(zhí)行”模式,將文件的內(nèi)容以對象的方式存儲到每個節(jié)點上。這樣既兼顧了集中式架構(gòu)和去中心化架構(gòu)的優(yōu)點,也保證了系統(tǒng)可分布式拓展,且沒有單點并發(fā)瓶頸?!?/span>
運氣還是偏執(zhí)
一切因此迎刃而解。
以2015年為起點,創(chuàng)業(yè)后的4年間,霄云科技的技術(shù)線從塊存儲,延伸至文件存儲、對象存儲,并推出碧海分布式存儲系統(tǒng)(BOSS)。同時,霄云科技攻克了“海量小文件聚合優(yōu)化”和“文件和對象可互通訪問”、“自適應(yīng)流控”等技術(shù)難題,還在實踐中自研應(yīng)用了“海量數(shù)據(jù)快速遷移工具”。
“每一次關(guān)鍵技術(shù)的突破,至少要經(jīng)歷三次以上的失敗?!崩钚∮抡f:“創(chuàng)業(yè)始于創(chuàng)新,但成功的技術(shù)創(chuàng)新,必然是小概率事件,需要一點點運氣,需要一點點偏執(zhí),也需要一點點時間?!?/span>
他所說的“一點點”運氣,就是技術(shù)創(chuàng)新的不確定性。如果有人有錢就能保證創(chuàng)新成功,就不可能有創(chuàng)業(yè)企業(yè)的生存空間。因為從來沒有所謂“條條大路通羅馬”,在技術(shù)創(chuàng)新過程中,只有部分道路才會通向羅馬。
當(dāng)然,李小勇所說“一點點”偏執(zhí)和“一點點”時間,是霄云科技已經(jīng)在分布式存儲領(lǐng)域堅持了10多年。人海戰(zhàn)術(shù),遠(yuǎn)遠(yuǎn)不能抵消“偏執(zhí)狂”在縱向領(lǐng)域10年+的探索積累。
在應(yīng)用場景中打開市場
這就使霄云科技,有資格去捅破第二層窗戶紙。
中國企業(yè)的數(shù)字化轉(zhuǎn)型始于2015年,至2020年前后進入深水區(qū)。此時產(chǎn)業(yè)格局發(fā)生著微妙的變化,科技企業(yè)在以“應(yīng)用場景”重新劃分市場格局。道理很簡單,業(yè)務(wù)痛點藏在應(yīng)用場景中,而數(shù)字化轉(zhuǎn)型的價值就是解決業(yè)務(wù)痛點。
“存儲產(chǎn)品并沒有行業(yè)屬性,但聚焦行業(yè)應(yīng)用場景,更容易打開市場。”霄云科技找到了, “碧海分布式存儲系統(tǒng)(BOSS),特別匹配醫(yī)院中的PACS場景,這可是醫(yī)療行業(yè)3大核心生產(chǎn)系統(tǒng)之一”。這并不是霄云科技摸索的第一個應(yīng)用場景,而是歷經(jīng)數(shù)年摸索了大概5-6個行業(yè)10幾種應(yīng)用場景后找到的。
10年前,患者CT檢查產(chǎn)生的圖像大約只有幾百張,醫(yī)生調(diào)閱患者PACS圖像只需要10秒左右。但在10年后,256排高端CT設(shè)備已經(jīng)廣泛應(yīng)用。目前,患者一次檢查產(chǎn)生的圖像數(shù)量達到3000~10000幅,調(diào)圖時間普遍在2分鐘以上。
別看就是這兩分鐘,初審醫(yī)生還可以喝杯水忍耐一下,但復(fù)審醫(yī)生每天要調(diào)用200組以上圖片,調(diào)圖卡頓等待時間可能超過4個小時,周末加班成為常態(tài)?!拔覀兊臅r間不能浪費在鼠標(biāo)“轉(zhuǎn)圈圈”上。中國人都要在月球建基地了,傳張圖片有那么困難嗎?”復(fù)審醫(yī)生經(jīng)常如此吐槽。
還真有這么難。
信息部門先后對系統(tǒng)硬盤和內(nèi)存進行升級,PACS軟件服務(wù)商也嘗試了6種優(yōu)化方案,網(wǎng)絡(luò)系統(tǒng)甚至已升級至“萬兆骨干、千兆桌面”,但效果都不明顯?!?span id="t65kie5" class="keyword">性能瓶頸只能是存儲系統(tǒng),”在逐一排除了可能存在的性能瓶頸之后,醫(yī)院也不得不面對和解決存儲的性能瓶頸。
在此之前,醫(yī)療PACS影像在線業(yè)務(wù)幾乎都是國外高端SAN存儲,并沒有三甲級醫(yī)院將分布式存儲用于在線業(yè)務(wù)的先例。但先例正是從此開始,經(jīng)實際業(yè)務(wù)測試,霄云科技碧海分布式存儲系統(tǒng)(BOSS),可實現(xiàn)百億級文件性能不衰減(100TB的PACS數(shù)據(jù)量約為2億個文件),將PACS系統(tǒng)的調(diào)圖速度從業(yè)內(nèi)普遍的每秒20~50幅,提高到每秒300幅以上,徹底解決了PACS影像調(diào)圖卡頓的痛點。
“每秒300幅就此成為行業(yè)門檻?!崩钚∮抡f。雖然友商也喊出了“每秒300幅”的目標(biāo),但那是下一代產(chǎn)品,霄云科技顯然不用讓用戶等那么久,其成熟產(chǎn)品已經(jīng)在實際項目中落地驗證。
這確是個技術(shù)問題。1995年,Sun公司發(fā)表文章,標(biāo)題為《為什么線程池設(shè)計是個很糟糕的想法》;2003年,伯克利大學(xué)也發(fā)表一篇文章,標(biāo)題為《事件驅(qū)動是行不通的》。兩篇文章的觀點截然相反,代表決定分布式存儲性能的兩種技術(shù)流派之爭:線程池模式與事件驅(qū)動模式。
而且兩種技術(shù)流派爭論了20年?!跋鲈瓶萍家沧哌^彎路,每一種流派都有過嘗試,”李小勇說:“最終霄云科技是將兩種方法結(jié)合,采用‘進程池+事件驅(qū)動’模式,每顆CPU啟動一個進程,每個進程內(nèi)部使用事件驅(qū)動模式。”
以“海量小文件聚合優(yōu)化”為例,霄云科技管理文件數(shù)可達百億,是傳統(tǒng)NAS存儲的100倍,是開源軟件Ceph的10倍。最終性能測試數(shù)據(jù)表明:霄云科技通過海量小文件聚合優(yōu)化技術(shù),能夠?qū)崿F(xiàn)百億級文件性能衰減小于5%,性能超過了傳統(tǒng)及Ceph開源存儲。
同行之間才有赤裸裸的信任
正因如此。霄云科技的碧海分布式存儲系統(tǒng)(BOSS),成為目前為數(shù)不多能用于醫(yī)療PACS影像在線業(yè)務(wù)的分布式存儲產(chǎn)品。這可并不是一個小市場,中國三級甲等綜合醫(yī)院已經(jīng)超過1600家,二級醫(yī)院數(shù)量更為龐大。
僅此應(yīng)用場景,年市場容量就在20億~50億元,而且在如此專業(yè)的應(yīng)用場景中,只有同行之間才有赤裸裸的信任。因為客戶信任同行的背書,客戶關(guān)注同行的實踐。這正是霄云科技捅破的第二層窗戶紙。
目前,霄云科技推出的新一代醫(yī)療PACS影像存儲解決方案,已經(jīng)服務(wù)近30%上海大三甲醫(yī)院,輻射北上廣深及全國范圍三甲醫(yī)院,包括上海市胸科醫(yī)院、上海市五官科醫(yī)院、復(fù)旦大學(xué)附屬腫瘤醫(yī)院、上海兒童醫(yī)學(xué)中心、上海市華東醫(yī)院、上海市龍華醫(yī)院以及北京、深圳、江蘇、山東、山西、安徽等多家三級甲等醫(yī)院。
“此后,醫(yī)療大數(shù)據(jù)、醫(yī)療影像云、醫(yī)療云平臺、金融電子票據(jù)、大數(shù)據(jù)分析等應(yīng)用場景,數(shù)據(jù)量巨大、性能要求高的應(yīng)用場景,都將成為霄云科技的目標(biāo)市場?!崩钚∮?span id="0x000vt" class="keyword">提出了后續(xù)業(yè)務(wù)目標(biāo)。
當(dāng)然,有一點永遠(yuǎn)不會改變。
“市場就是大浪淘沙。缺乏核心技術(shù)競爭力,產(chǎn)品同質(zhì)化,就容易徘徊在低端市場,難以盈利,很難有好的發(fā)展前景。而碧海分布式存儲系統(tǒng)(BOSS)在系統(tǒng)架構(gòu)、性能、穩(wěn)定性方面的優(yōu)勢,將使霄云科技有能力在中高端分布式存儲市場,占據(jù)一席之地?!崩钚∮伦詈笳f。
全部評論