數(shù)據(jù),機(jī)器學(xué)習(xí)最有價(jià)值的東西
機(jī)器學(xué)習(xí)領(lǐng)域目前的流行趨勢(shì)是免費(fèi)提供軟件等產(chǎn)品??萍脊疽恢碧岢㈤_源社區(qū),并且非常樂意將其部分代碼開源。然而,在過去的一年(2015年)中,機(jī)器學(xué)習(xí)領(lǐng)域的大佬們卻將自己完整的代碼庫貢獻(xiàn)出來了:谷歌TensorFlow開源;Facebook也將其經(jīng)過優(yōu)化的深度學(xué)習(xí)模塊提供給了開源圖書館Torch;然后,Microsoft推出了免費(fèi)的分布式機(jī)器學(xué)習(xí)工具包(DMTK);IBM也推出了開源SystemML平臺(tái)。 這些發(fā)展已經(jīng)明確證實(shí)了觀察者們已經(jīng)知道的信息,即科技公司不會(huì)再將軟件和算法當(dāng)做私有化的寶貴財(cái)產(chǎn)。當(dāng)今最有價(jià)值的資產(chǎn)是數(shù)據(jù),而緊隨其后的是使用這些數(shù)據(jù)的天賦。
2015年是開源年
Facebook:提供給Torch的深度學(xué)習(xí)模塊
在2015年1月,F(xiàn)acebook成為首家將機(jī)器學(xué)習(xí)代碼開源的公司。Facebook的人工智能工作是在其人工智能研究實(shí)驗(yàn)室FAIR中進(jìn)行的。在該實(shí)驗(yàn)室中,F(xiàn)acebook使用Torch(一種開源開發(fā)工具包)來完成機(jī)器學(xué)習(xí)任務(wù)。許多公司都使用Torch,包括Twitter、NVidia、AMD和Intel。Torch在深度學(xué)習(xí)和卷積神經(jīng)網(wǎng)絡(luò)領(lǐng)域應(yīng)用得非常好,而卷積神經(jīng)網(wǎng)絡(luò)在深度理解圖像和視頻等方面很成功。2015年早些時(shí)候,F(xiàn)acebook將其經(jīng)過優(yōu)化的深度學(xué)習(xí)模塊也開源提供。這些模塊的速度遠(yuǎn)超Torch的默認(rèn)模塊,從而使得開發(fā)者可以在更短的時(shí)間內(nèi)訓(xùn)練更大型的神經(jīng)網(wǎng)絡(luò)。
IBM:SystemML
IBM幾乎是人工智能的代名詞,因?yàn)樗鼡碛猩钏{(lán)計(jì)算機(jī)和沃森系統(tǒng)。2015年6月,IBM將其機(jī)器學(xué)習(xí)平臺(tái)SystemML提供給了快速發(fā)展的開源社區(qū)Apache Spark。IBM將繼續(xù)提供Spark更多的資源,并將其作為更廣泛的IBM Bluemix開放云技術(shù)平臺(tái)的一部分。
Google:TensorFlow
2015年11月,Google推出了免費(fèi)的TensorFlow。TensorFlow是Google的第二代機(jī)器學(xué)習(xí)系統(tǒng),意在取代DistBelief。該系統(tǒng)將計(jì)算以狀態(tài)化數(shù)據(jù)流圖表的形式呈現(xiàn),使得在硬件系統(tǒng)不同的多臺(tái)機(jī)器之間運(yùn)行網(wǎng)絡(luò)變得更加容易。TensorFlow是由Google大腦研究組(其中有深度學(xué)習(xí)領(lǐng)域的傳奇人物Geoffrey Hinton)開發(fā)的,廣泛應(yīng)用于Google的多種產(chǎn)品之中,包括Gmail郵箱和Photos。其最受矚目的應(yīng)用是Google的人工智能引擎RankBrain系統(tǒng),該引擎系統(tǒng)處理著Google大量的搜索查詢。
微軟:分布式機(jī)器學(xué)習(xí)工具包(DMTK)
終于,在Google推出TensorFlow的3天后,微軟也將其分布式機(jī)器學(xué)習(xí)的框架和算法進(jìn)行了開源。DMTK使得機(jī)器學(xué)習(xí)任務(wù)很容易進(jìn)行擴(kuò)展。該工具包還包括LightLDA(主題模型訓(xùn)練的一種高效算法)和分布式詞向量(Distributed Word Embedding,一種自然語言處理工具)。
隨著數(shù)據(jù)價(jià)值的提高,軟件將會(huì)傾向于免費(fèi)
機(jī)器學(xué)習(xí)工具使得對(duì)豐富數(shù)據(jù)的理解變得更加容易。深度學(xué)習(xí)技術(shù)使得系統(tǒng)可以從非結(jié)構(gòu)化數(shù)據(jù)中學(xué)習(xí)。真實(shí)世界中的許多情況是混亂而復(fù)雜的,現(xiàn)實(shí)世界中的數(shù)據(jù)多是非結(jié)構(gòu)化的數(shù)據(jù),和傳統(tǒng)的關(guān)系數(shù)據(jù)庫系統(tǒng)中的結(jié)構(gòu)化數(shù)據(jù)(表現(xiàn)為行和列)不一樣。視頻、未標(biāo)記的文字和語音現(xiàn)在都可以由能根據(jù)上下文進(jìn)行推斷的系統(tǒng)進(jìn)行分析,從而使得其見解更加準(zhǔn)確,且更有價(jià)值。
「當(dāng)行業(yè)的落伍者還在辯論自有服務(wù)器與云服務(wù)的優(yōu)缺點(diǎn),并且努力合并大量數(shù)據(jù)庫時(shí),行業(yè)的科技領(lǐng)導(dǎo)者們已經(jīng)在加緊向前推進(jìn)?!?/p>
知識(shí)產(chǎn)權(quán)正在交付給開源社區(qū),并讓他們按照自己的想法來使用。當(dāng)大多數(shù)公司剛開始推出大數(shù)據(jù)戰(zhàn)略時(shí),Google、Facebook、微軟和IBM已經(jīng)踐行了他們的戰(zhàn)略,建立了大數(shù)據(jù)和機(jī)器學(xué)習(xí)工具,并且已經(jīng)開始免費(fèi)提供。 大多數(shù)公司將專有軟件視為自身的競(jìng)爭(zhēng)優(yōu)勢(shì),可為消費(fèi)者提供相應(yīng)的價(jià)值。當(dāng)傳統(tǒng)硬件公司正在慢慢試圖轉(zhuǎn)變?yōu)檐浖头?wù)公司時(shí),他們賴以存在的基礎(chǔ)開始發(fā)生轉(zhuǎn)變。 電信運(yùn)營(yíng)商正在努力適應(yīng)以軟件定義的、而不是由路由器和交換機(jī)定義的網(wǎng)絡(luò)世界,制造商正在從提供工具和部件的角色向使用分析和預(yù)測(cè)維護(hù)轉(zhuǎn)變。當(dāng)他們到達(dá)軟件與服務(wù)有望帶來豐厚利潤(rùn)的新黎明時(shí),他們會(huì)發(fā)現(xiàn)這其實(shí)是一個(gè)海市蜃樓。網(wǎng)絡(luò)上的軟件幾乎沒有邊際成本;軟件的價(jià)格將會(huì)傾向于零。真正有價(jià)值的東西是數(shù)據(jù)。
使用機(jī)器學(xué)習(xí)工具非常困難
Google、Facebook、微軟和IBM并沒有免費(fèi)提供所有的軟件。Google、微軟和IBM也擁有付費(fèi)的機(jī)器學(xué)習(xí)平臺(tái),通過這些平臺(tái),他們可以為付費(fèi)用戶提供機(jī)器學(xué)習(xí)API。這些公司希望吸引更多的開發(fā)者來建設(shè)他們的平臺(tái),從而使得平臺(tái)更具有價(jià)值。他們將其工具進(jìn)行開源,從而使得開發(fā)者可以學(xué)習(xí)如何使用他們。這對(duì)于未來的招聘是非常有益的;同時(shí),這也可以培養(yǎng)一個(gè)繁榮的開發(fā)者生態(tài)系統(tǒng)。 有價(jià)值的平臺(tái)會(huì)吸引用戶和開發(fā)者。開發(fā)者擁有的資源有限,因此只會(huì)將能產(chǎn)生最大利潤(rùn)的資源提供給平臺(tái)。這也是為什么小型開發(fā)者首先會(huì)開發(fā)iOS App,然后是安卓App,而永遠(yuǎn)不會(huì)開發(fā)Windows 移動(dòng)平臺(tái)App。平臺(tái)技術(shù)的經(jīng)濟(jì)學(xué)就是:勝利者獲得一切。公司可以招攬開發(fā)者;為他們提供薪水,以便讓他們建設(shè)該平臺(tái);并減少其銷售收入的分成。但是如果平臺(tái)根本就沒有用戶,那就另當(dāng)別論了,例如Windows 移動(dòng)平臺(tái)。
「對(duì)于那些試圖為客戶建立平臺(tái)的非軟件公司,他們的挑戰(zhàn)就是,開源其實(shí)并不是他們自身文化的一部分。」
客戶價(jià)值是隨著機(jī)器學(xué)習(xí)應(yīng)用程序而建立的,這些應(yīng)用程序來自于第三方開發(fā)者提供的新型創(chuàng)新服務(wù)。為了吸引開發(fā)者,開源是唯一的方法,而數(shù)據(jù)將會(huì)是唯一可持續(xù)的競(jìng)爭(zhēng)優(yōu)勢(shì)。 最近對(duì)于行業(yè)的建議是,從物質(zhì)產(chǎn)品中抽身,轉(zhuǎn)而制造數(shù)字產(chǎn)品。然而,對(duì)網(wǎng)絡(luò)數(shù)字產(chǎn)品進(jìn)行收費(fèi)比以往任何時(shí)候都要困難。對(duì)于機(jī)器學(xué)習(xí),制造數(shù)字產(chǎn)品還遠(yuǎn)遠(yuǎn)不夠。公司需要放棄數(shù)字產(chǎn)品,這對(duì)于很多正在經(jīng)歷數(shù)字化轉(zhuǎn)變的公司的管理層和董事會(huì)來說,是一個(gè)難以下咽的苦果。
如今,唯一重要的東西是數(shù)據(jù)。
全部評(píng)論