因?yàn)閮?yōu)秀的表達(dá)能力、靈活的分析能力,圖技術(shù)正在成為當(dāng)下數(shù)據(jù)分析領(lǐng)域最熱的技術(shù)之一。
知名研究機(jī)構(gòu)Gartner最新報(bào)告預(yù)計(jì),到2025年,圖技術(shù)將用于80%的數(shù)據(jù)分析創(chuàng)新,進(jìn)一步促進(jìn)企業(yè)的運(yùn)營(yíng)決策。但在去年底,這個(gè)數(shù)值僅有10%。
也有相關(guān)數(shù)據(jù)顯示,截至2025年,包括圖數(shù)據(jù)庫(kù)管理系統(tǒng)(DBMS)在內(nèi)的圖技術(shù)市場(chǎng)將增長(zhǎng)到32億美元,復(fù)合年增長(zhǎng)率為28.1%。目前,大型傳統(tǒng)數(shù)據(jù)庫(kù)管理系統(tǒng)供應(yīng)商和初創(chuàng)公司都在瞄準(zhǔn)這個(gè)極具爆發(fā)潛力的賽道。
(資料圖片)
與此同時(shí),諸多嗅覺(jué)敏銳的投資機(jī)構(gòu)對(duì)這一領(lǐng)域也在加速布局。在國(guó)外市場(chǎng),去年,國(guó)際知名的圖數(shù)據(jù)庫(kù)公司Neo4j宣布,完成由Eurazeo領(lǐng)投、GV(原Google Ventures)參投的3.25億美元F輪股權(quán)融資,創(chuàng)下圖數(shù)據(jù)庫(kù)與圖計(jì)算賽道的最大單筆股權(quán)融資。美國(guó)圖數(shù)據(jù)庫(kù)廠商TigerGraph也在2021年完成了自己C輪1.05億美金的融資。
在國(guó)內(nèi)市場(chǎng),投資機(jī)構(gòu)也正在緊密地布局包括圖數(shù)據(jù)庫(kù)在內(nèi)的整個(gè)數(shù)據(jù)庫(kù)領(lǐng)域,2021年,獲得新一輪融資的數(shù)據(jù)庫(kù)企業(yè)超過(guò)了20家,一些頭部基金投資的數(shù)量超過(guò)了3家。
今年初,國(guó)內(nèi)圖計(jì)算頭部企業(yè)海致科技完成由中國(guó)互聯(lián)網(wǎng)投資基金領(lǐng)投,上海人工智能產(chǎn)業(yè)投資基金、高瓴創(chuàng)投、君聯(lián)資本、微村智科、一村資本、億宸資本、禾其資本跟投的超過(guò)5億元的D輪融資。
在此之前,海致科技完成多輪融資,投資方包括BAI資本、高瓴創(chuàng)投、君聯(lián)資本等知名投資機(jī)構(gòu)。
在投資行業(yè)人士看來(lái),持續(xù)加碼圖數(shù)據(jù)庫(kù)賽道投資,除了賽道本身的高爆發(fā)潛力,另一個(gè)重要原因是行業(yè)競(jìng)爭(zhēng)格局未定,而該賽道本身的龐大市場(chǎng)空間,能夠支撐出現(xiàn)多家獨(dú)角獸企業(yè)。
技術(shù):超越關(guān)系型數(shù)據(jù)庫(kù)
近年,圖數(shù)據(jù)庫(kù)和圖計(jì)算技術(shù)高速發(fā)展,其在復(fù)雜場(chǎng)景的計(jì)算速度,較傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù)有著指數(shù)級(jí)提升。
相比關(guān)系型數(shù)據(jù)庫(kù),圖數(shù)據(jù)庫(kù)更能實(shí)現(xiàn)對(duì)真實(shí)世界的完整描摹——以圖的方式進(jìn)行建模,能更好地表達(dá)萬(wàn)事萬(wàn)物之間的關(guān)系。
“某種程度而言,圖數(shù)據(jù)庫(kù)是知識(shí)圖譜的一大核心技術(shù)環(huán)節(jié),尤其是高性能圖數(shù)據(jù)庫(kù),可以支持更大范圍的實(shí)時(shí)應(yīng)用場(chǎng)景,包括萬(wàn)億級(jí)大圖查詢,對(duì)金融領(lǐng)域高頻交易、工業(yè)互聯(lián)網(wǎng)產(chǎn)效提升、能源領(lǐng)域電碳實(shí)時(shí)測(cè)算等應(yīng)用場(chǎng)景都能提供強(qiáng)有力的支撐。”海致科技集團(tuán)總裁楊娟在接受本報(bào)記者采訪時(shí)表示。
在大數(shù)據(jù)時(shí)代,越來(lái)越多企業(yè)發(fā)現(xiàn),原先的關(guān)系型數(shù)據(jù)庫(kù)雖然簡(jiǎn)潔易理解,但它未必能全面真實(shí)地展現(xiàn)“現(xiàn)實(shí)世界”的描述。
以金融領(lǐng)域反洗錢為例,隨著互聯(lián)網(wǎng)技術(shù)發(fā)展與支付電子化,洗錢活動(dòng)正變得更加專業(yè)復(fù)雜隱蔽。在關(guān)系型數(shù)據(jù)庫(kù)有時(shí)對(duì)涉嫌洗錢行為的展示不夠直觀,難以甄別潛在的其他洗錢資金流向關(guān)系。
因此,越來(lái)越多全球銀行正構(gòu)建基于圖數(shù)據(jù)庫(kù)與知識(shí)圖譜的反洗錢監(jiān)測(cè)應(yīng)用平臺(tái),通過(guò)覆蓋千萬(wàn)級(jí)別節(jié)點(diǎn)和億級(jí)關(guān)系,建立反洗錢客戶關(guān)系網(wǎng)絡(luò),融合可疑交易特征和全量交易登錄流水,以網(wǎng)絡(luò)圖譜方式動(dòng)態(tài)展現(xiàn)資金流轉(zhuǎn)全貌,完整準(zhǔn)確展現(xiàn)團(tuán)伙共用設(shè)備關(guān)系、賬戶資金分層結(jié)構(gòu)和流向軌跡。如此,銀行風(fēng)控團(tuán)隊(duì)也能通過(guò)圖的異常形態(tài)識(shí)別與人工智能圖算法構(gòu)建有效預(yù)警模型,從廣大客群里“抓到”涉嫌洗錢團(tuán)伙。
不僅是金融領(lǐng)域,全球工業(yè)制造,交通、能源、政府部門等各個(gè)領(lǐng)域都對(duì)圖數(shù)據(jù)庫(kù)技術(shù)的使用需求日益旺盛,而越來(lái)越多圖數(shù)據(jù)庫(kù)研發(fā)商通過(guò)將圖算法和機(jī)器學(xué)習(xí)融合在一起,投射到各類業(yè)務(wù)場(chǎng)景,這項(xiàng)技術(shù)在金融、工業(yè)制造、能源、交通、醫(yī)療等領(lǐng)域得到迅猛發(fā)展。
然而,由于不同行業(yè)的數(shù)據(jù)來(lái)源與數(shù)據(jù)結(jié)構(gòu)差別很大,如何通過(guò)圖數(shù)據(jù)庫(kù)、圖計(jì)算等技術(shù)實(shí)現(xiàn)知識(shí)圖譜升級(jí)迭代并構(gòu)建多模態(tài)知識(shí)圖譜,正成為新的挑戰(zhàn)。
楊娟告訴記者,金融與政府行業(yè)的數(shù)據(jù)相對(duì)而言更具結(jié)構(gòu)化特點(diǎn),但能源、工業(yè)制造等行業(yè)有大量非結(jié)構(gòu)化數(shù)據(jù),比如文本、音頻、視頻、設(shè)備數(shù)據(jù)。這都需要圖數(shù)據(jù)庫(kù)研發(fā)商不斷加大研發(fā)投入升級(jí)多模態(tài)知識(shí)圖譜技術(shù),致力于提升多模態(tài)知識(shí)數(shù)據(jù)的匯聚、檢索、問(wèn)答、模型訓(xùn)練、知識(shí)抽取、圖譜構(gòu)建與價(jià)值挖掘能力。
“我們的解決方案是采取底層技術(shù)與行業(yè)應(yīng)用相隔離的策略,即產(chǎn)品是分層的,底下會(huì)有一個(gè)通用平臺(tái)層,即各個(gè)行業(yè)都通用的技術(shù)組件,在這個(gè)平臺(tái)層上,有不同行業(yè)團(tuán)隊(duì)去構(gòu)建針對(duì)每個(gè)行業(yè)的場(chǎng)景和模型,與各個(gè)行業(yè)相匹配。”楊娟說(shuō)。
市場(chǎng):
國(guó)內(nèi)企業(yè)的超車機(jī)會(huì)
在關(guān)系型數(shù)據(jù)庫(kù)領(lǐng)域,國(guó)外企業(yè)如Oracle、DB2因先發(fā)優(yōu)勢(shì)而具有較大優(yōu)勢(shì),令國(guó)產(chǎn)關(guān)系型數(shù)據(jù)庫(kù)行業(yè)的追趕周期相對(duì)較長(zhǎng)。相比而言,圖計(jì)算技術(shù)比較新,且國(guó)內(nèi)外技術(shù)差距不大,令國(guó)內(nèi)圖數(shù)據(jù)庫(kù)領(lǐng)域的追趕能力更強(qiáng)。
楊娟告訴記者,“盡管現(xiàn)在海外圖數(shù)據(jù)庫(kù)產(chǎn)品在國(guó)內(nèi)占據(jù)較高市場(chǎng)份額,但國(guó)內(nèi)相關(guān)產(chǎn)品正迅速興起,且在某些技術(shù)環(huán)節(jié)具備較強(qiáng)競(jìng)爭(zhēng)力。”
她分析指出:首先,多數(shù)海外圖數(shù)據(jù)庫(kù)產(chǎn)品仍是單機(jī)為主的技術(shù)架構(gòu),在分布式領(lǐng)域技術(shù)架構(gòu)未必完善,無(wú)法在分布式環(huán)境下實(shí)現(xiàn)擴(kuò)容,但國(guó)內(nèi)眾多圖數(shù)據(jù)庫(kù)研發(fā)平臺(tái)基于云計(jì)算的分布式環(huán)境搭建新的技術(shù)架構(gòu),在分布式的高性能圖計(jì)算方面具有一定領(lǐng)先性。
其次,基于國(guó)內(nèi)企業(yè)需求的深入洞察與圖計(jì)算技術(shù)迭代升級(jí),國(guó)內(nèi)圖數(shù)據(jù)庫(kù)企業(yè)在基礎(chǔ)架構(gòu)層設(shè)計(jì)、產(chǎn)品語(yǔ)言等方面也有一定前沿性。越來(lái)越多的國(guó)內(nèi)金融機(jī)構(gòu)與企業(yè)選擇技術(shù)自主可控的圖數(shù)據(jù)庫(kù)企業(yè)合作,而后者通過(guò)與不同行業(yè)企業(yè)開展合作,產(chǎn)品性能得到更多打磨錘煉,業(yè)務(wù)空間得到進(jìn)一步提升。
楊娟告訴記者,就近期參加的各種POC(Proof of concept,概念驗(yàn)證,針對(duì)客戶具體應(yīng)用的驗(yàn)證性測(cè)試)與評(píng)測(cè)分析,相比海外同行,海致的圖數(shù)據(jù)庫(kù)在不少性能方面表現(xiàn)更好。
在楊娟看來(lái),超越歐美圖數(shù)據(jù)庫(kù),形成新的競(jìng)爭(zhēng)壁壘,國(guó)內(nèi)企業(yè)必須具體三大條件:一是,技術(shù)方面的深入洞察和前沿視野;二是,搭建卓越的技術(shù)研發(fā)團(tuán)隊(duì);三是,與不同行業(yè)龍頭企業(yè)開展合作,構(gòu)建相關(guān)圖數(shù)據(jù)庫(kù)與圖計(jì)算技術(shù)應(yīng)用的“行業(yè)標(biāo)準(zhǔn)”。
據(jù)了解,海致今年參與了國(guó)際權(quán)威技術(shù)協(xié)會(huì)“關(guān)聯(lián)數(shù)據(jù)基準(zhǔn)委員會(huì)(LDBC)”立項(xiàng)的全球首個(gè)金融圖數(shù)據(jù)庫(kù)測(cè)試基準(zhǔn)的編寫,標(biāo)準(zhǔn)組成員還包括螞蟻集團(tuán)、Intel等國(guó)內(nèi)外6家知名頭部科技公司。
楊娟補(bǔ)充表示,國(guó)內(nèi)大型互聯(lián)網(wǎng)公司在圖計(jì)算領(lǐng)域技術(shù)也有優(yōu)勢(shì),但其技術(shù)、團(tuán)隊(duì)則與其主營(yíng)業(yè)務(wù)緊密綁定,產(chǎn)品場(chǎng)景高度定制化。更多偏向2C端服務(wù),因此與聚焦B端產(chǎn)品和服務(wù)的公司,并不存在諸多競(jìng)爭(zhēng)。
“隨著元宇宙產(chǎn)業(yè)的快速興起,圖能夠更清晰地實(shí)現(xiàn)虛實(shí)映射,也是幫助數(shù)字人進(jìn)行認(rèn)知和思考的技術(shù),我們也在探索圖技術(shù)在元宇宙之中的應(yīng)用以及發(fā)展空間。”楊娟說(shuō)。
關(guān)鍵詞: 資本搶灘圖數(shù)據(jù)庫(kù) 國(guó)內(nèi)企業(yè)如何構(gòu)建新的護(hù)城河