作者:娜娜邱
ChatGPT引發的AI大模型浪潮,引爆了AIGC市場,也帶火了數據庫、芯片等相關產業。作為一個致力于成為中國的國際智能數據算力公司,柏睿數據毫無疑問已經站在了風口上。柏睿數據董事長兼首席科學家劉睿民近日接受GPLP犀牛財經采訪時表示,柏睿數據已經堅持“Data + AI”(數據+智能)技術戰略多年,現在只是正好站到了人工智能的潮頭上了。
標準先行并保持技術領先
【資料圖】
劉睿民是在2014年全球數據庫老大Oracle推出令人矚目的數據庫一體機Exadata X2、正如日中天時回國創立柏睿數據的。他當時認為,Oracle Exadata X2將傳統關系型數據庫的性能做到了極致,但這同時意味著傳統數據庫的技術周期已到,新的機會要來了。與此同時,當時互聯網帶來的海量數據的存儲、計算成為IT業界的全新挑戰,大容量、高并發的應用場景所占比重越來越大。作為一個標志性事件,長期受制于甲骨文數據庫的SAP在2011年推出了內存數據庫產品HANA。
此時的劉睿民密切關注著流數據庫和內存數據庫技術等前沿數據庫技術。其中,流數據庫是指以時間軸來定義流動數據的數據表,而非傳統的靜態定義的數據表,從而實現實時的數據分析和處理。帶著讓這種國際前沿技術在國內發展的美好愿望,劉睿民回國創了業。
此后的柏睿數據,標準制定、產品研發兩條腿走路。
在標準方面,柏睿數據一直堅持標準先行。劉睿民本人更是主筆撰寫了《SQL9075 2018流數據庫》《AI-in-Database庫內人工智能》兩個國際標準,由此成為我國大數據領域的國際標準主筆第一人。柏睿數據站到了流數據庫和庫內人工智能標準的制高點上,掌握行業話語權和主動權。
當前,柏睿數據還是全國信標委數據庫標準工作組分析型數據庫專題組組長單位,正持續開展《分析型數據庫系統技術要求》的起草、研制等相關工作。
技術創新是數據庫創業企業生存和發展的關鍵因素之一。柏睿數據非常關注研發,過去幾年研發的投入一直保持在營業收入的30%左右。正是在這樣的背景下,柏睿數據擁有完全自主研發的分布式內存數據庫和流數據庫核心技術,并基于這兩種技術推出數據智能產品體系。
在劉睿民看來,從2014年創業到現在近9年,柏睿數據基本上已經實現、甚至已經超出了創立時的預期,柏睿數據已經規模性市場擴張階段,企業運營步入了健康發展的軌道。
不過,柏睿數據這9年的成長過程,并不是一帆風順。這其中,有兩個沒想到對柏睿數據的發展帶來了很大的影響:一是國際化發展沒有達到預期,一是信創替代帶來了巨大的應用空間。
資本市場遇阻但曙光已現
劉睿民創業時,非常前瞻地看好流數據庫的發展前景,諸如亞馬遜等國際巨頭,也是在柏睿數據成立后才進入這一賽道。因此創業之初,劉睿民瞄準的是國際市場,其中包括國際化的資本市場。
但是后來國際環境風云變幻,美國對中國企業的融資變得警惕,因此柏睿數據只好面向國內資本市場進行融資。此時,柏睿數據就不得不面臨兩個問題:
一是國內創投資本通常追求短平快,可接受的投資周期通常為“5+2”。相比之下,對高科技領域創投有著豐富經驗的美國等海外投資者,則通常采用“8+3”的投資周期。后者更適合高科技產業的發展特性;
二是國內資本市場對軟件行業了解甚少。即便科創板已經開通,但投資者通常普遍更青睞于投資硬件廠商。“摸不著、看不見”數據庫更是難上加難。
因此,融資難一度成為柏睿數據這樣的資本密集型初創基礎軟件廠商發展的一大障礙。
不過,得益于信創替代帶來的國產數據庫應用熱潮,以及柏睿數據本身堅持市場導向,順勢而為適時推出適銷對路的產品,柏睿數據在資本運營沒有達到預期目標背景下快速成長。
劉睿民強調,作為一個數據庫廠商,柏睿數據很少為客戶提供定制服務,而將定制服務交給前端的應用開發商。這種堅持對核心產品(數據庫)進行投入的策略,一方面讓柏睿數據將資源、精力更多地聚焦在核心競爭力的打造上,另一方面給合作伙伴留出了更多的合作空間。
幸運的是,隨著ChatGPT的火爆出圈,越來越的資本關注到AI和數據庫的巨大潛力。在國際市場上,近一個月內四家數據庫初創企業均獲得了新一輪融資:Pinecone完成1億美元B輪融資,WeaviateBV獲得5000萬美元B輪融資,Chroma獲得1800萬美元種子輪融資,Qdrant獲750萬美元種子融資。在國內市場,去年上市的向量數據庫廠商星環科技股價與3月6日的低點相比,一度翻倍。
與此同時,劉睿民認為,星環科技等數據庫相關企業的成功上市,以及老牌數據庫廠商達夢的上市注冊,都加速了整個資本市場對軟件,特別是對數據庫的認知。
根據天眼查App的信息,柏睿數據本身也已經處于上市輔導階段。
信創市場有驚喜且前景樂觀
信創替代帶來的巨大的應用市場基于是劉睿民創業以來遇到的第二個沒想到。
柏睿數據以“全內存分布式計算引擎”為基礎,打造了新一代高性能、標準化、全智能的數據智能產品體系,不僅能夠支撐用戶從國外數據庫到信創數據庫的平滑遷移、無感替換,還能帶來更加高效、穩定的性能。
此外,柏睿數據還對數據使用成熟度較低、對數據處理自動化需求較高的智能制造等領域推出了數據庫一體機產品。劉睿民告訴GPLP犀牛財經,該產品的價格是甲骨文名噪一時的一體機產品Exadata的一半,但性能提升了一倍。
劉睿民告訴GPLP犀牛財經,傳統數據庫廠商在市場上很少與柏睿數據出現交集,他們有他們優勢領域并非柏睿數據重點關注所在。柏睿數據聚焦新一代開源數據庫的信創替代,因為那些用戶“已經被教育過”,能更好地接受柏睿數據先進的全內存數據庫。
劉睿民補充說,傳統數據庫廠商通常只是將內存數據庫作為一個增強型的補充。“國內提供全內存數據庫的廠商,除了柏睿數據,目前我還沒有碰到這一技術路線的其他廠商,由于這一領域的高技術門檻,完全有理由相信柏睿數據的技術優勢還能保持幾年”。
據悉,目前柏睿數據的主要應用市場包括金融、智能制造、電信運營、能源電力、交通等領域,這些領域市場更加開放,對性能的追求更高,柏睿數據的全內存數據庫,正好契合他們的需求,且能深切感受到柏睿數據產品帶來的性能變化。
據悉,柏睿數據智能數據算力產品已經完成了與鯤鵬、飛騰、龍芯、海光、兆芯等CPU,麒麟、統信、安超云等操作系統信創產業上下游企業的產品適配工作;加入國家信創工委會和北京、上海信創工委會,入駐華為鯤鵬智能數據產業聯盟等國家級創新平臺。
此外,柏睿數據還自產了基于申威CPU的主板,“實現與申威CPU的適配及自有的主板設計能力,也從另一個角度說明我們對整個CPU、操作系統、數據庫技術棧的強大技術掌控能力。”劉睿民說,“說明我們的代碼是完全自主可控的。”
擁抱大模型未來可期
當前,ChatGPT帶動起來的大模型熱、AI熱更是將柏睿數據推到了風口浪尖。但是劉睿民告訴GPLP犀牛財經,柏睿數據自成立以來,一直都在堅持“Data + AI”(數據+智能)的技術路線,并進行長期投入;柏睿數據之前的堅持終于得到了回報。
劉睿民認為,未來五年將是AI大模型風起云涌的五年,AI大模型將帶動新的產業發展和行業應用,垂直場景落地和大規模推廣將進入跑馬圈地階段,加快構建數據智能底座是當務之急。
而柏睿數據早已有布局。他介紹,柏睿數據去年發布的4.3版本產品,就與AI大模型密切相關。柏睿數據獨立自主研發的新一代高性能、標準化、全智能的數據智能產品體系,可為AI大模型發展提供從數據采集、存儲、計算分析到模型訓練、部署、應用的全生命周期解決方案,助力用戶高效、安全構建部署AI大模型。
其中,柏睿數據RapidsDB是基于全內存分布式架構的智能算力分析引擎,支持大規模并行計算,具有高性能、高并發、高擴展性等特點,能夠實現PB級規模數據存儲與實時在線分析,以及3000億條數據查詢秒級響應。RapidsDB可為執行大規模數據訓練任務的AI大模型提供實時的海量數據計算處理能力,降低模型訓練時間和成本。
劉睿民還特別向GPLP犀牛財經介紹了AI低代碼平臺AIworkflow。他解釋說,AIworkflow的推出是為了滿足企業日益迫切的異構數據處理需求,以及順應BYOC(Build Your Own Cloud,構建自己的云)的應用趨勢。所謂BYOC,對于數據庫來說,就是要將處理后的諸如chatGPT等公有數據并入企業的核心數據,以保證企業在采用大模型的時候核心數據的安全性。
此外,劉睿民認為,AIGC的蓬勃發展,將給流數據庫帶來更廣闊的應用空間:
其一,流數據庫可以更好地支撐AI大模型訓練。流數據庫可以快速接收數據流并進行實時處理,還能在不同的數據源之間實現數據流和數據交換,支持多節點并行計算,能夠大大提高訓練速度。
其二,AIGC將帶來更加海量的數據,需要對這些數據進行分類以更好地發掘數據價值。流數據庫可以自動地將新數據流中的數據與已有的分類進行匹配,高效地對新數據進行分類并存儲,提高數據處理的實時性和效率。
如此看來,柏睿數據在AI領域大有可為。劉睿民最后表示,柏睿數據持續研究全球最前沿技術趨勢,聯合上下游企業共建國內數據智能產業生態,加速大數據和人工智能的創新應用。
Copyright @ 2015-2022 海外生活網版權所有 備案號: 滬ICP備2020036824號-21 聯系郵箱:562 66 29@qq.com