首頁
關于我們
團隊
投資案例
產業生態
動態
嚴正聲明
EN
EN
首頁
關于我們
團隊
投資案例
產業生態
動態
嚴正聲明
「未來速度」獲耀途資本數百萬美元天使輪融資,加速大規模數據處理和AI
作者|肖千平、周倩
編輯|彭孝秋
36氪獲悉,「未來速度」日前完成數百萬美元天使輪融資,由耀途資本獨家投資,融資資金將用于產品研發、用戶體驗改善和云平臺搭建。
未來速度成立于2022年,旗下產品Xorbits為分布式數據科學計算框架,旨在加速Python生態下大規模數據的處理。
Python作為一門容易上手的編程語言,具有較高的開發效率,同時有Pandas、Numpy等豐富的第三方庫幫助簡化操作,是大數據及AI領域的標準語言之一。然而,在金融量化分析、生物基因測序、地理空間多維度分析等實際應用中,Python卻可能面臨運行效率較低、單機運行第三方庫時內存不足等諸多挑戰。
對此,Xorbits運用多核、異構、分布式等技術,加速執行已有代碼,提高程序運行效率,能夠覆蓋科學計算、數據科學和機器學習等維度。同時,Xorbits還可兼容Pandas、Numpy等現有的Python數據科學庫,用戶無需學習新接口即可完成代碼遷移,獲得并行加速效果。
“就像在裝修房子,我們分配10個人鋪地板,5個人刷墻,把大的計算任務分解成很多小任務。”未來速度CEO秦續業告訴36氪。為了實現加速功能,Xorbits采用了分而治之的并行計算方式。具體來看,用戶調用Xorbits函數時,Xorbits客戶端將構建相應的計算圖并提交至服務端,計算圖將在服務端被處理成多個小的執行單元,再由調度器分發任務給worker執行處理。
“市面上一些大數據或并行計算框架,采用的是更為粗放的調度方式,好比先讓10個人把地板鋪完,才開始刷墻。”秦續業介紹。為了避免類似的算力浪費,Xorbits為細粒度調度引擎,能讓任務細分與調度更加精細,如默認使用深度優先策略以盡早釋放中間結果,減少計算使用的峰值內存等,目的在于以最優解進行調度。此外,Xorbits還進行了計算圖動態列裁剪、圖融合、支持迭代式tiling等優化工作。
相比國外Dask、Modin等計算框架,Xorbits在執行模式上也有其特色。計算框架執行模式主要分為立即執行與延遲執行兩類。立即執行可在調用框架時立即計算,方便用戶操作,但也壓縮了性能優化的空間;延遲執行則意味著程序構建完成后,用戶需要在一定節點手動調用函數等觸發執行,拉高了使用門檻。而Xorbit采用了特殊的推遲執行方式,可以推斷用戶所需并自動將任務提交執行,盡可能減少用戶操作,以此平衡計算框架的性能與易用性。
基于上述設計,在面對scale factor 100(約100GB數據集)和scale factor 1000(約1TB數據集)的基準測試中,Xorbits相比同類計算框架,運算速度能快3-7倍,且體現出更高的性能與API兼容性。
Xorbits在性能上比競爭對手快7倍左右
在具體服務方面,Xorbits與多個云廠商展開合作,提供云上SaaS服務,用戶改動相應代碼即可進行云上運算提速。Xorbits會根據用戶預算及訴求,衡量性能和性價比,為用戶選擇合適的方案。此外,由于Xorbits是開源平臺,用戶能夠共同參與平臺維護,并幫助平臺進一步完善。
目前,Xorbits開源產品已正式發布
(閱讀更多)
,未來速度計劃將進一步發展其開源社區,吸引更多用戶共同建設平臺,同時也將持續推進產品迭代,進一步簡化操作。
團隊方面,未來速度成員主要來自阿里、華為、微軟等企業,在大數據及Python領域經驗豐富。創始人秦續業畢業于上海交通大學,曾在阿里云長期負責Python數據和AI領域工作,主導并開源Mars開源項目。
耀途資本創始合伙人楊光表示,“數據科學和人工智能(DSML)的崛起背后,是Python工程師的崛起。Python native生態會在未來基礎設施中扮演越來越重要的角色。Python數據分析、數據科學和機器學習,不應該僅僅停留在單機,我們看好Xorbits成為推動Python從單機走向分布式的關鍵力量。”
耀途資本長期聚焦企業服務及AI方向投資,已投案例包括端點科技、MemVerge、霧幟智能、智齒科技、南大通用、焱融科技、速石科技、云科安信、MagicBI、Greptime、Allegro熹樂科技、SQream、StorOne等。
花蝴蝶在线视频免费观看视频动漫