IDC调研发现,95%的企业认为图数据库是重要的数据管理工具,超过65%的厂商认为在业务上图数据库优于其他选择,当前应用场景用例主要集中在金融风控、欺诈检测、人际关系分析(执法部门)和预测分析(营销和商业计划)方面,以实现更简单的内容和数据管理和更灵活高效的数据开发。但整体来看,图数据库的使用仍处于早期阶段,市场需要一份统一标准的评估作为参考和支撑。
整体来看,中国图数据库市场经历市场教育阶段,进入大规模商业化落地的初期。早期金融、互联网客户采用开源方案来探索图数据库与业务的落地实践,处于小范围开发实验时期,此时对图数据库的业务认可度和采购意愿较低,厂商市场教育成本高,但随着企业对于业务逻辑开发和关系挖掘需求增强,以及大型央国企和银行数字化转型政策的强制要求,企业开始主动了解图数据库商业化版本,寻求合适的供应厂商,市场从厂商对客户的教育培训转变成客户对厂商的主动的行业落地诉求,2022年中国图数据库市场规模达到2.4亿元人民币,预计2023年整体市场规模将超过4亿元人民币,呈现快速增长的态势。
在此背景下,为了更清晰地展示图数据库提供商的综合实力,IDC发布了《IDC MarketScape:中国图数据库市场2023年厂商评估》市场研究报告,最终入选报告的厂商包括(按照首字母顺序排序):创邻科技、Fabarta、华为云、杭州悦数、海致科技、蚂蚁集团、明略科技、Neo4j、蜀天梦图、TigerGraph、星环科技、嬴图。厂商评估结果基于IDC MarketScape模型以图像形式展示。
本次研究的主要市场发现包括:
从整体市场来看
市场拓展至多行业需求,金融仍是主要客户渠道。社会数据素养持续提升,对数据本身和数据价值挖掘的重视程度持续提升,图数据库的适用范围也从金融、互联网等数据就绪度较高的行业,扩展至政府、物流、公安、电信、能源、工业、零售等领域,主要应用案例即利用关系挖掘实现客户推荐、智能营销、反洗钱、电信诈骗、专家图谱、点位推荐等领域,各行业客户开始主动探索图数据库与业务价值的融合,数据存储分析不再局限于部分特定场景,而是广泛出现在所有有数据流通的地方。但值得注意的是,考虑到市场规模、信息化水平、开发成本、部署效率、回款速度,银行、保险、证券等金融场景仍占到企业收入的60%以上,企业也希望通过金融客户的高要求开发部署来提升自身产品水平。根据客户需求调研,未来政府、物流 、互联网将有更大的市场潜力和产品采购或替代意愿,除用户关系挖掘,也可将智能设备、GPS坐标等信息抽象成实例来做进一步分析。
数字化转型是当前市场化主要推手,图数据库尚未形成独立价值闭环。图数据库市场受大型央国企数字化转型政策的推动明显,企业采购需求增大,但往往图数据库仅作为数字化转型整体项目中的一个产品来落地,企业通常会选择更为完整的技术解决方案,包括大数据、人工智能、云计算等模块,搭配图数据库来进行场景挖掘和营销推荐。基于此,企业市场教育仍需继续,由于图数据与传统数据存储、管理、算法和分析方式不同,图数据库不仅代表数据存储架构,也包括上层的算法模型和分析管理平台,以此来形成独立的价值闭环。
图数据库对降本增效有明显作用。IDC调研数据表明,分析应用程序、数据智能软件平台以及数据集成和完整性工具受市场经济下行的挑战影响更小,因为他们是企业寻找新机会和降低风险的战略核心。聚焦金融场景,存量经济时代更需要深层关系挖掘,金融科技的关联分析能力和支撑要求越来越高,打造更深刻的客户洞察和画像,从点、面、网来做网络分析,在采用图数据库后,部分银行拓客业务可增长50%用户。
客户在选型时更加看重厂商的综合实力。上文提到客户更加注重厂商解决方案的完整性,尤其是银行客户更看重厂商的综合实力、商业背景、技术研发能力、风险处理能力以及丰富的行业经验,还有在场景探索的主动性和引导性,即厂商在提供客户挖掘和关联分析等简单能力后,如何深入客户业务场景来指引未来的开发计划,实现投入收益最大化。值得注意的是,部分厂商会选择开源的产品路径,开源确实会扩大产品影响力和开发者使用规模,但由于图的专业性较高,客户在选择商业化版本评估时,开源的优先级较低,因此厂商也需要平衡开源投入与预期收益。另外,往往出海业务更加偏向开源版本。
从产品功能来看
对于ChatGPT带来的新一波浪潮,市场对通用预训练模型期待度较高。图数据库与AI融合度较低,当前ChatGPT带来的波动在产业界延续,用户侧对大模型期待较高,主要体现在ChatGPT对于存算管理、查询分析、数据开发、可视化呈现、场景预训练模型等方面,需求和采购意愿明显。但厂商侧对大模型开发势头较为缓慢,一方面中国相继出台数据安全政策,规范约束了大模型的训练和使用,另一方面图数据库厂商正处于与AI厂商对接合作的密集更新迭代阶段,尚未做大范围开放。值得注意的是,厂商需要平衡对ChatGPT的人员资金投入和预期效果,避免打乱既定的产品发布计划和市场策略。
场景的探索与开箱即用的业务模型是市场更进一步的需求。客户在采购图数据库实现基础关系查询后,对后续数据挖掘和业务价值提升规划不清晰,不了解重点开发方向,亟需与外部厂商和同行业人员交流沟通,探索接下来人员开发投入重点。另外,开箱即用的业务模型可以极大缓解开发压力,厂商将业务服务经验沉淀在底层平台能力上,为金融、政府、能源等领域开发专业模型和工具组件,减少客户从0到1、从通用到专用的重复造轮子工作。
图计算平台仍有较大缺口。基于图数据库的上层图计算分析平台面临简单开源封装、查询分析难、功能实现复杂、优化效果差等问题,使得部分客户在采购相关平台后使用率不高,转而选择直接使用python来更加灵活敏捷的分析数据,这造成了资源的浪费和采购的空置。厂商在开发图计算分析平台时,需要围绕数据的全部流动环节,创新完善查询能力与算子模型,高效满足客户复杂的查询需求。另外,厂商对于图数据的开发可视化呈现需求明显,例如图形化BI、可视化操作界面、拖拉拽操作等。
图数据库还需要实现可预见性、灵活升级、AI和大数据融合、实时性。图数据分析平台中场景算法仍是开发重点,客户需要内部场景业务的交流以及外部厂商对业务模型的主动引入。数据迁移成本较高,无感知的数据迁移和架构升级可以极大降低部署和后期运维压力。另外AI for DB和DB for AI都有明显的市场潜力,包括行业知识库构建流程、定制查询、目标定义、算法选型、模型构建、资源监控、可解释性、迭代管理等,图数据库也需要和HTAP、湖仓一体、云、实时数仓的进一步结合。
从标准生态来看
图数据库缺乏统一标准范式,技术生态环境弱势。图数据库已涌现出一批国内优秀厂商,但产品功能与技术路线有较大差异,市场缺少统一标准,尤其是在语言、算子、查询开发方式等方面,代表厂商在积极牵头或参加制定国际和国内标准规范,有望逐步标准化产品技术。同时,市场生态的弱势也制约客户选型和部署,虽然部分大型银行等创新企业已有近10年的图数据库开发经验,但对于中小银行、政府等企业,其概念相对较新,了解产品渠道有限,产品选型较难,客户往往通过市场调研来考察开源和商业化方案,并参考研究机构的白皮书报告,但仍评估范围不广、评估体系不全、评估指标不细,没有大范围考量国内主流图数据库厂商,因此需要更加权威的报告和白皮书撰写,以及打造更完备的普适性使用文档、标准规范和技术生态,考虑到厂商一般会将落地周期控制在3–6个月,这些的缺乏也会为IT运维带来更大的压力。
图数据库厂商应该重新考虑与上层数据分析平台和其他数据库的关系。对于综合的业务场景,数据分析中台不仅是对底层图数据库来做查询分析,也涉及到其他关系型数据库,使得厂商提供的图数据库管理平台存在局限性,厂商需要考虑如何更好地与上层整体分析平台功能的融合,以及与其他数据库的数据联动。另外,由于基于图数据库的图算法模型和基于关系型数据库的Transformer模型同样可以实现逻辑推理,且在企业内部往往归属于不同的业务部门并难以融合,因此图数据库厂商需要凸显图挖掘分析优势,例如性能效率或场景功能,并主动与其他数据部门沟通探索融合创新可能性。
IDC中国新兴科技研究组高级分析师李浩然表示,根据IDC数据,2022年中国图数据库市场规模达到2.4亿元人民币,预计2023年整体市场规模将超过4亿元人民币,呈现快速增长的态势。从整体市场来看,市场拓展至多行业需求,金融仍是主要客户渠道,数字化转型是当前市场化主要推手。图数据库尚未形成独立价值闭环,企业市场教育仍需继续,由于图数据与传统数据存储、管理、算法和分析方式不同,图数据库不仅代表数据存储架构,也包括上层的算法模型和分析管理平台,以此来形成独立的价值闭环。从产品功能来看,对于ChatGPT带来的新一波浪潮,市场对通用预训练模型期待度较高,主要体现在ChatGPT对于存算管理、查询分析、数据开发、可视化呈现、场景预训练模型等方面。从标准生态来看,图数据库厂商加快统一标准范式,并考虑与上层数据分析平台和其他数据库的关系。