谷歌云近日发布最新动态,对其分布式数据库产品Google Cloud Spanner增加图处理能力,谷歌称之为“Spanner Graph”。同期更新的产品还有Bigtable,谷歌为Bigtable添加了SQL语句支持。
在分析人士看来,此次更新将有助于开发人员围绕人工智能场景构建应用,比如:智能推荐系统或者欺诈检测场景,会全面提升应用体验。
用The Futurum Group首席技术顾问Steven Dickens的话来说,Spanner Graph可以满足不同行业各个场景中不断增长的数据处理和分析需求,让更多人利用人工智能现代技术堆栈为业务赋能。
“凭借更强大的建模和复杂数据关系的处理能力,图检索增强生成(Graph RAG)成为传统向量数据库的有力补充。这种新的技术方案,进一步增强了人工智能应用中对相关信息的检索,提高了内容输出的准确性和相关性。”
dbInsight的首席分析师托尼·贝尔(Tony Baer)表示,对知识图谱和GraphRAG模式需求的增加,是Spanner增加图处理能力的一个重要原因。GraphRAG模式可以增强检索信息的深度,提供上下文的关联性,通过高维向量处理能力捕捉各种特征,展示更多细节内容。
IDC研究副总裁Carl Olofson则认为: “Spanner的最新更新,本质上仍然是一个关系型数据库管理系统(DBMS),只不过是在数据库内部以更灵活的方式处理图数据。新的图功能的增加,可以让用户基于现有的关系数据库具有了图数据处理能力。”
Olofson进一步解释道,Spanner的更新并不会影响专业图数据库的地位,比如:Neo4j、OrientDB、TigerGraph和Aerospike graph,这些数据库在性能方面可能更适用于纯粹的图数据应用场景。
多模数据库vs专业数据库
从技术发展路线来看,Google为Spanner增加图处理能力的举动,与很多DBMS公司的做法如出一辙。为了在战略上获得有利地位,满足用户的多场景需求,传统的关系型数据库会增加多模或者很多专业数据库才有的能力。
以云数据库服务商为例,包括Oracle、AWS、Microsoft、Google和MongoDB等,他们会在原有数据库基础上添加了向量插件功能,以满足用户在人工智能时代的多样化需求。这是向量数据库的其中一个发展路线;另一个发展方向是走专业化路线,向量数据库由专业服务商提供,比如:Pinecone、Weaviate和Milvus等。
另外,Nucleus Research高级分析师Alexander Wurm也持有相同观点, Spanner添加图处理能力后,使谷歌云增加了能够与Neo4j、亚马逊Neptune和微软Azure Cosmos DB等成品同台竞技的又一个筹码。
有了图数据处理能力,开发人员可以极大地简化数据管理压力,通过单一平台查询结构化和非结构化数据,降低管理多个数据库的复杂性,进而全面提高业务运营效率。
另外,dbInsight的首席分析师托尼·贝尔指出,Spanner Graph填补了谷歌数据库云产品组合的空白。谷歌云之所以先推出Spanner,是因为希望可以解决横向扩展问题,而这样的能力也一直是图数据库的致命弱点。
GQL和SQL之间的互操作性
谷歌数据库工程副总裁Andi Gutmans则表示,从Spanner Graph或Spanner现在的表现来看,等于具备了支持图形查询语言(GQL)的能力,并且该数据库还将实现与SQL的互操作性。
据分析人士称,与SQL的互操作性,将使Google能够让开发人员和数据专业人员能够基于熟悉的SQL语言构建应用,而无需学习新的查询语言。
上个月,谷歌更新了Spanner,增加了维护双区域配置的选项,同时声称这一操作将使企业在有限的云支持条件下,更容易遵守各国的数据规范,同时确保应用的可用性。
今年早些时候,该公司表示将在包括Spanner在内的更多云数据库中增加向量功能,如:近似最近邻检索(Approximate Nearest Neighbor,ANN)和K-最近邻(K-Nearest Neighbors,KNN)功能。
简单理解,ANN可以用于优化搜索,减少大型数据集的延迟;而KNN可以用于在较小的数据集上返回更具体或更精确的搜索结果。
谷歌还表示,企业将以一种名为Spanner Editions的方式提供打包版的Spanner服务,具体包括标准版、企业版和企业Plus版的云数据库。