数据库供应商Rockset周二宣布支持向量嵌入,旨在使用户能够实时搜索和操作任何类型的数据。
Rockset公司总部位于加利福尼亚州圣马特奥市,该公司此前支持结构化和半结构化数据,允许用户使用SQL和NoSQL实时搜索和分析数据。
现在,随着增加对向量嵌入的支持,Rockset还使用户能够搜索和分析非结构化数据,并将非结构化数据与结构化和半结构化数据相结合。
2020年底,这家2016年的初创公司筹集了4000万美元的风险投资资金,将其总融资额提高到6000万美元以上。不到一年后,Rockset推出了使客户能够直接查询事件流的功能。从那时起,该公司与Microsoft、Oracle和Snowflake等供应商合作构建集成和连接器。
最近,该公司报告称,其年度经常性收入在2022年增加了两倍,其客户群在这一年中增加了一倍多。Rockset公司的创始人Venkat Venkataramani和Dhruba Borthakur都来自Facebook。
新功能
向量本质上是非结构化数据(例如文本、图像和视频)的数字表示形式,无法以与结构化数据相同的方式在行和列中捕获。当通过算法转换为数字表示后,向量通常用于语义搜索,以便用户可以发现具有相似属性的其他数据。
随后,这使企业能够将非结构化数据与其他类型的数据相结合,以获得更完整的运营视图。TechTarget企业战略集团分析师Stephen Catanzano表示,向量可帮助实现更完整的视图,这也使向量成为现代分析的重要部分。
他表示:“向量在数据分析中很重要,因为它们提供了一种强大而有效的方式来表示和分析大量数据。它们使我们能够衡量数据点之间的异同,并提供一套丰富的工具来分析和操作数据。这几乎就像从单一维度到3D(通过突出显示)数据如何互连。”
Rockset对向量嵌入的支持现在支持的特定功能包括:
- 使用 SQL 将矢量搜索结果与其他数据联接,以开发更完整的实时 AI 和机器学习模型。
- 高速索引实时数据。
- 从搜索中快速生成结果,搜索结合向量、关键字和元数据。
Catanzano指出,虽然Rockset与Elastic等供应商竞争,但Rockset的不同之处在于,使客户能够管理所有类型的数据并大规模管理。
他表示:“对于企业来说,能够整合所有类型的收集数据,并对其进行处理和建模以实时创建强大的新数据见解非常重要,Rockset 的关键是大规模实时完成所有工作并提供实时见解。”
同样,Venkataramani表示,增加对向量嵌入支持的关键方面是该供应商现在允许用户在一个位置管理和探索所有类型的数据。Venkataramani除了是Rockset的联合创始人外,还担任首席执行官
他指出:“现在单个数据库就可以存储你的结构化数据、半结构化数据和你的向量嵌入,以构建丰富的人工智能应用程序。我们已经有擅长存储结构化数据和半结构化数据的数据库,并将它们整合在一起,以构建实时应用程序。现在,借助本地向量支持,你现在可以构建支持混合搜索的应用程序。”
实际应用
Venkataramani继续说道,在混合应用程序中将向量嵌入与结构化和半结构化数据相结合而实现的主要用例之一是电子商务的实时个性化。
网站上的每个产品都包含图像和文本,并且可以编码为向量。同样,可以根据每个客户查看和购买的产品集为其分配一个向量。
然后,可以将这些向量与其他数据(例如哪些产品有库存)相结合,以过滤掉当前不相关的数据。
通过这种整合,电子商务供应商可以发现客户想要购买特定产品的可能性,同时确保向客户推出的产品有库存或该产品的最新版本。
Venkataramani说:“这就是现在所有个性化引擎的工作方式。正在发生的事情是,你有关于商品是否有库存的元数据,以及关于登录用户感兴趣的可能性的向量数据。”
事实上,Venkataramani指出,Rockset增加对向量嵌入支持的主要原因是一家电子商务供应商的要求,该供应商需要为其客户提供个性化推荐。
当时该公司正在做自己的特定工作,将向量与Rockset的元数据过滤功能相结合,他们询问Rockset是否可以建立自己的向量嵌入支持。
然后,这两家公司共同开发了Rockset对向量嵌入的新支持。
Venkataramani 称:“这位客户来找我们说,‘你必须为我们建造这个,’这是我们所做工作的自然延伸,也是为我们的很多客户添加的良好功能。”
未来计划
根据Venkataramani的说法,现在Rockset已经增加对向量嵌入的支持,他们计划使向量搜索过程更快。
实现这一点的一种方法是开发相似性指数,向用户显示哪些向量与其他向量相似,而无需搜索来查找完全匹配项。
Venkataramani 称:“人们对创建相似性指数很感兴趣,这样向量就不会与其他一两个混合在一起。我们希望支持用户想要构建的任何类型的相似性索引,以便他们可以在本地进行近似向量搜索。”
与此同时,Catanzano表示,Rockset继续响应客户的需求非常重要。
他说,该供应商已经在大规模实时云数据库市场上建立良好的声誉。因此,在没有明显的新功能可添加的情况下,使用客户需求来指导其路线图对 Rockset 来说是明智的。
Catanzano 称:“这一公告是一个很好的例子,说明他们如何倾听客户的意见并创新以跟上发展步伐。”
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
作者
翻译
相关推荐
-
Java、JDBC和Postgres
现在越来越多的企业开始部署PostgreSQL,为什么呢?当你看到这个许可开源数据库所提供的功能,你就不会对此 […]
-
5个元数据管理最佳实践
在数据驱动的环境中,元数据不仅仅是数据的副产品;还是综合数据治理战略的关键组成部分。企业需要适当的元数据管理, […]
-
Cockroach Labs增加矢量搜索,更新定价选项
Cockroach Labs 近日推出矢量搜索功能,旨在使客户能够访问和操作非结构化数据,以训练生成式人工智能 […]
-
如何使用数据治理成熟度模型
如果没有强大的数据治理,数据就无法产生有价值的见解以及改善决策。数据治理成熟度模型可帮助企业评估当前的成就水平 […]