Zilliz为开源Milvus矢量数据库筹集6000万美元

日期: 2022-09-01 翻译:邹铮 来源:TechTarget中国 英文

矢量数据库供应商Zilliz周三表示,他们在B轮融资中筹集了6000万美元,用于推进开源Milvus平台。

矢量数据库的工作方式与依赖结构化数据的关系数据库有些不同。通过使用矢量数据库,非结构化数据被转换为数学数组,以帮助理解相关性。

开源Milvus矢量数据库特别关注AI应用,它是LF AI & Data Foundation的顶级项目,LF AI & Data FoundationLinux基金会的一个部门,致力于AI和数据。Milvus 2.1版本于83日正式发布,带来性能提升以及数据处理改进。

Zilliz及其Milvus数据库与其他矢量数据库供应商竞争,包括Pinecone,后者在3月份筹集了2800万美元。Zilliz正在为Milvus构建托管云数据库即服务平台,该平台现在处于私有预览阶段。

在本次采访中,Zilliz公司创始人兼首席执行官Charles XieMilvus数据库及其矢量数据库技术进行了深入剖析。

为什么现在为Zilliz和您的矢量数据库技术筹集资金?

Charles Xie:我认为与传统的数据处理技术相比,矢量数据库还处于非常早期的阶段。

我们筹集这么多资金,因为我们认为现在是时候让Milvus矢量数据库和Zilliz真正走向全球。我们将用这笔钱去聘请更多有才华的工程师,并加强我们的市场推广工作。

我们希望利用这轮新一轮的资金来加倍投入人才招聘,并帮助我们打造商业产品。

启动开源Milvus矢量数据库的初衷是什么?

Xie:在Zilliz,我们专注于开发人工智能时代的下一代数据库。

在过去的十年中,我们看到很多不同数据库的创新,包括时间序列、图形和实时分析数据库。所有这些数据库都依赖于某种形式的结构化数据处理。

在人工智能时代,非结构化数据呈上升趋势。例如,非结构化数据包括用于生命科学的图像、视频、人声甚至分子结构等内容。

现实是,现实世界是由大量非结构化数据组成的。我们意识到,从数据库的角度来看,需要新的数据库来管理、存储、索引和分析非结构化数据。

我们于2018年启动Milvus数据库,在2019年开源化该技术,并于2020年将该项目贡献给Linux基金会的LF AI & Data Foundation。

Milvus旨在帮助公司利用非结构化数据。

矢量数据库技术实际上是如何摄取非结构化数据?

Xie:为了将非结构化数据带入向量数据库,我们必须经过一个过程,我们称之为非结构化数据的新ETL[提取、转换和加载]。我们必须将所有非结构化数据(无论是图像还是视频)转换为特征向量。

我们还有一个由Zilliz开发的名为Towhee的开源项目,它可以帮助企业将非结构化数据转换为特征向量。在Towhee中,我们使用深度学习算法来转换非结构化数据,然后将其放入Milvus数据库中,在那里可以对其进行分析和搜索。

非结构化数据的数据标记和AI的矢量数据库的交叉点是什么?

Xie:人工智能处理非结构化数据的传统方法是数据标记,将数据标记为不同的类别。

在我们看来,未来的数据标注将被基于特征向量的处理所取代。一个标签只有预设数量的类别,这可能是一个限制,不能表达数据的所有语义。

借助矢量数据库,我们可以帮助人们非常详细地了解非结构化数据。数据标签是几十年前开发的,它适用于很多场景。但是现在,通过现代矢量数据库技术,我们可以更好地处理和理解非结构化数据。

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

翻译

邹铮
邹铮

相关推荐

  • Java、JDBC和Postgres

    现在越来越多的企业开始部署PostgreSQL,为什么呢?当你看到这个许可开源数据库所提供的功能,你就不会对此 […]

  • 5个元数据管理最佳实践

    在数据驱动的环境中,元数据不仅仅是数据的副产品;还是综合数据治理战略的关键组成部分。企业需要适当的元数据管理, […]

  • Cockroach Labs增加矢量搜索,更新定价选项

    Cockroach Labs 近日推出矢量搜索功能,旨在使客户能够访问和操作非结构化数据,以训练生成式人工智能 […]

  • 如何使用数据治理成熟度模型

    如果没有强大的数据治理,数据就无法产生有价值的见解以及改善决策。数据治理成熟度模型可帮助企业评估当前的成就水平 […]