矢量数据库供应商Zilliz周三表示,他们在B轮融资中筹集了6000万美元,用于推进开源Milvus平台。
矢量数据库的工作方式与依赖结构化数据的关系数据库有些不同。通过使用矢量数据库,非结构化数据被转换为数学数组,以帮助理解相关性。
开源Milvus矢量数据库特别关注AI应用,它是LF AI & Data Foundation的顶级项目,LF AI & Data Foundation是Linux基金会的一个部门,致力于AI和数据。Milvus 2.1版本于8月3日正式发布,带来性能提升以及数据处理改进。
Zilliz及其Milvus数据库与其他矢量数据库供应商竞争,包括Pinecone,后者在3月份筹集了2800万美元。Zilliz正在为Milvus构建托管云数据库即服务平台,该平台现在处于私有预览阶段。
在本次采访中,Zilliz公司创始人兼首席执行官Charles Xie对Milvus数据库及其矢量数据库技术进行了深入剖析。
为什么现在为Zilliz和您的矢量数据库技术筹集资金?
Charles Xie:我认为与传统的数据处理技术相比,矢量数据库还处于非常早期的阶段。
我们筹集这么多资金,因为我们认为现在是时候让Milvus矢量数据库和Zilliz真正走向全球。我们将用这笔钱去聘请更多有才华的工程师,并加强我们的市场推广工作。
我们希望利用这轮新一轮的资金来加倍投入人才招聘,并帮助我们打造商业产品。
启动开源Milvus矢量数据库的初衷是什么?
Xie:在Zilliz,我们专注于开发人工智能时代的下一代数据库。
在过去的十年中,我们看到很多不同数据库的创新,包括时间序列、图形和实时分析数据库。所有这些数据库都依赖于某种形式的结构化数据处理。
在人工智能时代,非结构化数据呈上升趋势。例如,非结构化数据包括用于生命科学的图像、视频、人声甚至分子结构等内容。
现实是,现实世界是由大量非结构化数据组成的。我们意识到,从数据库的角度来看,需要新的数据库来管理、存储、索引和分析非结构化数据。
我们于2018年启动Milvus数据库,在2019年开源化该技术,并于2020年将该项目贡献给Linux基金会的LF AI & Data Foundation。
Milvus旨在帮助公司利用非结构化数据。
矢量数据库技术实际上是如何摄取非结构化数据?
Xie:为了将非结构化数据带入向量数据库,我们必须经过一个过程,我们称之为非结构化数据的新ETL[提取、转换和加载]。我们必须将所有非结构化数据(无论是图像还是视频)转换为特征向量。
我们还有一个由Zilliz开发的名为Towhee的开源项目,它可以帮助企业将非结构化数据转换为特征向量。在Towhee中,我们使用深度学习算法来转换非结构化数据,然后将其放入Milvus数据库中,在那里可以对其进行分析和搜索。
非结构化数据的数据标记和AI的矢量数据库的交叉点是什么?
Xie:人工智能处理非结构化数据的传统方法是数据标记,将数据标记为不同的类别。
在我们看来,未来的数据标注将被基于特征向量的处理所取代。一个标签只有预设数量的类别,这可能是一个限制,不能表达数据的所有语义。
借助矢量数据库,我们可以帮助人们非常详细地了解非结构化数据。数据标签是几十年前开发的,它适用于很多场景。但是现在,通过现代矢量数据库技术,我们可以更好地处理和理解非结构化数据。
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
翻译
相关推荐
-
Java、JDBC和Postgres
现在越来越多的企业开始部署PostgreSQL,为什么呢?当你看到这个许可开源数据库所提供的功能,你就不会对此 […]
-
5个元数据管理最佳实践
在数据驱动的环境中,元数据不仅仅是数据的副产品;还是综合数据治理战略的关键组成部分。企业需要适当的元数据管理, […]
-
Cockroach Labs增加矢量搜索,更新定价选项
Cockroach Labs 近日推出矢量搜索功能,旨在使客户能够访问和操作非结构化数据,以训练生成式人工智能 […]
-
如何使用数据治理成熟度模型
如果没有强大的数据治理,数据就无法产生有价值的见解以及改善决策。数据治理成熟度模型可帮助企业评估当前的成就水平 […]