/milvus_docs

Milvus的中文文档教程

Primary LanguagePythonMIT LicenseMIT

什么是Milvus向量数据库?

Milvus 是在2019年创建的,其唯一目标是存储、索引和管理由深度神经网络和其他机器学习(ML)模型生成的大规模嵌入向量。作为一个专门设计用于处理输入向量查询的数据库,它能够处理万亿级别的向量索引。与现有的关系型数据库主要处理遵循预定义模式的结构化数据不同,Milvus从底层设计用于处理从非结构化数据转换而来的嵌入向量。

工作流程

关键概念

如果您对向量数据库和相似度搜索的世界还不熟悉,请阅读以下关键概念的解释,以更好地理解。

  • 非结构化数据:包括图像、视频、音频和自然语言等信息,这些信息不遵循预定义的模型或组织方式。这种数据类型占据了世界数据的约80%,可以使用各种人工智能(AI)和机器学习(ML)模型将其转换为向量。

  • 嵌入向量:是对非结构化数据的特征抽象。数学上,嵌入向量是一个浮点数或二进制数的数组。现代的嵌入技术被用于将非结构化数据转换为嵌入向量。

  • 向量相似度搜索:是将向量与数据库进行比较,以找到与查询向量最相似的向量的过程。使用近似最近邻搜索算法加速搜索过程。如果两个嵌入向量非常相似,那么原始数据源也是相似的。

为什么选择Milvus?

  • 高性能:在处理大规模数据集的向量搜索时具有高性能。

  • 开发者社区:开发者优先的社区,提供多语言支持和工具链。

  • 云扩展性:高可靠性,即使出现故障也不会受到影响。

  • 混合搜索:通过将标量过滤与向量相似度搜索配对,实现混合搜索。

了解更多

本文文档为 第三方维护 的中文文档,所有内容基于官方英文文档进行机翻和人工校对,人力资源紧张,如果你有发现任何错误,欢迎提 issues 和 pr.

  1. fork 仓库
  2. 翻译文字
  3. 图片拉入public/assets/文件夹下,所有图片路径(../../../assets/)替换为/assets/。
  4. 替换所有跳转链接执行 links_convert.py
  5. 生成目录映射文件_meta.json,执行update_Chinese_metajson.py 配置项将"need_create_meta"设置为 1。
  6. 中英文目录映射,pages下的aggregated_meta.json存放了中英文对照。执行update_Chinese_metajson.py 配置项将"need_replace_values"设置为 1,

组队,入群学习

学习社群

links

"openaidoc": {
  "title": "Openai中文文档",
  "type": "page",
  "href": "https://www.openaidoc.com.cn/",
  "newWindow": true
},
"milvus-io": {
  "title": "Milvus-io 中文文档",
  "type": "page",
  "href": "https://www.milvus-io.com",
  "newWindow": true
},
"langchain":{
  "title": "Langchain 中文文档",
  "type": "page",
  "href": "https://www.langchain.com.cn/",
  "newWindow": true
}