跳到主要内容

Embeddings

Embeddings 用于把文本转换为向量,常见于语义搜索、推荐、聚类、去重和 RAG 检索。当前文档侧重接入说明;具体开放模型和接口以控制台与 API 参考为准。

典型流程

  1. 对文档段落、商品描述或知识库片段生成向量。
  2. 将向量写入向量数据库或支持向量检索的存储系统。
  3. 查询时对用户问题生成向量。
  4. 通过相似度召回相关内容,再交给聊天模型生成答案。

使用建议

  • 输入文本先做切分,避免单条内容过长。
  • 存储向量时保留原文、来源、更新时间和权限字段。
  • 检索结果进入聊天模型前,建议做去重、排序和长度控制。
  • 如果业务有多语言数据,优先选择支持多语言语义对齐的 embedding 模型。

下一步