news 2026/2/25 18:58:16

EverMemOS 访问外部(deepinfra)API接口

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
EverMemOS 访问外部(deepinfra)API接口

EverMemOS 访问外部API接口


📋 概述

  • EverMemOS 通过调用 外部大模型API 服务,实现evermemos内部业务响应,请求三方接口详情

✅ 目标接口

接口功能输入格式输出格式
POST /v1/chat/completions大语言模型对话Chat Completions 格式Chat 格式
POST /v1/reranker文档重排序Rerank Service 统一请求格式统一响应格式(含 rank)
POST /v1/embeddings文本向量化Vectorize Service 请求格式(支持is_queryEmbedding 格式

详细接口说明

1./v1/chat/completions

功能描述

生成基于输入消息的聊天响应,使用配置的 LLM 引擎。

请求参数
参数名类型是否必需默认值描述
modelstringNone模型名称
messagesarray of objectNone聊天消息列表,每个消息包含rolecontent字段
temperaturefloat0.7生成温度,控制输出随机性
max_tokensinteger1024最大生成 token 数
streambooleanfalse是否流式输出
response_formatobjectNone响应格式
请求示例
{"model":"qwen-7b","messages":[{"role":"user","content":"你好,请介绍一下自己"}],"temperature":0.7,"max_tokens":512}
响应结构
字段名类型描述
idstring响应 ID
objectstring对象类型,固定为 “chat.completion”
createdinteger创建时间戳
modelstring使用的模型名称
choicesarray of object响应选项列表
choices[].indexinteger选项索引
choices[].messageobject包含rolecontent的消息对象
choices[].finish_reasonstring完成原因
usageobject令牌使用情况
usage.prompt_tokensinteger提示令牌数
usage.completion_tokensinteger完成令牌数
usage.total_tokensinteger总令牌数
响应示例
{"id":"chatcmpl-abcdef123456","object":"chat.completion","created":1689123456,"model":"qwen-7b","choices":[{"index":0,"message":{"role":"assistant","content":"你好!我是一个基于 Qwen 模型的 AI 助手,很高兴为你服务。请问有什么我可以帮助你的吗?"},"finish_reason":"stop"}],"usage":{"prompt_tokens":10,"completion_tokens":25,"total_tokens":35}}

2./v1/embeddings

功能描述

生成文本的嵌入向量,可用于文本相似度计算、检索等任务。

请求参数
参数名类型是否必需默认值描述
inputarray of stringNone要生成嵌入的文本列表
modelstring“dengcao/Qwen3-Embedding-0.6B”模型名称
encoding_formatstring“float”编码格式
dimensionsinteger1024嵌入维度
is_querybooleanfalse是否为查询文本
请求示例
{"input":["人工智能的发展历程","机器学习的基本原理"],"model":"dengcao/Qwen3-Embedding-0.6B","is_query":false}
响应结构
字段名类型描述
objectstring对象类型,固定为 “list”
dataarray of object嵌入数据列表
data[].objectstring数据对象类型,固定为 “embedding”
data[].embeddingarray of float嵌入向量
data[].indexinteger索引
modelstring使用的模型名称
usageobject使用情况
usage.prompt_tokensinteger提示令牌数
usage.total_tokensinteger总令牌数
响应示例
{"object":"list","data":[{"object":"embedding","embedding":[0.123,0.456,-0.789,...],"index":0},{"object":"embedding","embedding":[0.987,-0.654,0.321,...],"index":1}],"model":"dengcao/Qwen3-Embedding-0.6B","usage":{"prompt_tokens":2,"total_tokens":2}}
错误处理
状态码描述
500内部服务器错误,返回错误详情

3./v1/reranker

功能描述

根据查询对文档列表进行重排序,返回按相关性排序的结果。

请求参数
参数名类型是否必需默认值描述
querystringNone查询文本
documentsarray of stringNone文档列表
modelstring“dengcao/Qwen3-Reranker-0.6B”模型名称
instructionstring“Given a search query, retrieve relevant passages that answer the query”指令文本
请求示例
{"query":"人工智能的应用领域","documents":["人工智能在医疗领域的应用包括疾病诊断和药物研发","机器学习是人工智能的一个重要分支","人工智能在金融领域用于风险评估和欺诈检测","人工智能的发展历史可以追溯到上世纪50年代"],"model":"dengcao/Qwen3-Reranker-0.6B"}
响应结构
字段名类型描述
resultsarray of object排序结果列表
results[].indexinteger原始文档索引
results[].scorefloat相关性分数
results[].rankinteger排序 rank
modelstring使用的模型名称
input_tokensinteger输入令牌数
request_idstring请求 ID
响应示例
{"results":[{"index":0,"score":0.95,"rank":0},{"index":2,"score":0.90,"rank":1},{"index":3,"score":0.75,"rank":2},{"index":1,"score":0.60,"rank":3}],"model":"dengcao/Qwen3-Reranker-0.6B","input_tokens":50,"request_id":"uuid-123456"}

✅ 3. 启动与测试

测试命令

Chat
curl-X POST http://xxx.xxx.xxx/v1/chat/completions\-H"Content-Type: application/json"\-d'{ "model": "qwen3:4b", "messages": [{"role": "user", "content": "你好!"}] }'
Embedding
curl-X POST http://xxx.xxx.xxx/v1/embeddings\-H"Content-Type: application/json"\-d'{ "input": ["这里太暗了"], "is_query": true }'
Reranker
curl-X POST http://xxx.xxx.xxx/v1/reranker\-H"Content-Type: application/json"\-d'{ "query": "这里太暗了", "documents": ["请打开灯", "今天天气很好"] }'

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/2/25 13:08:41

Phi-4-mini-reasoning开源可部署价值再升级|ollama镜像通过CNCF认证

Phi-4-mini-reasoning开源可部署价值再升级|ollama镜像通过CNCF认证 1. 轻量级推理模型的新选择 Phi-4-mini-reasoning作为Phi-4模型家族的最新成员,为开发者提供了一个专注于数学推理和逻辑分析的轻量级解决方案。这个开源模型最大的特点是能够在保持…

作者头像 李华
网站建设 2026/2/22 8:57:19

3大突破+5大场景:零基础玩转多平台数据采集工具

3大突破5大场景:零基础玩转多平台数据采集工具 【免费下载链接】MediaCrawler-new 项目地址: https://gitcode.com/GitHub_Trending/me/MediaCrawler-new 多平台数据采集是信息时代获取有价值内容的核心技能,如何在复杂的网络环境中高效、合规地…

作者头像 李华
网站建设 2026/2/19 11:31:39

3分钟上手音乐下载工具:告别会员限制,轻松获取无损音乐资源

3分钟上手音乐下载工具:告别会员限制,轻松获取无损音乐资源 【免费下载链接】res-downloader 资源下载器、网络资源嗅探,支持微信视频号下载、网页抖音无水印下载、网页快手无水印视频下载、酷狗音乐下载等网络资源拦截下载! 项目地址: htt…

作者头像 李华
网站建设 2026/2/15 21:38:19

Local SDXL-Turbo部署教程:GPU利用率监控(nvidia-smi + Prometheus)

Local SDXL-Turbo部署教程:GPU利用率监控(nvidia-smi Prometheus) 1. 前言:为什么需要监控GPU利用率 当你部署了Local SDXL-Turbo这样的实时绘画工具后,了解GPU资源的使用情况变得尤为重要。这个基于StabilityAI SD…

作者头像 李华
网站建设 2026/2/19 9:11:46

阿里MGeo模型文档解读:快速开始四步法高效上手机器学习任务

阿里MGeo模型文档解读:快速开始四步法高效上手机器学习任务 1. 这个模型到底能帮你解决什么问题? 你有没有遇到过这样的场景:电商后台积压了上万条用户填写的收货地址,格式五花八门——“北京市朝阳区建国路8号”“北京朝阳建国…

作者头像 李华
网站建设 2026/2/12 17:08:08

零基础入门Glyph:智谱新框架让AI看懂文档,部署只需3步

零基础入门Glyph:智谱新框架让AI看懂文档,部署只需3步 1. 为什么你需要Glyph?——一个被忽略的“文档理解”痛点 你有没有遇到过这样的情况: 给AI扔进去一份50页的PDF合同,问它“违约责任条款在哪几条”&#xff0c…

作者头像 李华