概念-数据面板-推理协议

type
status
date
slug
summary
tags
category
icon
password
网址
KServe的V1协议为所有模型框架提供了标准化的预测工作流程。该协议版本仍然受支持,但建议用户迁移到V2协议以获得更好的性能和服务运行时的标准化。但是,如果用例需要比协议v2更灵活的架构,v1协议仍然是一个选择。
API
动作
路径
请求负载
响应负载
列出模型
GET
/v1/models
{"models": [<model_name>]}
模型就绪
GET
/v1/models/<model_name>
{"name": <model_name>,"ready": $bool}
预测
POST
/v1/models/<model_name>:predict
{"instances": []} **
{"predictions": []}
解释
POST
/v1/models/<model_name>:explain
{"instances": []} **
{"predictions": [], "explanations": []}
  • = 负载是可选的
注意:V1协议中的响应负载并不严格强制执行。自定义服务器可以定义并返回其自己的响应负载。我们鼓励使用KServe定义的响应负载以保持一致性。

API定义

API
定义
预测
"预测"API在模型上执行推理。响应是预测结果。所有推理服务都遵循Tensorflow V1 HTTP API
解释
"解释"API是一个可选组件,除了预测之外还提供模型解释。标准化的解释器接口与Tensorflow V1 HTTP API相同,只是添加了":explain"动作。
模型就绪
"模型就绪"健康API指示特定模型是否准备好进行推理。如果模型已下载并准备好服务请求,模型就绪端点将返回可访问模型的列表。
列出模型
"模型"API展示模型注册表中的模型列表。
上一篇
概念-数据面板 - 推理面板
下一篇
概念-数据面板-开放推理协议V2
Loading...
目录
文章列表
Kserve中文文档
快速开始
管理指南
用户指南
开发指南
机器学习概念
大模型周报