推理图-图像识别示例

type

status

date

slug

summary

在InferenceGraph请求流程中，图像以base64格式编码并首先发送到dog-cat-classifier模型，如果前一个模型预测结果为狗，则dog-cat-classifier推理服务的图像输入会被转发到下一阶段的模型进行品种分类。

您可以参考狗猫分类和狗品种分类来训练不同阶段的图像分类器模型。

在使用InferenceGraph自定义资源部署图路由器之前，您需要先部署使用上一步训练的模型的独立InferenceServices。

模型应使用以下命令打包，然后与配置一起上传到您的模型存储：

然后您可以使用以下InferenceService自定义资源将模型部署到KServe。

请查看PyTorch教程了解如何打包模型并使用InferenceService进行部署的更多详细信息。

当InferenceServices处于就绪状态后，您现在可以部署InferenceGraph来串联这两个模型以生成最终的推理结果。

📔

注意有关推理图规范的更多信息，请参阅参考文档。

InferenceGraph定义了两个步骤，每个步骤都指向上面部署的InferenceServices。这些步骤按顺序执行：首先将图像作为请求发送到cat-dog-classifier模型，如果第一个模型将其分类为狗，则发送到dog-breed-classifier。

在第二步中指定了condition，因此只有当response数据匹配定义的条件时，才会将请求发送到当前步骤。当条件不匹配时，图会短路并返回上一步的响应。有关如何表达条件的信息，请参考gjson语法，目前KServe仅支持REST协议使用此功能。

在测试InferenceGraph之前，首先检查图是否处于就绪状态，然后获取用于发送请求的路由器URL。

第一步是确定入口IP和端口并设置INGRESS_HOST和INGRESS_PORT。现在，您可以通过发送猫和狗的图像数据来测试推理图。

预期输出

您可以看到，如果第一个模型将图像分类为狗，则会将其发送到第二个模型进行进一步的狗品种分类；如果图像被分类为猫，则InferenceGraph路由器会返回第一个模型的响应。