安装指南 - Serverless 安装
type
status
date
slug
summary
tags
category
icon
password
网址
KServe Serverless(无服务器)安装可以根据请求数量自动调整服务规模,并且支持将服务规模在零和所需数量之间灵活调整。此外,它还能管理不同版本,并支持基于版本的金丝雀发布(逐步升级)功能。
系统要求:您需要使用Kubernetes 1.28或更新版本。在安装时,请查看下方推荐的Knative和Istio版本,确保它们与您的Kubernetes版本相互兼容。
推荐版本对照表
Kubernetes Version | Recommended Istio Version | Recommended Knative Version |
1.28 | 1.22 | 1.15 |
1.29 | 1.22,1.23 | 1.15,1.16 |
1.30 | 1.22,1.23 | 1.15,1.16 |
1. 安装 Knative Serving
请参考 Knative Serving 安装指南进行安装。
提示
如果您想使用 nodeSelector、affinity 或 tolerations 等 Pod 配置选项(在 v1beta1 API中支持),需要在 Knative 配置中开启相应的功能开关。
注意:Knative 1.13.1 需要 Istio 1.20 或更高版本。在旧版本的 Istio 上,gRPC 路由将无法正常工作。详情请查看发布说明。
2. 安装网络层
推荐使用 Istio 作为 KServe 的网络层,因为它与 KServe 配合最佳。请参考 Istio 安装指南。您也可以选择其他网络层,比如 Kourier 或 Contour。如需了解 Kourier 的安装方法,请参考Kourier 安装指南。
3. 安装证书管理器
需要安装 1.15.0 或更高版本的证书管理器,请参考 证书管理器安装指南。
提示
在生产环境中,证书管理器用于管理 webhook 证书。如果不使用证书管理器,您也可以选择运行自签名证书生成脚本。
4. 安装 KServe
使用 Helm 安装
第一步:安装 KServe CRD(自定义资源定义)
第二步:安装 KServe 组件
使用命令行安装
第一步:安装 KServe CRD 和控制器(由于 InferenceService CRD 较大,需要使用
--server-side
选项,详见此问题)第二步:安装 KServe 内置的集群服务运行时
注意:如果您使用的是 KServe v0.8.0 或更高版本,需要安装集群服务运行时才能使用内置的模型服务功能。
上一篇
与推理服务(InferenceService)的 Swagger 用户界面进行交互
下一篇
Istio Service Mesh
Loading...