安装指南 - Serverless 安装

type
status
date
slug
summary
tags
category
icon
password
网址
KServe Serverless(无服务器)安装可以根据请求数量自动调整服务规模,并且支持将服务规模在零和所需数量之间灵活调整。此外,它还能管理不同版本,并支持基于版本的金丝雀发布(逐步升级)功能。
系统要求:您需要使用Kubernetes 1.28或更新版本。在安装时,请查看下方推荐的Knative和Istio版本,确保它们与您的Kubernetes版本相互兼容。

推荐版本对照表

Kubernetes Version
Recommended Istio Version
Recommended Knative Version
1.28
1.22
1.15
1.29
1.22,1.23
1.15,1.16
1.30
1.22,1.23
1.15,1.16

1. 安装 Knative Serving

请参考 Knative Serving 安装指南进行安装。
📔
提示
如果您想使用 nodeSelector、affinity 或 tolerations 等 Pod 配置选项(在 v1beta1 API中支持),需要在 Knative 配置中开启相应的功能开关
注意:Knative 1.13.1 需要 Istio 1.20 或更高版本。在旧版本的 Istio 上,gRPC 路由将无法正常工作。详情请查看发布说明

2. 安装网络层

推荐使用 Istio 作为 KServe 的网络层,因为它与 KServe 配合最佳。请参考 Istio 安装指南。您也可以选择其他网络层,比如 KourierContour。如需了解 Kourier 的安装方法,请参考Kourier 安装指南

3. 安装证书管理器

需要安装 1.15.0 或更高版本的证书管理器,请参考 证书管理器安装指南
提示
在生产环境中,证书管理器用于管理 webhook 证书。如果不使用证书管理器,您也可以选择运行自签名证书生成脚本。

4. 安装 KServe

使用 Helm 安装
第一步:安装 KServe CRD(自定义资源定义)
第二步:安装 KServe 组件
使用命令行安装
第一步:安装 KServe CRD 和控制器(由于 InferenceService CRD 较大,需要使用 --server-side 选项,详见此问题
第二步:安装 KServe 内置的集群服务运行时
注意:如果您使用的是 KServe v0.8.0 或更高版本,需要安装集群服务运行时才能使用内置的模型服务功能。
 
上一篇
与推理服务(InferenceService)的 Swagger 用户界面进行交互
下一篇
Istio Service Mesh
Loading...
文章列表
Kserve中文文档
快速开始
管理指南
用户指南
开发指南
机器学习概念
大模型周报