模型存储 - Hugging Face

type
status
date
slug
summary
tags
category
icon
password
网址
您可以在 InferenceService YAML 中使用以下格式指定 storageUri 字段,以从 Hugging Face Hub 部署模型。
例如 hf://facebook/opt-125m

公开的 Hugging Face 模型

如果未提供凭据,将使用匿名客户端从 HF 仓库下载模型。

私有的 Hugging Face 模型

KServe 支持使用 HF_TOKEN 进行身份验证以下载模型,并创建 Kubernetes secret 来存储 HF 令牌。

从 HF Hub 部署推理服务

选项1:使用带有 Secret 引用的服务账号

创建一个带有 HF 令牌 secret 名称引用的 Kubernetes ServiceAccount,并在 InferenceService 规范中指定 ServiceAccountName

选项2:使用带有 Secret 引用的环境变量

创建一个 Kubernetes HF 令牌,并使用 InferenceService 规范中的环境变量指定 HF 令牌 secret 引用。
yaml

检查推理服务状态

预期输出
上一篇
模型存储 - GCS
下一篇
模型存储 - 模型缓存
Loading...
文章列表
Kserve中文文档
快速开始
管理指南
用户指南
开发指南
机器学习概念
大模型周报