部署

KServe 模型部署与弹性推理实践(2025)

KServe 模型部署与弹性推理实践(2025)一、部署与接口InferenceService:统一模型入口与协议(REST/gRPC)。模型格式:支持 ONNX/TensorFlow/PMML 等多格式。二、弹性与发布Autoscaling:按 QPS/并发与延迟指标伸缩副本。Canary:按权重

Supabase pgvector Embeddings 管道与函数部署

引言基于 pgvector 的向量检索可在 Postgres 内完成;通过 Edge Functions 构建向量化管道实现生成、写入与检索的统一。能力与管道(已验证)pgvector:在 Supabase 的 Postgres 中启用扩展,创建向量列与索引(HNSW/IVFFlat)以支持相似度查