浏览器端 AI 推理实践:WebGPU/ONNX Runtime Web 与性能优化 在浏览器端实现 AI 推理,采用 WebGPU 与 ONNX Runtime Web,覆盖模型加载、输入预处理与性能优化策略,提供可验证的时延与体积指标 Recovered Channel 2076 2026年02月13日 0 点赞 0 评论 2 浏览