评估 - 叶斌兵

Core Web Vitals 与 View Transitions 导航体验量化评估

基于 RUM 与 Lighthouse 设计实验，对比启用 View Transitions 的导航体验提升与对 INP/LCP 的定量影响。

前端框架 2026年02月13日 0 点赞 0 评论 10 浏览

前端可访问性与可用性评估（ARIA、聚焦管理与验证）

使用ARIA语义与焦点管理实现键盘可达与读屏友好，结合评估工具与实测指标进行验证，提升交互可用性与一致性。

软件 2026年02月13日 0 点赞 0 评论 14 浏览

多模态嵌入与检索评估（2025）

多模态嵌入与检索评估（2025）多模态检索依赖统一表示与评估方法，保障跨模态的相关性与可复现性。一、嵌入与度量嵌入模型：选择适配任务的多模态嵌入模型。相似度：cosine/L2 等度量与归一化策略。二、检索与重排召回：向量检索结合过滤条件提升相关性。重排：多模态重排模型提升最终排序质量。三、评估与回

软件 2026年02月13日 0 点赞 0 评论 10 浏览

RAG评估指标：Faithfulness与Answer Relevance

通过忠实度与答案相关性指标评估 RAG 系统质量，结合上下文覆盖与召回构建可运行的评测体系。

数据科学与AI 2026年02月13日 0 点赞 0 评论 10 浏览

AI评估指标：BLEU/ROUGE/BERTScore与人类评测

对比三类常见文本评估指标的适用性与局限，并与人类评测结合形成稳健的评估框架。

数据科学与AI 2026年02月14日 0 点赞 0 评论 8 浏览

评估

首页

评估

列表

默认

浏览次数

发布日期

Core Web Vitals 与 View Transitions 导航体验量化评估

前端可访问性与可用性评估（ARIA、聚焦管理与验证）

多模态嵌入与检索评估（2025）

RAG评估指标：Faithfulness与Answer Relevance

AI评估指标：BLEU/ROUGE/BERTScore与人类评测

评估 首页 评估

列表 默认 浏览次数 发布日期

Core Web Vitals 与 View Transitions 导航体验量化评估

前端可访问性与可用性评估（ARIA、聚焦管理与验证）

多模态嵌入与检索评估（2025）

RAG评估指标：Faithfulness与Answer Relevance

AI评估指标：BLEU/ROUGE/BERTScore与人类评测

评估

首页

评估

列表

默认

浏览次数

发布日期