科技资讯 - 叶斌兵

Fetch 上传流式请求：duplex 与 ReadableStream 管线实践

使用 fetch 的 duplex 与 ReadableStream 构建上传管线，在弱网下提升稳定性与降低内存峰值，并提供经验证的吞吐与延迟指标与回退方案。

硬件技术 2026年04月30日 0 点赞 0 评论 43 浏览

Fetch 上传流：ReadableStream 与分块上传实践

说明基于 ReadableStream 的请求体上传、必需的 duplex 配置、分块管线与服务端兼容注意事项，并提供示例与参考。

网络技术 2026年04月30日 0 点赞 0 评论 43 浏览

GPU 调度与 AI 推理成本优化（2025）

# GPU 调度与 AI 推理成本优化（2025）推理服务成本受批量与并发与精度等影响，需在性能与体验之间平衡。 ## 一、批处理与并发 - 批处理：提升吞吐但增加延迟；按场景权衡批大小。 - 并发调度：控制并发队列与优先级，避免拥塞与抖动。 ## 二、精度与算子 - 混合精度：FP16/BF16 在可接受损失下提升性能。 - 算子优化：选择高效算子与图优化，减少无效计算。 ## 三、观

硬件技术 2026年04月30日 0 点赞 0 评论 43 浏览

Kafka 主题保留与压缩策略（Retention、Log Compaction、cleanup.policy）

设计 Kafka 主题的保留与压缩策略，合理配置 `cleanup.policy=delete/compact`，并验证可靠性与成本的平衡。

硬件技术 2026年04月30日 0 点赞 0 评论 43 浏览

Argo Workflows批处理编排与并行策略实践

使用 Argo Workflows 编排批处理任务，配置并行与资源策略、重试与退避、模板与Artifact复用，并提供验证与监控方法。

硬件技术 2026年04月30日 0 点赞 0 评论 42 浏览

Device Memory API：内存感知与资源策略

使用 Device Memory API 获取设备内存量级，按阈值调整资源加载与策略，提升低端设备体验与稳定性。

硬件技术 2026年04月30日 0 点赞 0 评论 42 浏览

GraphQL订阅与实时：WebSocket与Server-Sent Events

为 GraphQL 提供实时能力的订阅机制，对比 WebSocket 与 SSE 在实现与兼容上的差异与取舍。

网络技术 2026年04月30日 0 点赞 0 评论 42 浏览

HTTP/3 与 QUIC 在生产中的落地实战

基于 QUIC 的 HTTP/3 在生产的优势与部署要点，涵盖端口、TLS、安全与可观测性，帮助稳定提升页面加载与弱网体验。

网络技术 2026年04月30日 0 点赞 0 评论 42 浏览

HTTP范围请求与断点续传治理

通过范围请求与响应分段治理大文件下载与续传，提升可靠性并减少带宽浪费。

网络技术 2026年04月30日 0 点赞 0 评论 42 浏览

Kubernetes HPA 自动扩缩容实战

使用 HPA 基于 CPU/内存与自定义指标实现自动扩缩容，并给出验证与排障要点。

硬件技术 2026年04月30日 0 点赞 0 评论 42 浏览

FinOps 成本治理（标签、预算、利用率与优化）

建立 FinOps 成本治理体系，实施资源标签与预算、利用率监控与优化策略，并提供可验证的流程与报表机制。

硬件技术 2026年04月30日 0 点赞 0 评论 41 浏览

HTTP 103 Early Hints：预加载提示与首包优化

利用 103 Early Hints 在服务器开始生成主响应前下发关键资源预加载提示，降低首包等待并改善首屏体验，含服务端与验证示例。

网络技术 2026年04月30日 0 点赞 0 评论 41 浏览

HTTP-3 与 QUIC 深入解析与性能优化

引言 - HTTP/3 以 QUIC（基于 UDP）为传输层，解决了 TCP+TLS 在多路复用与握手延迟上的结构性问题。 - 关键收益：更低的握手延迟、避免队头阻塞、支持连接迁移与更高效的头部压缩。核心机制与技术参数（已验证） - 流复用：HTTP/3 复用 QUIC 的流模型，HTTP/3 帧结构更简单（帧头包含类型与长度），不再在帧层定义 Stream。来源：小林coding HTT

网络技术 2026年04月30日 0 点赞 0 评论 41 浏览

AMD Instinct MI300X 架构与参数解析

系统化梳理 MI300X 的显存、带宽与算力特征，帮助评估在生成式 AI 与 HPC 负载下的部署与选型。

硬件技术 2026年04月30日 0 点赞 0 评论 40 浏览

Fetch Priority：fetchpriority 与资源调度优化

使用 fetchpriority 为关键资源提供优先级提示，优化首屏与关键路径加载；结合实测与 DevTools 验证效果。

网络技术 2026年04月30日 0 点赞 0 评论 40 浏览

科技资讯

首页

文章资讯

科技资讯

列表

默认

浏览次数

发布时间

Fetch 上传流式请求：duplex 与 ReadableStream 管线实践

Fetch 上传流：ReadableStream 与分块上传实践

GPU 调度与 AI 推理成本优化（2025）

Kafka 主题保留与压缩策略（Retention、Log Compaction、cleanup.policy）

Argo Workflows批处理编排与并行策略实践

Device Memory API：内存感知与资源策略

GraphQL订阅与实时：WebSocket与Server-Sent Events

HTTP/3 与 QUIC 在生产中的落地实战

HTTP范围请求与断点续传治理

Kubernetes HPA 自动扩缩容实战

FinOps 成本治理（标签、预算、利用率与优化）

HTTP 103 Early Hints：预加载提示与首包优化

HTTP-3 与 QUIC 深入解析与性能优化

AMD Instinct MI300X 架构与参数解析

Fetch Priority：fetchpriority 与资源调度优化

科技资讯 首页 文章资讯 科技资讯

列表 默认 浏览次数 发布时间

科技资讯

首页

文章资讯

科技资讯

列表

默认

浏览次数

发布时间