news 2026/2/4 16:37:46

ISP模式

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
ISP模式

H.266 / VVC中,ISP 模式指的是:

ISP = Intra Sub-Partitioning(帧内子分区预测)

它是VVC 相比 HEVC 新增的一项重要帧内预测工具,目标是:
👉提升细长 CU、强方向纹理区域的帧内预测精度


一句话先抓重点 🧠

ISP 的核心思想:
不是“一个 CU 用一个预测”,
而是“一个 CU 沿方向切成多块,每块单独做帧内预测”。


一、ISP 在解决什么问题?

在 HEVC / 传统帧内预测里:

  • 一个 CU(如 8×16、4×16)

  • 整块只选一个 Intra Mode

  • 对于:

    • 竖直条纹
    • 横向边缘
    • 强方向纹理

👉预测不够贴合


二、ISP 的基本做法

1️⃣ 适用对象

  • 帧内 CU

  • 通常是非方形、细长 CU

  • 如:

    • 4×16
    • 8×32
    • 16×4

2️⃣ 分区方式(重点)

ISP 只做一维切分,而且方向与预测方向一致

ISP 类型子分区方式
ISP-H沿水平方向切(多条横条)
ISP-V沿垂直方向切(多条竖条)

示意(ISP-V):

+----+----+----+ | | | | | | | | | | | | +----+----+----+

3️⃣ 每个子分区怎么处理?

每一个子分区

  • 使用同一个 Intra Mode

  • 但:

    • 独立生成预测
    • 独立做残差、变换、量化
  • 参考像素:

    • 左 / 上边界
    • 以及前一个已重建的子分区

👉 子分区有因果顺序


三、ISP 的 RD 优势来源(为什么有效)

ISP 提升 RD 的原因主要有 3 点:

✅ 1️⃣ 缩短预测距离

  • 每个子分区只预测一小条
  • 插值误差明显下降

✅ 2️⃣ 更好贴合方向纹理

  • 特别适合:

    • 垂直结构 → ISP-V
    • 水平结构 → ISP-H

✅ 3️⃣ 残差能量更集中

  • 残差更“尖”
  • 变换效率更高

四、ISP 的代价(为什么复杂)

⚠️ 编码复杂度高

  • 同一个 CU:

    • 普通 Intra
    • ISP-H
    • ISP-V
      → 都要试 RD

⚠️ 解码复杂度增加

  • 顺序重建
  • 依赖前子分区像素

⚠️ 实现复杂

  • 参考样本管理更复杂
  • 管线不好做并行

五、ISP 与其他 Intra 工具的关系(工程里很关键)

ISP vs MIP

ISPMIP
思想子分区模型预测
擅长强方向纹理低频/平滑
是否可共存❌ 同一 CU 不能同时用

👉ISP 和 MIP 互斥


ISP vs Intra 多方向模式

  • ISP不是新方向
  • 是对已有方向预测的结构增强

六、在 VTM / ECM

常见规律(经验):

  • 16x4→ ISP-H 命中率高
  • 4x16 / 8x16→ ISP-V 命中率高
  • 大方块(32×32) → 很少选 ISP

七、标准层面的位置

  • ISP 定义在VVC 帧内预测工具集

  • 编码器可选工具(非强制)

  • 通过 flag 信令:

    • 是否启用 ISP
    • ISP-H / ISP-V

八、一句工程总结(给做编码的人)

ISP 本质是:
用“空间顺序 + 局部预测”
换取“RD 增益”,
代价是“复杂度 + 实现难度”。


版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/2/3 2:24:27

Qwen1.5-0.5B-Chat内存占用高?<2GB优化部署实战案例

Qwen1.5-0.5B-Chat内存占用高&#xff1f;<2GB优化部署实战案例 1. 为什么说“轻量”不等于“低耗”&#xff1a;一个被低估的部署痛点 你是不是也遇到过这种情况&#xff1a;看到模型参数只有0.5B&#xff0c;兴奋地拉下来准备跑在老笔记本或边缘设备上&#xff0c;结果一…

作者头像 李华
网站建设 2026/2/3 6:20:53

Clawdbot直连Qwen3-32B部署教程:Nginx反向代理+SSL证书配置完整步骤

Clawdbot直连Qwen3-32B部署教程&#xff1a;Nginx反向代理SSL证书配置完整步骤 1. 为什么需要这个部署方案 你是不是也遇到过这样的问题&#xff1a;本地跑着Qwen3-32B大模型&#xff0c;用Ollama启动后只能通过http://localhost:11434访问&#xff0c;但想让团队同事、客户或…

作者头像 李华
网站建设 2026/2/4 11:17:58

Clawdbot整合Qwen3:32B企业落地:与Jira/Confluence双向知识同步方案

Clawdbot整合Qwen3:32B企业落地&#xff1a;与Jira/Confluence双向知识同步方案 1. 方案价值&#xff1a;为什么需要这个集成 你有没有遇到过这些情况&#xff1f; 产品需求写在Jira里&#xff0c;但技术细节散落在Confluence文档中&#xff0c;新人上手要花半天翻找&#x…

作者头像 李华
网站建设 2026/2/5 4:53:45

GLM-TTS高级功能揭秘:音素级控制精准发音

GLM-TTS高级功能揭秘&#xff1a;音素级控制精准发音 在语音合成领域&#xff0c;真正决定用户体验上限的&#xff0c;往往不是“能不能说”&#xff0c;而是“说得准不准”“像不像”“有没有情绪”。很多开发者用过开源TTS模型后都有类似困惑&#xff1a;多音字总读错&#…

作者头像 李华
网站建设 2026/2/4 2:15:33

USB3.0链路训练过程全解析:深度剖析LTSSM状态机

以下是对您提供的技术博文《USB3.0链路训练过程全解析:深度剖析LTSSM状态机》的 专业级润色与优化版本 。本次优化严格遵循您的全部要求: ✅ 彻底去除AI痕迹 :全文以资深硬件工程师/协议栈开发者第一人称视角展开,语言自然、节奏紧凑、有经验沉淀感; ✅ 摒弃模板化…

作者头像 李华