首页 / 文章 / Apple PICO:面向人类视觉系统的实用学习型图像编解码器
← 返回
AI技术

Apple PICO:面向人类视觉系统的实用学习型图像编解码器

✍️ zhirenhun 📅 2026/5/25 👁 72 阅读 ⏱ 2 分钟
Apple PICO:面向人类视觉系统的实用学习型图像编解码器

Apple PICO:面向人类视觉系统的实用学习型图像编解码器


核心亮点

Apple 发布 PICO(Perceptual Image Codec)——首个同时具备实用性感知优化的学习型编解码器。通过对数百万种模型配置的系统性搜索,PICO在感知质量和设备端运行时间之间找到了最佳平衡。

基于大规模主观用户研究,PICO相比AV1节省2.3-3倍码率,比最佳学习型编解码器节省20-40%。在iPhone 17 Pro Max上,编码12MP照片仅需230ms,解码仅需150ms——比大多数ML编解码器在V100 GPU上还快。

三大技术创新

1. 全面消融研究: 数百万种模型配置的系统性探索,明确优化感知质量与运行时间的权衡曲线。

2. 专用损失函数: "外科手术式"地减轻文本块和平铺伪影,这是感知质量提升的关键。

3. 性能感知NAS: 在满足设备端运行时间要求的前提下,最大化感知指标衡量的压缩性能。

PICO还具备跨平台鲁棒性保证,这是大多数学习型编解码器所不具备的。

——

🧑‍💻

zhirenhun

一个热爱技术的程序员,喜欢分享前沿AI知识和开发经验。

← 上一篇
约束衰减:LLM Agent在后端代码生成中的脆弱性剖析
下一篇 →
构建生成式AI应用的十大常见陷阱

📌 相关推荐

走向 Agent 记忆的标准模型
2026/5/31
浏览器内部的悄然 AI 战争
2026/5/31
为什么 AI 会忘记你说过的话(以及如何解决)
2026/5/31
← 返回文章列表