Apple 发布 PICO(Perceptual Image Codec)——首个同时具备实用性和感知优化的学习型编解码器。通过对数百万种模型配置的系统性搜索,PICO在感知质量和设备端运行时间之间找到了最佳平衡。
基于大规模主观用户研究,PICO相比AV1节省2.3-3倍码率,比最佳学习型编解码器节省20-40%。在iPhone 17 Pro Max上,编码12MP照片仅需230ms,解码仅需150ms——比大多数ML编解码器在V100 GPU上还快。
1. 全面消融研究: 数百万种模型配置的系统性探索,明确优化感知质量与运行时间的权衡曲线。
2. 专用损失函数: "外科手术式"地减轻文本块和平铺伪影,这是感知质量提升的关键。
3. 性能感知NAS: 在满足设备端运行时间要求的前提下,最大化感知指标衡量的压缩性能。
PICO还具备跨平台鲁棒性保证,这是大多数学习型编解码器所不具备的。
——
一个热爱技术的程序员,喜欢分享前沿AI知识和开发经验。