自蒸馏微调(SDFT)概述 自蒸馏微调(Self-Distillation Fine-Tuning, SDFT)是一种简单而高效的方法,它能够直接从演示(demonstrations)中实现策略内(on-policy)学习。SDFT巧妙地利用了上下文学习(in-context learning)的...
δ-mem:面向大型语言模型的高效在线记忆 翻译自 arXiv:2605.12357 | 分类: AI 技术 Jingdi Lei†1,3, Di Zhang†2,3, Junxian Li4, Weida Wang2, Kaixuan Fan5,3, Xiang Liu6,3, Qihan...