Cloudflare 分享了使用 Anthropic Mythos Preview 进行漏洞研究的经验:漏洞链构建、概念验证生成、信噪比问题和多阶段测试框架设计。
Odyssey 发布 Agora-1,首个多智能体世界模型,支持四人在同一生成世界中实时交互,将模拟与渲染解耦,开创游戏、机器人、RL 训练新范式。
如果vibecoding真那么强,世界应到处是vibecoded的作品。但现实中一个也没有。AI降低了打字门槛但从未触及验证层和决策层——真正的门槛一直在那儿。
当市场下行时每家公司都在优化流程,AI带来不切实际期望。但作者指出仅靠AI无法让流程变快——真正瓶颈在上游输入质量。瓶颈需要高质量输入而非盲目加速。
Semble是一个专为AI智能体打造的代码搜索库,CPU运行无需API Key或GPU,tree-sitter分块+Model2Vec+BM25双路检索,比grep+read节省98% token,支持MCP模式兼容主流AI编码工具。
AI对齐(alignment)的核心难题在于:我们试图让智能系统“自然”地服从人类意图,但对齐本身却是一项彻头彻尾的人造工程。这种人造性体现在三个层面:目标设定、价值嵌入与评估反馈。首先,对齐目标的定义源自人类的主观判断,而非机器的内生法则。我们通过人工标注、偏好聚合或法律规范来“捏造”一个近似于人...
当前AI发展的主流叙事往往聚焦于风险防范与伦理边界,但仅止步于规避危害远远不够。若要真正驾驭人工智能的社会价值,我们必须转向以“福祉”(wellbeing)为核心的积极愿景建构——这不仅是技术路线选择,更是文明层面的价值观重塑。 从技术细节看,当前AI系统的优化目标通常局限于效率、准确性或商业转化...
当前的大语言模型(LLM)聊天机器人,如GPT-4o、Claude等,虽然在对话流畅度、知识覆盖和指令遵循上取得了惊人进展,但一个根本性的缺陷正日益凸显:它们缺乏真正的“目的感”。这种缺失导致对话虽然看似合理,却往往在深度和方向性上显得空洞。 从技术本质看,现有LLM的核心机制是“下一个token...
近年来,多模态大模型(如GPT-4V、Gemini)的崛起让许多人误以为多模态能力是通往通用人工智能(AGI)的必经之路。然而,这一观点值得商榷:AGI的本质并非输入模态的多样性,而是抽象推理与跨任务泛化的能力。正如《The Gradient》上的这篇文章所论证的,单一模态(如纯文本)已经足以催生通...
在AI对齐研究中,“正交性命题”长期占据核心地位:智能体的能力与其最终目标可以任意正交,高能力并不意味着固有友善。然而,随着可扩展监督、弱到强泛化和博弈论建模等技术的推进,学界开始反思这一命题的局限性。美德伦理学视角为此提供了关键补充——它要求我们不再仅仅追问“如何指定目标函数”,而是转向“如何塑造...