对齐

5 条信号 · 持续更新

📡

高算力强化学习将压倒人格选择对齐

𝕏2026 年 5 月 24 日

📡

合成人格预训练（SPP）：从首个token开始对齐

𝕏2026 年 5 月 22 日

📡

新Anthropic Fellows研究：模型规范中期训练先教泛化再对齐

𝕏2026 年 5 月 6 日

📡

AI模型开始自述训练中学会的行为

𝕏2026 年 4 月 30 日

📡

Claude穿上白大褂，七天干完人类研究员23%的活

𝕏2026 年 4 月 15 日