长琴
...
→
菜单
跳至内容
首页
导览
简历
好玩
大神
观点
项目
存档
2026
稳定压倒一切:MoE RL 训推不一致问题及解决策略
2025
DeepSeekV3.2后训练:稳定压倒一切
DeepSeekMath-V2自我验证:搞数据的风吹到了奖励模型
DeepSeek R1后应用、职业与行业影响——2025年梳理