HomeTimelineSearch
无情快进@fastcalm.bsky.social
我总倾向于神经元的结构差不多 所以 system2,大概率就是层级比较深 如果必要性强,pe 大 那就传递的深入
无情快进·Feb 25, 2026
原则上来说 就像是在低维运算 因为梯度太大了 1 和 2 本质就是值得分配能量多寡 1 里面都是大梯度的
February 25, 2026 at 10:39 PM