Home
Timeline
Search
松弛又拉满
@fastcalm.bsky.social
当然也是目标驱动 Loss Function 和 Reward Function 都是要自由能的降低,认知熵值的降低 PE 即 奖励
松弛又拉满
·
Mar 31, 2026
曾经的我是目标驱动 后来的我是过程驱动