"妄人" 方舟子
起因
2025年新年中午,方舟子在 Bluesky 发表了一条帖子。
通过 DeepSeek 对提示词 9.9和9.11哪个大 的幻觉反馈,来佐证 DeepSeek 是一个性能较差的大模型。
紧急修改
我测试了 DeepSeek 的反馈,发现并没有出现高比例的幻觉反馈,便留言分享这个事实。方舟子回复到:
方舟子以较为确信的口吻,说性能变化是 DeepSeek 的紧急修改所致。
方舟子的图是直接从 自己推文下面的网友评论 里拿来的,网友是当日11点13的评论,且说是她早晨测试的,方舟子是12点36/40发的贴,我看到并测试是在12点50左右,方舟子大概都懒得去独立验证,便随手把网友的截屏发了出来。这个截屏基本可以确定是 v3 的,而且方舟子是第一个有影响力发这张截屏的人。
DeepSeek 团队必须要在元旦假日的午休期间,在业内对数学计算出现幻觉可以接受的情况下,作为开源模型,在大家可以随意独立验证在这个提示词上比 GPT-4o 和 Claude-3.5-Sonnet 表现的还要好的情况下,在国际上已经满是美誉的情况下,因为方舟子发帖,要在十分钟内,从团队看到并做出了紧急修改,可能性有多高呢?
方舟子以较为确信的口吻,说性能骤变是 DeepSeek 的紧急修改所致,是一个想当然的臆断。
选择性截屏
大模型并不是稳定地给出一致的答案,也就是存在选择性的截屏,允许人以偏概全来评价性能。
评价一个大模型的好坏,不应该用一个题目,更不应该使用一个题目的一次回答,而是要有更多的样本,提供统计数字,方舟子觉得大模型有一次说错就就能作为嘲讽的依据,其实体现的就是他对这个领域的陌生和不了解,现在最先进的 OpenAI o1,做高中数学题也能出离谱的错,我们能依此嘲讽说 OpenAI 的数学 “的确与众不同” 吗?AlphaFold 也有幻觉,我们也要拿出一个选择性的截屏来嘲讽 2024年因 AlphaFold 而获得诺贝尔奖化学奖的 Demis Hassabis 吗?
方舟子以较为确信的口吻,认为无法出现选择性截屏,是一个错误的臆断。
换话题
我和方舟子说, GPT-4o 和 Claude-3.5-Sonnet,在这个提示词上并没有表现的更好。对此方舟子回复说:
“现在要换话题比烂了” 是一句非常糊涂的话,DeepSeek 的性能是否相比之下更差就是话题本身,似乎方舟子是想说我在指责转移,Whataboutism,AlphaFold 也有幻觉,我们去找大模型的缺陷难道是这个帖子的主题?一个 “智商高于180” 的天才,为什么会在讨论过程中连论点是什么都能搞糊涂?因为他认知能力没他吹嘘的那么高。
方舟子自诩科学精神,却同时使用了两次 Cherry Picking 的诡辩,首先,他选择了大模型里普遍存在的、常见的幻觉提示词来嘲讽性能,其次,即使 DeepSeek 在这个幻觉上表现比其他大模型更出色,他却找了一个发生概率低的单一样本来佐证。
通过一次飞机失事,来嘲笑飞机的安全性不如私家车,这就是方舟子自诩的科学精神吗?
“妄人” 方舟子
对论据,方舟子自己懒得求证,觉得没啥大问题,就拿来嘲讽 ”天才“ ,那为什么方舟子这么确信骂我没常识、确信紧急修改、无法选择性截屏呢?因为他对大模型很不了解,在这个领域,他在这个互动里所表现的“很无知,又一脑子浆糊很糊涂”,“不知藏拙,偏爱跨领域乱说”,“没有严谨的思维”,也就是他总爱说别人的,是一个 无知无畏的 ”妄人“。
人身攻击
方舟子后来拉黑了我,他在这次互动中辱贬我是“弱智”,后续又说我作为他验收过的“方黑”,是“人格卑贱的人渣”,也曾说过“方黑都是这种智商不满80的弱智”,“方黑都是无可救药的精神病,无一例外”。
若是鲁迅在世,他会耻于有这样一个有影响力的崇拜者吧,甚至没准会写文章骂他。
“孔乙己” 方舟子
鲁迅笔下的孔乙己,经常欺人骗己,以为知道了一些实用性很差、他人又不知道的冷僻知识,便生出优越感来,嘲笑对方,除了做 “妄人”,方舟子做 “孔乙己” 的酸腐事迹也不少。
2024年11月29日,他发了一张张爱玲的绿卡的图片,然后网友们因为这个卡片是不是 “绿卡” 而讨论起来,以致方舟子说几个网友是 “看不懂简单英语的妄人”。
但实际上,张爱玲的 ”绿卡” 是一张特殊 ”绿卡” ,准确的说那是一张可以用作 ”绿卡” 的 “过境卡”。那张卡片的标题写的是 “Border Crossing Card”,是 “Resident Alien’s Border Crossing Identification Card” 的简写,是 “绿卡” 持有者通过 Form I-189 申请办理的,是用来短期内过境加拿大和墨西哥的卡片,是不同于 ”绿卡” 的 另外一张卡片。但张爱玲的 “过境卡” 是可以作为 “绿卡” 使用的二合一特殊卡片。
虽然可以用作 “绿卡”,但是能够让大家看出来是绿卡的信号却很微弱,只有背面的小字 Form I-151 来明确这是一张 “绿卡”,而常规的绿卡,是会写着 “Alien Registration Receipt Card” 的标题的,因为这样才有助于大家识别 “绿卡”。
如果大家看到 “Border Crossing Card” 这样的显著信号,去搜索或是问 AI,会发现这是一个不同于 “绿卡” 功能的另外一个卡片,甚至发现这种 “过境卡” 后来只针对 Nonresident Aliens,因此产生迷惑是一个很常规的反应,大家不是专家,大家不需要知道 “茴字的四种写法”,不需要知道存在一种 “过境卡” 其实可以当做 “绿卡” 使用,不需要知道绿卡曾经叫做 Form I-151。
如果类比成中文语境的话,比如说有一个美国网络名人,发了一张图,说这是李连杰的学生证,但是那张卡片上明明写的是 “食堂饭卡”,只是背面写了小字 “表格151”,可以证明这确实可以用作学生证(不是学生也办不了嘛),但没有写任何 “学生证” 的显著信息,大家去网上搜发现找到的 “学生证” 都是写明 “学生证” 的,于是有人说这应该不是“学生证”,美国网络名人就说这些人是连简单的中文都看不懂的妄人,其实就是拿生僻的 “茴” 字的另一种写法来表演酸腐罢了。
就像孔乙己,方舟子说的 “茴” 字写法确实存在。或许他也迷惑于 “绿卡” 为啥叫 “过境卡”,却避而不提,因那些都已不甚重要。通过冷僻知识,嘲笑他人是妄人,情绪价值就赚足了,精神上也就又 “获胜” 了一次,还要什么自行车。
注:按照参与讨论的网友 @Exexutorencable 的 说法,方舟子在这件事后拉黑了关注方舟子几十年的 TA