Yingkui Lin

Yingkui Lin

A Curious Mind.

02 Jan 2025

"妄人" 方舟子

起因

2025年新年中午,方舟子在 Bluesky 发表了一条帖子

通过 DeepSeek 对提示词 9.9和9.11哪个大 的幻觉反馈,来佐证 DeepSeek 是一个性能较差的大模型。

紧急修改

我测试了 DeepSeek 的反馈,发现并没有出现高比例的幻觉反馈,便留言分享这个事实。方舟子回复到:

方舟子以较为确信的口吻,说性能变化是 DeepSeek 的紧急修改所致。

方舟子的图是直接从 自己推文下面的网友评论 里拿来的,网友是当日11点13的评论,且说是她早晨测试的,方舟子是12点36/40发的贴,我看到并测试是在12点50左右,方舟子大概都懒得去独立验证,便随手把网友的截屏发了出来。这个截屏基本可以确定是 v3 的,而且方舟子是第一个有影响力发这张截屏的人。

DeepSeek 团队必须要在元旦假日的午休期间,在业内对数学计算出现幻觉可以接受的情况下,作为开源模型,在大家可以随意独立验证在这个提示词上比 GPT-4o 和 Claude-3.5-Sonnet 表现的还要好的情况下,在国际上已经满是美誉的情况下,因为方舟子发帖,要在十分钟内,从团队看到并做出了紧急修改,可能性有多高呢?

方舟子以较为确信的口吻,说性能骤变是 DeepSeek 的紧急修改所致,是一个想当然的臆断。

选择性截屏

大模型并不是稳定地给出一致的答案,也就是存在选择性的截屏,允许人以偏概全来评价性能。

评价一个大模型的好坏,不应该用一个题目,更不应该使用一个题目的一次回答,而是要有更多的样本,提供统计数字,方舟子觉得大模型有一次说错就就能作为嘲讽的依据,其实体现的就是他对这个领域的陌生和不了解,现在最先进的 OpenAI o1,做高中数学题也能出离谱的错,我们能依此嘲讽说 OpenAI 的数学 “的确与众不同” 吗?AlphaFold 也有幻觉,我们也要拿出一个选择性的截屏来嘲讽 2024年因 AlphaFold 而获得诺贝尔奖化学奖的 Demis Hassabis 吗?

方舟子以较为确信的口吻,认为无法出现选择性截屏,是一个错误的臆断。

换话题

我和方舟子说, GPT-4o 和 Claude-3.5-Sonnet,在这个提示词上并没有表现的更好。对此方舟子回复说:

“现在要换话题比烂了” 是一句非常糊涂的话,DeepSeek 的性能是否相比之下更差就是话题本身,似乎方舟子是想说我在指责转移,Whataboutism,AlphaFold 也有幻觉,我们去找大模型的缺陷难道是这个帖子的主题?一个 “智商高于180” 的天才,为什么会在讨论过程中连论点是什么都能搞糊涂?因为他认知能力没他吹嘘的那么高。

方舟子自诩科学精神,却同时使用了两次 Cherry Picking 的诡辩,首先,他选择了大模型里普遍存在的、常见的幻觉提示词来嘲讽性能,其次,即使 DeepSeek 在这个幻觉上表现比其他大模型更出色,他却找了一个发生概率低的单一样本来佐证。(2025年八月初发布的 GPT-5 同样会对这个提示词产生幻觉)

通过一次飞机失事,来嘲笑飞机的安全性不如私家车,这就是方舟子自诩的科学精神吗?

“妄人” 方舟子

对论据,方舟子自己懒得求证,觉得没啥大问题,就拿来嘲讽 ”天才“ ,那为什么方舟子这么确信骂我没常识、确信紧急修改、无法选择性截屏呢?因为他对大模型很不了解,在这个领域,他在这个互动里所表现的“很无知,又一脑子浆糊很糊涂”,“不知藏拙,偏爱跨领域乱说”,“没有严谨的思维”,也就是他总爱说别人的,是一个 无知无畏的 ”妄人“

人身攻击

方舟子后来拉黑了我,他在这次互动中辱贬我是“弱智”,后续又说我作为他验收过的“方黑”,是“人格卑贱的人渣”,也曾说过“方黑都是这种智商不满80的弱智”,“方黑都是无可救药的精神病,无一例外”。

若是鲁迅在世,他会耻于有这样一个有影响力的崇拜者吧,甚至没准会写文章骂他。




“孔乙己” 方舟子

鲁迅笔下的孔乙己,经常欺人骗己,以为知道了一些实用性很差、他人又不知道的冷僻知识,便生出优越感来,嘲笑对方,除了做 “妄人”,方舟子做 “孔乙己” 的酸腐事迹也不少。

2024年11月29日,他发了一张张爱玲的绿卡的图片,然后网友们因为这个卡片是不是 “绿卡” 而讨论起来,以致方舟子说几个网友是 “看不懂简单英语的妄人”。

但实际上,张爱玲的 ”绿卡” 是一张特殊时期的 ”绿卡”。那张卡片的标题写的是 “Border Crossing Card”,是 “Resident Alien’s Border Crossing Identification Card” 的简写,是 “绿卡” 持有者(1952年以前)通过 Form I-189 申请办理的,是用来短期内过境加拿大和墨西哥的卡片,是不同于 ”绿卡” 的 另外一张卡片

1952年05月30日 起,“绿卡”持有者可以自动获得“过境卡”的权益,所以张爱玲的 “绿卡” 是可以作为 “过境卡” 使用的 二合一卡片,为了让过境更加顺利,从而加上了 “过境卡” 的标题,而省略了 “Alien Registration Receipt Card” 的显著信号标题。虽然是 “绿卡”,但是能够让大家看出来是绿卡的信号却很微弱,只有背面的小字 Form I-151 来明确这是一张 “绿卡”(Form I-151 也是不为现在人所熟知的旧叫法)。

如果大家看到 “Border Crossing Card” 这样的显著信号,去搜索或是问 AI,会发现这是一个不同于 “绿卡” 功能的另外一个卡片,甚至发现这种 “过境卡” 后来只针对 Nonresident Aliens,因此产生迷惑是一个很常规的反应,大家不是专家,大家不需要知道 “茴字的四种写法”,不需要知道存在一种 “过境卡” 其实可以当做 “绿卡” 使用,不需要知道绿卡曾经叫做 Form I-151。

如果类比成中文语境的话,比如说有一个美国网络名人,发了一张图,说这是李连杰的学生证,但是那张卡片上明明写的是 “食堂饭卡”,只是背面写了小字 “表格151”,可以证明这确实可以用作学生证,但没有写任何 “学生证” 的显著信息,于是有人说这应该不是“学生证”,美国网络名人就说这些人是连简单的中文都看不懂的妄人,其实就是拿生僻的 “茴” 字的另一种写法来表演酸腐罢了。他骂网友 “看不懂简单英语” 更是无稽之谈,这里的“茴”字是英语极为精通的人也没必要知道的偏僻专业知识,即使 “If 18 years of age or older, you are required by law to have this card with you at all times” 这句话确实让人觉得似乎只有绿卡才有必要这么写,但依旧是迷惑的。

就像孔乙己,方舟子说的 “茴” 字写法确实存在。或许他也迷惑于 “绿卡” 为啥叫 “过境卡”,却避而不提,因那些都已不甚重要。通过冷僻知识,嘲笑他人是妄人,情绪价值就赚足了,精神上也就又 “获胜” 了一次,还要什么自行车。

注:按照参与讨论的网友 @Exexutorencable 的 说法,方舟子在这件事后拉黑了关注方舟子几十年的 TA