这位网友自述因为和方舟子发生了“很令人失望的互动”就写了这么一篇长文,来与我“分享”,还让我评论“方舟子还是在践行科学精神吗?”
我虽没有看到这互动的全过程,仅从文中提供的引文来看,大概理解发生了什么。就简单说说。(文字稍太长,只好用图片)
我虽没有看到这互动的全过程,仅从文中提供的引文来看,大概理解发生了什么。就简单说说。(文字稍太长,只好用图片)
Comments
首先,Deepseek 是开源大模型,参数是公开的,在本地运行就能确实是否是紧急更改的,经过测试,不是紧急修改。
同时,Deepseek v2.5 是12月10日发布的,而引起关注的也就是这个帖子中讨论的是 v3 是 12月26日发布的,也就说,我无法判断这个帖子的截屏时间,如果早于12月26日,连 v3 都不是
我无法确认什么时候这个截图能起到足够多的关注,导致 Deepseek 要专门修改,在和方老师讨论的语境里,假想中的紧急修改并不是太遥远的事
而且您说截屏当然不是十分钟前,但引起重视并紧急修改的时间和截屏时间是可以有很长距离的
这个问题上,方老师是犯了事实性错误的,方老师所给的例子,是带有选择性偏见的特例
我们说一个大模型不好,确实应该以统计学上数据来说,比如,大模型解决 IMO 的数学难题,不能因为一个题解错了,而否定已经提高到了 96% 准确率的成果,这属于以偏概全
即使现在最先进的大模型,也能找到胡说幻觉的时候,但我们依然要承认这是非凡的成果
而方老师分享的那个截屏,并不能代表绝大多数下(我测试的是 100% 准确)的 Deepseek 的客观水平
如果 Deepseek 在这个例子上比收费的 GPT-4o 还要好的多,那用此来挖苦 “天才少女”,不是说服力不足吗?
就好像有人讽刺“通商宽衣”的语文,你却一本正经地要用“当事人语文考试成绩在班里名列前茅,而且他应该认得衣农两字之别”来反驳他,你不着边际。你能指控那些不管当事人真实语文考试成绩如何却一再讽刺他读出“通商宽衣”的人是在“犯了事实性错误”?
如果你能把“通商宽衣”这事件的性质搞明白了,也就能明白你和老方的这件事了。
关于如何进行有效讨论减少不必要分歧,推荐你阅读我写的《寻共识以闻道》。
方舟子有明显的 自恋型人格障碍 特征,在这次互动里,
- A small critique makes him feel like an attack on his identity.
- Accuse critics of bad intentions.
- Insult the critic and publicly shamed me as a retarded and worthless scumbag.
He makes his followers feel fear, leaving them too afraid to question or oppose him.
He is like the medieval church oppressing scientists, and like an authoritarian ruler suppressing dissenters.
他的账号是他的领地,他想怎么弄是他的自由,但方舟子不是科学精神的践行者
方舟子仅仅在我们的交流中就错误连连,我可以再说一遍
1. 他非常自信地说,Deepseek 紧急修改了,但没有,错
2. 他说怎么可能出现选择性截屏,可以出现,错
3. 他说我是弱智妄人,我确实智商没到 180,但绝不是弱智,说我低于 130,我都认为与事实不符,方老师错
4. 他恶意揣度我的好意,我两次明确解释没有任何指控造谣的意图,礼貌地回复,方老师却一口咬定我就在指控造谣,我明白我自己的心意,他就是错了
5. 他说我是人格卑贱的人渣,黄先生,他说的对了吗?
您也要说我是 retarded and a scumbag 吗?
即使是方老师,他也在强调这个帖子的所描述的真实性是重要的话题
这就是为什么方老师非要说这是紧急修正的结果,为什么骂我没常识来维护不知道这是紧急修正,为什么说选择性截屏的原因,为什么说我造谣
如果帖子是错的,那挖苦天才的说服力就在降低,这是很明显的论证过程的一环,您说得意思是,有论点了,就不能较真论据的可靠性了?我不喜欢特朗普、马斯克,但我也不会发布不可靠的信息来佐证自己,那不就成了 conformational bias 了吗?