耿同学,一个退学博士用AI降维打击中国顶层学术圈

2026-05-21 | 来源: 凤凰网 | 转到微信 | 有0人参与评论 | 字体: 放大缩小 | 收藏 | 打印

2026年的春夏之交，中国学术圈和文学圈接连经历了两场“地震”。

学术圈的震中，是一个叫“耿同学讲故事”的B站up主。36天时间里，他连续实名举报了5位985高校院长级学者的论文造假，被点名的无一例外都是手握国家杰出青年科学基金和“长江学者”等头衔的资深学者。

文学圈的震中，是一个叫“抒情的森林”的普通网友。从2024年10月开始，他用逐字逐句的文本对比，一年多时间内点名了近40位作家涉嫌抄袭——从86岁的杨本芬，到贾平凹、贾浅浅父女，再到蒋方舟等中生代与青年作者，覆盖文坛老中青三代。

一个是生物医学退学博士，一个是普通读书人；一个用的是AI图片查重和统计学工具，一个靠的是肉眼比对和查重软件。两个普通人，凭着各自的“武器”，正在撼动两个领域的权威。

这听起来像是两个“愤青”打假的故事。但仔细一想，这里面还有更多值得思考的地方，那就是AI时代的到来，当普通人也能使用技术工具，监督权不再是少数人的特权，正在交还给每一个会使用工具的人。

当然，更深层的问题是，当一个体系需要靠一个退学博士来纠错时，到底该从哪些方面来改进？

打假门槛低了

这场风暴最让人震惊的地方，不是耿同学有多厉害，而是他用的方法竟然出奇地“低门槛”。

美两党参议员提案助盟友购买美国技术抗衡中国

黄仁勋:受出口管制影响中国AI市场已让给华为

中国工程院院士、中南大学前校长被双开

在中国学术圈，过往的学术打假是极少数人的能耐。要么你是同领域学者，要么得像饶毅那样有学界影响又有揭露问题的勇气，普通人连Nature这种期刊的文章都未必能完全读懂，更别提找出数据造假的痕迹了。造假者占尽了所有便宜，专业壁垒让外行人无从下手，学术共同体的“熟人社会”让内行人睁一只眼闭一只眼，期刊审稿人时间精力有限只能基于信任评审。这三个门槛对普通人来说太高了，也因此让造假长期是一种“低成本、高回报”的选择。

而耿同学的打法和所有人都不一样。他不跟你讨论高深的生物学机制，不需要在Nature发过论文才有资格质疑你。他的武器是AI辅助的图片和数据查重技术。

他的操作方法被技术圈拆解过，核心流程其实只有三步：把一篇论文的PDF拆成文本、表格和图片，再把数据交给AI做审查。

具体来说，他重点检查三个地方：

第一，看数据末尾数字分布是否过于集中。真实的实验数据因为测量误差的存在，小数点后一位乃至两位应该是随机分布的，而造假数据则会出现大量“5”“0”或某个数字完全消失的情况。

第二，看不同量表之间的数据有没有雷同。比如基因表达量的数据序列和肿瘤体积的数据序列，本该毫不相干的实验却出现了几个数值完全相同。

第三，用视觉大模型检查图片有没有被篡改或重复使用。

耿同学自己有一句话说得极妙，在揭露中山大学邝栋明的论文造假时，他说：“这不仅是学术界的耻辱，更是造假界的耻辱。连随机数生成器都不会用的人，也配学术造假？”

数据造假被发现，根本原因往往不是造假者技术太差，而是太敷衍。中山大学康铁邦论文中被质疑的实验图片，被网友形容为“像是从不同论文里直接复制粘贴的”。上海大学苏佳灿的论文数据中，一组数据直接呈等差数列，“人为编造痕迹明显”。就连同济大学王平的那篇Nature论文，196只小鼠的体重数据中也出现了一只末位为“0”的离群值，这在统计学上是极不自然的。