III 贴吧自娱自乐指数
最后更新于
最后更新于
本期导读:上期我们介绍了民科自娱自乐指数,通过自娱自乐指数(RDI)可以大体上反应一个民科与外部交流互动的情况。这期我们把自娱自乐指数推广到整个贴吧,来反映每个贴吧内楼主与他人的互动情况。
关于自娱自乐指数(RDI)的介绍请见上期:II 民科自娱自乐指数
贴吧自娱自乐指数(RDI)的计算方式与每个人是相同的,将统计范围内贴吧的所有帖子中楼主楼层/总楼层即可得到贴吧的自娱自乐指数。但是百度贴吧比较烦人,抓太多的话账号可能有危险(别问我怎么知道的)。所以我们设定抓取每个贴吧的首页贴,抓取时间为2019年8月4日下午15:00。
首先来看我们的大本营民科吧:
民科吧首页贴为48个有效,其中总楼层517,楼主楼层119,RDI为0.208。看上去似乎相当的低,这是因为民科吧的吧务团队对复读机都有比较严厉的处罚,因此复读概率比较低。下图是民科吧数据对应的散点图,途中蓝线为RDI=0.2,绿线为RDI=0.4,可以看出据大部分帖子楼主都只有1~3层,而楼层较多的帖子都在蓝线之下。这些数据说明民科吧的活跃帖子中自娱自乐现象已经得到有效遏制。
再来看看另一个民科的大本营:反相吧
反相吧在首页一共47个有效帖,其中总楼层776,楼主楼层274,RDI=0.353,大约比民科吧高了75%。从散点图上可以看出反相吧多数帖子都在RDI>0.2(蓝线)以上,甚至相当多的帖子在RDI>0.4(绿线)以上。尤其是高楼贴,多数都又极高的RDI。而RDI的评价机制决定了高楼的全重要远高于低回复的帖子。嗯,反相吧的自娱自乐现象还是挺重的。
作为对比,我们放几个其他贴吧。比如民科吧和反相吧的共同祖先,相对论吧。
相对论吧首页有效帖子48个,总楼层441,其中楼主楼层154,RDI=0.349,居然仍然远高于民科吧。从散点图上能看出其实这主要是拜某个自身RDI超过0.6的神贴所赐,这是由于某吧友在这个贴中长文科普相对论,算是特殊帖子。如果去掉这个奇葩帖子,那么相对论吧的RDI会降低到0.3左右。
当抹除了那个奇葩的帖子之后,可以看到超过10层以上的帖子有明显的两极分化,一部分RDI极低,另一部分RDI很高。这是因为在相对论吧中仍然能见到不少反相吧的民科,这可能是RDI居高不下的原因之一。
再看看另一个经常被民科光顾的贴吧:物理吧
物理吧首页48贴中总计楼层438,其中楼主楼层129,RDI=0.295。和相对论吧一样又一个自身RDI巨高的帖子,抹除该帖子后物理吧的RDI将会降低到0.24左右。
抹除该帖子后,分布似乎与相对论吧极为相似,两个吧RDI增加应该是由于同样的原因。
最后,我们能不能找个不会被民科影响的贴吧呢?那就上次出场的滑稽吧吧。由于滑稽吧楼层普遍较高,我只抓取了14层(再刷下去没时间水帖了)。这14贴总计1225层,其中楼主37层,RDI=0.030,低的可怕有木有。散点图就不用看了,反正就是低的可怕。
此外还可以看出虽然滑稽吧和民科吧的发帖量和楼层数都有很大差距,但是每个帖子的RDI分布表已经非常接近,说明民科吧正在摆脱民科的影响,似乎逐渐倾向于理性交流。哦,我的天啊!
需要额外说明一点,由于任何一个帖子都至少包含一个楼主层,所以很明显贴里流量越大RDI就会相对越低,因此大流量的贴吧要比小流量的贴吧具有更低的RDI,这也是滑稽吧RDI很低的一个原因。
总结:从上述分析可以看出受民科影响的贴吧明显会出现RDI增加的趋势,其中在相对论吧中出现的反相民科对推高该贴吧的RDI有不可推卸的责任。民科吧由于对民科复读行为控制的较为严格,因而RDI反而比较低。
让我们记住2019年8月4日统计的各个贴吧的RDI(剔除异常帖后数值),方便今后去对比
滑稽吧0.030204
民科吧0.208406
物理吧0.245333
相对论吧0.304688
反相吧0.353093