IX 民科贴吧水贴分析
最后更新于
最后更新于
本期导读:上一期我们分析了民科吧自2017年以来的发帖纪录,发现在民科吧中发帖量Top 25的用户占据了历史发帖量中的三分之一。那么用相似的方法来分析,其他几个相关贴吧怎么样呢?
我们定义一个指标:发帖量为Top X(X为正整数)的用户发帖量占总发帖量的比值。然后分别抓取了民科吧、反相吧、反民科吧、雷氏力学吧,以及一个对照组——滑稽吧。让我们一个一个来分析:
作为雷绍武老师的根据地,发帖量占比最高的居然不是雷老师,而是一个叫ID为灵台方寸的(似乎是个反民科?)......在雷氏力学吧中总计抓到1275个帖子,其中灵台方寸发帖298个,雷绍武发帖297个,两人合计占比为47%......相比之下其他人都是弱鸡。
Top25用户发帖占比达到了恐怖的89%,说明雷氏力学吧的活跃用户高度集中在少数几个民科身上。
反相吧的Top25用户发帖占比大约为48%,接近一半(民科吧是34%),其中其中空无必能658贴一骑绝尘(总贴量为9062)
在TOP25中空无必能自己能独占15%,要知道反相吧可不是雷氏力学吧这样的体量,水贴能力之强可见一斑。
反民科吧的发帖状况总的来说和民科吧没什么大的差别,这里一起讨论好了。尹海柔居然碾压雷老师拿到了反民科吧的Top1,实在意外。TOP25发帖量占总发帖量的37%,略高于民科吧。
民科吧的分析已经在上一期说过了,这里补一张图。
作为对照组的滑稽吧发帖量占比如下,滑稽吧贴量巨大,所以只抓取了前12000个帖子(由于网络还有百度删帖等原因,成功获取11491个)
雷氏力学吧、反相吧的发帖量主要集中在少数用户身上,而民科吧和反民科吧相的发帖量分布相对平均。
这种代码实际上没啥值得说的,随便学点python都能分分钟写出来,因为只爬用户名所以用txt文本记录都可以......