意外发现!深入揭秘Reddit反垃圾邮件机制及多种移除情况 深入了解Reddit的反垃圾邮件机制2026年6月27日回溯到5年前作者还在使用Reddit时发生了一件不寻常的事。常用应用[Relay for reddit]不断推送大量关于移除垃圾信息的奇怪通知。作为几个小型子版块的版主收到此类通知本不稀奇因为这些版块会自动移除垃圾帖子。然而当查看被移除的垃圾信息时作者看到了Reddit的反垃圾邮件内部机制。移除内容显示如spamurai*从未经验证的用户处移除潜在垃圾内容*用户u/GoodBoyBacon账号使用0.06天垃圾倾向值11非托管账号负1点Karma收到4条举报网络服务提供商ComcastCable邮箱gmail.com在r/GoodBoysOnly访客身份发布的评论t1_pupp13垃圾可能性为0.7294469等。此外还提到u/BadGuy67与一个链接里的是同一人以及Reddit在2021年10月27日实施影子封禁等情况。Reddit的版主管理机制Reddit是由众多子社区子版块组成的网站任何人都可创建子版块由子版块创建者指定的社区版主管理。以[/r/mylittlepony]为例访问该子版块可在侧边栏看到版主列表这些版主可以移除帖子、封禁用户、管理版主邮件等但他们只是普通的Reddit用户。版主能看到是谁移除了帖子或评论其中包括[automod]——一个基于规则的管理系统。有时还会看到神秘的 “Auto”当内容被Reddit神秘的垃圾邮件过滤器拦截或者被Reddit的全站管理员手动移除时就会显示 “Auto”。在版主日志中它们会显示为 “reddit” 和 “Anti - Evil Operations”。意外发现2021年因Reddit方面的某种错误原本显示的 “Removed: Auto” 文本被实际的移除原因取代约一小时后恢复正常作者留下了异常期间截取的截图。直到2017年Reddit的[源代码]是公开的可分析存档代码推测可能发生的情况。负责版主移除操作的函数是**[POST_remove]**它调用了**admintools.spam**函数并传入相关参数。再深入研究还会发现**[get_mod_attributes]**函数这是API中实际返回移除信息的部分。“Auto” 文本实际上来自Relay本身。原来Reddit会复用**banner**字段来记录内部移除原因可通过一个被移除的帖子看到实际效果似乎在2012年em曾尝试自动移除Reddit上所有的Tumblr链接。Reddit将其内部的垃圾信息移除原因存储在**banner**字段中但只有全站管理员才能看到这些信息而部分代码出现故障让作者得以看到这些原因。域名移除2012年至今第一类是域名移除几乎所有这类移除的原因都是 “Removed: domain (spam)”不过也有特别例子如1presafur在MyLittleOutOfContext版块的帖子移除原因是 “domain (le sexxxxy sex spam)”。Reddit可能在Tumblr垃圾邮件方面遇到过问题还有例子显示针对整个Tumblr的移除。域名移除是在Reddit公开源代码中唯一能看到的反垃圾邮件类型且部分代码是隐藏的。spammit2012年至今spammit会对帖子进行分析并给出一个百分比评级被移除帖子的百分比评级通常较高最低为39.71%最高为98.19%。不过对于作者管理的子版块来说spammit似乎不是非常准确的反垃圾邮件措施因为它会将很多合法的Imgur帖子标记为70 - 98%的垃圾可能性。封禁用户帖子移除2016年至今接下来是因用户被封禁而移除的帖子有些帖子标记为 “Removed: banned user”有些标记为 “Removed: Reddit (banall performed)”。作者看到的这类被移除的帖子大多是明显的垃圾信息怀疑是管理员发现垃圾机器人账号后直接将其封禁。影子封禁2016年至今众所周知Reddit会对用户进行影子封禁这是一种无声的封禁用户账户看似正常但其他人无法看到他们的帖子和评论。有一个[子版块]专门用于检查用户是否被影子封禁。从管理员眼中可以看到影子封禁的具体情况还有有趣的评论线程有人责怪版主移除评论实际上是被Reddit影子封禁了。spamurai2020年至今这是整个垃圾邮件过滤机制中最有趣的部分Reddit使用Minsky进行 “机器学习”使用Spamurai执行 “规则”。似乎有一个名为echelon的spamurai子系统会移除某些关键词和低俗内容。还有针对性的移除和基于通用规则的过滤器。以一个包含大量信息的移除情况为例分析其中各项信息。链接t3_phc4xx是帖子的ID0.12571795 perspective spam几乎可以确定是使用了**[Perspective API]**Reddit使用了其 “实验性” SPAM属性该属性用于检测垃圾信息数据基于《纽约时报》的评论和管理数据进行训练。自2026年2月起无法在Google Cloud上创建新的Perspective API项目。通过测试发现不良行为者可以通过修改消息内容使其在Perspective免费API中不被判定为垃圾信息从而绕过spamurai的主要判断标准因为SPAM分数对字符的微小变化非常敏感还会忽略数字和大小写对其他字母表也同样如此。此外还分析了spamurai信息展示中的其他各项内容如用户名、账号使用天数、垃圾倾向值、Karma、举报总数、网络服务提供商、邮箱域名、帖子所在子版块、帖子链接域名、身份验证方式、用户代理字符串、指纹哈希、语言设置、TLS指纹、来源页面、缩略图、帖子内容和链接等。也有一些spamurai明确使用相同数据并遵循特定规则的例子有些移除操作还会根据版主的操作进行调整。其他情况还有一些移除情况不太能归入上述类别例如Pinterest重定向链接会被移除Mega.nz链接也会被移除甚至一个合法的存档YouTube视频链接也被错误移除。另一种被禁止的链接是免费可用的子域名如1cpsryan在UnusAnnusArchival版块的帖子虽本身未包含这类链接但包含的磁力链接中的_2ftracker.opentrackr.org_被Reddit链接化不确定为什么opentrackr会被归类为 “免费可用”。