将 SpamAssassin 与我的 PHP 应用程序集成

Integrating SpamAssassin with my PHP application

我已经使用 PHP 构建了一个网络应用程序,它从 Instagram 获取许多包含 'pizza' 等关键字的 posts 并将它们与其他一些数据一起加载到 MongoDB.

其中一个模块是 Python 的 NLTK,下面是我如何调用它(是的,我正在疯狂地切换语言 [只是为了研究它们]):

$foo = exec("python tokenize.py $bar");

现在上面的代码行完全正常,但我正在寻找一种类似的方法来调用我的 SpamAssassin 来检查 Instagram post 的内容是否是垃圾邮件。从SA的文档来看,我知道可以检查一些纯文本文件,因为它们是邮件like here。不过我是SA新手。

对于高级 SA 用户来说,这个问题可能非常简单,但我无法像上面的 PHP-to-Python 调用一样从 cmd 中分辨出 SA 中的任何输入输出选项。假设 $string 是 Instagram post 的内容,我正在寻找这样的脚本:

$score_of_SA = exec("spamassassin.exe $string")

在 PHP 中是否有类似的脚本?如果没有,我需要做什么来检查该内容?

假设我的 SA 已更新和训练。

存疑。 Spamassassin 不是通用的文本检查器,它通过查看各种已知的电子邮件相关因素(例如发送服务器是否具有有效的 MX 记录或 SPF 或 DKIM 消息)从源电子邮件中构建分数。

None 其中与非电子邮件结构有关。文本分析的核心组件之一是贝叶斯过滤器的实现。

不过还是有希望的!一个更集成到 PHP 项目中的解决方案。碰巧在 Packagist 中有一个 php 贝叶斯垃圾邮件过滤器库:See here.

您确实必须训练垃圾邮件过滤器,这个库也不例外。