如何对 Python 中的文本使用双法线分离

How to use Bi-normal Separation for text in Python

我正在寻找一种使用 Sklearn 实现双法线分离的方法。但我没有找到任何可用的解决方案。我阅读了 Forman's article BNS Feature Scaling 相对于 TF-IDF 的优势。

您可以使用为您在 Github 中提到的文章制作的代码。 您可以找到代码片段以及如何将 BNS 与 sklearn SVM 分类器一起使用的示例数量等。

你应该在转换数据之前适应BNS,虽然作者在例子中跳过了这个阶段:

X_bns = bns.transform(X) #change to 
X_bns = bns.fit_transform(X)

代码写在Python 2.确保在bns.py中将"iteritems()"更改为"items()"。