文本分割数据集

Text Segmentation Dataset

我想知道是否有人可以帮助我获得一个数据集来测试我开发并想要测试的文本分割方法。

我找了 Freddy Choi 的数据集,没找到。我特别需要这个数据集。

谁有或者知道哪里可以买到,请指教

此外,如果有人对同一任务的其他数据集有建议,请指教。

谢谢

我找到了。这有点棘手,但我找到了。 这个 link 有 Choi 的软件和数据集。 我在 web.archive.org

上找到了 Choi 的页面

http://web.archive.org/web/20040810103924/http://www.cs.man.ac.uk/~mary/choif/software.html

Freddy Choi 似乎已经消失了,但我已经将他的源代码和数据导入了一些 GitHub 个存储库:

  • C99(版本 1.0、1.1 和 1.2)
  • C99 Demo(版本 1.0)