哪种语言具有最好的数据挖掘和机器学习社区? Python、Java、c++ 还是其他?

Which language has best community for Data mining and Machine learning? Python, Java, c++ or any other?

我精通 C++、ruby、rails 和其他一些脚本语言。我想开始尝试和学习数据挖掘和机器学习中的概念。

我想充分掌握这些概念所需的编程知识。

哪种语言对 DM 和 ML 的支持最好? puthon,Java,C++? Java脚本中有什么东西吗?

谢谢

Python 得到了数据科学社区的大力支持,你们有很好的包,比如 Pandas 和 Python 与 Spark

的集成非常好

使用你觉得最舒服的任何东西。

至少如果它有基础的话。 JavaScript 和 PHP 在这个领域不是很好。它们只是不能很好地进行数值计算。 Python、R、Java 和 Scala 最受欢迎。有 Matlab,但那里不再发生太多事情了。有 Julia,它具有类似的语法,但如果不是用于 colum-major、1-indexed 数组和类似 matlab 的语法,它会更加活跃并且显示出一些希望。一些使用 Lua,另一些使用 Mathematica... 有很多因素在起作用。 例如,像 Python 和 R 这样的脚本语言真的很慢——但是这两种语言与 C 库(和 Fortran!)的接口也很好,所以如果你通常将它们用作 "driver" 并且库可以完成所有工作工作然后他们可以非常有用。请确保不要假设每个模块都很快...

我觉得你的问题可能有点离题。这些语言本身通常没有支持:它是与这些语言接口的包,例如 Apache Spark(它们的 ML 包的接口)、英特尔的 MKL(针对 Xeon Phi 优化的向量和矩阵运算)、SciKit(Python 接口)等

也就是说,我看到对驱动分布式处理的语言的最积极支持。在我看来,Java/Spark 目前 是领跑者,但一两个主要版本可以显着改变市场——例如,查看 Tensor 上的嗡嗡声,或者BeautifulSoup.

的持久力

要进行实验,请从您的舒适区开始。还有很多很好的工具可以很好地与 Ruby 和 C++ 交互。只要您使用它来学习基本概念,我相信您会用一种您已经知道的语言做得最好:这会减少您学习曲线中的挫败感。

Anony-Mousse 和 Patricio 给了你非常好的观点,我完全同意。我在 Python 和 Scala 工作,下面是 Java 和 Spark。