科学的Python安装建议

Scientific Python installation recommendations

我是 Python 的新手,正在着手一个将分发给用户的大型项目。我也是公司中第一个使用它的人,我想获得有关安装 Python 和软件包的最佳方法的建议,这样我就不会走错方向了。

我需要数据分析框架(pandas、numpy、scipy、matplotlib、statsmodels、pymongo),我最初的做法是直接安装Python 3.5,然后使用pip在每个包上安装。

我 运行 遇到了其他人 [Unable to find vcvarsall] 发现并解决的类似问题。下一个问题是安装 scipy 时缺少 BLAS 和 LAPACK。在这一点上,我决定 Anaconda 是要走的路,而不是单独的 pip 安装,并且可以轻松地设置一切。

Anaconda 的一个问题是它安装了很多我永远不会使用的软件包,并且可能没有一些我将来想使用的软件包,例如TensorFlow(大概可以做 pip install 来获得不包括在内的额外的?)。

中间的解决方案似乎是 Miniconda,我相信它可以解决 scipy 的 BLAS/LAPACK 问题。

所以我的问题是:是否有人可以在 Python 开发数据分析项目,并将其部署到用户的 Windows 桌面,并使用服务器端组件 运行 在 Linux 上,提供有关如果在新组织从头开始他们会做什么的建议?

(我目前赞成沿着 Anaconda 路线前进。)

个人觉得Anaconda(康达)比较好。首先,conda是跨平台的包管理器,安装使用方便。其次,conda具有virtualenv的功能,可以使用conda create来创建环境。最后,还有 Anaconda cloud 和 condo-forge,这些社区可以帮助您解决 conda 问题、构建包和分享想法。

另外,Anaconda(康达)确实安装了很多包,但那些都是依赖。比如你"conda install scikit-learn",conda会自动帮你安装依赖,numpy和spicy。