Datameer 与 Alteryx 的优缺点

Pros and cons of Datameer vs Altreyx

我正在尝试评估 Datameer 和 Alteryx 是否满足我们的大数据分析需求。这两个工具的优缺点是什么?

首先,全面披露:我是 Datameer 的技术产品营销高级总监,所以请以适当的怀疑态度对待我要说的话。就其价值而言,我还为 ZDNet 撰写了有关大数据的文章(但不是关于 Datameer),并且我是 Gigaom Research 的大数据和分析研究总监。所以我对 BI/Big 数据市场略知一二。

顺便说一句,Alteryx 和 Datameer 实际上是完全不同的产品。即使我们的消息有时听起来很相似,但我们做的事情却不同。

Alteryx 在允许其用户以图形方式设置工作流以进行数据转换方面做得很好,然后 运行 在设计完成后设置这些工作流。 Alteryx 通过 Hive 及其 ODBC 驱动程序连接到 Hadoop,将数据移出 Hadoop 以便对其进行处理。

Alteryx 运行s 作为 Windows 桌面应用程序,使用看起来很像集成开发环境 (IDE) 的 UI。如果您是一名开发人员,甚至是某种类型的高级用户(例如,喜欢时不时地编写一些代码的人),那么您会感到宾至如归。

另一方面,Datameer 可以 运行 在 Hadoop 上本地运行。 Hadoop 实际上 我们的引擎,而不是通过 Hive 连接并将数据从 Hadoop 移动到我们的引擎,这是最有意义的。我们使用电子表格隐喻而不是图形工作流程,允许用户在工作表中输入公式以影响数据 transformation/shaping/cleansing。我们的智能采样功能不会让您执行整个工作簿以查看结果,而是在设计时引入数据,因此您可以在决定从头到尾执行整个工作簿之前以交互方式处理数据的子集。

Web 浏览器中的 Datameer 运行s,而不是桌面应用程序,允许我们 运行 在 Windows 和 Mac 之间跨平台 OS(例如),以及平板电脑 运行ning Android、iOS 或 Windows。 Datameer 可以 运行 本地或作为服务,采用各种配置。使用我们的个人和工作组产品,您可能会处理较小的数据量,我们绕过 Hadoop 并在内存中执行您的工作簿。

我们有高级模块可以做一些有趣的事情。智能执行可以简化一些您必须自己做出的 Hadoop 决策,包括是使用 MapReduce、Tez 还是我们的本地内存引擎。我们的 Smart Analytics 模块让您可以使用机器学习算法更好地理解您的数据,而我们这样做的速度非常快。

Alteryx 本质上包装了 R 以提供机器学习服务,并且这样做是为了预测分析,而不是数据发现本身。 Alteryx 中的 ML 功能比我们的更全面,但它们基于插入数据流的 R 函数,而我们的 ML 功能是向导驱动的。我们的 ML 功能集更小,而且我们相信更简单。从我们的角度来看,80-20 规则适用。

Alteryx 在整合消费者和空间数据以计算和可视化特定行驶时间半径内的位置等方面做得非常出色。 Datameer 没有类似的功能。另一方面,我们确实有超过 60 个连接到各种 RDBMS、DW、NoSQL、社交和 SaaS 数据库和服务的本地连接器,而且它们都在盒子里。 Alteryx 可以集成的数据集每个席位的成本相对较高,至少就公司网站上的标价而言(http://www.alteryx.com/products/pricing)。

Alteryx 是具有丰富历史的 BI 产品,可以追溯到十年前,该公司在添加大数据功能方面做得很好,因为这些功能已经与市场相关。 Datameer 是围绕大数据用例和技术从头开始设计的。所以,真的,我们非常不同。你能用这两种产品做同样的事情吗?当然。您还可以使用 Excel 宏和 C 语言编码来做同样的事情;这就是计算的工作原理。但是我们的方法很不一样。