寻找合适的 Azure 工具

Looking for the right Azure tools

首先,我对 Azure 开发完全陌生。我正在从事一个关于基于知识的管理的 school/enterprise 项目,我们将在 Azure 环境中处理大数据。

基本上我们想从不同的API收集数据,也可能使用爬取的数据。一切都将在一个网络应用程序上进行设置,该应用程序对于与我们合作的公司来说易于使用。基本上,我们需要将获得的数据集成到部署在 Azure 中的用户界面中。我不确定我们是否需要 database/storage,或者是否有一些 Azure 服务可以使用给定参数获取和显示数据。

所以我的问题是,我应该研究 Azure 中的哪些工具?有这么多不同的东西,它们有点令人困惑,因为看起来很多人都在做 "kind of" 相同的事情。在 Azure 中设置爬网程序的最佳方式是什么?或者那些 API 请求并在网页上显示它们?

谢谢!

我知道一开始可能会让人望而生畏!

作为 10 的入门者,您可能想查看 Logic Apps 从第 3 方 API.

中提取数据

您还需要考虑 "big" 数据是怎样的,数据的结构以及您的网络应用需要如何使用它。

是否需要进入 SQL 数据库的高度结构化数据,key/value 您可以存储在存储表或其他完全存储的数据?

就网络爬虫而言,您打算为此编写自己的代码吗?你可以看看 WebJob sitting on your web app or if you want to get fancy you could look at doing it with a timer based Durable Function.

还有许多其他事项需要考虑,但希望以上内容至少能让您有所了解。

在 Azure 中总是至少有六种方法可以做同样的事情所以不要假设你必须找到 "right" 解决方案,如果你能找到适合你的解决方案开发难易程度、成本等条件,那就去做吧!

我赞成逻辑应用程序的建议。我已经使用 Logic Apps 完成了许多与您所描述的类似的工作。查看将自定义连接器与逻辑应用程序结合使用,这基本上将您的第 3 方 API 作为任何逻辑应用程序中的可重用对象公开。我要补充一点,如果您连接的 API 较旧(即 SOAP),您可能会遇到一些问题,因为逻辑应用程序处理 XML 的方式不如 json ].对于网络爬虫,根据复杂性,您可以创建一个逻辑应用程序,将网页转换为可消费的 API... http://dontcodetired.com/blog/post/Screen-Scraping-As-A-Service-with-Azure-Functions-in-5-Mins