如何以编程方式从组织目录中检索信息?

How to programatically retrieve information from organisation directory?

背景 - 我的组织有一个全局目录。 Active Directory 仅存储员工编号和员工姓名。 Active Directory 中没有存储有关角色标题的信息。 (我已经构建了一个 LDAP 查询来检索来自 AD 的所有信息,检索角色标题是我的问题)。

在我们的内部网中,有一个全局目录,显示角色名称。现在这对我来说很明显,角色标题存储在其他数据库中。(不是 AD)

我想写一个脚本(不知道用什么),在搜索框中抽取员工编号列表并检索角色标题。 这可能吗?我从来没有编写任何脚本来从来自 website/intranet 等的结果中检索信息。任何指导将不胜感激,不幸的是,LDAP 查询对我来说不是正确的方法,因为组织不在 AD 中存储角色标题。 (我有成千上万的员工要找,我认为单独搜索不切实际)

宝石

我想你只能访问这个系统的前端。这并不理想,但唯一的方法是使用 web scraping。即从网页中解析HTML

这种方法组合起来很耗时,而且很容易出错,因为它完全取决于数据在页面上的呈现方式。如果有任何变化,您的网络抓取可能会中断。

但如果你只需要做一次,那可能是值得的。一个工具 like this one 可以帮助您做到这一点。 (这只是我在网上找到的第一个,还有其他的,搜索一下。)

但由于我们无法访问此站点,因此我们也无能为力。

网络抓取确实是绝对的最后手段。 任何获取数据的其他方式都比这更好。也许您甚至可以要求该系统的管理员只为您提供一份您需要查看的数据的一次性报告。只要他们愿意,他们就没有理由不给你一个包含数据的 Excel 电子表格。