使用 login.microsoftonline.com 验证请求会话

Authenticate requests session with login.microsoftonline.com

我正在尝试对 login.microsoftonline.com 进行身份验证以访问隐藏在 SSO 后面的资源。我需要将对 post 的 SAML 响应发送到 SSO 以允许我进行身份验证。唯一的问题是我无法通过 Microsoft 进行身份验证,因为流令牌和请求不会加载流令牌,因为它需要加载 javascript。如何进行身份验证?

我想说答案很简单,但需要一些工作,而且我不确定这在不同环境中如何工作,但这是我为自己所做的。

  1. 创建一个 class 并初始化动态信息。这是我的
class Microsoft:
    # TODO: Add MFA option
    def __init__(self, username: str, password: str):
        self.sess = requests.Session()
        self.username = username
        self.password = password
        self.base = "https://login.microsoftonline.com/"
        self.tenant = "redacted/"
        self.url = ""
  1. 使用requests_html HTMLSession 和 bs4 beautifuSoup(此处为 bs)获取流令牌
# used to return values of input fields rendered
    def get_html_name_value(self, html: str, name: str) -> str:
        return bs(html, "lxml").find("input", {"name": name}).get("value")

# get redirected to obtain flow token with appropriate SAML
    def _get_tokens(self):
        session = HTMLSession()
        # update this
        resp = session.get(
            "https://sso.redacted.com/cas/clientredirect?client_name=SAML2Client45&"
            + "service=https://full/path/to/service_behind_sso"
        )
        self.url = resp.url
        resp.html.render()
        html = resp.html.html
        data = {
            "flowToken": bs(resp.html.html, "lxml")
            .find(id="i0327")
            .get("value"),
            "ctx": self.get_html_name_value(html, "ctx"),
            "canary": self.get_html_name_value(html, "canary"),
            "hpgrequestid": self.get_html_name_value(html, "hpgrequestid"),
        }
        return session, data

  1. Post 获取 saml 令牌的数据。当您 post 给定数据时,它将 return 需要 post 编辑的 html 表格。
    def _get_saml_tokens(self):
        sess, payload = self._get_tokens()
        payload["login"] = self.username
        payload["loginfmt"] = self.username
        payload["passwd"] = self.password
        headers = {
            "Host": "login.microsoftonline.com",
            "User-Agent": "Mozilla/5.0 (X11; Linux x86_64; rv:88.0) Gecko/20100101"
            + " Firefox/88.0",
            "Referer": self.url,
            "Origin": "https://login.microsoftonline.com",
        }
        html = sess.post(
            self.base + self.tenant + "/login",
            data=payload,
            headers=headers,
        ).text

        data = {
            "SAMLResponse": self.get_html_name_value(html, "SAMLResponse"),
            "RelayState": self.get_html_name_value(html, "RelayState"),
        }
        return sess, data

  1. 最后一步是 post saml 响应和中继状态,以便您可以访问服务

    def _login(self):
        sess, payload = self._get_saml_tokens()

        return sess.post(
            "https://sso.redacted.com/cas/login?client_name=SAML2Client45",
            data=payload,
        )

从这里您可以提取 cookie 并将它们放入正常的请求会话中,或者继续在 HTMLSession() 中运行

你可以对其他资源使用token auth做类似的事情,但我还没有访问它,也没有写代码。

关键是更改第 2 步中的初始请求,以便第 3 步将收到一个令牌,然后 post 在那里获得正确的身份验证。希望大家根据需要适配