为什么我的 Github 存储库有很多独特的克隆,但没有什么有趣的东西可看?
Why are there lots of unique clones of my Github repo when there is nothing interesting to see?
我上周创建了一个存储库,其中包含我网站的内容。这是一个众所周知的模板的分支。到目前为止,任何人都看不到任何有趣的东西,更不用说克隆这个 repo 了。然而,已经有 12 个 repo 的唯一克隆,如 Traffic section 所示。更令人怀疑的是,我的存储库只有一个唯一访问者(即我的第二个帐户),因此 none 的克隆者甚至访问了该存储库,他们只是克隆了它。
他们是谁?我的假设是:
- 有人在备份互联网,例如 archive.org(在查询我的回购 url 时没有显示任何结果)
- 寻找剩余密码或私钥的恶意机器人
- 我这边的一些错误或者github
编辑: 可能相关,但我觉得原因可能不同,我希望他们已经修复了错误的脚本。
GitHub 提供 public 事件 API,用户可以在其中看到几乎 public 发生的所有事件。这意味着一旦您创建了一个存储库并将数据推送到它,任何人都可以注意到这一事实,而无需查看您的存储库的页面。
在不知道是谁在克隆它的情况下,很难说为什么要克隆它,但可能是寻找凭证的人、对流行语言或软件开发实践感兴趣的研究人员,或者各种各样的其他事物。甚至 GitHub 也可能不知道答案,因为在这种情况下,他们拥有的关于克隆者的所有信息都是 IP 地址,如果用户通过了身份验证,还有用户名。只要存储库是 public 并且使用水平不过分,这不是他们认为本质上关心的事情,也不会更深入地询问。
我也希望我有一些神奇的方法来找到这些信息,因为这是一个奇怪的现象,但我不确定是否有可能知道。
我上周创建了一个存储库,其中包含我网站的内容。这是一个众所周知的模板的分支。到目前为止,任何人都看不到任何有趣的东西,更不用说克隆这个 repo 了。然而,已经有 12 个 repo 的唯一克隆,如 Traffic section 所示。更令人怀疑的是,我的存储库只有一个唯一访问者(即我的第二个帐户),因此 none 的克隆者甚至访问了该存储库,他们只是克隆了它。 他们是谁?我的假设是:
- 有人在备份互联网,例如 archive.org(在查询我的回购 url 时没有显示任何结果)
- 寻找剩余密码或私钥的恶意机器人
- 我这边的一些错误或者github
编辑:
GitHub 提供 public 事件 API,用户可以在其中看到几乎 public 发生的所有事件。这意味着一旦您创建了一个存储库并将数据推送到它,任何人都可以注意到这一事实,而无需查看您的存储库的页面。
在不知道是谁在克隆它的情况下,很难说为什么要克隆它,但可能是寻找凭证的人、对流行语言或软件开发实践感兴趣的研究人员,或者各种各样的其他事物。甚至 GitHub 也可能不知道答案,因为在这种情况下,他们拥有的关于克隆者的所有信息都是 IP 地址,如果用户通过了身份验证,还有用户名。只要存储库是 public 并且使用水平不过分,这不是他们认为本质上关心的事情,也不会更深入地询问。
我也希望我有一些神奇的方法来找到这些信息,因为这是一个奇怪的现象,但我不确定是否有可能知道。