如何反映 MOSS 抄袭检测的结果?
How can I mirror the results of MOSS plagiarism detection?
MOSS是一个著名的软件抄袭检查服务器。它允许教师发送作业提交,计算不同提交之间的相似度,并为非常相似的代码块着色。
Here is an example of the results of the comparison。
如您所见,它非常简单:它包含一个带有可疑文件索引的 HTML 文件,并且包含用于比较的特定 HTML 文件的链接。
结果会在 MOSS 网站上保留两周。我想将所有结果下载到我的电脑中,以便以后查看。我使用 this command on Linux:
wget -mkEpnp http://moss.stanford.edu/results/5/7683916027631/index.html
我得到的是:
如您所见,仅下载了 index.html
文件。从 index.html
链接的其他文件,例如match0.html 和 match1.html,未下载。
我尝试使用不同的工具镜像同一个网站 - Web HTTrack
- 但得到的结果完全相同 - 只有索引文件被镜像,而不是 match
文件。
HTML看起来很简单,想不通为什么镜像不行。我该怎么做才能正确反映结果?
P.S。如果相关,robots.txt 文件包含以下内容:
User-agent: *
Disallow: /
您需要忽略 robots.txt 文件
例如
wget -r -l 1 -e robots=off http://moss.stanford.edu/results/1/XXXXXXXXXX/
MOSS是一个著名的软件抄袭检查服务器。它允许教师发送作业提交,计算不同提交之间的相似度,并为非常相似的代码块着色。 Here is an example of the results of the comparison。 如您所见,它非常简单:它包含一个带有可疑文件索引的 HTML 文件,并且包含用于比较的特定 HTML 文件的链接。
结果会在 MOSS 网站上保留两周。我想将所有结果下载到我的电脑中,以便以后查看。我使用 this command on Linux:
wget -mkEpnp http://moss.stanford.edu/results/5/7683916027631/index.html
我得到的是:
如您所见,仅下载了 index.html
文件。从 index.html
链接的其他文件,例如match0.html 和 match1.html,未下载。
我尝试使用不同的工具镜像同一个网站 - Web HTTrack
- 但得到的结果完全相同 - 只有索引文件被镜像,而不是 match
文件。
HTML看起来很简单,想不通为什么镜像不行。我该怎么做才能正确反映结果?
P.S。如果相关,robots.txt 文件包含以下内容:
User-agent: *
Disallow: /
您需要忽略 robots.txt 文件 例如
wget -r -l 1 -e robots=off http://moss.stanford.edu/results/1/XXXXXXXXXX/