curl:填写网络表单并检索内容

curl: fill in web form and retrieve content

我想使用 bash 脚本自动填写网站上的 Web 表单:http://www.epncb.oma.be/_productsservices/coord_trans/index.php,并从输出文本框中检索结果。

我试过了:

curl -d from_frame_in="values" -d from_epoch_year="values" -d from_epoch_decimal="values" -d inputvalues="values" -d to_frame_out="values" -d to_epoch_year="values" -d to_epoch_decimal="values" -d transform_button="values" "$websiteurl".

但是epoch下拉列表没有被选中,只有frame下拉列表和输入文本框取值

我也试过:

wget --post-data 'from_frame_in=values&from_epoch_year=values&from_epoch_decimal=values&inputvalues=values&to_frame_out=values&to_epoch_year=values&to_epoch_decimal=values&transform_button=values' "$websiteurl".

这个脚本可以让所有的下拉列表和输入文本框都取值。 但是对于上面提到的两种方法,我不知道如何从输出文本框中检索计算结果。

如果有人能帮助我或指出解决此类问题的方向,我将不胜感激。

请格式化您的问题。

打开页面,例如Chrome,按 F12,选项卡网络,单击转换(在您的网页上)。在网络选项卡中向上滚动并右键单击 index.php - 复制 - 复制为 cURL (bash) 剥离垃圾后你应该得到:

curl -s 'http://www.epncb.oma.be/_productsservices/coord_trans/index.php'   --data-raw 'from_frame_in=ETRF89&from_epoch_year=2000&from_epoch_decimal=0&from_epoch_year2=2000&from_epoch_doy=001&from_epoch_date=2000-01-01&from_epoch_week=1042&from_epoch_dow=6&inputvalues=%23+Lines+starting+by+%23+are+treated+as+comments%0D%0A%23+Fields+%28in+decimal+format%29+should+be+separated+by+at+least+one+space%0D%0A%23%0D%0A%23+--%3E+Example+without+velocity+-+StationName%28no+space+character%29+X%5Bm%5D+Y%5Bm%5D+Z%5Bm%5D+%3A%0D%0AStationName+4027894.006+307045.600+4919474.910%0D%0A%23%0D%0A%23+--%3E+Example+with+velocity+-+StationName%28no+space+character%29+X%5Bm%5D+Y%5Bm%5D+Z%5Bm%5D+VX%5Bm%2Fyr%5D+VY%5Bm%2Fyr%5D+VZ%5Bm%2Fyr%5D+%3A%0D%0AStationName+4027894.006+307045.600+4919474.910+0.01+0.2+0.03%0D%0A&to_frame_out=ETRF89&to_epoch_year=2000&to_epoch_decimal=0&to_epoch_year2=2000&to_epoch_doy=001&to_epoch_date=2000-01-01&to_epoch_week=1042&to_epoch_dow=6&outputvalues=StationName+4027894.00600++307045.60000+4919474.91000+%C2%A0+%C2%A0+%C2%A0%0D%0AStationName+4027894.00600++307045.60000+4919474.91000++0.01000++0.20000++0.03000%0D%0A&epochtype=decimalyear&transform_button=Transform'   --compressed   --insecure | xmllint --html --xpath "//textarea[@name='outputvalues']/text()" - 2>/dev/null

StationName 4027894.00600  307045.60000 4919474.91000      
StationName 4027894.00600  307045.60000 4919474.91000  0.01000  0.20000  0.03000

-s silence curl progress,xmllint --html --xpath 解析 xpath 中 curl 和 clip 元素的输出(xmllint 可以通过 sudo apt install libxml2-utils 安装),- 告诉 xmllint 采取 stdin/pipe 从 curl 而不是文件,2>/dev/null 将错误输出重定向到地狱 - 讨厌的方式摆脱解析错误