如何爬虫在 asp.net mvc web 应用程序中保存 mp3 url

how to crawler to save mp3 urls in asp.net mvc web application

我想创建一个可以抓取不同网站并根据给定查询收集 mp3 url 的应用程序。

如果数据库中有可用结果,用户可以搜索歌曲名称然后显示相关歌曲url否则抓取网站并找到相关结果保存在数据库中并向用户显示结果。

我会 HtmlAgilityPack 试一试(您可以使用包管理器安装)。

如何开始的简单示例:

string url = "http://www.google.com";
HtmlWeb web = new HtmlWeb();
HtmlDocument doc = web.Load(url);

加载文档后,您可以检查它:

foreach (HtmlNode node in doc.DocumentNode.SelectNodes("//a[@href]"))
{
     if (node.Attributes.Contains("href"))
     {
         Console.WriteLine(node.Attributes["href"].Value);
     }
}

上面应该打印它能找到的所有锚点 URL。