C# OpenXML:仅在除最后一个文件之外的所有文件中获取文件中的第一个超链接
C# OpenXML: Only getting first hyperlink in file in all files except for the last one
我被指派编写一个应用程序,该应用程序可以进入目录、查找特定类型的文件、获取文件中的任何超链接并记录它们。到目前为止,一切都很顺利。但是,出于某种原因,我遇到了一个问题,即只能获取文件中的两个链接之一。两个链接指向相同的 url。它似乎忽略了前两个文件中的第二个,但第三个就好了。
string pathtofolder = "C:\Users\Icmolreulf\source\repos\FileSearch\FileSearch\powershelltesting";
string[] files = System.IO.Directory.GetFiles(pathtofolder, "*.docx");
Console.WriteLine(files.Length);
for (int i = 0; i < files.Length; i++)
{
WordprocessingDocument word = WordprocessingDocument.Open(files[i], true);
IEnumerable<HyperlinkRelationship> link = from x in word.MainDocumentPart.HyperlinkRelationships where (x.RelationshipType == "http://schemas.openxmlformats.org/officeDocument/2006/relationships/hyperlink") select x;
foreach (HyperlinkRelationship l in link)
{
if (isValidURL(l.Uri.ToString()))
{
Console.WriteLine(l.Uri.ToString());
}
}
}
static bool isValidURL(string uriName)
{
Uri uriResult;
bool result = Uri.TryCreate(uriName, UriKind.Absolute, out uriResult)
&& (uriResult.Scheme == Uri.UriSchemeHttp || uriResult.Scheme == Uri.UriSchemeHttps);
return result;
}
我不知道问题出在哪里。我希望找到的 url 对于所有文件都是相同的:http://burymewithmymoney.com/。我已经确保它在所有这些中。我还尝试将另一个 .docx 文件添加到目录中,它可以工作,但它也忽略了该文件。如果能得到任何帮助,我将不胜感激。
问题出在我正在读取的文件上。代码工作正常。很抱歉占用您的时间。祝您一天愉快。
我被指派编写一个应用程序,该应用程序可以进入目录、查找特定类型的文件、获取文件中的任何超链接并记录它们。到目前为止,一切都很顺利。但是,出于某种原因,我遇到了一个问题,即只能获取文件中的两个链接之一。两个链接指向相同的 url。它似乎忽略了前两个文件中的第二个,但第三个就好了。
string pathtofolder = "C:\Users\Icmolreulf\source\repos\FileSearch\FileSearch\powershelltesting";
string[] files = System.IO.Directory.GetFiles(pathtofolder, "*.docx");
Console.WriteLine(files.Length);
for (int i = 0; i < files.Length; i++)
{
WordprocessingDocument word = WordprocessingDocument.Open(files[i], true);
IEnumerable<HyperlinkRelationship> link = from x in word.MainDocumentPart.HyperlinkRelationships where (x.RelationshipType == "http://schemas.openxmlformats.org/officeDocument/2006/relationships/hyperlink") select x;
foreach (HyperlinkRelationship l in link)
{
if (isValidURL(l.Uri.ToString()))
{
Console.WriteLine(l.Uri.ToString());
}
}
}
static bool isValidURL(string uriName)
{
Uri uriResult;
bool result = Uri.TryCreate(uriName, UriKind.Absolute, out uriResult)
&& (uriResult.Scheme == Uri.UriSchemeHttp || uriResult.Scheme == Uri.UriSchemeHttps);
return result;
}
我不知道问题出在哪里。我希望找到的 url 对于所有文件都是相同的:http://burymewithmymoney.com/。我已经确保它在所有这些中。我还尝试将另一个 .docx 文件添加到目录中,它可以工作,但它也忽略了该文件。如果能得到任何帮助,我将不胜感激。
问题出在我正在读取的文件上。代码工作正常。很抱歉占用您的时间。祝您一天愉快。