微数据模式解析器

Microdata schema parser

我想解析microdata schema from the html content programmatically (like the way Google Structured Data Test Tool在做什么)

例如给定 html 包含 JobPosting and Website 架构,该工具将检测 return 2 个对象 JobPostingWebsite 以及相关属性信息。

最好的方法是什么?我应该创建 XSD 模式来验证 Html 内容还是仅使用 XPath 进行正常的 Html 处理?有什么好的图书馆可以做吗?

我已经创建了一个库来完成这个任务。该库基于 HtmlAgilityPack 库。代码已放在Github:https://github.com/minhnguyenlinknode/MicroSchemaParser

用法:

var microSchemaParser = new MicroSchemaParser(yourHtmlString);

// Detect all supported schemas
List<ISchema> allSupportedSchemas = microSchemaParser.Parse();

// Find a specific schema
var schema = microSchemaParser.Find<ItemListSchema>();

// Check the schema validation
var validateResult = itemListSchema.Validate();