SI 格式与 SGML 格式
TEI format vs. SGML format
简而言之TEI是XML,XML是SGML。
SGML(标准 通用 Markup Language)中的 "G" 意味着(除其他外)标记语言可以自定义它 语法。例如,您可以定义一个 SGML 语法,其中标记(或元素)类似于 [v id:id1]
而不是 <v id="id1"></v>
.
XML 是 SGML 的具体语法,加上子集 SGML 的其他几个要求。在 XML(以及 HTML 中),元素由 angular 方括号分隔:<body>
。 XML 中的每个标签都必须与明确的结束标签配对:</body>
.
到目前为止,我们还没有讨论文档的结构(文档类型或架构)。 XML 本身不对文档结构施加限制。以下是有效的(即格式正确的)XML:
<item>
<body>
<head>I don't know what I'm doing</head>
</body>
</item>
TEI 定义了所有 TEI 文档必须遵守的通用结构,并为每个标签分配了含义。例如:
The actual text (<text>
) contains a single text of any kind. This
commonly contains the actual text and other encodings. A text <text>
minimally contains a text body (<body>
). The body contains lower-level
text structures like paragraphs (<p>
), or different structures for
text genres other than prose [source]
<text>
<body>
<p>For the first time in twenty-five years...</p>
</body>
</text>
简而言之TEI是XML,XML是SGML。
SGML(标准 通用 Markup Language)中的 "G" 意味着(除其他外)标记语言可以自定义它 语法。例如,您可以定义一个 SGML 语法,其中标记(或元素)类似于 [v id:id1]
而不是 <v id="id1"></v>
.
XML 是 SGML 的具体语法,加上子集 SGML 的其他几个要求。在 XML(以及 HTML 中),元素由 angular 方括号分隔:<body>
。 XML 中的每个标签都必须与明确的结束标签配对:</body>
.
到目前为止,我们还没有讨论文档的结构(文档类型或架构)。 XML 本身不对文档结构施加限制。以下是有效的(即格式正确的)XML:
<item>
<body>
<head>I don't know what I'm doing</head>
</body>
</item>
TEI 定义了所有 TEI 文档必须遵守的通用结构,并为每个标签分配了含义。例如:
The actual text (
<text>
) contains a single text of any kind. This commonly contains the actual text and other encodings. A text<text>
minimally contains a text body (<body>
). The body contains lower-level text structures like paragraphs (<p>
), or different structures for text genres other than prose [source]
<text>
<body>
<p>For the first time in twenty-five years...</p>
</body>
</text>