QNAmaker 最大数量的 QNA 对

QNAmaker max amount of QNA pairs

我正在生成一个包含多轮问题的大型 PDF。

我正在通过浏览器执行此操作,更新需要很长时间,最后它说它仍在后台 运行。

为了检查它何时完成,我进行了 api 调用以获取操作的详细信息。最终这个 returns 状态失败,没有任何错误代码。

当我检查我的 QnA 对时,我正好有 1000 个,这似乎不是一个随机数。

但是我在任何地方都找不到关于 QnA 对限制的任何信息,我发现它应该是无限的。

我是不是做错了什么或者这里发生了什么?


编辑

当我查询服务器统计信息时,这就是我得到的答案。 documentCount 的配额为 null,这应该意味着它是无限制的。

` {
    "@odata.context": "mylink",
    "counters": {
        "documentCount": {
            "usage": 2000,
            "quota": null
        },
        "indexesCount": {
            "usage": 2,
            "quota": 3
        },
        "indexersCount": {
            "usage": 0,
            "quota": 3
        },
        "dataSourcesCount": {
            "usage": 0,
            "quota": 3
        },
        "storageSize": {
            "usage": 1714194,
            "quota": 52428800
        },
        "synonymMaps": {
            "usage": 1,
            "quota": 3
        }
    },
    "limits": {
        "maxFieldsPerIndex": 1000,
        "maxIndexerRunTime": "PT1M",
        "maxFileExtractionSize": 16777216,
        "maxFileContentCharactersToExtract": 32768,
        "maxFieldNestingDepthPerIndex": 10,
        "maxComplexCollectionFieldsPerIndex": 40,
        "maxComplexObjectsInCollectionsPerDocument": 3000
    }
} `

编辑 2

我有一些重复的问题,我删除了这些问题并将一些问题重构为子问题。不知道为什么,现在上传成功了

根据 QnA Maker Limits 页面,以下限制适用于知识库的内容:

Length of answer text: 25,000
Length of question text: 1,000
Length of metadata key/value text: 100
Supported characters for metadata name: Alphabets, digits and _
Supported characters for metadata value: All except : and |
Length of file name: 200
Supported file formats: ".tsv", ".pdf", ".txt", ".docx", ".xlsx".
Maximum number of alternate questions: 300
Maximum number of question-answer pairs: Depends on the Azure Cognitive Search tier chosen. A question and answer pair maps to a document on Azure Cognitive Search index.
URL/HTML page: 1 million characters

重要的部分是“问题和答案对映射到 Azure 认知搜索索引上的文档。

文档可用 here

因此,如果您使用的是免费套餐,则可能会达到每个索引器 1-3 分钟的最大运行时间限制,或者达到 table 下的上标 1 的免费服务 1 分钟的最大运行时间限制。

您可以尝试致电 this API for more information, and also ensure that you are under the document size limit.

编辑

查看 QnA Maker 可能会有所帮助 data source guidelines, as well as the specific guidelines for structured PDF content here. There is also a formatting guideline

QnA Maker identifies sections and subsections and relationships in the file based on visual clues like:

font size
font style
numbering
colors

如果将来有人在 PDF 格式方面苦苦挣扎,那么我建议尝试使用 .docxxlx.tsv 格式,因为它们可以让您拥有更多具体围绕什么是问题,什么是答案

对于文档:

alternating Questions and Answers per line, one question per line followed by its answer in the following line

对于电子表格:

Question1 \t Answer1 \t Key1:Value1 | Key2:Value2

根据this link