使用命名实体识别的自动摘要

Automatic Summarization using Named Entity Recognition

我想使用命名实体识别 (NER) 根据给定的数据集自动汇总机票

基本上这是我的数据集。

我需要在 pdf 格式中创建有关乘客详细信息的摘要,例如:

The PNR Number ____(PNRNum) refers to the passenger name ____(Name) travelling from ____(Dep Airport),____(Start Country) to ____(Arr Airport),____(End Country) starting at ____(Start Time). The flight number is ____(Flight No) which is _____(Int Dom) using _____(Cabin Class) ticket of base fare _____(Base Fare).

此处应将 PNR 编号作为输入输入以输入第一个空白 space 并且数据集中的相应数据应填写在剩余的空白 space 中。

airline = pd.read_csv("AIR-LINE.csv")
def create_airline_ticket():
    c = canvas.Canvas('AIRlines.pdf')

    c.setFont("Courier", 20)
    c.drawCentredString(300, 700, 'Airline Ticket')
    c.setFont("Courier", 14)
    form = c.acroForm

    c.drawString(10, 650, 'The PNR Number')
    options = [('airline.loc[[0, 10], :]')]
    form.choice(name='choice1', tooltip='Field choice1',
                value='A',
                x=165, y=645, width=72, height=20,
                borderColor=magenta, fillColor=pink, 
                textColor=blue, forceBorder=True, options=options)

    c.save()

我想到了使用 ReportLabs 模块,以便使用其中可用的列表框。但它并没有照此进行。我必须用其他方式处理。

那么你能建议我一步一步的程序吗?由于我是 python 的初学者,所以我可以轻松学习。谢谢。

是的,我肯定会推荐带有 python 的 SpaCy。另一个选择是 StanfordNER。

我不明白你说的引用是什么意思?你的意思是如果其他人试图做机票汇总?