如何将文本文件中的字符串作为标记变量提取到电子表格中

how to pull strings from a text file into a spreadsheet as labeled variables

我是一名医学领域的非技术人员,试图尽量减少转录错误。我不知道从哪里开始,希望人们能指出我正确的方向。我会尽量简明扼要地总结一下流程,并说明需要什么:
机器扫描人的眼睛并将测量数据输出为带有清晰印刷文本的打印输出;此打印输出被扫描并以 PNG 格式上传到系统中。我可以通过开源 OCR 程序下载和 运行 PNG,并获得带有换行符的文本文件,原始打印输出中的大部分文本都被正确读取。下一步是提取此数据中的某些行或短语,并将它们转录到特定网站的字段中。然而,作为一个中间步骤,最好将它们作为带标签的变量或数据标签放入 excel 文件中,因为这将允许某人快速 copy/paste 将它们放入适当的字段中网站。

我懂一点 VBA 编码,我至少熟悉正则表达式模式匹配的概念,但我不是程序员。我没有在这个论坛上看到附加文件的方法,但我可以 post 输出数据文本文件的示例和我输入的指南,它准确描述了我想要的信息(总共 18 个变量)从数据集中拉取。

非常感谢任何和所有反馈!

我在您的 post 中没有看到任何样本数据。如果你会包括我可能已经能够提供一个确切的答案。 当执行像这样的重复任务时,你最好使用 get 和 transform 而不是 vba。 转到数据选项卡->获取和转换功能区->获取数据->导入csv。 困难的部分是进行所有必要的更改,但是一旦您通过 window 进行获取和转换,如果文件是重复文件,需要类似的基于逻辑的步骤,您将不必通过清理数据再次处理。