如何从 AFP 文件中提取元数据?
how to extract metadata from AFP file?
我有一个示例 AFP 文件..想从中读取 TLE(标签逻辑元素)以获取某些预定义标签,例如帐号或账单号,以便我可以将其转换为特定账单号的 PDF。也有任何 public Java api 用于执行相同的操作。
有两种不同类型的 TLE:组级别和页面级别。组级 TLE 出现在 BNG(开始命名组)之后,而页面级 TLE 出现在页面环境组 (BPG) 之后。 TLE 本身使用两个三元组来承载元数据:FullyQualifiedName 和 AttributeValue。第一个包含键名,另一个包含值。
假设您的 AFP 格式正确,以下代码可帮助您从 TLE 中提取元数据:
import java.io.BufferedInputStream;
import java.io.FileInputStream;
import java.io.IOException;
import java.util.Optional;
import org.afplib.afplib.*;
import org.afplib.base.*;
import org.afplib.io.AfpInputStream;
public class DumpTLE {
public static void main(String[] args) {
try (AfpInputStream in = new AfpInputStream(
new BufferedInputStream(new FileInputStream(args[0])))) {
int page = 0;
int group = 0;
boolean pageLevel = false;
SF sf;
while((sf = in.readStructuredField()) != null) {
if(sf instanceof BPG) {
page++;
pageLevel = true;
}
if(sf instanceof EPG) {
pageLevel = false;
}
if(sf instanceof BNG) {
group++;
}
if(sf instanceof TLE) {
TLE tle = (TLE) sf;
Optional<FullyQualifiedName> fqn = tle.getTriplets().stream()
.filter(FullyQualifiedName.class::isInstance).map(FullyQualifiedName.class::cast)
.findFirst();
Optional<AttributeValue> value = tle.getTriplets().stream()
.filter(AttributeValue.class::isInstance).map(AttributeValue.class::cast)
.findFirst();
if(fqn.isPresent() && value.isPresent()) {
if(pageLevel) {
System.out.println("page "+page+" - "+fqn.get().getFQName()+":"+value.get().getAttVal());
} else {
System.out.println("group "+group+" - "+fqn.get().getFQName()+":"+value.get().getAttVal());
}
}
}
}
} catch (IOException e) {
e.printStackTrace();
}
}
}
代码使用 afplib (https://github.com/yan74/afplib)。将 AFP 转换为 PDF 是一个完全不同的故事,并不那么容易。
我有一个示例 AFP 文件..想从中读取 TLE(标签逻辑元素)以获取某些预定义标签,例如帐号或账单号,以便我可以将其转换为特定账单号的 PDF。也有任何 public Java api 用于执行相同的操作。
有两种不同类型的 TLE:组级别和页面级别。组级 TLE 出现在 BNG(开始命名组)之后,而页面级 TLE 出现在页面环境组 (BPG) 之后。 TLE 本身使用两个三元组来承载元数据:FullyQualifiedName 和 AttributeValue。第一个包含键名,另一个包含值。
假设您的 AFP 格式正确,以下代码可帮助您从 TLE 中提取元数据:
import java.io.BufferedInputStream;
import java.io.FileInputStream;
import java.io.IOException;
import java.util.Optional;
import org.afplib.afplib.*;
import org.afplib.base.*;
import org.afplib.io.AfpInputStream;
public class DumpTLE {
public static void main(String[] args) {
try (AfpInputStream in = new AfpInputStream(
new BufferedInputStream(new FileInputStream(args[0])))) {
int page = 0;
int group = 0;
boolean pageLevel = false;
SF sf;
while((sf = in.readStructuredField()) != null) {
if(sf instanceof BPG) {
page++;
pageLevel = true;
}
if(sf instanceof EPG) {
pageLevel = false;
}
if(sf instanceof BNG) {
group++;
}
if(sf instanceof TLE) {
TLE tle = (TLE) sf;
Optional<FullyQualifiedName> fqn = tle.getTriplets().stream()
.filter(FullyQualifiedName.class::isInstance).map(FullyQualifiedName.class::cast)
.findFirst();
Optional<AttributeValue> value = tle.getTriplets().stream()
.filter(AttributeValue.class::isInstance).map(AttributeValue.class::cast)
.findFirst();
if(fqn.isPresent() && value.isPresent()) {
if(pageLevel) {
System.out.println("page "+page+" - "+fqn.get().getFQName()+":"+value.get().getAttVal());
} else {
System.out.println("group "+group+" - "+fqn.get().getFQName()+":"+value.get().getAttVal());
}
}
}
}
} catch (IOException e) {
e.printStackTrace();
}
}
}
代码使用 afplib (https://github.com/yan74/afplib)。将 AFP 转换为 PDF 是一个完全不同的故事,并不那么容易。