使用 PDFClown 展平表单会抛出 IndexOutOfBounds 异常

Flattening form using PDFClown throws IndexOutOfBounds exception

我正在使用 PDFClown-0.2.0 来展平 this pdf 文件。这是我的代码:

import org.pdfclown.documents.Document;
import org.pdfclown.files.File;
import org.pdfclown.files.SerializationModeEnum;
import org.pdfclown.tools.FormFlattener;

public class Sample {
    public static void main(String args[]){
        try {
            File f = new File("label.pdf");
            Document doc = f.getDocument();

            FormFlattener formFlattener = new FormFlattener();
            formFlattener.flatten(doc);
            f.save(SerializationModeEnum.Standard);
        } catch (Exception e) {
            e.printStackTrace();
        }
    }
}

我正在按照 http://pdfclown.org/2014/09/12/waiting-for-pdf-clown-0-2-0-release/#FormFlattening 上提供的说明进行操作。但是,当我 运行 代码时,出现以下错误:

java.lang.IndexOutOfBoundsException: Index: 1, Size: 1
    at java.util.ArrayList.rangeCheck(ArrayList.java:653)
    at java.util.ArrayList.get(ArrayList.java:429)
    at org.pdfclown.objects.PdfArray.get(PdfArray.java:314)
    at org.pdfclown.documents.interaction.forms.FieldWidgets.get(FieldWidgets.java:135)
    at org.pdfclown.documents.interaction.forms.FieldWidgets.next(FieldWidgets.java:380)
    at org.pdfclown.documents.interaction.forms.FieldWidgets.next(FieldWidgets.java:1)
    at org.pdfclown.tools.FormFlattener.flatten(FormFlattener.java:74)
    at com.narvar.webservices.returns.retailers.Sample.main(Sample.java:18)

我做错了什么?请注意,pdf 是使用 PDFBox 生成的,我已将表单字段设置为只读。

调试代码后它看起来像一个 PdfClown 错误:

org.pdfclown.documents.interaction.forms.FieldWidgets.iterator() 返回的 Iterator 无法识别下方的小部件集合已更改(变小),因此尝试读取超出其大小的内容。

详细:

org.pdfclown.tools.FormFlattener.flatten(Document) 遍历字段的小部件:

  for(Widget widget : field.getWidgets())

但在此循环内,它从当前字段的 Kids 中删除当前小部件:

    // Removing the field references relating the widget...
    PdfDictionary fieldPartDictionary = widget.getBaseDataObject();
    while (fieldPartDictionary != null)
    {
      [...]
      kidsArray.remove(fieldPartDictionary.getReference());
      [...]
    }

因此,外部 for 迭代的集合发生了变化。不幸的是,这里使用的 Iterator 并不知道基础集合中的变化

return new Iterator<Widget>()
{
  /** Index of the next item. */
  private int index = 0;
  /** Collection size. */
  private final int size = size();

  @Override
  public boolean hasNext( )
  {return (index < size);}

  @Override
  public Widget next( )
  {
    if(!hasNext()) throw new NoSuchElementException();
    return get(index++);
  }

  @Override
  public void remove( )
  {throw new UnsupportedOperationException();}
};

如您所见,它不仅不被告知也不检查自己是基础集合,它甚至对集合大小有自己的想法,即 Iterator 代集的集合大小 size.

这样的 Iterator 实现对于可以通过体系结构或合同强制执行的不变集合是可以的。但在手头的情况下,我没有看到,架构显然允许集合更改,并且没有暗示所讨论的迭代器可能仅用于稳定的基础集合。

这应该是固定的。

一种解决方法

可以通过更改 FormFlattener.flatten 来尝试解决方案,以检索小部件的本地副本并迭代此副本,例如通过替换

  for(Widget widget : field.getWidgets())

  List<Widget> widgets = new ArrayList<Widget>(field.getWidgets());
  for(Widget widget : widgets)