Hadoop:将 BytesWritable 转换为 byte[]
Hadoop: Convert BytesWritable to byte[]
谁能帮我把 BytesWritable 转换成 byte[]。如果我使用 value.getBytes() 值是 BytesWritable.
,我会得到额外的字节
谢谢
您遇到的问题是 BytesWritable 包含一个字节数组和一个长度。你必须结合使用这些。这是我写的一个小单元测试,向您展示发生了什么:
@Test
public void testBytesWritable() {
BytesWritable bw = new BytesWritable();
Text t1 = new Text("ABCD");
bw.set(t1.getBytes(), 0, t1.getLength());
System.out.println("Size: " + bw.getBytes().length);
Text t2 = new Text("A");
bw.set(t2.getBytes(), 0, t2.getLength());
System.out.println("Size: " + bw.getBytes().length);
byte[] newArray = Arrays.copyOf(bw.getBytes(), bw.getLength());
System.out.println("Size: " + newArray.length);
}
打印出来:
Size: 6
Size: 6
Size: 1
所以你可以看到BytesWritable被设置了两次,第一次设置了更长的字节。打印出字节数组的长度表明内部字节数组的长度没有减少,它保持很大。因此,您必须使用 getLength()
方法来确定 BytesWritable 中有多少字节是有效的。在单元测试中,我使用 Arrays.copyOf()
来获取正确的字节,因为它需要一个字节数组和一个长度。
谁能帮我把 BytesWritable 转换成 byte[]。如果我使用 value.getBytes() 值是 BytesWritable.
,我会得到额外的字节谢谢
您遇到的问题是 BytesWritable 包含一个字节数组和一个长度。你必须结合使用这些。这是我写的一个小单元测试,向您展示发生了什么:
@Test
public void testBytesWritable() {
BytesWritable bw = new BytesWritable();
Text t1 = new Text("ABCD");
bw.set(t1.getBytes(), 0, t1.getLength());
System.out.println("Size: " + bw.getBytes().length);
Text t2 = new Text("A");
bw.set(t2.getBytes(), 0, t2.getLength());
System.out.println("Size: " + bw.getBytes().length);
byte[] newArray = Arrays.copyOf(bw.getBytes(), bw.getLength());
System.out.println("Size: " + newArray.length);
}
打印出来:
Size: 6
Size: 6
Size: 1
所以你可以看到BytesWritable被设置了两次,第一次设置了更长的字节。打印出字节数组的长度表明内部字节数组的长度没有减少,它保持很大。因此,您必须使用 getLength()
方法来确定 BytesWritable 中有多少字节是有效的。在单元测试中,我使用 Arrays.copyOf()
来获取正确的字节,因为它需要一个字节数组和一个长度。