Hadoop-PCap-Lib 字段类型

Hadoop-PCap-Lib Field Types

我正在尝试制作一个 protobuf class,它可以更有效地流式传输使用 TCPDump 捕获的 DNS 数据包。

我想知道这个库中提供的所有可能字段的类型:

DNSPacket Fields:
    QUERYID
    QR
    OPCODE
    RCODE
    QUESTION
    QNAME
    QTYPE
    ANSWER
    AUTHORITY
    ADDITIONAL
Packet Fields:
    TIMESTAMP
    TIMESTAMP_USEC
    TIMESTAMP_MICROS
    TTL
    IP_VERSION
    IP_HEADER_LENGTH
    IP_FLAGS_DF
    IP_FLAGS_MF
    IPV6_FLAGS_M
    FRAGMENT_OFFSET
    FRAGMENT
    LAST_FRAGMENT
    PROTOCOL
    SRC
    DST
    ID
    SRC_PORT
    DST_PORT
    TCP_HEADER_LENGTH
    TCP_SEQ
    TCP_ACK
    LEN
    UDPSUM
    UDP_LENGTH
    TCP_FLAG_NS
    TCP_FLAG_CWR
    TCP_FLAG_ECE
    TCP_FLAG_URG
    TCP_FLAG_ACK
    TCP_FLAG_PSH
    TCP_FLAG_RST
    TCP_FLAG_SYN
    TCP_FLAG_FIN
    /*Not sure bout these two*/
    REASSEMBLED_TCP_FRAGMENTS 
    REASSEMBLED_DATAGRAM_FRAGMENTS

我的应用程序是在 Scala 中,我尝试对我捕获的一些数据包进行简单反射,但是很多字段都是空的,这没有帮助。

可以在 GitHub here

上找到该库

有没有一种简单的方法可以获取这些字段的 ALL 类型? (以编程方式或通过文本源)

谢谢, RDS

我以最直接明显的方式解决了这个问题。

我决定使用绝对数量的数据包来解决这个问题,使用 Wireshark 捕获了大约 100,000 个 DNS 数据包,然后将捕获的数据保存为 .pcap 文件。

我然后 运行 文件中的以下内容:

try {
  var dataInStream: DataInputStream = null
  //Open the file and set up the DataInputStream
  val f = new File(pCapFileName)
  if (f.getAbsoluteFile.exists) {
    val fis = new FileInputStream(f)
    dataInStream = new DataInputStream(fis)
    val dnsPcapReader = new DnsPcapReader(dataInStream)
    val pktIter = dnsPcapReader.iterator
    var counter = 0
    while (pktIter.hasNext) {
      counter += 1
      if (counter % 100 == 0) println(counter)
      val pCapFile = pktIter.next.asInstanceOf[DnsPacket]
      for (i <- 0 until types.length) {
        val tuple = types(i)
        val fieldName = tuple._1
        var className = Option(pCapFile.get(fieldName)).map(_.getClass).toString
        var numOccurances = tuple._3
        if(className.equals("None"))
          className = tuple._2.asInstanceOf[String]
        else
          numOccurances += 1
        val newTuple = (fieldName, className, numOccurances)
        types = types.updated(i, newTuple)
      }
    }
  }
  for {
    tuple <- types
  } printf("%s%-25s%-25s%-25s\n%s\n", "\t", tuple._1 + ":", tuple._2,
    "[" + tuple._3 + "]", spacer)
  //Close the stream
  dataInStream.close
} catch {
  case e: Exception => e.printStackTrace()
}

本质上,对于每个字段名称,它都会检查一个值,然后还会检查该值的 class。每次更新列表中相应的 space 以反映该字段(不是太优雅,但它以合理的方式获得结果)。此外,查看哪些字段常见哪些不常见也很方便。

结果如下:

dst:                     Some(class java.lang.String)[98823]                  

dst_port:                Some(class java.lang.Integer)[98614]                  

fragment:                Some(class java.lang.Boolean)[98823]                  

fragment_offset:         Some(class java.lang.Long)[98799]                  

id:                      Some(class java.lang.Long)[98799]                  

ip_flags_df:             Some(class java.lang.Boolean)[98799]                  

ip_flags_mf:             Some(class java.lang.Boolean)[98799]                  

ip_header_length:        Some(class java.lang.Integer)[98823]                  

ip_version:              Some(class java.lang.Integer)[98823]                  

ipv6_flags_m:            null                     [0]                      

last_fragment:           null                     [0]                      

len:                     Some(class java.lang.Integer)[98823]                  

protocol:                Some(class java.lang.String)[98618]                  

reassembled_datagram_fragments:null                     [0]                      

reassembled_tcp_fragments:Some(class java.lang.Integer)[835]                    

src:                     Some(class java.lang.String)[98823]                  

src_port:                Some(class java.lang.Integer)[98614]                  

tcp_ack:                 Some(class java.lang.Long)[96106]                  

tcp_flag_ack:            Some(class java.lang.Boolean)[96106]                  

tcp_flag_cwr:            Some(class java.lang.Boolean)[96106]                  

tcp_flag_ece:            Some(class java.lang.Boolean)[96106]                  

tcp_flag_fin:            Some(class java.lang.Boolean)[96106]                  

tcp_flag_ns:             Some(class java.lang.Boolean)[96106]                  

tcp_flag_psh:            Some(class java.lang.Boolean)[96106]                  

tcp_flag_rst:            Some(class java.lang.Boolean)[96106]                  

tcp_flag_syn:            Some(class java.lang.Boolean)[96106]                  

tcp_flag_urg:            Some(class java.lang.Boolean)[96106]                  

tcp_header_length:       Some(class java.lang.Integer)[96106]                  

tcp_seq:                 Some(class java.lang.Long)[96106]                  

ts:                      Some(class java.lang.Long)[100258]                 

ts_micros:               Some(class java.lang.Long)[100258]                 

ts_usec:                 Some(class java.lang.Double)[100258]                 

ttl:                     Some(class java.lang.Integer)[98823]                  

udp_length:              Some(class java.lang.Integer)[2508]                   

udpsum:                  Some(class java.lang.Integer)[2508]                   

dns_additional:          Some(class java.util.ArrayList)[320]                    

dns_answer:              Some(class java.util.ArrayList)[320]                    

dns_authority:           Some(class java.util.ArrayList)[320]                    

dns_flags:               Some(class java.lang.String)[320]                    

dns_opcode:              Some(class java.lang.String)[320]                    

dns_qname:               Some(class java.lang.String)[320]                    

dns_qr:                  Some(class java.lang.Boolean)[320]                    

dns_qtype:               Some(class java.lang.Integer)[320]                    

dns_queryid:             Some(class java.lang.Integer)[320]                    

dns_question:            Some(class java.lang.String)[320]                    

dns_rcode:               Some(class java.lang.String)[320]                    

三个字段仍然出现 0 次,因此它们的 class 类型仍然未知: ipv6_flags_mlast_fragmentreassembled_datagram_fragments

由于 ipv6_flags_m 是一个标志,它很可能是一个布尔值,我假设它留下了两个字段。由于在 100,000 个数据包中没有出现,我认为这些字段无关紧要,因此将它们完全从我的列表中删除。