diff/delta 对多个文件或数据结构的术语
Term for diff/delta on multiple files or data structures
我想知道是否有一个合适的术语来描述 "diffing" 的/获取多个文件或数据结构之间的增量,这样得到的 "diff" 首先包含对all files/structures 共有的部分,然后描述必须如何修改此 "base" file/structure 以获得单独的部分,最好以分层方式进行,如果有些 files/structures 比其他的更相似。
关于如何使用某些工具(例如DIFF utility works for 2 files. How to compare more than 2 files at a time?)执行此操作有一些问题和答案,但我想针对特定类型的数据结构(即 JSON),我什至不知道应该搜索什么。
在我看来,这种类型的问题应该足够普遍,可以命名为 "hierarchical diff"(但似乎是为分层数据结构上的双向差异保留的),"commonality finding",或类似的东西。
我想关于共性和差异的层次排序的相关概念是 formal concept analysis,但这对属性集而不是层次数据结构进行操作,对我帮助不大。
有多个有效面额:
- 数据比较(或序列比较)
- 增量编码
- 增量压缩(或差异压缩)
算法:
- An O(ND) Difference Algorithm and Its Variations(尤金·迈尔)
- A technique for isolating differences between files(保罗·赫克尔)
- The String-to-String Correction Problem with Block Moves(沃尔特·蒂奇)
良好的维基百科链接
一些实现
我想知道是否有一个合适的术语来描述 "diffing" 的/获取多个文件或数据结构之间的增量,这样得到的 "diff" 首先包含对all files/structures 共有的部分,然后描述必须如何修改此 "base" file/structure 以获得单独的部分,最好以分层方式进行,如果有些 files/structures 比其他的更相似。
关于如何使用某些工具(例如DIFF utility works for 2 files. How to compare more than 2 files at a time?)执行此操作有一些问题和答案,但我想针对特定类型的数据结构(即 JSON),我什至不知道应该搜索什么。
在我看来,这种类型的问题应该足够普遍,可以命名为 "hierarchical diff"(但似乎是为分层数据结构上的双向差异保留的),"commonality finding",或类似的东西。
我想关于共性和差异的层次排序的相关概念是 formal concept analysis,但这对属性集而不是层次数据结构进行操作,对我帮助不大。
有多个有效面额:
- 数据比较(或序列比较)
- 增量编码
- 增量压缩(或差异压缩)
算法:
- An O(ND) Difference Algorithm and Its Variations(尤金·迈尔)
- A technique for isolating differences between files(保罗·赫克尔)
- The String-to-String Correction Problem with Block Moves(沃尔特·蒂奇)
良好的维基百科链接
一些实现