如何在文件夹层次结构中找到所有不同的贪婪文件后缀?

How can I find all of the distinct greedy file suffixes in a folder hierarchy?

我在这里找到了一个相关问题:

How can I find all of the distinct file extensions in a folder hierarchy?

但我的情况略有不同。在 Ubuntu 14.04 Linux 上使用 bash,如果我有一堆文件,如下所示:

ls -1 | sort -V
fileA.foo.bar.txt.gz
fileA.foo.foo.txt.gz
fileA.xyz.bar.txt.gz
fileB.foo.bar.txt.gz
fileB.foo.foo.txt.gz
fileB.xyz.bar.txt.gz

我想知道从 first 分隔符中找到的每个扩展名有多少文件(例如示例中的 \.)。所以它将是:

2 .foo.bar.txt.gz
2 .foo.foo.txt.gz
2 .xyz.bar.txt.gz

这不是我在上述问题中找到的最佳答案:

find . -type f | sed -e 's/.*\.//' | sed -e 's/.*\///' | sort | uniq -c | sort -rn
      6 gz

find . -type f | perl -ne 'print  if m/\.([^.\/]+)$/' | sort | uniq -c
      6 gz

您可以去掉 sedperl 并使用 cut,尝试使用:

find . -type f  | cut -d. -f3- | sort | uniq -c

cwd中文件的全部bash解决方案:

declare -A a         # declare an associative array a
for f in *.*         # loop all filenames with a .
do 
  ((a[${f#*.}]++))   # increment array elements value
done

输出计数:

for k in "${!a[@]}"  # loop all array keys
do 
  echo ${a[$k]} $k   # output value and key
done
1 zip
2 txt
1 txt~