如何在 Postgres 中存储小数列表

How to store a list of small numbers in Postgres

我有一长串小数字,它们都小于 16,但在一个唯一列表中可以有超过 10000 个。

我将值作为逗号分隔列表获取,例如:

6,12,10,2,2,2,6,12,8,2,2,6,10,2,4,12,14,10,2, .... lots and lots of numbers

最后,我需要以最有效的方式将值存储在数据库中,以便被读回并再次处理...作为字符串、逗号分隔值。

我正在考虑将它们存储在一个大的 TEXT 字段中......但是我发现在其中添加所有逗号会浪费 space.

我想知道是否有适合这种情况的最佳实践。

更多技术细节:

对于数据库,我必须使用 Postgres(而且我是这个领域的初学者),编程语言是 Ruby(也是初学者 :))

numbers = "6,12,10,2,2,2,6,12,8,2,2,6,10,2,4,12,14,10,2"

numbers.split(',')
       .map { |n| n.to_i.to_s(2).rjust(4, '0') }
       .join
       .to_i(2)
       .to_s(36)
#⇒ "57ymwcgbl1umt2a"

"57ymwcgbl1umt2a".to_i(36)
                 .to_s(2)
                 .tap { |e| e.prepend('0') until (e.length % 4).zero? }
                 .scan(/.{4}/)
                 .map { |e| e.to_i(2).to_s }
                 .join(',')
#⇒ "6,12,10,2,2,2,6,12,8,2,2,6,10,2,4,12,14,10,2"

要获得快速且合理 space 高效的解决方案,您可以简单地编写一个十六进制字符串:

string = '6,12,10,2,2,2,6,12,8,2,2,6,10,2,4,12,14,10,2'

p string.split(',').map { |v| v.to_i.to_s(16) }.join
# "6ca2226c8226a24cea2"
p '6ca2226c8226a24cea2'.each_char.map { |c| c.to_i(16) }.join(',')
# "6,12,10,2,2,2,6,12,8,2,2,6,10,2,4,12,14,10,2"

它带来了任何数据库和任何程序都可以轻松读取的优势。

此外,即使字符串中有前导 0,它也能正常工作:"0,0,6".

如果你有偶数个元素,你可以将 2 个十六进制字符打包成一个字节,将字符串长度除以 2。