在 ruby 中的西里尔数组上应用 .capitalize

Apply .capitalize on an Cyrillic array in ruby

我想将数组中的字符串元素大写为ruby

这是我的代码:

headermonths = ["января","февраля","марта","апреля","мая","июня","июля","августа","октября","ноября","декабря"]

headermonths.each {|month| month.capitalize!}
puts headermonths

我得到以下输出:

января
февраля
марта
апреля
мая
июня
июля
августа
октября
ноября
декабря

如果打印数组:

 print headermonths    

我得到以下内容

["\u044F\u043D\u0432\u0430\u0440\u044F", "\u0444\u0435\u0432\u0440\u0430\u043B\u044F", "\u043C\u0430\u0440\u0442\u0430", "\u0430\u043F\u0440\u0435\u043B\u044F", "\u043C\u0430\u044F", "\u0438\u044E\u043D\u044F", "\u0438\u044E\u043B\u044F", "\u0430\u0432\u0433\u0443\u0441\u0442\u0430", "\u043E\u043A\u0442\u044F\u0431\u0440\u044F", "\u043D\u043E\u044F\u0431\u0440\u044F", "\u0434\u0435\u043A\u0430\u0431\u0440\u044F"]

但我想要这样的输出:

Января Февраля Марта Апреля Мая Июня Июля Августа Октября Ноября Декабря

如何使用 ruby 方法实现此目的?

独立解决方案:

# From : https://en.wikipedia.org/wiki/Cyrillic_alphabets :
upcase   = "АБВГДЕЖЗИЙКЛМНОПРСТУФХЦЧШЩЬЮЯ"
downcase = "абвгдежзийклмнопрстуфхцчшщьюя"

headermonths = ["января","февраля","марта","апреля","мая","июня","июля","августа","октября","ноября","декабря"]

headermonths.each{|word| word[0] = word[0].tr(downcase,upcase)}
# => ["Января", "Февраля", "Марта", "Апреля", "Мая", "Июня", "Июля", "Августа", "Октября", "Ноября", "Декабря"]

如果您想将它用于拉丁字母和西里尔字母的单词:

headermonths.each{|word| word[0] = word[0].tr(downcase,upcase).upcase }

使用 ActiveSupport

您可以使用 ActiveSupport::Multibyte :

require 'active_support/core_ext/string/multibyte'
"января".mb_chars.capitalize.to_s #=> "Января"

因此您的脚本变为:

require 'active_support/core_ext/string/multibyte'

headermonths = ["января","февраля","марта","апреля","мая","июня","июля","августа","октября","ноября","декабря"]

headermonths.map!{|word| word.mb_chars.capitalize.to_s}
#=> ["Января", "Февраля", "Марта", "Апреля", "Мая", "Июня", "Июля", "Августа", "Октября", "Ноября", "Декабря"]

Ruby2.4

您问题中的代码将按预期与 Ruby 2.4.

一起工作

参见 "Case sensitivity for unicode characters" here

下面的示例是一个强大的大写版本,适用于以 1.9 开头的任何 ruby,但由于 -32 硬编码,仅适用于西里尔文。

NB:感谢@Stefan 和@EricDuminil,他们带领我走向正确的方向

headermonths = %w|января февраля марта апреля мая июня
                  июля августа октября ноября декабря|
puts (headermonths.each do |s|
  s[0] = (s[0].ord - 32).chr(Encoding::UTF_8) 
end.inspect)
#⇒ ["Января", "Февраля", "Марта", "Апреля", "Мая", "Июня",
#   "Июля", "Августа", "Октября", "Ноября", "Декабря"]

您可以使用 unicode gem

require 'unicode'

headermonths = ["января","февраля","марта","апреля","мая","июня","июля","августа","октября","ноября","декабря"]

headermonths.map! {|month| Unicode::capitalize month }
puts headermonths
# >> ["Января", "Февраля", "Марта", "Апреля", "Мая", "Июня", "Июля", "Августа", "Октября", "Ноября", "Декабря"]