在 cassandra 中支持多种语言

supporting multiple languages in cassandra

我正在使用 Cassandra 分析 Facebook 数据,因此我最终需要在我的一个专栏中使用多种语言的文本。

我无法将非英文文本数据插入 Cassandra:

<stdin>:1:'ascii' codec can't encode character u'\u010c' in position 51: ordinal not in range(128)

<stdin>:1:Invalid syntax at char 7623

我浏览了整个互联网,发现我需要覆盖编码(link) 但我不确定如何配置它。

注意:一行中可能有多种语言。

您的专栏似乎是 ascii 类型,它只支持 US-ASCII-encoded 文本。如果您需要更广泛的字符,请改用 varchar(有关 CQL 类型的详细信息,请参阅 here)。

要更改列类型,请使用此 ALTER TABLE 语句:

ALTER TABLE my_table ALTER my_column TYPE varchar;

有关 ALTER TABLE 的详细信息,请参阅 here