MS SQL 对中文名称的列进行排序
MS SQL sorting a column with Chinese Name
我有一个数据库table,里面有英文名和中文名。我已将中文名称栏的排序规则更改为Chinese_PRC_CS_AS,但仍然无法正确排序。
我希望他们根据字典使用(拼音)的方式进行排序。
我可以知道以前是否有人这样做过吗?
您可以在 select 语句中指定 Chinese_PRC_CS_AS
select * from yourtable order by columnWithChineseName collate Chinese_PRC_CI_AS
我也在 [http://www.blogjava.net/parable-myth/archive/2010/10/12/334525.html][1] 找到了解决方案。为了防止以后link被破坏,我把内容贴在这里。应归还原作者。
sql按拼音排序
select * from user order by name collate Chinese_PRC_CS_AS_KS_WS
二.排序规则简介:
什么叫排序规则呢?ms是这样描述的:"在 microsoft sql server 2000 中, 字符串的物理存储由排序规则控制。排序规则指定表示每个字符的位模式以及存 储和比较字符所使用的规则。"
在查询分析器内执行下面语句,可以得到sql server支持的所有排序规则。
select * from ::fn_helpcollations()
排序规则名称由两部份构成,前半部份是指本排序规则所支持的字符集。 如: chinese_prc_cs_ai_ws
前半部份:指unicode字符集,chinese_prc_指针对大陆简体字unicode的排序规则。 排序规则的后半部份即后缀 含义:
_bin 二进制排序
_ci(cs) 是否区分大小写,ci不区分,cs区分
_ai(as) 是否区分重音,ai不区分,as区分
_ki(ks) 是否区分假名类型,ki不区分,ks区分
_wi(ws) 是否区分宽度 wi不区分,ws区分
区分大小写:如果想让比较将大写字母和小写字母视为不等,请选择该选项。
区分重音:如果想让比较将重音和非重音字母视为不等,请选择该选项。如果选择该选项,
比较还将重音不同的字母视为不等。 区分假名:如果想让比较将片假名和平假名日语音节视为不等,请选择该选项。 区分宽度:如果想让比较将半角字符和全角字符视为不等,请选择该选项
三.排序规则的应用: sql server提供了大量的windows和sqlserver专用的排序规则,但它的应用往往
被开发人员所忽略。其实它在实践中大有用处。
例1:让表name列的内容按拼音排序:
create table #t(id int,name varchar(20)) insert #t select 1,中 union
all select 2,国 union all select 3,人 union all select 4,阿
select * from #t order by name collate chinese_prc_cs_as_ks_ws drop
table #t /*结果: id name
----------- -------------------- 4 阿 2 国 3 人 1 中
*/
例2:让表name列的内容按姓氏笔划排序:
create table #t(id int,name varchar(20))
insert #t select 1,三 union all select 2,乙 union all select 3,二 union
all select 4,一 union all select 5,十 select * from #t order by name
collate chinese_prc_stroke_cs_as_ks_ws drop table #t /*结果: id
name
----------- -------------------- 4 一 2 乙 3 二 5 十 1 三
*/
四.在实践中排序规则应用的扩展 sql server汉字排序规则可以按拼音、笔划等排序,那么我们如何利用这种功能
来处理汉字的一些难题呢?我现在举个例子:
用排序规则的特性计算汉字笔划
要计算汉字笔划,我们得先做准备工作,我们知道,windows多国汉字,unicode目前
收录汉字共20902个。简体gbk码汉字unicode值从19968开始。
首先,我们先用sqlserver方法得到所有汉字,不用字典,我们简单利用sql语句就 可以得到:
select top 20902 code=identity(int,19968,1) into #t from syscolumns
a,syscolumns b
再用以下语句,我们就得到所有汉字,它是按unicode值排序的:
select code,nchar(code) as cnword from #t
然后,我们用select语句,让它按笔划排序。
select code,nchar(code) as cnword from #t order by nchar(code)
collate chinese_prc_stroke_cs_as_ks_ws,code
结果: code cnword
本文章出处 http://www.itphome.cn/shujukuyingyong/mssql/2010-01-27/106.html
[1]: http://www.itphome.cn/shujukuyingyong/mssql/2010-01-27/106.html
我有一个数据库table,里面有英文名和中文名。我已将中文名称栏的排序规则更改为Chinese_PRC_CS_AS,但仍然无法正确排序。
我希望他们根据字典使用(拼音)的方式进行排序。
我可以知道以前是否有人这样做过吗?
您可以在 select 语句中指定 Chinese_PRC_CS_AS
select * from yourtable order by columnWithChineseName collate Chinese_PRC_CI_AS
我也在 [http://www.blogjava.net/parable-myth/archive/2010/10/12/334525.html][1] 找到了解决方案。为了防止以后link被破坏,我把内容贴在这里。应归还原作者。
sql按拼音排序
select * from user order by name collate Chinese_PRC_CS_AS_KS_WS
二.排序规则简介:
什么叫排序规则呢?ms是这样描述的:"在 microsoft sql server 2000 中, 字符串的物理存储由排序规则控制。排序规则指定表示每个字符的位模式以及存 储和比较字符所使用的规则。"
在查询分析器内执行下面语句,可以得到sql server支持的所有排序规则。
select * from ::fn_helpcollations()
排序规则名称由两部份构成,前半部份是指本排序规则所支持的字符集。 如: chinese_prc_cs_ai_ws 前半部份:指unicode字符集,chinese_prc_指针对大陆简体字unicode的排序规则。 排序规则的后半部份即后缀 含义: _bin 二进制排序 _ci(cs) 是否区分大小写,ci不区分,cs区分 _ai(as) 是否区分重音,ai不区分,as区分 _ki(ks) 是否区分假名类型,ki不区分,ks区分 _wi(ws) 是否区分宽度 wi不区分,ws区分
区分大小写:如果想让比较将大写字母和小写字母视为不等,请选择该选项。 区分重音:如果想让比较将重音和非重音字母视为不等,请选择该选项。如果选择该选项, 比较还将重音不同的字母视为不等。 区分假名:如果想让比较将片假名和平假名日语音节视为不等,请选择该选项。 区分宽度:如果想让比较将半角字符和全角字符视为不等,请选择该选项
三.排序规则的应用: sql server提供了大量的windows和sqlserver专用的排序规则,但它的应用往往 被开发人员所忽略。其实它在实践中大有用处。
例1:让表name列的内容按拼音排序:
create table #t(id int,name varchar(20)) insert #t select 1,中 union all select 2,国 union all select 3,人 union all select 4,阿
select * from #t order by name collate chinese_prc_cs_as_ks_ws drop table #t /*结果: id name
----------- -------------------- 4 阿 2 国 3 人 1 中 */例2:让表name列的内容按姓氏笔划排序:
create table #t(id int,name varchar(20))
insert #t select 1,三 union all select 2,乙 union all select 3,二 union all select 4,一 union all select 5,十 select * from #t order by name collate chinese_prc_stroke_cs_as_ks_ws drop table #t /*结果: id
name
----------- -------------------- 4 一 2 乙 3 二 5 十 1 三 */四.在实践中排序规则应用的扩展 sql server汉字排序规则可以按拼音、笔划等排序,那么我们如何利用这种功能 来处理汉字的一些难题呢?我现在举个例子:
用排序规则的特性计算汉字笔划
要计算汉字笔划,我们得先做准备工作,我们知道,windows多国汉字,unicode目前 收录汉字共20902个。简体gbk码汉字unicode值从19968开始。 首先,我们先用sqlserver方法得到所有汉字,不用字典,我们简单利用sql语句就 可以得到:
select top 20902 code=identity(int,19968,1) into #t from syscolumns a,syscolumns b
再用以下语句,我们就得到所有汉字,它是按unicode值排序的:
select code,nchar(code) as cnword from #t
然后,我们用select语句,让它按笔划排序。
select code,nchar(code) as cnword from #t order by nchar(code) collate chinese_prc_stroke_cs_as_ks_ws,code
结果: code cnword
本文章出处 http://www.itphome.cn/shujukuyingyong/mssql/2010-01-27/106.html
[1]: http://www.itphome.cn/shujukuyingyong/mssql/2010-01-27/106.html