如何在字符串中搜索任何 unicode 符号?
How to search for any unicode symbol in a character string?
我有一个现有的 DOORS 模块,它恰好有一些富文本条目;这些条目中有一些符号,例如 'curly' 引号。我正在尝试升级导出 LaTeX 源文件的 DXL 宏,问题是 TexMaker 的导入函数不考虑这些高数字符号 "standard UTF-8" (并且在任何情况下都可能不会被处理Xelatex 或其他转换器)。我不能简单地使用 DXL 中的 UnicodeString
函数,因为它们破坏了富文本的其余部分,显然字符标识符 charOf(decimal_number_code)
仅适用于基本字符集,即少于一些数字代码价值。例如,charOf(8217)
应该创建一个右弯单引号,但是当我尝试按照
行编写代码时
if (charOf(8217) == one_char)
我从来没有匹配到。我确实从 DOORS 模块复制了卷曲引号,并通过在线 unicode 分析器验证它绝对是 Unicode 十进制值 8217 。
那么,我在这里缺少什么?我只想能够检测任何符号字符,正确识别它,然后在输出流中用 \textquoteright
替换它。
我的整体设置适用于较少数量的字符,因为它适用:
(c
是从字符串中提取的单个字符)
thedeg = charOf(176)
if( thedeg == c )
{
temp += "$\degree$"
}
在 IBM forums 获得了 DXL 编码专家的帮助。
引用重要内容(那里也有一些有用的代码片段):
Hey, you are right it seems intOf(char) and charOf(int) both do some
modulo 256 and therefore cut anything above that off. Try:
int i=8217;
char c = addr_(i);
print c;
然后允许将 c
与任何输入字符进行比较。
我有一个现有的 DOORS 模块,它恰好有一些富文本条目;这些条目中有一些符号,例如 'curly' 引号。我正在尝试升级导出 LaTeX 源文件的 DXL 宏,问题是 TexMaker 的导入函数不考虑这些高数字符号 "standard UTF-8" (并且在任何情况下都可能不会被处理Xelatex 或其他转换器)。我不能简单地使用 DXL 中的 UnicodeString
函数,因为它们破坏了富文本的其余部分,显然字符标识符 charOf(decimal_number_code)
仅适用于基本字符集,即少于一些数字代码价值。例如,charOf(8217)
应该创建一个右弯单引号,但是当我尝试按照
if (charOf(8217) == one_char)
我从来没有匹配到。我确实从 DOORS 模块复制了卷曲引号,并通过在线 unicode 分析器验证它绝对是 Unicode 十进制值 8217 。
那么,我在这里缺少什么?我只想能够检测任何符号字符,正确识别它,然后在输出流中用 \textquoteright
替换它。
我的整体设置适用于较少数量的字符,因为它适用:
(c
是从字符串中提取的单个字符)
thedeg = charOf(176)
if( thedeg == c )
{
temp += "$\degree$"
}
在 IBM forums 获得了 DXL 编码专家的帮助。
引用重要内容(那里也有一些有用的代码片段):
Hey, you are right it seems intOf(char) and charOf(int) both do some modulo 256 and therefore cut anything above that off. Try:
int i=8217;
char c = addr_(i);
print c;
然后允许将 c
与任何输入字符进行比较。