从 C++ std::string& 获取 unichar * 以在 Objective-C++ 中创建一个非空 NSString

Get unichar * from a C++ std::string& to create a nonnull NSString in Objective-C++

我有一些 Objective-C++ 包装了现有的 C++ 库。 C++ 库偶尔会给我 std::string& 参数,我想将其转换为 nonnull NSStrings。几乎所有 NSString 初始值设定项 return nullable NSString 除了:-initWithCharactersNoCopy:length:freeWhenDone:-initWithCharacters:length:。但是,这两个都需要 unichar *,但是 std::string.c_str() returns char *

如何从 C++ std::string 中获取 unichar * 以便创建 NSString * _Nonnull

不是重复的

Other questions simply want to convert from std::string to NSString. I want to know if it's possible to do so without producing a null NSString *, possibly by calling methods on std::string to get unichar *. std::wstring_convert 看起来很有前途,但我不是 C++ 开发人员,所以我还不知道如何开始。

可能的解决方案

进一步研究后,我了解到std::string只是一个std::basic_string<char>,似乎您可以定义自己的std::basic_string。我找到了 similar example that converts to std::wstring:

// std::string -> std::wstring
std::string s("string");
std::wstring ws;
ws.assign(s.begin(), s.end());

所以我将其改编为 std::basic_string<unichar>,并且编译正常:

void Foo(const std::string& bar) {
  std::basic_string<unichar> barUnichar;
  barUnichar.assign(bar.begin(),
                    bar.end());
  NSString * _Nonnull barNSString = 
  [NSString stringWithCharacters:barUnichar.c_str() 
                          length:barUnichar.length()];
  NSLog(@"bar: %@", bar);
}

我不介意从 std::string 转换为 std::basic_string<unichar> 执行不必要的复制,我想我可以更改上面的代码以使用 -[NSString initWithCharactersNoCopy:length:freeWhenDone:] 一旦我了解更多关于C++ 内存所有权规则。

可能的解决方案不好

Joe Groff says on twitter:

That's going to do a byte-by-byte mapping. It may work for ASCII but will give you garbage for any Unicode.

我们再试一次,看看对你有没有帮助。您已根据重复的建议编辑了问题并添加了:

Other questions simply want to convert from std::string to NSString. I want to know if it's possible to do so without producing a null NSString *...

直接回答:否

原因很简单:Objective-C 库不能假定传递给它的任何指针都引用有效编码的 C 字符串,即使该指针是 std::string.

现在您可能非常有信心您的 C++ 代码永远不会向您传递无效编码的字符串 – 可以说这种信心是合理的(但毕竟是 C++ ;-)) – 所以相信null 结果永远不会发生,但这不会改变 Objective-C 库不能假设它不会发生的事实。

DIY答案:是

试图避免空值,例如通过尝试将 std::string 转换为 unichar * 等,正如您所考虑的那样,只是避免了这个问题 - 某处的某些代码必须处理检查编码或风险 returning编码无效 NSString.

虽然可以做到这一点,但与 DIY 方法相比,它会更加复杂,并且可能会让您不知道 return 为无效编码编辑了什么:只需处理 null return 你自己在源代码中并用其他东西替换它。例如:

std::string someCstring;

NSString *convertedString = @(someCstring.c_str()) ?: @"ERROR: C string is invalid UTF8";

这里convertedString永远不会是nil

(如果您的 C 字符串不是 UTF8,您将需要使用另一个采用编码的 NSString 初始化程序。)

HTH