Speech API OneCore 中 Sayaka 的声音在哪里?
Where is the Sayaka voice in Speech API OneCore?
Windows 10.我在设置里面安装了日语TTS语音。现在,当我在 Speech API 5.4 OneCore 中使用语音枚举时(虽然不是在 5.4 中),我得到 6 个语音:
- 大卫
- 齐拉
- 亚由美
- 遥
- 马克
- 一郎
语音设置页面也显示了这 6 个。但注册表中显然还有第七个,Sayaka (HKLM\SOFTWARE\WOW6432Node\Microsoft\Speech_OneCore\Voices\Tokens\MSTTS_V110_jaJP_SayakaM
)。它的文件位于 C:\windows\Speech_OneCore\Engines\TTS\ja-JP
下。与其他文件相比,有一个额外的文件,.heq
。为什么不枚举?
枚举代码如下:
#import "libid:E6DA930B-BBA5-44DF-AC6F-FE60C1EDDEC8" rename_namespace("SAPI") //v5.4 OneCore
HRESULT hr;
SAPI::ISpVoicePtr v;
v.CreateInstance(__uuidof(SAPI::SpVoice));
SAPI::ISpObjectTokenPtr tok;
hr = v->GetVoice(&tok); //Retrieve the default voice
SAPI::ISpObjectTokenCategoryPtr cat;
hr = tok->GetCategory(&cat); //Retrieve the voices category
SAPI::IEnumSpObjectTokensPtr toks;
hr = cat->EnumTokens(0, 0, &toks);
//And enumerate
unsigned long i, n;
hr = toks->GetCount(&n);
LPWSTR ws;
for (i = 0; i < n; i++)
{
hr = toks->Item(i, &tok);
hr = tok->GetId(&ws);
CoTaskMemFree(ws);
}
我能在网上找到的唯一提到 Sayaka 的是 here
编辑
通过 Reset()/Next() 枚举给出相同的 6。尝试直接在注册表路径周围创建令牌会给出错误 0x8004503a (SPERR_NOT_FOUND
)。 在使用 Process Monitor 观察的同时这样做揭示了一个有趣的事实:进程询问以下键而不是 HKLM 下的 Sayaka,:
HKCU\Software\Microsoft\Speech_OneCore\IsolatedWUiMB20NMV5Y7TgZ2WJXbUw32iGZQSvSkeaf0AevtQ\HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Speech_OneCore\Voices\Tokens\MSTTS_V110_jaJP_SayakaM
在 HKCU 下确实有一个像这样的键,它包含 SAPI 的 HKLM 和 HKCU 设置的副本,并且在那个键中的声音下确实没有 Sayaka。只是我提到的六个。
因此存在某种隔离,在多个副本中使用 SAPI 设置。 Isolated
下面有7个不同的子键,下面的语音集是不同的。其中两个包含与我们所知道的毫无共同之处的声音,而这些声音与 Cortana 有关。很难说隔离的单位是什么 - 可能是用户,也可能是应用程序包(在 UWP 意义上)。
编辑
正如我所怀疑的,正在进行基于应用程序包的隔离。我用相同的代码 运行 创建了一个 b运行d 新项目,并获得了不同的隔离密钥 - F2yLLxINh6S1e3y3MkJo4ilfh036RB_9pHLEVL88yL0
。看起来每次你 运行 启用 SAPI 的应用程序时,它都会从当前可执行文件中派生一个隔离配置文件。片刻之前,该隔离配置文件不存在,现在存在。所以它是由 SAPI 即时创建的。我不认为声音是硬编码的,所以它从主列表的某个地方复制了隔离配置文件中的声音。
总表在哪里?不是HKLM\...\Speech_OneCore
,因为可以看到Sayaka在那里。它可能是 C:\Windows\SysWOW64\Speech_OneCore\Common\ja-JP
下的 tokens_TTS_ja-JP.xml
,因为那里列出了 Ayumi/Ichiro/Haruka,但 Sayaka 没有。虽然该文件的安全性非常严格,但即使具有管理员权限,我也无法编辑该文件。此外,它是 C:\Windows\WinSxS\wow64_microsoft-windows-t..peech-ja-jp-onecore_31bf3856ad364e35_10.0.18362.1_none_46741f8a666da90a
.
的第二个硬链接
SysWOW64\Speech_OneCore
文件夹允许管理员写入,但 SysWOW64\Speech_OneCore\Common
不允许。只有 TrustedInstaller 可以写入。
顺便说一句,隔离逻辑是OneCore特有的。 SetId()
in SAPI 5.4 正确查找与提供的 Id
.
相匹配的密钥
替代方法:SAPI 5.4 文档提到了 ISpRegDataKey 接口,它允许直接从 HKEY 初始化令牌。虽然它不在类型库中。
这个答案是关于为那些没有明确选择加入的 SAPI 应用程序启用 Sayaka 的。
日语TTS语音总表在C:\Windows\System32\Speech_OneCore\Common\ja-JP
下。它不仅仅是一个文件——SAPI 枚举了那里的所有 XML。问题是,为了将文件写入该文件夹,需要一个实用程序,让 运行 程序成为 TrustedInstaller
。那些存在;有一个列表 here. I've used the one called PowerRun.
您需要创建一个名为 tokens_TTS_ja-JP_Sayaka.xml
的文件(具体名称并不重要),内容如下:
<?xml version="1.0" encoding="utf-8"?>
<Tokens>
<Category name="Voices" categoryBase="HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Speech_OneCore">
<Token name="MSTTS_V110_jaJP_SayakaM">
<String name="" value="Microsoft Sayaka - Japanese (Japan)" />
<String name="LangDataPath" value="%windir%\Speech_OneCore\Engines\TTS\ja-JP\MSTTSLocjaJP.dat" />
<String name="VoicePath" value="%windir%\Speech_OneCore\Engines\TTS\ja-JP\M1041Sayaka" />
<String name="411" value="Microsoft Sayaka - Japanese (Japan)" />
<String name="CLSID" value="{179F3D56-1B0B-42B2-A962-59B7EF59FE1B}" />
<Attribute name="Version" value="11.0" />
<Attribute name="Language" value="411" />
<Attribute name="Gender" value="Female" />
<Attribute name="Age" value="Adult" />
<Attribute name="DataVersion" value="11.0.2016.0221" />
<Attribute name="SharedPronunciation" value="" />
<Attribute name="Name" value="Microsoft Sayaka" />
<Attribute name="Vendor" value="Microsoft" />
<Attribute name="SayAsSupport" value="spell=NativeSupported; cardinal=GlobalSupported; ordinal=NativeSupported; date=GlobalSupported; time=GlobalSupported; telephone=NativeSupported; address=NativeSupported; message=NativeSupported; url=NativeSupported; currency=NativeSupported; alphanumeric=NativeSupported" />
<Attribute name="SampleText" value="既定の音声として%1を選びました" />
</Token>
</Category>
</Tokens>
然后将该文件作为TrustedInstaller
复制到C:\Windows\System32\Speech_OneCore\Common\ja-JP
。在 64 位 Windows 上,也将副本放入 C:\Windows\SysWOW64\Speech_OneCore\Common\ja-JP
以涵盖 32 位应用程序。
然后所有桌面 SAPI 应用程序也将获得 Sayaka,即使是那些目前已经具有独立设置密钥的应用程序。如有必要,SAPI 似乎会刷新主列表中的隔离设置。
Sayaka 也会出现在 Settings/Speech 下的语音列表中,并在被问到时说出她的问候语。
如果隔离注册表项没有 Sayaka,但 HKLM 有,应用程序可以将 Sayaka 令牌复制到第一个 运行 上的隔离键。此处的关键见解是 隔离密钥无需提升即可写入,并且 SAPI 支持创建和填充令牌。这不依赖于隔离的细节。为 Sayaka 创建一个带有硬编码 ID 的令牌,并从 HKLM 复制属性和特性。像这样:
#import "libid:E6DA930B-BBA5-44DF-AC6F-FE60C1EDDEC8" rename_namespace("SAPI") //v5.4 OneCore
//Get the default voice to avoid hard-coding the category
SAPI::ISpVoicePtr v;
SAPI::ISpObjectTokenPtr tok;
v.CreateInstance(__uuidof(SAPI::SpVoice));
v->GetVoice(&tok);
LPWSTR ws;
tok->GetId(&ws);
wchar_t TokID[200];
wcscpy_s(TokID, ws);
CoTaskMemFree(ws);
//Check if Sayaka is already registered in SAPI
SAPI::ISpObjectTokenCategoryPtr cat;
tok->GetCategory(&cat); //The category of voices
SAPI::IEnumSpObjectTokensPtr toks;
cat->EnumTokens(L"name=Microsoft Sayaka", 0, &toks);
unsigned long n;
toks->GetCount(&n);
if (n == 0) //Sayaka is not registered already
{
//Is Sayaka present under HKLM\..\Voices\Tokens?
HKEY hkSayaka, hkAttrs;
if (RegOpenKeyEx(HKEY_LOCAL_MACHINE, L"SOFTWARE\Microsoft\Speech_OneCore\Voices\Tokens\MSTTS_V110_jaJP_SayakaM", 0, KEY_READ, &hkSayaka) == ERROR_SUCCESS)
{
if (RegOpenKeyEx(hkSayaka, L"Attributes", 0, KEY_READ, &hkAttrs) == ERROR_SUCCESS)
{
//If yes, create a Sayaka token where SAPI OneCore thinks it should be!
//Replace the final path component of the default voice's ID with Sayaka
LPWSTR pbs = wcsrchr(TokID, L'\');
wcscpy_s(pbs + 1, _countof(TokID) - (pbs - TokID) - 1, L"MSTTS_V110_jaJP_SayakaM");
tok.CreateInstance(__uuidof(SAPI::SpObjectToken));
//Note the 1 in the third parameter - "create if needed"
HRESULT hr = tok->SetId(0, (LPWSTR)TokID, 1);
DWORD dwi;
wchar_t ValName[100]; //Enough
unsigned char ValData[1000]; //Enough
DWORD ValNameLen, ValDataLen, Type;
//Copy all values from the Sayaka key
//They are all strings
for (dwi = 0; RegEnumValue(hkSayaka, dwi, ValName, &(ValNameLen = _countof(ValName)), 0, &Type, ValData, &(ValDataLen = sizeof(ValData))) == ERROR_SUCCESS; dwi++)
tok->SetStringValue(ValName, (LPWSTR)ValData);
//Copy all attributes from the Sayaka\Attributes key
//All strings too.
SAPI::ISpDataKeyPtr attrs;
tok->CreateKey((LPWSTR)L"Attributes", &attrs);
for (dwi = 0; RegEnumValue(hkAttrs, dwi, ValName, &(ValNameLen = _countof(ValName)), 0, &Type, ValData, &(ValDataLen = sizeof(ValData))) == ERROR_SUCCESS; dwi++)
attrs->SetStringValue(ValName, (LPWSTR)ValData);
RegCloseKey(hkAttrs);
}
RegCloseKey(hkSayaka);
}
}
这里描述了一种暴露隐藏的 TTS 语音的类似方法:https://www.ghacks.net/2018/08/11/unlock-all-windows-10-tts-voices-system-wide-to-get-more-of-them/
由于我最初的问题仅限于一个支持 TTS 的应用程序,我将接受这个答案而不是另一个。也就是说,没有邀请 Sayaka 参加聚会的整个问题可能是微软的疏忽,他们最终应该解决这个问题。欢迎投票 my Feedback Hub request。 Windows 仅限 10 个用户。
Windows 10.我在设置里面安装了日语TTS语音。现在,当我在 Speech API 5.4 OneCore 中使用语音枚举时(虽然不是在 5.4 中),我得到 6 个语音:
- 大卫
- 齐拉
- 亚由美
- 遥
- 马克
- 一郎
语音设置页面也显示了这 6 个。但注册表中显然还有第七个,Sayaka (HKLM\SOFTWARE\WOW6432Node\Microsoft\Speech_OneCore\Voices\Tokens\MSTTS_V110_jaJP_SayakaM
)。它的文件位于 C:\windows\Speech_OneCore\Engines\TTS\ja-JP
下。与其他文件相比,有一个额外的文件,.heq
。为什么不枚举?
枚举代码如下:
#import "libid:E6DA930B-BBA5-44DF-AC6F-FE60C1EDDEC8" rename_namespace("SAPI") //v5.4 OneCore
HRESULT hr;
SAPI::ISpVoicePtr v;
v.CreateInstance(__uuidof(SAPI::SpVoice));
SAPI::ISpObjectTokenPtr tok;
hr = v->GetVoice(&tok); //Retrieve the default voice
SAPI::ISpObjectTokenCategoryPtr cat;
hr = tok->GetCategory(&cat); //Retrieve the voices category
SAPI::IEnumSpObjectTokensPtr toks;
hr = cat->EnumTokens(0, 0, &toks);
//And enumerate
unsigned long i, n;
hr = toks->GetCount(&n);
LPWSTR ws;
for (i = 0; i < n; i++)
{
hr = toks->Item(i, &tok);
hr = tok->GetId(&ws);
CoTaskMemFree(ws);
}
我能在网上找到的唯一提到 Sayaka 的是 here
编辑
通过 Reset()/Next() 枚举给出相同的 6。尝试直接在注册表路径周围创建令牌会给出错误 0x8004503a (SPERR_NOT_FOUND
)。 在使用 Process Monitor 观察的同时这样做揭示了一个有趣的事实:进程询问以下键而不是 HKLM 下的 Sayaka,:
HKCU\Software\Microsoft\Speech_OneCore\IsolatedWUiMB20NMV5Y7TgZ2WJXbUw32iGZQSvSkeaf0AevtQ\HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Speech_OneCore\Voices\Tokens\MSTTS_V110_jaJP_SayakaM
在 HKCU 下确实有一个像这样的键,它包含 SAPI 的 HKLM 和 HKCU 设置的副本,并且在那个键中的声音下确实没有 Sayaka。只是我提到的六个。
因此存在某种隔离,在多个副本中使用 SAPI 设置。 Isolated
下面有7个不同的子键,下面的语音集是不同的。其中两个包含与我们所知道的毫无共同之处的声音,而这些声音与 Cortana 有关。很难说隔离的单位是什么 - 可能是用户,也可能是应用程序包(在 UWP 意义上)。
编辑
正如我所怀疑的,正在进行基于应用程序包的隔离。我用相同的代码 运行 创建了一个 b运行d 新项目,并获得了不同的隔离密钥 - F2yLLxINh6S1e3y3MkJo4ilfh036RB_9pHLEVL88yL0
。看起来每次你 运行 启用 SAPI 的应用程序时,它都会从当前可执行文件中派生一个隔离配置文件。片刻之前,该隔离配置文件不存在,现在存在。所以它是由 SAPI 即时创建的。我不认为声音是硬编码的,所以它从主列表的某个地方复制了隔离配置文件中的声音。
总表在哪里?不是HKLM\...\Speech_OneCore
,因为可以看到Sayaka在那里。它可能是 C:\Windows\SysWOW64\Speech_OneCore\Common\ja-JP
下的 tokens_TTS_ja-JP.xml
,因为那里列出了 Ayumi/Ichiro/Haruka,但 Sayaka 没有。虽然该文件的安全性非常严格,但即使具有管理员权限,我也无法编辑该文件。此外,它是 C:\Windows\WinSxS\wow64_microsoft-windows-t..peech-ja-jp-onecore_31bf3856ad364e35_10.0.18362.1_none_46741f8a666da90a
.
SysWOW64\Speech_OneCore
文件夹允许管理员写入,但 SysWOW64\Speech_OneCore\Common
不允许。只有 TrustedInstaller 可以写入。
顺便说一句,隔离逻辑是OneCore特有的。 SetId()
in SAPI 5.4 正确查找与提供的 Id
.
替代方法:SAPI 5.4 文档提到了 ISpRegDataKey 接口,它允许直接从 HKEY 初始化令牌。虽然它不在类型库中。
这个答案是关于为那些没有明确选择加入的 SAPI 应用程序启用 Sayaka 的。
日语TTS语音总表在C:\Windows\System32\Speech_OneCore\Common\ja-JP
下。它不仅仅是一个文件——SAPI 枚举了那里的所有 XML。问题是,为了将文件写入该文件夹,需要一个实用程序,让 运行 程序成为 TrustedInstaller
。那些存在;有一个列表 here. I've used the one called PowerRun.
您需要创建一个名为 tokens_TTS_ja-JP_Sayaka.xml
的文件(具体名称并不重要),内容如下:
<?xml version="1.0" encoding="utf-8"?>
<Tokens>
<Category name="Voices" categoryBase="HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Speech_OneCore">
<Token name="MSTTS_V110_jaJP_SayakaM">
<String name="" value="Microsoft Sayaka - Japanese (Japan)" />
<String name="LangDataPath" value="%windir%\Speech_OneCore\Engines\TTS\ja-JP\MSTTSLocjaJP.dat" />
<String name="VoicePath" value="%windir%\Speech_OneCore\Engines\TTS\ja-JP\M1041Sayaka" />
<String name="411" value="Microsoft Sayaka - Japanese (Japan)" />
<String name="CLSID" value="{179F3D56-1B0B-42B2-A962-59B7EF59FE1B}" />
<Attribute name="Version" value="11.0" />
<Attribute name="Language" value="411" />
<Attribute name="Gender" value="Female" />
<Attribute name="Age" value="Adult" />
<Attribute name="DataVersion" value="11.0.2016.0221" />
<Attribute name="SharedPronunciation" value="" />
<Attribute name="Name" value="Microsoft Sayaka" />
<Attribute name="Vendor" value="Microsoft" />
<Attribute name="SayAsSupport" value="spell=NativeSupported; cardinal=GlobalSupported; ordinal=NativeSupported; date=GlobalSupported; time=GlobalSupported; telephone=NativeSupported; address=NativeSupported; message=NativeSupported; url=NativeSupported; currency=NativeSupported; alphanumeric=NativeSupported" />
<Attribute name="SampleText" value="既定の音声として%1を選びました" />
</Token>
</Category>
</Tokens>
然后将该文件作为TrustedInstaller
复制到C:\Windows\System32\Speech_OneCore\Common\ja-JP
。在 64 位 Windows 上,也将副本放入 C:\Windows\SysWOW64\Speech_OneCore\Common\ja-JP
以涵盖 32 位应用程序。
然后所有桌面 SAPI 应用程序也将获得 Sayaka,即使是那些目前已经具有独立设置密钥的应用程序。如有必要,SAPI 似乎会刷新主列表中的隔离设置。
Sayaka 也会出现在 Settings/Speech 下的语音列表中,并在被问到时说出她的问候语。
如果隔离注册表项没有 Sayaka,但 HKLM 有,应用程序可以将 Sayaka 令牌复制到第一个 运行 上的隔离键。此处的关键见解是 隔离密钥无需提升即可写入,并且 SAPI 支持创建和填充令牌。这不依赖于隔离的细节。为 Sayaka 创建一个带有硬编码 ID 的令牌,并从 HKLM 复制属性和特性。像这样:
#import "libid:E6DA930B-BBA5-44DF-AC6F-FE60C1EDDEC8" rename_namespace("SAPI") //v5.4 OneCore
//Get the default voice to avoid hard-coding the category
SAPI::ISpVoicePtr v;
SAPI::ISpObjectTokenPtr tok;
v.CreateInstance(__uuidof(SAPI::SpVoice));
v->GetVoice(&tok);
LPWSTR ws;
tok->GetId(&ws);
wchar_t TokID[200];
wcscpy_s(TokID, ws);
CoTaskMemFree(ws);
//Check if Sayaka is already registered in SAPI
SAPI::ISpObjectTokenCategoryPtr cat;
tok->GetCategory(&cat); //The category of voices
SAPI::IEnumSpObjectTokensPtr toks;
cat->EnumTokens(L"name=Microsoft Sayaka", 0, &toks);
unsigned long n;
toks->GetCount(&n);
if (n == 0) //Sayaka is not registered already
{
//Is Sayaka present under HKLM\..\Voices\Tokens?
HKEY hkSayaka, hkAttrs;
if (RegOpenKeyEx(HKEY_LOCAL_MACHINE, L"SOFTWARE\Microsoft\Speech_OneCore\Voices\Tokens\MSTTS_V110_jaJP_SayakaM", 0, KEY_READ, &hkSayaka) == ERROR_SUCCESS)
{
if (RegOpenKeyEx(hkSayaka, L"Attributes", 0, KEY_READ, &hkAttrs) == ERROR_SUCCESS)
{
//If yes, create a Sayaka token where SAPI OneCore thinks it should be!
//Replace the final path component of the default voice's ID with Sayaka
LPWSTR pbs = wcsrchr(TokID, L'\');
wcscpy_s(pbs + 1, _countof(TokID) - (pbs - TokID) - 1, L"MSTTS_V110_jaJP_SayakaM");
tok.CreateInstance(__uuidof(SAPI::SpObjectToken));
//Note the 1 in the third parameter - "create if needed"
HRESULT hr = tok->SetId(0, (LPWSTR)TokID, 1);
DWORD dwi;
wchar_t ValName[100]; //Enough
unsigned char ValData[1000]; //Enough
DWORD ValNameLen, ValDataLen, Type;
//Copy all values from the Sayaka key
//They are all strings
for (dwi = 0; RegEnumValue(hkSayaka, dwi, ValName, &(ValNameLen = _countof(ValName)), 0, &Type, ValData, &(ValDataLen = sizeof(ValData))) == ERROR_SUCCESS; dwi++)
tok->SetStringValue(ValName, (LPWSTR)ValData);
//Copy all attributes from the Sayaka\Attributes key
//All strings too.
SAPI::ISpDataKeyPtr attrs;
tok->CreateKey((LPWSTR)L"Attributes", &attrs);
for (dwi = 0; RegEnumValue(hkAttrs, dwi, ValName, &(ValNameLen = _countof(ValName)), 0, &Type, ValData, &(ValDataLen = sizeof(ValData))) == ERROR_SUCCESS; dwi++)
attrs->SetStringValue(ValName, (LPWSTR)ValData);
RegCloseKey(hkAttrs);
}
RegCloseKey(hkSayaka);
}
}
这里描述了一种暴露隐藏的 TTS 语音的类似方法:https://www.ghacks.net/2018/08/11/unlock-all-windows-10-tts-voices-system-wide-to-get-more-of-them/
由于我最初的问题仅限于一个支持 TTS 的应用程序,我将接受这个答案而不是另一个。也就是说,没有邀请 Sayaka 参加聚会的整个问题可能是微软的疏忽,他们最终应该解决这个问题。欢迎投票 my Feedback Hub request。 Windows 仅限 10 个用户。