如何使用 OpenFST python 扩展从 fst 模型获取输入符号?
How to get input symbols from a fst model using the OpenFST python extension?
OpenFST 提供了一个python extension。是否可以使用 API?
从已编译的 FST 模型中读取输入符号 (isyms)
我找不到正确的 属性 或方法:
>>> import fst
>>> f = fst.Fst('/home/jan/Downloads/en_us_nostress/model.fst')
>>> dir(f)
['__class__', '__delattr__', '__doc__', '__format__',
'__getattribute__', '__hash__', '__init__', '__new__', '__reduce__',
'__reduce_ex__', '__repr__', '__setattr__', '__sizeof__', '__str__',
'__subclasshook__', '_arc_type', '_check_mutating_imethod',
'_fst_type', '_weight_type', 'arcsort', 'closure', 'concat',
'connect', 'decode', 'encode', 'invert', 'minimize', 'project',
'properties', 'prune', 'push', 'relabel', 'reweight', 'rmepsilon',
'topsort', 'union', 'verify', 'write']
>>> dir(fst)
['ACCEPTOR','ACCESSIBLE', 'ACYCLIC', 'ADD_ARC_PROPERTIES',
'ADD_STATE_PROPERTIES', 'ADD_SUPERFINAL_PROPERTIES',
'ARC_SORT_PROPERTIES', 'BINARY_PROPERTIES', 'COACCESSIBLE',
'COPY_PROPERTIES', 'CYCLIC', 'DELETE_ARC_PROPERTIES',
'DELETE_STATE_PROPERTIES', 'EPSILONS', 'ERROR', 'EXPANDED',
'EXTRINSIC_PROPERTIES', 'FST_PROPERTIES', 'Fst',
'FstError', 'FstWarning', 'INITIAL_ACYCLIC', 'INITIAL_CYCLIC',
'INTRINSIC_PROPERTIES', 'I_DETERMINISTIC', 'I_EPSILONS',
'I_LABEL_INVARIANT_PROPERTIES', 'I_LABEL_SORTED', 'MUTABLE',
'NEG_TRINARY_PROPERTIES', 'NON_I_DETERMINISTIC',
'NON_O_DETERMINISTIC', 'NOT_ACCEPTOR', 'NOT_ACCESSIBLE',
'NOT_COACCESSIBLE', 'NOT_I_LABEL_SORTED', 'NOT_O_LABEL_SORTED',
'NOT_STRING', 'NOT_TOP_SORTED', 'NO_EPSILONS', 'NO_I_EPSILONS',
'NO_O_EPSILSONS', 'NULL_PROPERTIES', 'O_DETERMINISTIC', 'O_EPSILONS',
'O_LABEL_INVARIANT_PROPERTIES', 'O_LABEL_SORTED',
'POS_TRINARY_PROPERTIES', 'RM_SUPERFINAL_PROPERTIES',
'SET_ARC_PROPERTIES', 'SET_FINAL_PROPERTIES', 'SET_START_PROPERTIES',
'STATE_SORT_PROPERTIES', 'STRING', 'TOP_SORTED',
'TRINARY_PROPERTIES', 'UNWEIGHTED', 'WEIGHTED',
'WEIGHT_INVARIANT_PROPERTIES', 'Weight', '_Fst', '_MutableFst',
'__builtins__', '__doc__', '__file__', '__name__', '__package__',
'__pyx_capi__', '__test__', '_fst_error_fatal_old',
'_get_compose_filter', '_get_queue_type', '_get_rand_arc_selection',
'_get_replace_label_type', 'arcmap', 'compose', 'convert',
'determinize', 'difference', 'disambiguate', 'epsnormalize',
'equal', 'equivalent', 'intersect', 'isomorphic', 'prune', 'push', 'randequivalent', 'randgen', 'replace', 'reverse', 'rmepsilon',
'shortestdistance', 'shortestpath', 'synchronize']
我怀疑您使用的是 OpenFST 1.5.0 版,其中该功能不可用。我相信这是在 1.5.1 左右的版本中添加的。
http://www.openfst.org/twiki/bin/view/News/FstNews
我正在使用 1.5.3 并且能够使用 input_symbols
和 output_symbols
访问符号表。
>>> dir(fst._Fst)
['__class__', '__delattr__', '__doc__', '__format__',
'__getattribute__', '__hash__', '__init__', '__new__',
'__pyx_vtable__', '__reduce__', '__reduce_ex__', '__repr__',
'__setattr__', '__sizeof__', '__str__', '__subclasshook__',
'_repr_svg_', 'arc_type', 'arcs', 'copy', 'draw', 'final',
'fst_type', 'input_symbols', 'num_arcs', 'num_input_epsilons',
'num_output_epsilons', 'output_symbols', 'properties', 'start',
'states', 'text', 'verify', 'weight_type', 'write']
此处 http://www.openfst.org/twiki/bin/view/FST/PythonExtension "FST object attributes and properties"
下提供了更多信息
在 OpenFST 1.7.6 中,可以提取输入和输出符号 tables 作为 FSTPRINT 的一个选项。这是该命令的帮助选项的编辑版本。 FST 文件将打印到屏幕,但您会在指定的文件中找到符号 table(s)。
更新: 为避免冗长的屏幕打印,只需将 FSTPRINT 的输出发送到临时文件,例如 "junk.txt",您可以在保存符号 [ 时将其删除=27=] 文件。请参阅代码部分末尾添加的示例。
fstprint --help
Prints out binary FSTs in simple text format.
Usage: c:\OpenFST\fstprint.exe [binary.fst [text.fst]]
Flags Description:
.
.
.
.
--save_isymbols: type = string, default = ""
Save input symbol table to file
--save_osymbols: type = string, default = ""
Save output symbol table to file
.
.
.
Powershell 命令提示符下 Windows10 的使用示例:
fstprint --save_osymbols=HCLout.sym HCL.fst junk.txt
HCLout.sym将是HCL.fst的输出符号table,junk.txt将是二进制fst的简单文本格式的内容,您可以将其删除。
OpenFST 提供了一个python extension。是否可以使用 API?
从已编译的 FST 模型中读取输入符号 (isyms)我找不到正确的 属性 或方法:
>>> import fst
>>> f = fst.Fst('/home/jan/Downloads/en_us_nostress/model.fst')
>>> dir(f)
['__class__', '__delattr__', '__doc__', '__format__',
'__getattribute__', '__hash__', '__init__', '__new__', '__reduce__',
'__reduce_ex__', '__repr__', '__setattr__', '__sizeof__', '__str__',
'__subclasshook__', '_arc_type', '_check_mutating_imethod',
'_fst_type', '_weight_type', 'arcsort', 'closure', 'concat',
'connect', 'decode', 'encode', 'invert', 'minimize', 'project',
'properties', 'prune', 'push', 'relabel', 'reweight', 'rmepsilon',
'topsort', 'union', 'verify', 'write']
>>> dir(fst)
['ACCEPTOR','ACCESSIBLE', 'ACYCLIC', 'ADD_ARC_PROPERTIES',
'ADD_STATE_PROPERTIES', 'ADD_SUPERFINAL_PROPERTIES',
'ARC_SORT_PROPERTIES', 'BINARY_PROPERTIES', 'COACCESSIBLE',
'COPY_PROPERTIES', 'CYCLIC', 'DELETE_ARC_PROPERTIES',
'DELETE_STATE_PROPERTIES', 'EPSILONS', 'ERROR', 'EXPANDED',
'EXTRINSIC_PROPERTIES', 'FST_PROPERTIES', 'Fst',
'FstError', 'FstWarning', 'INITIAL_ACYCLIC', 'INITIAL_CYCLIC',
'INTRINSIC_PROPERTIES', 'I_DETERMINISTIC', 'I_EPSILONS',
'I_LABEL_INVARIANT_PROPERTIES', 'I_LABEL_SORTED', 'MUTABLE',
'NEG_TRINARY_PROPERTIES', 'NON_I_DETERMINISTIC',
'NON_O_DETERMINISTIC', 'NOT_ACCEPTOR', 'NOT_ACCESSIBLE',
'NOT_COACCESSIBLE', 'NOT_I_LABEL_SORTED', 'NOT_O_LABEL_SORTED',
'NOT_STRING', 'NOT_TOP_SORTED', 'NO_EPSILONS', 'NO_I_EPSILONS',
'NO_O_EPSILSONS', 'NULL_PROPERTIES', 'O_DETERMINISTIC', 'O_EPSILONS',
'O_LABEL_INVARIANT_PROPERTIES', 'O_LABEL_SORTED',
'POS_TRINARY_PROPERTIES', 'RM_SUPERFINAL_PROPERTIES',
'SET_ARC_PROPERTIES', 'SET_FINAL_PROPERTIES', 'SET_START_PROPERTIES',
'STATE_SORT_PROPERTIES', 'STRING', 'TOP_SORTED',
'TRINARY_PROPERTIES', 'UNWEIGHTED', 'WEIGHTED',
'WEIGHT_INVARIANT_PROPERTIES', 'Weight', '_Fst', '_MutableFst',
'__builtins__', '__doc__', '__file__', '__name__', '__package__',
'__pyx_capi__', '__test__', '_fst_error_fatal_old',
'_get_compose_filter', '_get_queue_type', '_get_rand_arc_selection',
'_get_replace_label_type', 'arcmap', 'compose', 'convert',
'determinize', 'difference', 'disambiguate', 'epsnormalize',
'equal', 'equivalent', 'intersect', 'isomorphic', 'prune', 'push', 'randequivalent', 'randgen', 'replace', 'reverse', 'rmepsilon',
'shortestdistance', 'shortestpath', 'synchronize']
我怀疑您使用的是 OpenFST 1.5.0 版,其中该功能不可用。我相信这是在 1.5.1 左右的版本中添加的。 http://www.openfst.org/twiki/bin/view/News/FstNews
我正在使用 1.5.3 并且能够使用 input_symbols
和 output_symbols
访问符号表。
>>> dir(fst._Fst)
['__class__', '__delattr__', '__doc__', '__format__',
'__getattribute__', '__hash__', '__init__', '__new__',
'__pyx_vtable__', '__reduce__', '__reduce_ex__', '__repr__',
'__setattr__', '__sizeof__', '__str__', '__subclasshook__',
'_repr_svg_', 'arc_type', 'arcs', 'copy', 'draw', 'final',
'fst_type', 'input_symbols', 'num_arcs', 'num_input_epsilons',
'num_output_epsilons', 'output_symbols', 'properties', 'start',
'states', 'text', 'verify', 'weight_type', 'write']
此处 http://www.openfst.org/twiki/bin/view/FST/PythonExtension "FST object attributes and properties"
下提供了更多信息在 OpenFST 1.7.6 中,可以提取输入和输出符号 tables 作为 FSTPRINT 的一个选项。这是该命令的帮助选项的编辑版本。 FST 文件将打印到屏幕,但您会在指定的文件中找到符号 table(s)。
更新: 为避免冗长的屏幕打印,只需将 FSTPRINT 的输出发送到临时文件,例如 "junk.txt",您可以在保存符号 [ 时将其删除=27=] 文件。请参阅代码部分末尾添加的示例。
fstprint --help
Prints out binary FSTs in simple text format.
Usage: c:\OpenFST\fstprint.exe [binary.fst [text.fst]]
Flags Description:
.
.
.
.
--save_isymbols: type = string, default = ""
Save input symbol table to file
--save_osymbols: type = string, default = ""
Save output symbol table to file
.
.
.
Powershell 命令提示符下 Windows10 的使用示例:
fstprint --save_osymbols=HCLout.sym HCL.fst junk.txt
HCLout.sym将是HCL.fst的输出符号table,junk.txt将是二进制fst的简单文本格式的内容,您可以将其删除。