gensim 的快速文本的默认值是什么?
What are the defaults for gensim's fasttext?
我找不到任何有关 gensim fasttext 参数默认值的信息 here
或者它们是否与原始 Facebook fasttext 实施相同?
您问题中的 link https://radimrehurek.com/gensim/models/fasttext.html#gensim.models.fasttext.FastText 显示了所有默认值。在此摘录:
class gensim.models.fasttext.FastText(sentences=None, corpus_file=None,
sg=0, hs=0, size=100, alpha=0.025, window=5, min_count=5,
max_vocab_size=None, word_ngrams=1, sample=0.001, seed=1, workers=3,
min_alpha=0.0001, negative=5, ns_exponent=0.75, cbow_mean=1,
hashfxn=<built-in function hash>, iter=5, null_word=0, min_n=3,
max_n=6, sorted_vocab=1, bucket=2000000, trim_rule=None,
batch_words=10000, callbacks=(), compatible_hash=True)
那些与 Facebook 原生 FastText 对应的参数可能 应该 具有相同的默认值,但可能有些略有不同以匹配其他 gensim 类中的类似参数.因此,如果您在某些分析中指望使用相同的默认值,则应根据 Facebook 文档检查这些值。
我找不到任何有关 gensim fasttext 参数默认值的信息 here
或者它们是否与原始 Facebook fasttext 实施相同?
您问题中的 link https://radimrehurek.com/gensim/models/fasttext.html#gensim.models.fasttext.FastText 显示了所有默认值。在此摘录:
class gensim.models.fasttext.FastText(sentences=None, corpus_file=None,
sg=0, hs=0, size=100, alpha=0.025, window=5, min_count=5,
max_vocab_size=None, word_ngrams=1, sample=0.001, seed=1, workers=3,
min_alpha=0.0001, negative=5, ns_exponent=0.75, cbow_mean=1,
hashfxn=<built-in function hash>, iter=5, null_word=0, min_n=3,
max_n=6, sorted_vocab=1, bucket=2000000, trim_rule=None,
batch_words=10000, callbacks=(), compatible_hash=True)
那些与 Facebook 原生 FastText 对应的参数可能 应该 具有相同的默认值,但可能有些略有不同以匹配其他 gensim 类中的类似参数.因此,如果您在某些分析中指望使用相同的默认值,则应根据 Facebook 文档检查这些值。