如何分析非结构化文本?
How can I analyze a nonstructured text?
我使用 TF-IDF 来影响权重,这可以帮助我构建字典。但我的模型还不够好,因为我有非结构化文本。
对TF-IDF类似算法有什么建议吗?
当你说你的模型不够好时,是否意味着你生成的字典不够好?使用TF-IDF权重提取关键术语和构建字典实际上是特征select离子步骤。
要为您的模型提取或 select 特征,您可以遵循其他方法,如主成分分析、潜在语义分析等。机器学习中的许多其他特征 selection 技术可能很有用太!
但我坚信对于情感分类任务,TF-IDF 应该是构建字典的一种很好的方法。我宁愿建议您在训练模型时调整模型参数,而不是责怪特征 selection 方法。
还有许多适用于您的目标任务的深度学习技术。
我使用 TF-IDF 来影响权重,这可以帮助我构建字典。但我的模型还不够好,因为我有非结构化文本。
对TF-IDF类似算法有什么建议吗?
当你说你的模型不够好时,是否意味着你生成的字典不够好?使用TF-IDF权重提取关键术语和构建字典实际上是特征select离子步骤。
要为您的模型提取或 select 特征,您可以遵循其他方法,如主成分分析、潜在语义分析等。机器学习中的许多其他特征 selection 技术可能很有用太!
但我坚信对于情感分类任务,TF-IDF 应该是构建字典的一种很好的方法。我宁愿建议您在训练模型时调整模型参数,而不是责怪特征 selection 方法。
还有许多适用于您的目标任务的深度学习技术。