在 NLP google API 中,“ ”.join() 解析 txt 以识别命名实体时出错
Error with ' '.join() parsing txt for named entity recognition in NLP google API
我在尝试通过 Google input_helper_v2.py 提供的脚本在 Google NLP API 中构建用于命名实体识别的数据集时遇到了困难
函数 _DownloadGcsFile 出现问题,因为它抛出此错误:
gsutil_cp_cmd = ' '.join(['gsutil', 'cp', gcs_file, local_filename])
TypeError: sequence item 2: expected str instance, bytes found
我试过 b' '.join(['gsutil', 'cp', gcs_file, local_filename])
,但它产生了类似的问题。
在查找资料时,我注意到可能是python 2.7 中开发的脚本导致的。
我将不胜感激任何帮助,因为我是一个完全的初学者。非常感谢。
嗯,这意味着 gcs_file 的类型为 bytes。所以你需要把它做成字符串(str)类型。例如:
gsutil_cp_cmd = ' '.join(['gsutil', 'cp', gcs_file.decode('utf-8'), local_filename])
我在尝试通过 Google input_helper_v2.py 提供的脚本在 Google NLP API 中构建用于命名实体识别的数据集时遇到了困难
函数 _DownloadGcsFile 出现问题,因为它抛出此错误:
gsutil_cp_cmd = ' '.join(['gsutil', 'cp', gcs_file, local_filename])
TypeError: sequence item 2: expected str instance, bytes found
我试过 b' '.join(['gsutil', 'cp', gcs_file, local_filename])
,但它产生了类似的问题。
在查找资料时,我注意到可能是python 2.7 中开发的脚本导致的。
我将不胜感激任何帮助,因为我是一个完全的初学者。非常感谢。
嗯,这意味着 gcs_file 的类型为 bytes。所以你需要把它做成字符串(str)类型。例如:
gsutil_cp_cmd = ' '.join(['gsutil', 'cp', gcs_file.decode('utf-8'), local_filename])