将大量 csv 文件(Flickr8k_text 数据集)翻译成 python 中的 'Nepali' 语言
Translating big amount of csv file (Flickr8k_text dataset) to 'Nepali' Language in python
我一直在 'Nepali Language' 的图像字幕项目中工作。对于数据集部分,我尝试将所有英文字幕文本翻译成 Flickr8k 数据集的尼泊尔语。为此,我使用 python translate
工具作为
dataset = pd.read_csv('/content/gdrive/My Drive/out.csv',delimiter = '\t')
dataset.drop('Unnamed: 0',axis = 1)
def trans(x):
translator= Translator(to_lang="ne")
return translator.translate(x)
dataset['caption'] = dataset['caption'].apply(trans)
print('done')
但它只将 130 行字幕翻译成尼泊尔语,然后所有其他文本都翻译成
我的记忆警告:您使用了今天所有可用的免费翻译。下一个在 23 小时 24 分钟 38 秒后可用访问翻译更多
有什么办法可以一次性翻译所有的文字吗??
我也尝试过 googletrans,但由于 API
上的频繁请求,它也失败了
注意:数据集包含 40458 行,标题列中包含英文句子。
如果有任何方法可以翻译所有文本,这将是一个很大的帮助,在此先感谢:)
好吧,我自己想出来了。使用 google sheet 并导入您的 csv 文件
并使用 header 命名目标语言名称的列并使用公式 =googletranslate(cell_with_text, "source_language", "target_language")
示例:=googletranslate(A2,"en","ne")
现在,从鼠标指针显示为 + 号的单元格角开始一直向下移动,您可以一次翻译一列中的所有文本。
我一直在 'Nepali Language' 的图像字幕项目中工作。对于数据集部分,我尝试将所有英文字幕文本翻译成 Flickr8k 数据集的尼泊尔语。为此,我使用 python translate
工具作为
dataset = pd.read_csv('/content/gdrive/My Drive/out.csv',delimiter = '\t')
dataset.drop('Unnamed: 0',axis = 1)
def trans(x):
translator= Translator(to_lang="ne")
return translator.translate(x)
dataset['caption'] = dataset['caption'].apply(trans)
print('done')
但它只将 130 行字幕翻译成尼泊尔语,然后所有其他文本都翻译成
我的记忆警告:您使用了今天所有可用的免费翻译。下一个在 23 小时 24 分钟 38 秒后可用访问翻译更多
有什么办法可以一次性翻译所有的文字吗??
我也尝试过 googletrans,但由于 API
上的频繁请求,它也失败了注意:数据集包含 40458 行,标题列中包含英文句子。
如果有任何方法可以翻译所有文本,这将是一个很大的帮助,在此先感谢:)
好吧,我自己想出来了。使用 google sheet 并导入您的 csv 文件
并使用 header 命名目标语言名称的列并使用公式 =googletranslate(cell_with_text, "source_language", "target_language")
示例:=googletranslate(A2,"en","ne")
现在,从鼠标指针显示为 + 号的单元格角开始一直向下移动,您可以一次翻译一列中的所有文本。