用 python 搜索/替换 html 个文件中的文本

search /replace text in html files with python

我正在尝试使用以下代码搜索和替换多个 html 文件中的文本,它适用于 .txt,不适用于 html 转换为 .txt。 是utf-16的问题吗?我怎样才能让它发挥作用?

import os
directory ="/Users/sinanatra/PYTHON_STUFF/MSN/0/"

replacement = "test"
for dname, dirs, files in os.walk(directory):
    for fname in files:
        fpath = os.path.join(dname, fname)
        with open(fpath) as f:
            s = f.read()
        s = s.replace("head", replacement)
        with open(fpath, "w") as f:
            f.write(s)                

如果你使用 utf-16 那么你需要

s.read().decode('utf-16') 并且对于写入,您将需要:

f.write(s.encode('utf16'))