Notepad++ - 如果条件为真,如何替换 1 个字符
Notepad++ - how to replace 1 character if a condition is true
我正在 Notepad++ 上修正一些字幕(.srt 文件)。
我要解决的问题:有些词组(字幕)有一个'.' (端点)在行尾,但短语继续到下一个字幕(向下几行,在带有字幕索引的行和带有时间码的行之后)。
我想做的事情:如果下一个字幕(下面几行)以小写字符开头,我想删除一行的端点[a-z]
示例:
我要转这个:
124
01:09:01,200 --> 01:09:02,800
卢克,我是。
125
01:09:02,800 --> 01:09:04,900
你爸爸。
变成这样:
124
01:09:01,200 --> 01:09:02,800
卢克,我是
125
01:09:02,800 --> 01:09:04,900
你爸爸。
到目前为止我得到了什么: 我可以使用此 REGEX 代码找到我要删除的端点:
查找:
(\.)+(\n\n[0-9][0-9][0-9]\r\n[0-9][0-9]:[0-9][0-9]:[0-9][0-9],[0-9][0-9][0-9] --> [0-9][0-9]:[0-9][0-9]:[0-9][0-9],[0-9][0-9][0-9]\r\n[a-z])
但是我不明白我应该在 'Replace' 字段中输入什么。
我只想替换端点 (.)
如果这是一个 'dumb' 问题,请原谅,我正在为一个弱者尝试,但我无法弄清楚,我是正则表达式的新手。
感谢您的帮助。
编辑:
如果将替换字段留空,它会删除所有这些:
.
字幕索引 (125)
字幕时间码 (01:09:02,800 --> 01:09:04,900)
- Ctrl+H
- 查找内容:
\.(?=\R\R[\d:,\s\->]+?\R[a-z])
- 替换为:
LEAVE EMPTY
- 检查 匹配大小写
- 检查 环绕
- 检查 正则表达式
- 全部替换
解释:
\. # a dot
(?= # lookahead, make sure we have after:
\R\R # 2 any kind of linebreak
[\d:,\s\->]+? # 1 or more digit, colon, comma, space, hyphen, greater than
\R # any kind of linebreak
[a-z] # a lowercase letter
)
屏幕截图(之前):
截图(后):
不确定为什么我面前有 3 个已删除的答案,但这样做就可以了:
\.(?=[\r\n]+\d+[\r\n]+\d\d:\d\d:\d\d,\d+ --> \d\d:\d\d:\d\d,\d+[\r\n]+[a-z])
使用正则表达式 \.(?=\R+\d+\R+.*?\R+[a-z])
并选中“匹配大小写”、“环绕”和“正则表达式”并将替换文本留空。
\.
匹配终点
(?=<expression>)
是向前看。也就是说,它必须匹配但不是搜索结果的一部分,因此不会被替换。
\R+
匹配行尾字符(至少一个)。
\d+
是个数。
.*?
是任意数量的任意字符,但越少越好。这代表时间范围,但不会吞下以下模式(因为 ?
)。
[a-z]
匹配小写字母。
我正在 Notepad++ 上修正一些字幕(.srt 文件)。
我要解决的问题:有些词组(字幕)有一个'.' (端点)在行尾,但短语继续到下一个字幕(向下几行,在带有字幕索引的行和带有时间码的行之后)。
我想做的事情:如果下一个字幕(下面几行)以小写字符开头,我想删除一行的端点[a-z]
示例:
我要转这个:
124
01:09:01,200 --> 01:09:02,800
卢克,我是。
125
01:09:02,800 --> 01:09:04,900
你爸爸。
变成这样:
124
01:09:01,200 --> 01:09:02,800
卢克,我是
125
01:09:02,800 --> 01:09:04,900
你爸爸。
到目前为止我得到了什么: 我可以使用此 REGEX 代码找到我要删除的端点:
查找:
(\.)+(\n\n[0-9][0-9][0-9]\r\n[0-9][0-9]:[0-9][0-9]:[0-9][0-9],[0-9][0-9][0-9] --> [0-9][0-9]:[0-9][0-9]:[0-9][0-9],[0-9][0-9][0-9]\r\n[a-z])
但是我不明白我应该在 'Replace' 字段中输入什么。 我只想替换端点 (.)
如果这是一个 'dumb' 问题,请原谅,我正在为一个弱者尝试,但我无法弄清楚,我是正则表达式的新手。 感谢您的帮助。
编辑: 如果将替换字段留空,它会删除所有这些: . 字幕索引 (125) 字幕时间码 (01:09:02,800 --> 01:09:04,900)
- Ctrl+H
- 查找内容:
\.(?=\R\R[\d:,\s\->]+?\R[a-z])
- 替换为:
LEAVE EMPTY
- 检查 匹配大小写
- 检查 环绕
- 检查 正则表达式
- 全部替换
解释:
\. # a dot
(?= # lookahead, make sure we have after:
\R\R # 2 any kind of linebreak
[\d:,\s\->]+? # 1 or more digit, colon, comma, space, hyphen, greater than
\R # any kind of linebreak
[a-z] # a lowercase letter
)
屏幕截图(之前):
截图(后):
不确定为什么我面前有 3 个已删除的答案,但这样做就可以了:
\.(?=[\r\n]+\d+[\r\n]+\d\d:\d\d:\d\d,\d+ --> \d\d:\d\d:\d\d,\d+[\r\n]+[a-z])
使用正则表达式 \.(?=\R+\d+\R+.*?\R+[a-z])
并选中“匹配大小写”、“环绕”和“正则表达式”并将替换文本留空。
\.
匹配终点(?=<expression>)
是向前看。也就是说,它必须匹配但不是搜索结果的一部分,因此不会被替换。\R+
匹配行尾字符(至少一个)。\d+
是个数。.*?
是任意数量的任意字符,但越少越好。这代表时间范围,但不会吞下以下模式(因为?
)。
[a-z]
匹配小写字母。