V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
sunhk25
V2EX  ›  问与答

正则表达式,如何一个一个替换括号外的内容

  •  
  •   sunhk25 · 2017-05-19 15:44:52 +08:00 · 2210 次点击
    这是一个创建于 2780 天前的主题,其中的信息可能已经有所发展或是发生改变。
    替换前:AA[BCD]EEE[FF]GH
    替换后:-A-A[BCD]-E-E-E[FF]-G-H
    我写了一个"([^\[\]]+(?=\[[^\[\]]+\])|[^\[\]]+$)",替换后的结果是"-AA[BCD]-EEE[FF]-GH"
    就不知道如何修改了
    8 条回复    2017-05-22 08:50:20 +08:00
    geelaw
        1
    geelaw  
       2017-05-19 16:30:01 +08:00 via iPhone   ❤️ 1
    定义一下“括号外”

    比如 A[B[C]D]E]F[G]H
    sunhk25
        2
    sunhk25  
    OP
       2017-05-19 16:38:23 +08:00
    @geelaw 我的情况是没有多层括号,就像例子一样是单层的,'[]'算一对
    whahuzhihao
        3
    whahuzhihao  
       2017-05-19 17:01:42 +08:00   ❤️ 1
    需要找一个零宽度的位置来替换,这个位置满足:
    1. 右侧必须是非括号
    2. 右侧之后不能有右括号
    用 PHP 实现如下

    echo preg_replace('/(?=[^\[\]])(?![^\[\]]*\])/','-','AA[BCD]EEE[FF]GH ');
    whahuzhihao
        4
    whahuzhihao  
       2017-05-19 17:02:54 +08:00   ❤️ 2
    @whahuzhihao
    上面多了一个空格 应该是
    echo preg_replace('/(?=[^\[\]])(?![^\[\]]*\])/','-','AA[BCD]EEE[FF]GH');
    sunhk25
        5
    sunhk25  
    OP
       2017-05-19 17:06:56 +08:00
    @whahuzhihao 正好匹配 谢谢
    airycanon
        6
    airycanon  
       2017-05-19 17:35:59 +08:00
    @whahuzhihao 原来零宽度可以这样用,学习了。
    geelaw
        7
    geelaw  
       2017-05-19 17:44:02 +08:00   ❤️ 1
    一个更简单的方法:

    (.(\[.*?\])+|.) 替换为 -$1

    因为优先匹配竖线左边的情况,所以会把形如 x[y...z]...[a...b] 的拿出来变成 -x[y...z]...[a...b]。
    但如果一个字符 x 后面紧接着不是 [,那么只能匹配到 x 本身,拿出来变成 -x。

    又因为查找不重叠,所以当括号深度不超过 1 且正确配对的时候这个表达式实现正确功能,且该过程是线性的。

    用前面提到的零宽度查询法通常的实现会是平方速度的,考虑 [x...x],括号里面每个位置是否匹配需要线性时间,通常的引擎无法利用“后面有 ]”的知识更快解决问题。
    sunhk25
        8
    sunhk25  
    OP
       2017-05-22 08:50:20 +08:00
    @geelaw 学习
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2120 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 24ms · UTC 01:21 · PVG 09:21 · LAX 17:21 · JFK 20:21
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.