1
ljbha007 2013-04-24 10:27:34 +08:00
百分号呢
|
2
ljbha007 2013-04-24 10:27:50 +08:00
还有@呢?
|
4
rrfeng 2013-04-24 10:37:09 +08:00
枚举出来,写进[]里。
|
5
ljbha007 2013-04-24 10:39:33 +08:00
/([\[\]\,.?"\(\)+_*\/\\&\$#^@!~`]|(?!\s)'\s+|\s+'(?!\s)|(?!\s)"\s+|\s+"(?!\s))/
用javascript测试成功 |
6
ljbha007 2013-04-24 10:42:30 +08:00 1
|
7
lfocy 2013-04-24 10:55:30 +08:00
/\b[^'-]\b/gmi
|
10
xhj OP |
12
lululau 2013-04-24 11:12:53 +08:00
CJK 标点的 Unicode 代码范围: 0x3000 ~ 0x303F ,不知能是否符合所谓“中文标点”的需求。。。
|
13
rrfeng 2013-04-24 11:16:19 +08:00
|
14
lululau 2013-04-24 11:17:45 +08:00
perl -e 'print pack("c*", 0x30, $_) for (0 .. 0x3F); print "\x00\n"' | iconv -f UTF-16BE
其实需要你的需求方先给出所谓“中文标点符号”的定义 |
15
lululau 2013-04-24 11:21:55 +08:00
发现还些标点符号不在 0x3000 ~ 0x303F 这个区域。。。
比如还有:0xFF00 ~ 0xFF61。。。 |
17
xhj OP |
18
rrfeng 2013-04-24 11:56:49 +08:00
|