一个字符串:
<!1!>3BA9CCE141782F12482585210023E5A4<file_unid>132277778533013248NH</file_unid><file_name>3 月会议计划(下发).xlsx</file_name><Ext>.xlsx</Ext><doc_unid>4825795A000CAA9048258523001F25C6</doc_unid></!1!><!2!>3BA9CCE141782F12482585210023E5A4<file_unid>132279467934597890NT</file_unid><file_name>通知( 3 月份会议计划).sep</file_name><Ext></Ext><doc_unid>4825795A000CAA9048258523001F25C8</doc_unid></!2!><!3!>3BA9CCE141782F12482585210023E5A4<file_unid>132279468239173323NP</file_unid><file_name>通知( 3 月份会议计划).gw</file_name><Ext></Ext><doc_unid>4825795A000CAA9048258523001F25CB</doc_unid></!3!>
怎么把他转成 json 的列表形式
[{'file_unid':'132277778533013248NH','file_name':'3 月会议计划(下发).xlsx','Ext':'.xlsx','doc_unid':'4825795A000CAA9048258523001F25C6'},{'file_unid':'132279467934597890NT','file_name':'通知( 3 月份会议计划).sep','doc_unid':'4825795A000CAA9048258523001F25C8'},.....]
1
noreplay 2020-03-09 19:11:02 +08:00 via Android
先转成 XML?
|
2
festoney8 2020-03-09 19:32:21 +08:00
文本格式不规矩,先用正则把数字标签替换成单词,再按 xml 解析(比如上第三方库 xmltodict )
|
4
jasonyun OP xml 只有一个根节点
|
5
ysc3839 2020-03-09 19:59:55 +08:00 via Android
数据比较规整,不考虑安全问题的话可以自己解析。感觉这样的数据解析起来也不难。
|
6
qiayue 2020-03-09 20:09:30 +08:00
先用正则替换
<!1!> 替换成 <list1> </!1!> 替换成 </list1> |
7
jasonyun OP 这个!会影响他解析成 xml
|
8
jasonyun OP res=re.findall(r'<(!\d+!)>(.*?)</\1>',file_infos)
for n in res: print(n[1][32:]) 通过正则,我已经把他变成了带<>的类 json 数组的形式了 |
9
jasonyun OP <file_unid>132277778533013248NH</file_unid><file_name>3 月会议计划(下发).xlsx</file_name><Ext>.xlsx</Ext><doc_unid>4825795A000CAA9048258523001F25C6</doc_unid>
<file_unid>132279467934597890NT</file_unid><file_name>通知( 3 月份会议计划).sep</file_name><Ext></Ext><doc_unid>4825795A000CAA9048258523001F25C8</doc_unid> <file_unid>132279468239173323NP</file_unid><file_name>通知( 3 月份会议计划).gw</file_name><Ext></Ext><doc_unid>4825795A000CAA9048258523001F25CB</doc_unid> 这个字符串数组怎么变成 json 数组 |
10
ChoateYao 2020-03-10 11:42:38 +08:00
自己写解析器啊,难道连个解析器都不会写吗?
|
11
Chenamy2017 2020-03-10 13:32:37 +08:00
这么有规律的字符串解析应当是基本操作的。
|
12
noreplay 2020-03-10 16:01:05 +08:00
其实可以把! 1 !的这种替换成 item1 这种,然后再把这段文字的前后加上<list></list>,这个就相当于一个 xml 文档了。
|