一个字符串:
<!1!>3BA9CCE141782F12482585210023E5A4<file_unid>132277778533013248NH</file_unid><file_name>3 月会议计划(下发).xlsx</file_name><Ext>.xlsx</Ext><doc_unid>4825795A000CAA9048258523001F25C6</doc_unid></!1!><!2!>3BA9CCE141782F12482585210023E5A4<file_unid>132279467934597890NT</file_unid><file_name>通知( 3 月份会议计划).sep</file_name><Ext></Ext><doc_unid>4825795A000CAA9048258523001F25C8</doc_unid></!2!><!3!>3BA9CCE141782F12482585210023E5A4<file_unid>132279468239173323NP</file_unid><file_name>通知( 3 月份会议计划).gw</file_name><Ext></Ext><doc_unid>4825795A000CAA9048258523001F25CB</doc_unid></!3!>
怎么把他转成 json 的列表形式
[{'file_unid':'132277778533013248NH','file_name':'3 月会议计划(下发).xlsx','Ext':'.xlsx','doc_unid':'4825795A000CAA9048258523001F25C6'},{'file_unid':'132279467934597890NT','file_name':'通知( 3 月份会议计划).sep','doc_unid':'4825795A000CAA9048258523001F25C8'},.....]
1 noreplay 2020-03-09 19:11:02 +08:00 via Android 先转成 XML? |
![]() | 2 festoney8 2020-03-09 19:32:21 +08:00 文本格式不规矩,先用正则把数字标签替换成单词,再按 xml 解析(比如上第三方库 xmltodict ) |
4 jasonyun OP xml 只有一个根节点 |
![]() | 5 ysc3839 2020-03-09 19:59:55 +08:00 via Android 数据比较规整,不考虑安全问题的话可以自己解析。感觉这样的数据解析起来也不难。 |
![]() | 6 qiayue PRO 先用正则替换 <!1!> 替换成 <list1> </!1!> 替换成 </list1> |
7 jasonyun OP 这个!会影响他解析成 xml |
8 jasonyun OP res=re.findall(r'<(!\d+!)>(.*?)</\1>',file_infos) for n in res: print(n[1][32:]) 通过正则,我已经把他变成了带<>的类 json 数组的形式了 |
9 jasonyun OP <file_unid>132277778533013248NH</file_unid><file_name>3 月会议计划(下发).xlsx</file_name><Ext>.xlsx</Ext><doc_unid>4825795A000CAA9048258523001F25C6</doc_unid> <file_unid>132279467934597890NT</file_unid><file_name>通知( 3 月份会议计划).sep</file_name><Ext></Ext><doc_unid>4825795A000CAA9048258523001F25C8</doc_unid> <file_unid>132279468239173323NP</file_unid><file_name>通知( 3 月份会议计划).gw</file_name><Ext></Ext><doc_unid>4825795A000CAA9048258523001F25CB</doc_unid> 这个字符串数组怎么变成 json 数组 |
10 ChoateYao 2020-03-10 11:42:38 +08:00 自己写解析器啊,难道连个解析器都不会写吗? |
11 Chenamy2017 2020-03-10 13:32:37 +08:00 这么有规律的字符串解析应当是基本操作的。 |
12 noreplay 2020-03-10 16:01:05 +08:00 其实可以把! 1 !的这种替换成 item1 这种,然后再把这段文字的前后加上<list></list>,这个就相当于一个 xml 文档了。 |