
1 yangqi 2013 年 9 月 25 日 php正则还是最方便了,这个放在前段用jquery很容易就提取了 |
3 emric 2013 年 9 月 25 日 Don't try to parse HTML using regex. Find an HTML parser please. |
4 kojp 2013 年 9 月 25 日 via Android A class named snopy Have a try. |
6 PrideChung 2013 年 9 月 26 日 对于HTML这么复杂的文本正则处理不来的,找个HTML parser才是正道。 |
7 pantaovay 2013 年 9 月 26 日 正则处理不来,用DOM操作吧 |
8 jacy OP 谢谢,我试试simplehtml。 |
9 mescoda 2013 年 9 月 26 日 PHP 用 simplehtmldom Python 用 [pywebquery](https://github.com/NStal/pywebquery) Node 用 [jwebquery](https://github.com/NStal/jwebquery) |
11 foru17 2013 年 9 月 26 日 我记得正则好像是行的。你搜一下 google 搜索结果 正则,参考一下,之前弄过一个类似的。 |
12 faceair 2013 年 9 月 26 日 <div class=\"content\">([\s\S]+?(<div[\s\S]+?<\/div>)+?[\s\S]+?)<\/div> 手机写的,你测试下,主要是确定中间的div是一对一对就可以了 |
13 liuyao729 2013 年 9 月 26 日 试试phpQuery |
14 faceair 2013 年 9 月 26 日 修改了下,测试貌似通过了 <div class=\"content\">([\s\S]+?(<div[\s\S]+?<\/div>)*?[\s\S]+?)*?<\/div> |
15 alexrezit 2013 年 9 月 26 日 不 要 用 正 则. 找 个 parser 用 XPath 很 难 么? |
16 cxshun 2013 年 9 月 26 日 其实xpath不是更方便么,直接//div[class='content']/*这个就OK啦。正则解析HTML是没办法的选择。 |
17 jiych 2013 年 9 月 26 日 可以用flex |
18 openclaw 2013 年 9 月 26 日 前端方便 |
19 marchtea 2013 年 9 月 26 日 用simple_html_dom来读取,再处理吧.直接弄貌似不是很好弄 |