
如何写一个正则表达式匹配这个网页中的歌词:小幸运 我试写了几次没能写正确.
1 knightdf Jul 22, 2016 用 xpath 把。。 |
2 Hello1995 Jul 22, 2016 via Android 找到 api ,直接用? |
3 yexiaoxing Jul 22, 2016 r'(?:<div class="lrc_main">)((.|\n)*)(?:<\/div>)' 或者……抓 class lrc_main 的内容嘛 |
5 protream OP @yexiaoxing 这个有问题. 我试了用 beautifulsoup 抓 lrc_main 的内容, 但是有问题, 你可以试试 |
6 9hills Jul 22, 2016 用 https://regex101.com/ 之类的网站 debug 吧 |
7 yexiaoxing Jul 22, 2016 @protream 问题是啥? |
8 protream OP @yexiaoxing ``` lyric = soup.find('div', class_='lrc_main') ``` 结果如下: <div class="lrc_main"> 让我能做回我自己我勇气<br/>幸运<br/> <br/>在青青草地<br/> </div> 用的是 html.parser, 貌似有 bug. |
9 chairuosen Jul 22, 2016 就不应该用正则,试试 pyquery |
11 zhouxuchen Jul 22, 2016 via iPhone pyquery+1 |