目前用的这个正则 <[a|A][^<>]href=\"([^\"]+)\"[^<>]>([^<>]+)<\/[a|A]>
可以匹配出诸如
<a href="url1.html">text1</a>
<a href="url1.html" target="_blank">text1</a>
<a class="c1" href="url1.html">text1</a>
目前发现在获取text的时候 有以下问题
如果是
<a href="url.html"><span>链接1</span></a>
就没办法获取了
请大侠帮忙解决下
或者有没有比较通用的提取链接的正则 目前在用python 不过正则应该没太大区别吧
可以匹配出诸如
<a href="url1.html">text1</a>
<a href="url1.html" target="_blank">text1</a>
<a class="c1" href="url1.html">text1</a>
目前发现在获取text的时候 有以下问题
如果是
<a href="url.html"><span>链接1</span></a>
就没办法获取了
请大侠帮忙解决下
或者有没有比较通用的提取链接的正则 目前在用python 不过正则应该没太大区别吧