需要提取的内容如下:
代码如下: <a href="http://baidu.com">http://baidu.com</a>这是第一个A标签, <a href="http://blog.baidu.com">成长脚印-专注于互联网发展</a>这是第二个A标签。 http://www.jb51.net这是第一个需要被提取的URL地址, http://blog.baidu.com这是第二个需要被提取的URL地址'。 <img border="0" alt="" src="http://baidu.com/css/sitelogo_zh-cn.gif">,这是一个IMG标签 类似微博中的自动提取URL为超链接地址。即内容提取出来添加A标签,转换成真正的超链接。网上搜索了很久,没有找到一个切实可行的解决方案。大都只是简单的提取URL(A标签和IMG标签内的地址也被提取替换了),并不能满足以上需求。正则表达式中也没发现能够实现提取时过滤掉A标签的方法。于是转换了一下思路,“曲线救国”。即,先将所有的A标签和IMG标签正则替换为某一个统一的标记,然后再提取URL地址替换为超链接,最后再将统一的标记还原替换为以前的A标签和IMG标签便解决了。 代码如下: function linkAdd($content){ //提取替换出所有A标签(统一标记<{link}>) preg_match_all('/<a.*?href=".*?".*?>.*?</a>/i',$content,$linkList); $linkList=$linkList[0]; $str=preg_replace('/<a.*?href=".*?".*?>.*?</a>/i','<{link}>',$content); //提取替换出所有的IMG标签(统一标记<{img}>) preg_match_all('/<img[^>]+>/im',$content,$imgList); $imgList=$imgList[0]; $str=preg_replace('/<img[^>]+>/im','<{img}>',$str); //提取替换标准的URL地址 $str=preg_replace('(((f|ht){1}tp://)[-a-zA-Z0-9@:%_/+.~#?&//=]+)','<a href="