如果去除采集内容里的链接和广告
一般我们采集规则写好后,比较郁闷的就是内容里的链接了,因为我不想看到内容里有别人网站的链接,当然更不用说广告了。这里需要说明的是,下面的方式只可以替换掉一些规则或者相对规则的链接和广告,只要那些比较变态的网站在内容里加很多随机文字的,那就没办法了。
过滤广告最简单的方式是在“过滤广告正则”的输入框里输入相应的正则,4.7以前的没有带,4.7以后的系统带的有,下面是个比较全些的广告过滤正则:
<a[!--ad--]>,</a>,<A[!--ad--]>,</A>,<div[!--ad--]>,</div>,<DIV[!--ad--]>,</DIV>,<iframe[!--ad--]</iframe>,<IFRAME[!--ad--]</IFRAME>
基本上已经够了。
如果过滤内容里的链接呢?这里可以在 过滤选项 的 替换:(针对标题与内容) 里输入正则,多个用逗号分开,但是不要在这里写<a[!--ad--]>,</a>,<A[!--ad--]>,</A>,这样的正则,因为这样你会采不到页面,呵呵,它把你采集的页面都给过滤了。
免责声明:本站所有文章和图片均来自用户分享和网络收集,文章和图片版权归原作者及原出处所有,仅供学习与参考,请勿用于商业用途,如果损害了您的权利,请联系网站客服处理。
帝国CMS7.0对商城系统的功能进行了大更新,功能更完善2019-02-16
帝国cms内容页灵动标签调用当前栏目多篇文章并且排除2019-02-23
帝国CMS技巧:如何添加自定义字段和引用2019-02-14
帝国cms实现首页用灵动标签调用文章内容的方法2019-02-15
帝国CMS7.5版视频播放器更新,做视频站更方便2019-02-23
帝国cms如何导入模板2019-02-13
在帝国cms列表页调用内容页内容字段newstext2019-02-19
帝国cms栏目导航调用之SQL语句调用一级栏目和二级栏目2019-02-23
帝国CMS商城系统在线支付后,订单邮件提醒2019-02-15
帝国CMS整站源码通用安装教程2019-10-11