修复DEDECMS5.5采集功能的一些bug

相关案例演示
修复1:将开始标签和结束标签以在网页源码中第一次出现的位置为准 
修改文件\include\dedecollection.class.php 
在成员函数GetHtmlArea中的 
$posend = @strpos($html,$areaRules[1],$posstart); 
语句前增加语句: 
$posstart=$posstart+strlen($areaRules[0]); 
将: 
return substr($html,$posstart+strlen($areaRules[0]),$posend-$posstart-strlen($areaRules[0])); 
替换为: 
return substr($html,$posstart,$posend-$posstart); 
 
修复2:下载图片时对图片的扩展名判断错误 
相同文件 
将 
 
eregi("\.gif",$v) 
替换为 
eregi("\.gif$",$url) 
 
eregi("\.png",$v) 
替换为 
eregi("\.png$",$url)
 
修复3:采集软件地址的正则表达式不准确 
\include\dedecollection.func.php 
将TurnLinkTag函数中 
preg_match_all("/<a(?:.*)href=['\"](.+?)['\"]([^>]+?)>(.+?)<\/a>/is",$body,$match);
换为: 
preg_match_all("/<a(?:[^\>]+?)href\\s*=\\s*[\'\"]?([^\\s\>\"\']+)([^\>]+?)>(.+?)<\/a>/is",$body,$match);
修复4:采集图片的正则表达式不准确
相同文件
preg_match_all('/src=[\'"](.+?)[\'"]/is',$body,$match);
 $ttx = '';
 if(is_array($match[1]) && count($match[1])>0)
 {
  for($i=0;isset($match[1][$i]);$i++)
  {
   $ttx .= "{dede:img text='' }".$match[1][$i]." {/dede:img}"."\r\n";
  }
 }
改为
$patten = "/<\\s*img\\s.*?src\\s*=\\s*([\"\\'])?(?(1)(.*?)\\1|([^\\s\\>\"\\']+))/isx";
    preg_match_all( $patten, $body, $images );
    $returnArray1 = $images[2];
    $returnArray2 = $images[3];
    foreach ( $returnArray1 as $key => $value )
    {
        if ( $value )
        {
            $ttx .= "{dede:img ddimg='$litpicname' text='图 ".($key+1)."'}".$value."{/dede:img}"."\r\n";
        }
        else
        {
            $ttx .= "{dede:img ddimg='$litpicname' text='图 ".($key+1)."'}".$returnArray2[$key]."{/dede:img}"."\r\n";
        }
 

免责声明:本站所有文章和图片均来自用户分享和网络收集,文章和图片版权归原作者及原出处所有,仅供学习与参考,请勿用于商业用途,如果损害了您的权利,请联系网站客服处理。


来源:网友投稿 关注: 时间:2019-01-07 09:50
首先声明,只要是我们的vip会员所有源码均可以免费下载,不做任何限制(了解更多)
☉本站的源码不会像其它下载站一样植入大量的广告。为了更好的用户体验以后坚持不打水印
☉本站只提供精品织梦源码,源码在于可用,不在多!!希望在这里找到你合适的。
☉本站提供的整站织梦程序,均带数据及演示地址。可以在任一源码详情页查看演示地址
☉本站所有资源(包括源码、模板、素材、特效等)仅供学习与参考,请勿用于商业用途。
☉如有其他问题,请加网站客服QQ进行交流。
相关织梦教程
QQ在线咨询