获取html中的文本数据

来源:互联网 发布:淘宝联盟怎么申请推广 编辑:程序博客网 时间:2024/05/20 09:24

function GetHtmlText($str)
{
 $str = preg_replace("/<sty(.*)//style>|<scr(.*)//script>|<!--(.*)-->/isU","",$str);
  $alltext = "";
  $start = 1;
  for($i=0;$i<strlen($str);$i++){
    if($start==0 && $str[$i]==">") $start = 1;
    else if($start==1){
     if($str[$i]=="<"){ $start = 0; $alltext .= " "; }
     else if(ord($str[$i])>32) $alltext .= $str[$i];
    }
  }
  $alltext = preg_replace("/&([^;&]*)(;|&)/"," ",$alltext);
  $alltext = preg_replace("/ {1,}/"," ",$alltext);
  $alltext = preg_replace("/ {1,}/"," ",$alltext);
  return $alltext;
}