您现在的位置: 万盛学电脑网 >> 程序编程 >> 网络编程 >> php编程 >> 正文

php 将 HTML 转换成文本

作者:佚名    责任编辑:admin    更新时间:2022-06-22

 

<?php
// $document 应包含一个 HTML 文档。

// 本例将去掉 HTML 标记,javascript 代码

// 和空白字符。还会将一些通用的

// HTML 实体转换成相应的文本。


$search = array ("'<script[^>]*?>.*?</script>'si", // 去掉 javascript
                 "'<[/!]*?[^<>]*?>'si", // 去掉 HTML 标记
                 "'([rn])[s]+'", // 去掉空白字符
                 "'&(quot|#34);'i", // 替换 HTML 实体
                 "'&(amp|#38);'i",
                 "'&(lt|#60);'i",
                 "'&(gt|#62);'i",
                 "'&(nbsp|#160);'i",
                 "'&(iexcl|#161);'i",
                 "'&(cent|#162);'i",
                 "'&(pound|#163);'i",
                 "'&(copy|#169);'i",
                 "'&#(d+);'e"); // 作为 PHP 代码运行

$replace = array ("",
                  "",
                  "1",
                  """,
                  "&",
                  "<",
                  ">",
                  " ",
                   chr(161),
                   chr(162),
                   chr(163),
                   chr(169),
                  "chr(1)");

$text = preg_replace ($search, $replace, $document);
?>