function getSummary(string $string): string {
// 把一些预定义的 HTML 实体转换为字符
// 预定义字符是指:<,>,&等有特殊含义(<,>,用于链接签,&用于转义),不能直接使用
$content = htmlspecialchars_decode($string);
//去除 <video></video>
$content = preg_replace('/<video([^>]+)>(?:(?!<\/video>)[\s\S])*<\/video>/', '', $content);
//去除<img />
$content = preg_replace('/<img(.*?)src=\"(.*?)\"(.*?)>/', '', $content);
//去除 <ol> <ul>
$content = preg_replace('/<ol>(?:(?!<\/ol>)[\s\S])*<\/ol>\n/', '', $content);
$content = preg_replace('/<ul>(?:(?!<\/ul>)[\s\S])*<\/ul>\n/', '', $content);
//去除空 <p></p> 空标签
$content = preg_replace('/<p([^>]*)><\/p>(\n)*/', '', $content);
//</p> 后增加 \n
$content = preg_replace('/<\/p>/', "</p>\n", $content);
$content = preg_replace('/<br \/>/', "<br />\n", $content);
// 去除字符串中的 HTML 标签
$content = strip_tags($content);
$contents = explode("\n", $content);
foreach ($contents as $item) {
if ($item) {
return $item;
}
}
return '';
}
可能根据需求不一样会有调整,我们这里通过编辑器生成的html 包含图片,视频,表格。并且所有文字一定包含在标签中。
|