* Xml.php
class Xml
{
public static function fixImg($s) {
$enterImg = false;
$ns = "";
for ($i = 0; isset($s[$i]); $i++) {
if ($s[$i] == '<' && $s[$i+1]=='i' && $s[$i+2]=='m' && $s[$i+3] == 'g') {
$enterImg = true;
$i += 3;
}
if ($enterImg && $s[$i] == '>') {
$enterImg = false;
if ($s[$i-1] != '/') {
$ns .= '/';
}
}
$ns .= $s[$i];
}
return $ns;
}
/**
* @param $s string
* @param $tags array
* @author mzh@shall-buy.com
* @date 2021-08-25 9:17 AM
*/
public static function fixCloseTags($s, $tags) {
$ns = "";
$enterTagMap = array();
foreach ($tags as $tag) {
$enterTagMap[$tag] = false;
}
for ($i = 0; isset($s[$i]); $i++) {
if ($s[$i] == '<') {
foreach ($tags as $tag) {
for ($j = 0; isset($tag[$j]); $j++) {
if ($s[$i + 1 + $j] != $tag[$j]) {
break;
}
}
if (!isset($tag[$j])) {
$enterTagMap[$tag] = true;
}
}
}
foreach ($enterTagMap as $tag => $b) {
if ($b && $s[$i] == '>') {
$enterTagMap[$tag] = false;
if ($s[$i-1] != '/') {
$ns .= '/';
}
}
}
$ns .= $s[$i];
}
return $ns;
}
}
https://php.net/manual/en/function.simplexml-load-string.php
* index.php
$content = <<<EOF
<p>很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长<a href="https://www.cnblogs.com/hdwang/p/4875678.html" rel="noopener noreferrer" target="_blank">链接</a>scaschttps://www.cnblogs.com/hdwang/p/4875678.html</p><img src="http://article-qiniu.shall-buy.com/article-other-20210712173735366066.jpg" image-src="http://article-qiniu.shall-buy.com/article-other-20210712173735366066.jpg" width="100%"><p><br></p><video class="ql-video" src="http://article-qiniu.shall-buy.com/article-other-20210714174137247867.mp4" video-src="http://article-qiniu.shall-buy.com/article-other-20210714174137247867.mp4" width="100%" controls="controls"></video><p><br></p><audio src="http://article-qiniu.shall-buy.com/article-other-20210713134439589170.mp3" audio-src="http://article-qiniu.shall-buy.com/article-other-20210713134439589170.mp3" controls="true" style="display:block;margin:0 auto"></audio><video class="ql-video" src="http://article-qiniu.shall-buy.com/article-other-20210713134451176754.mp4" video-src="http://article-qiniu.shall-buy.com/article-other-20210713134451176754.mp4" width="100%" controls="controls"></video><p><br></p><p>很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长很长</p>;
EOF;
$content = Xml::fixCloseTags($content, ["img", "br"]);
// load the XML string defined above
// $content = preg_replace("/<img .*>/", "<img ".${1}."\/>", $content);
$xml = sprintf("<?xml version=\"1.0\" encoding=\"UTF-8\"?><div>%s</div>", $content);
/** @var $dom \SimpleXMSimpleXMLElementLElement */
$dom = simplexml_load_string($xml);
if (false == $dom) {
throw new \InvalidArgumentException("Invalid xml: ".$xml);
}
$elements = array('text' => array(), 'img' => array(), 'audio' => array(), 'video' => array());
foreach ($dom as $tag => $attr) {
/** @var $attr \SimpleXMLElement */
if ($tag == 'img') {
array_push($elements['img'], $attr['src']->__toString());
} elseif ($tag == 'audio') {
array_push($elements['audio'], $attr['src']->__toString());
} elseif ($tag == 'video') {
array_push($elements['video'], $attr['src']->__toString());
} else {
$txt = \strip_tags($attr);
if (!empty($txt)) {
array_push($elements['text'], $txt);
}
}
}
var_dump($elements);
simplexml
|