下载鸥 > 网站下载 > 开发教程 > PHP

php分割中文字符源码分享与可行性分析

528 2021-05-13 22:43:56

收藏
php分割中文字符,之前计划的是可用于搜索结果、tag结果关键词标红。但在实际应用中发现存在bug,这里分享一段php分割中文字符的源码,存在的bug在文后说明。

php分割中文字符源码分享与可行性分析

php分割中文字符源码

// 中文切割
function mbStrSplit ($string, $len=1) {
    $start = 0;
    $strlen = mb_strlen($string);
    while ($strlen) {
        $array[] = mb_substr($string,$start,$len,"utf8");
        $string = mb_substr($string, $len, $strlen,"utf8");
        $strlen = mb_strlen($string);
    }
    return $array;
}
 

php分割字符在实际应用中的问题

1、下载鸥尝试了通过php分割中文字符并进行搜索结果关键词匹配标红,从中文结果来看,是成功了。但存在一个问题:如果关键词/tag存在英文字符时,会因为分割导致页面的html代码被一起分割了,最终导致存在英文字符的页面全部乱码。既然英文字符乱码,那么中文页面的alt、title属性应该是同样被截断了。因此,中文字符分割匹配从我本人目前的技术水平来看,还不可行。要做分割匹配,绕不开问题如下:
需要避开html标签
需要避开css样式
需要避开图片的alt、title属性
需要避开input等标签的placeholder、value等属性

2、如果是直接作用到列表页模板,则该方案还是可行的。参考源码如下,但在实际应用中发现对英文tag的兼容不够好,日后有时间再做优化。
$tagsplit=mbStrSplit($tagname);
foreach ($tagsplit as $key){
    if (!strpos($title, $tagname)){
      $key=strtolower($key);
      $title=str_replace($key,"<font>$key</font>",$title);
    }
    if (!strpos($smalltext, $tagname)){
      $key=strtolower($key);
      $smalltext=str_replace($key,"<font>$key</font>",$smalltext);
    }
}

3、换个角度考虑,则分词匹配的可行性要远高于字符分割匹配。

4、如果分割匹配的目的是其他的,如搜索(仅为搜索,并非标红),则源码可以考虑使用。

本文地址:https://xzo.com.cn/develop/php/948.html

有帮助,很赞!

信息来源:下载鸥
导出教程 下载word版教程
发表评论 共有条评论
关于PHP

PHP是一种服务器端、跨平台、html嵌入式的脚本语言,其功能十分强大、入门简单。在过去,民间一直有说法称“PHP是最好的编程语言”,是PHP开发者对自身所使用语言的肯定。

PHP曾是最主流的网站web开发语言之一,现在也依然十分流行。

推荐PHP开发教程
PHP判断某个时间戳(打卡、点餐、签到等)是不是今天记录的
PHP判断某个时间戳(打卡、点餐、签到等)是不是今天记录的

php判断时间戳是不是今天的实现方法:首先创建一个PHP示例文件;指定一个时间,并...

15 1199
PHP怎样正则匹配段落里的图片并提取图片链接?
PHP怎样正则匹配段落里的图片并提取图片链接?

在程序开发的过程中,我们可能需要提取段落里的图片用作缩略图。那么,这个正则...

19 1016
PHP怎样用正则判断一个链接是内链还是外链?
PHP怎样用正则判断一个链接是内链还是外链?

在日常文章的发表过程中,由于需要引入一些外部链接达到更好的效果与体验。但...

26 1386
PHP怎样高效快速地生成一组10条随机数?
PHP怎样高效快速地生成一组10条随机数?

猜你喜欢如果用rand()来获取随机ID是非常消耗性能的。小网站几百几千条数据...

1 553
php简单的数组介绍与应用
php简单的数组介绍与应用

数组在实际开发过程中运用非常频繁,通过合理运用数组,我们可以顺利实现各种数...

1 468
json数据{}转为php数组[]
json数据{}转为php数组[]

json是使用非常广泛的数据,通过使用json,我们还可以实现多种语言的联动。今天...

0 427
PHP的for循环为什么只执行了一次就停止了?
PHP的for循环为什么只执行了一次就停止了?

今天有朋友咨询鸥哥,说php写的for循环本来至少要循环9次,但却只执行了一次就...

1 514
简单的php高并发处理方案分享
简单的php高并发处理方案分享

很多互联网公司对并发要求比较高,如果完全依赖服务器性能的提升,则可能会面临...

0 486
推荐插件
帝国cms百度AI图像清晰度增强api接口对接插件
帝国cms百度AI图像清晰度增强api接口对接插件

通过本插件,可以实现帝国cms网站对接百度云api实现图像清晰度增强的功能。经...

0 621
帝国cms百度AI图像无损放大api接口对接插件
帝国cms百度AI图像无损放大api接口对接插件

通过本插件,可以实现帝国cms网站对接百度云api实现图像无损放大的功能。经过...

0 551
帝国cms百度AI黑白图像上色api接口对接插件
帝国cms百度AI黑白图像上色api接口对接插件

百度开放了系列AI功能api如图像上色、图像去雾、图像修复、无损放大、清晰...

0 527
帝国CMS内网用户静态站点文章访客统计插件
帝国CMS内网用户静态站点文章访客统计插件

本插件适用于内网用户,可查看单篇文章访问者ip地址。如果添加访问者ip组,可查...

0 665
帝国cms在线考试系统模板插件
帝国cms在线考试系统模板插件

一直没看到好用的帝国cms在线考试插件,所以自己开发了一款。在线考试插件用...

0 1423
帝国cms自动给正文关键词添加tag内链
帝国cms自动给正文关键词添加tag内链

帝国cms有自带的给关键词添加内链功能,但需要手动添加关键词,容易出现疏漏和...

0 952
帝国cms百度文字识别ocr接口对接插件
帝国cms百度文字识别ocr接口对接插件

许多网站会做一些小功能小插件给客户使用以增强用户黏性,比如图片转文字,这种...

0 558
帝国cms网站会员登录与退出历史记录日志插件
帝国cms网站会员登录与退出历史记录日志插件

帝国cms默认只有上次登录时间与ip,没有一个记录清单,所以今天,我们分享这个帝...

0 500
客服QQ:341553759
扫码咨询 常见问题 >
官方交流群:90432500
点击加入