下载鸥 > 网站下载 > 开发教程 > PHP

php分割中文字符源码分享与可行性分析

349 2021-05-13 22:43:56

收藏
php分割中文字符源码分享与可行性分析
php分割中文字符,之前计划的是可用于搜索结果、tag结果关键词标红。但在实际应用中发现存在bug,这里分享一段php分割中文字符的源码,存在的bug在文后说明。

php分割中文字符源码分享与可行性分析

php分割中文字符源码

// 中文切割
function mbStrSplit ($string, $len=1) {
    $start = 0;
    $strlen = mb_strlen($string);
    while ($strlen) {
        $array[] = mb_substr($string,$start,$len,"utf8");
        $string = mb_substr($string, $len, $strlen,"utf8");
        $strlen = mb_strlen($string);
    }
    return $array;
}
 

php分割字符在实际应用中的问题

1、下载鸥尝试了通过php分割中文字符并进行搜索结果关键词匹配标红,从中文结果来看,是成功了。但存在一个问题:如果关键词/tag存在英文字符时,会因为分割导致页面的html代码被一起分割了,最终导致存在英文字符的页面全部乱码。既然英文字符乱码,那么中文页面的alt、title属性应该是同样被截断了。因此,中文字符分割匹配从我本人目前的技术水平来看,还不可行。要做分割匹配,绕不开问题如下:
需要避开html标签
需要避开css样式
需要避开图片的alt、title属性
需要避开input等标签的placeholder、value等属性

2、如果是直接作用到列表页模板,则该方案还是可行的。参考源码如下,但在实际应用中发现对英文tag的兼容不够好,日后有时间再做优化。
$tagsplit=mbStrSplit($tagname);
foreach ($tagsplit as $key){
    if (!strpos($title, $tagname)){
      $key=strtolower($key);
      $title=str_replace($key,"<font>$key</font>",$title);
    }
    if (!strpos($smalltext, $tagname)){
      $key=strtolower($key);
      $smalltext=str_replace($key,"<font>$key</font>",$smalltext);
    }
}

3、换个角度考虑,则分词匹配的可行性要远高于字符分割匹配。

4、如果分割匹配的目的是其他的,如搜索(仅为搜索,并非标红),则源码可以考虑使用。

本文地址:https://xzo.com.cn/develop/php/948.html

有帮助,很赞!

信息来源:下载鸥
导出教程 下载word版教程
发表评论 共有条评论
关于PHP

PHP是一种服务器端、跨平台、html嵌入式的脚本语言,其功能十分强大、入门简单。在过去,民间一直有说法称“PHP是最好的编程语言”,是PHP开发者对自身所使用语言的肯定。

PHP曾是最主流的网站web开发语言之一,现在也依然十分流行。

推荐PHP开发教程
PHP正则提取字符串中的数字组成数组
PHP正则提取字符串中的数字组成数组

在实际操作过程中,我们可能需要通过PHP正则提取字符串中的数字,并组成数组。...

13 1330
PHP怎样高效快速地生成一组10条随机数?
PHP怎样高效快速地生成一组10条随机数?

猜你喜欢如果用rand()来获取随机ID是非常消耗性能的。小网站几百几千条数据...

1 398
PHP排序函数sort、asort、rsort、krsort、ksort区别与用法详解
PHP排序函数sort、asort、rsort、krsort、ksort区别与用法详解

在php中自带了大量了数组排序函数,使用起来非常简单,下面我们一一来介绍一下...

3 389
当缓存文件大于4KB,不能用cookie时的替代方案就是session
当缓存文件大于4KB,不能用cookie时的替代方案就是session

鸥哥最近在开发一个项目,出于对用户隐私的保护,数据一概不能存储到数据表,而是...

1 377
怎样在每次发起请求时重置session_id?
怎样在每次发起请求时重置session_id?

在一些开发场景中,我们需要在每次发起请求后更新重置session_id以同步用户数...

3 340
php基础应用:获取今天是星期几并给变量赋值
php基础应用:获取今天是星期几并给变量赋值

在网站的开发过程中,我们经常需要获取今天是星期几,并根据星期的不同而进行不...

0 341
什么是高并发,与CPU,内存,分布式有什么关系
什么是高并发,与CPU,内存,分布式有什么关系

我们在网站开发的过程中经常会接触到高并发这个概念,但高并发到底是什么,具体...

1 324
简单的php高并发处理方案分享
简单的php高并发处理方案分享

很多互联网公司对并发要求比较高,如果完全依赖服务器性能的提升,则可能会面临...

0 339
推荐插件
帝国cms联想词搜索高级搜索插件下载
帝国cms联想词搜索高级搜索插件下载

帝国CMS自带的搜索功能虽然强大,但也有很强的局限性 -- 必须关键词完全匹配...

0 630
帝国CMS内网用户静态站点文章访客统计插件
帝国CMS内网用户静态站点文章访客统计插件

本插件适用于内网用户,可查看单篇文章访问者ip地址。如果添加访问者ip组,可查...

0 459
帝国cms百度AI图像清晰度增强api接口对接插件
帝国cms百度AI图像清晰度增强api接口对接插件

通过本插件,可以实现帝国cms网站对接百度云api实现图像清晰度增强的功能。经...

0 417
帝国cms多栏目多数据表自动审核推送插件
帝国cms多栏目多数据表自动审核推送插件

本插件基于帝国cms帝国cms每日自动审核插件,在自动审核指定条数信息的基础上...

0 799
帝国cms批量添加后台用户插件
帝国cms批量添加后台用户插件

使用帝国cms的企业用户、新闻资讯类站点的用户很多,此类站点很多时候需要有...

0 594
帝国cms智能自动审核按星期几审核指定栏目带推送插件
帝国cms智能自动审核按星期几审核指定栏目带推送插件

采集站的必备资源是自动审核,要做到日收录也离不开定时发布。而本插件的自动...

0 1147
帝国cms访问统计ip地址链接与封禁插件下载
帝国cms访问统计ip地址链接与封禁插件下载

下载鸥开发了这款帝国cms封禁ip插件,自动记录访问情况,让我们可以更快的识别...

0 892
帝国cms自动生成文章新闻目录插件下载
帝国cms自动生成文章新闻目录插件下载

用户体验是我们的需求,百度蜘蛛的认可更是我们的需求。毕竟,没有收录排名,何来...

0 983
客服QQ:341553759
扫码咨询 常见问题 >
官方交流群:90432500
点击加入