下载鸥 > 网站下载 > 开发教程 > PHP

php分割中文字符源码分享与可行性分析

518 2021-05-13 22:43:56

收藏
php分割中文字符,之前计划的是可用于搜索结果、tag结果关键词标红。但在实际应用中发现存在bug,这里分享一段php分割中文字符的源码,存在的bug在文后说明。

php分割中文字符源码分享与可行性分析

php分割中文字符源码

// 中文切割
function mbStrSplit ($string, $len=1) {
    $start = 0;
    $strlen = mb_strlen($string);
    while ($strlen) {
        $array[] = mb_substr($string,$start,$len,"utf8");
        $string = mb_substr($string, $len, $strlen,"utf8");
        $strlen = mb_strlen($string);
    }
    return $array;
}
 

php分割字符在实际应用中的问题

1、下载鸥尝试了通过php分割中文字符并进行搜索结果关键词匹配标红,从中文结果来看,是成功了。但存在一个问题:如果关键词/tag存在英文字符时,会因为分割导致页面的html代码被一起分割了,最终导致存在英文字符的页面全部乱码。既然英文字符乱码,那么中文页面的alt、title属性应该是同样被截断了。因此,中文字符分割匹配从我本人目前的技术水平来看,还不可行。要做分割匹配,绕不开问题如下:
需要避开html标签
需要避开css样式
需要避开图片的alt、title属性
需要避开input等标签的placeholder、value等属性

2、如果是直接作用到列表页模板,则该方案还是可行的。参考源码如下,但在实际应用中发现对英文tag的兼容不够好,日后有时间再做优化。
$tagsplit=mbStrSplit($tagname);
foreach ($tagsplit as $key){
    if (!strpos($title, $tagname)){
      $key=strtolower($key);
      $title=str_replace($key,"<font>$key</font>",$title);
    }
    if (!strpos($smalltext, $tagname)){
      $key=strtolower($key);
      $smalltext=str_replace($key,"<font>$key</font>",$smalltext);
    }
}

3、换个角度考虑,则分词匹配的可行性要远高于字符分割匹配。

4、如果分割匹配的目的是其他的,如搜索(仅为搜索,并非标红),则源码可以考虑使用。

本文地址:https://xzo.com.cn/develop/php/948.html

有帮助,很赞!

信息来源:下载鸥
导出教程 下载word版教程
发表评论 共有条评论
关于PHP

PHP是一种服务器端、跨平台、html嵌入式的脚本语言,其功能十分强大、入门简单。在过去,民间一直有说法称“PHP是最好的编程语言”,是PHP开发者对自身所使用语言的肯定。

PHP曾是最主流的网站web开发语言之一,现在也依然十分流行。

推荐PHP开发教程
php怎样开发一个访问密码的界面防止资源被爬取?
php怎样开发一个访问密码的界面防止资源被爬取?

互联网上每天都有很多爬虫到处爬取内容,你可能不知道他们是干嘛的,但其中肯定...

1 467
ajax发起session请求发现session无效了怎么办?
ajax发起session请求发现session无效了怎么办?

今天遇到这样一个问题:php启用了session,经过测试也发现session生效了。但在a...

1 505
php怎样开启debug调试模式?
php怎样开启debug调试模式?

我们使用php开发网站的时候,经常会需要调试确保功能正常。而如果功能出现异...

0 704
json数据{}转为php数组[]
json数据{}转为php数组[]

json是使用非常广泛的数据,通过使用json,我们还可以实现多种语言的联动。今天...

0 419
php分割中文字符源码分享与可行性分析
php分割中文字符源码分享与可行性分析

php分割中文字符,之前计划的是可用于搜索结果、tag结果关键词标红。但在实际...

0 517
php常用基础函数isset()介绍
php常用基础函数isset()介绍

isset() 函数用于检测变量是否已设置并且非 NULL。如果已经使用 unset() 释...

0 458
PHP的for循环为什么只执行了一次就停止了?
PHP的for循环为什么只执行了一次就停止了?

今天有朋友咨询鸥哥,说php写的for循环本来至少要循环9次,但却只执行了一次就...

1 502
简单的php高并发处理方案分享
简单的php高并发处理方案分享

很多互联网公司对并发要求比较高,如果完全依赖服务器性能的提升,则可能会面临...

0 477
推荐插件
帝国cms百度AI图像无损放大api接口对接插件
帝国cms百度AI图像无损放大api接口对接插件

通过本插件,可以实现帝国cms网站对接百度云api实现图像无损放大的功能。经过...

0 542
帝国cms联想词搜索高级搜索插件下载
帝国cms联想词搜索高级搜索插件下载

帝国CMS自带的搜索功能虽然强大,但也有很强的局限性 -- 必须关键词完全匹配...

0 885
帝国cms百度AI图像去雾api接口对接插件
帝国cms百度AI图像去雾api接口对接插件

通过本插件,可以实现帝国cms网站对接百度云api实现图像去雾的功能。经过实际...

0 537
帝国cms纳米数据接口(足球比赛中最新数据)
帝国cms纳米数据接口(足球比赛中最新数据)

帝国cms 对接纳米数据(www.nami.com)接口,本接口主要接收、整理足球比赛实时数...

0 555
帝国cms在线考试系统模板插件
帝国cms在线考试系统模板插件

一直没看到好用的帝国cms在线考试插件,所以自己开发了一款。在线考试插件用...

0 1404
帝国cms百度AI图像清晰度增强api接口对接插件
帝国cms百度AI图像清晰度增强api接口对接插件

通过本插件,可以实现帝国cms网站对接百度云api实现图像清晰度增强的功能。经...

0 609
帝国cms百度AI黑白图像上色api接口对接插件
帝国cms百度AI黑白图像上色api接口对接插件

百度开放了系列AI功能api如图像上色、图像去雾、图像修复、无损放大、清晰...

0 514
帝国CMS内网用户静态站点文章访客统计插件
帝国CMS内网用户静态站点文章访客统计插件

本插件适用于内网用户,可查看单篇文章访问者ip地址。如果添加访问者ip组,可查...

0 653
客服QQ:341553759
扫码咨询 常见问题 >
官方交流群:90432500
点击加入