下载鸥 > 网站下载 > 开发教程 > PHP

php分割中文字符源码分享与可行性分析

397 2021-05-13 22:43:56

收藏
php分割中文字符源码分享与可行性分析
php分割中文字符,之前计划的是可用于搜索结果、tag结果关键词标红。但在实际应用中发现存在bug,这里分享一段php分割中文字符的源码,存在的bug在文后说明。

php分割中文字符源码分享与可行性分析

php分割中文字符源码

// 中文切割
function mbStrSplit ($string, $len=1) {
    $start = 0;
    $strlen = mb_strlen($string);
    while ($strlen) {
        $array[] = mb_substr($string,$start,$len,"utf8");
        $string = mb_substr($string, $len, $strlen,"utf8");
        $strlen = mb_strlen($string);
    }
    return $array;
}
 

php分割字符在实际应用中的问题

1、下载鸥尝试了通过php分割中文字符并进行搜索结果关键词匹配标红,从中文结果来看,是成功了。但存在一个问题:如果关键词/tag存在英文字符时,会因为分割导致页面的html代码被一起分割了,最终导致存在英文字符的页面全部乱码。既然英文字符乱码,那么中文页面的alt、title属性应该是同样被截断了。因此,中文字符分割匹配从我本人目前的技术水平来看,还不可行。要做分割匹配,绕不开问题如下:
需要避开html标签
需要避开css样式
需要避开图片的alt、title属性
需要避开input等标签的placeholder、value等属性

2、如果是直接作用到列表页模板,则该方案还是可行的。参考源码如下,但在实际应用中发现对英文tag的兼容不够好,日后有时间再做优化。
$tagsplit=mbStrSplit($tagname);
foreach ($tagsplit as $key){
    if (!strpos($title, $tagname)){
      $key=strtolower($key);
      $title=str_replace($key,"<font>$key</font>",$title);
    }
    if (!strpos($smalltext, $tagname)){
      $key=strtolower($key);
      $smalltext=str_replace($key,"<font>$key</font>",$smalltext);
    }
}

3、换个角度考虑,则分词匹配的可行性要远高于字符分割匹配。

4、如果分割匹配的目的是其他的,如搜索(仅为搜索,并非标红),则源码可以考虑使用。

本文地址:https://xzo.com.cn/develop/php/948.html

有帮助,很赞!

信息来源:下载鸥
导出教程 下载word版教程
发表评论 共有条评论
关于PHP

PHP是一种服务器端、跨平台、html嵌入式的脚本语言,其功能十分强大、入门简单。在过去,民间一直有说法称“PHP是最好的编程语言”,是PHP开发者对自身所使用语言的肯定。

PHP曾是最主流的网站web开发语言之一,现在也依然十分流行。

推荐PHP开发教程
PHP怎样正则匹配段落里的图片并提取图片链接?
PHP怎样正则匹配段落里的图片并提取图片链接?

在程序开发的过程中,我们可能需要提取段落里的图片用作缩略图。那么,这个正则...

19 924
str_replace怎样一次性替换多个值(数组)?
str_replace怎样一次性替换多个值(数组)?

我们知道,str_replace是可以执行替换命令的,但一般是用于一对一替换,这个很好...

1 426
php怎样开发一个访问密码的界面防止资源被爬取?
php怎样开发一个访问密码的界面防止资源被爬取?

互联网上每天都有很多爬虫到处爬取内容,你可能不知道他们是干嘛的,但其中肯定...

1 380
当缓存文件大于4KB,不能用cookie时的替代方案就是session
当缓存文件大于4KB,不能用cookie时的替代方案就是session

鸥哥最近在开发一个项目,出于对用户隐私的保护,数据一概不能存储到数据表,而是...

1 422
php怎样开启debug调试模式?
php怎样开启debug调试模式?

我们使用php开发网站的时候,经常会需要调试确保功能正常。而如果功能出现异...

0 686
json数据{}转为php数组[]
json数据{}转为php数组[]

json是使用非常广泛的数据,通过使用json,我们还可以实现多种语言的联动。今天...

0 367
什么是高并发,与CPU,内存,分布式有什么关系
什么是高并发,与CPU,内存,分布式有什么关系

我们在网站开发的过程中经常会接触到高并发这个概念,但高并发到底是什么,具体...

1 371
简单的php高并发处理方案分享
简单的php高并发处理方案分享

很多互联网公司对并发要求比较高,如果完全依赖服务器性能的提升,则可能会面临...

0 385
推荐插件
帝国cms百度文字识别ocr接口对接插件
帝国cms百度文字识别ocr接口对接插件

许多网站会做一些小功能小插件给客户使用以增强用户黏性,比如图片转文字,这种...

0 432
帝国cms纳米数据接口(足球比赛中最新数据)
帝国cms纳米数据接口(足球比赛中最新数据)

帝国cms 对接纳米数据(www.nami.com)接口,本接口主要接收、整理足球比赛实时数...

0 287
帝国cms百度AI图像去雾api接口对接插件
帝国cms百度AI图像去雾api接口对接插件

通过本插件,可以实现帝国cms网站对接百度云api实现图像去雾的功能。经过实际...

0 429
帝国cms自动给正文关键词添加tag内链
帝国cms自动给正文关键词添加tag内链

帝国cms有自带的给关键词添加内链功能,但需要手动添加关键词,容易出现疏漏和...

0 772
帝国cms在线考试系统模板插件
帝国cms在线考试系统模板插件

一直没看到好用的帝国cms在线考试插件,所以自己开发了一款。在线考试插件用...

0 1236
帝国cms百度AI黑白图像上色api接口对接插件
帝国cms百度AI黑白图像上色api接口对接插件

百度开放了系列AI功能api如图像上色、图像去雾、图像修复、无损放大、清晰...

0 376
帝国cms批量添加后台用户插件
帝国cms批量添加后台用户插件

使用帝国cms的企业用户、新闻资讯类站点的用户很多,此类站点很多时候需要有...

0 656
帝国cms联想词搜索高级搜索插件下载
帝国cms联想词搜索高级搜索插件下载

帝国CMS自带的搜索功能虽然强大,但也有很强的局限性 -- 必须关键词完全匹配...

0 711
客服QQ:341553759
扫码咨询 常见问题 >
官方交流群:90432500
点击加入