侧边栏壁纸
博主头像
落叶人生博主等级

走进秋风,寻找秋天的落叶

  • 累计撰写 130562 篇文章
  • 累计创建 28 个标签
  • 累计收到 9 条评论
标签搜索

目 录CONTENT

文章目录

php下检测字符串是否是utf8编码的代码

2023-12-15 星期五 / 0 评论 / 0 点赞 / 60 阅读 / 1991 字

functionis_utf8($string){ returnpreg_match('%^(?: [/x09/x0A/x0D/x20-/x7E]#ASCII |[/xC2-/xDF][/x80-/xBF]#non-ov

 function is_utf8($string) {
     return preg_match('%^(?:
             [/x09/x0A/x0D/x20-/x7E]                 # ASCII
         | [/xC2-/xDF][/x80-/xBF]                 # non-overlong 2-byte
         |     /xE0[/xA0-/xBF][/x80-/xBF]             # excluding overlongs
         | [/xE1-/xEC/xEE/xEF][/x80-/xBF]{2}     # straight 3-byte
         |     /xED[/x80-/x9F][/x80-/xBF]             # excluding surrogates
         |     /xF0[/x90-/xBF][/x80-/xBF]{2}     # planes 1-3
         | [/xF1-/xF3][/x80-/xBF]{3}             # planes 4-15
         |     /xF4[/x80-/x8F][/x80-/xBF]{2}     # plane 16
     )*$%xs', $string);     
}
准确率基本和mb_detect_encoding一样,要对一起对,要错一起错。
编码检测不可能100%准确,这个东西已经可以基本满足要求了。 

广告 广告

评论区