`
阿尔萨斯
  • 浏览: 4186896 次
社区版块
存档分类
最新评论

PHP字符集编码问题

 
阅读更多
几乎每个刚开始用 PHP 和 mySQL 开发 Web 应用的人,都受到过编码问题的困扰。要么页面原始汉字和从数据库里取出的汉字全是乱码;要么原始汉字和数据库汉字,一个显示正常了,另一个就变成乱码了。很烦很气人!

问题需要一步一步的解决。在实际操作以下方法之前,需要配置 Web 服务器,使其与 PHP 集成,最终可以调试 PHP 程序。我们以常见的 GB2312 和 UTF-8 字符集为例来测试和说明。浏览器是 IE7.0。

一,页面原始汉字乱码的解决

编码的原理我就不说了,网上搜索一下字符串“PHP 乱码”,整框整框的文章供大家阅读。我最关心的是具体怎么做,就可以解决这个实际问题。我最喜欢使用的文本编辑器是 UltraEdit,不仅仅因为它可以进行 16 进制编辑,还因为它支持多编码文档。解决这个问题就需要使用 UltraEdit 的这个功能。

1.1 打开中文 Windows,用 UltraEdit 创建一个文本文件,手工输入一个 PHP 页面文件,文件内容如下。保存为 test1.php 文件,注意保存时“格式”下拉框选择“默认”- 特别注意这里。

<Html>
<head>
<title>页面标题</title>
<META http-equiv=Content-Type content="text/html; charset=gb2312">
</head>
<Body>123123123中文blog.csdn.net/phphot
</body>
</html>

用 IE 浏览器打开网站的这一页面。可以看到,页面显示正常。在 IE 浏览器的“查看”/“编码”菜单下看到(勾选了“自动选择”),字符编码是 GB2312。

[Firefox 2.0 下显示正常。]

1.2 然后,在 UltraEdit 的“文件”菜单下,选“另存为”,格式选择“UTF-8”,文件名为 test2.php。用 IE 浏览器打开这一页面。可以看到,页面显示正常(其实英文字体已经有略微的变化了)。在 IE 浏览器的“查看”/“编码”菜单下看到(勾选了“自动选择”),字符编码是 UTF-8,自动变了!注意 <META http-equiv=Content-Type content="text/html; charset=gb2312"> 一句并没有修改,但是浏览器却自动辨别出了真实的字符集编码!看来 IE 还是比较聪明的,也说明 IE 自动判别字符集是比 METE 标签中 charset=xxx 的定义优先的。

[Firefox 2.0 下显示出现乱码。]

1.3 在该页面首部加语句

<?php
header("Content-Type:text/html;charset=utf-8");
?>

再次保存该页面文件,“格式”下拉框选择“默认”,文件名为 test3.php。用 IE 打开网站里的该文件,这次看到,除过英文字母,汉字变成乱码了!同时在 IE 浏览器的“查看”/“编码”菜单下看到(勾选了“自动选择”),字符编码是 UTF-8,已经被强制改变了。

出现汉字乱码的原因,是因为原本的 GB2312 编码,被强制以 UTF-8 的编码形式显示,所以乱码出现了。这个时候在浏览器里人为指定 GB2312 编码,页面汉字又显示正常了(真正制作页面时是不能这么做的,非要让浏览者自己选择编码,一个是浏览者可能根本不知道怎么选择编码、选什么编码,再者也显 得我们太菜了!)。

[Firefox 2.0 下显示出现乱码。]

1.4 在该页面首部加语句

<?php
header("Content-Type:text/html;charset=GB2312");
?>

再次保存该页面文件,“格式”下拉框选择“UTF-8”,文件名为 test4.php。用 IE 打开网站里的该文件,奇怪:看到页面汉字显示正常,并不是预想到的乱码?!在 IE 浏览器的“查看”/“编码”菜单下看到(勾选了“自动选择”),字符编码仍然是 UTF-8,并没有被强制改变了 GB2312 字符集。

这个时候在浏览器里人为指定 GB2312 编码,发现 IE 浏览器并不能人为指定编码。看来 IE 浏览器对 UTF-8 字符集特别关照。无论是在 META 标签指定,还是 PHP 语句指定,都不能让 IE 浏览器显示出汉字乱码。

[Firefox 2.0 下显示出现乱码。]

小结一下: 以上测试主要在 IE7.0 下进行,Web 服务器为 Windows Server 2003 下的 IIS6.0,PHP 版本为 4.4.7。可以看到,IE7.0 为了正确识别字符集做了很多额外的自动处理的工作,以显示其智能和友好。有时太殷勤了反而使我们不知所措。由于汉字乱码问题与不同的浏览器及其不同的版 本、Web 服务器、后台脚本和不同的字符集都有点关系,所以问题显得特别复杂。作为 Web 编程人员,主要关心与自己有关的因素就可以了,没必要成为字符集编码方面的专家。为了兼容目前流行的 IE 和 FF 浏览器,我们可以按照以下简单的方法处理我们的 PHP 代码:
1,页面的真正字符集与 META 标签指定的应该一致;
2,也可以使用 header("Content-Type:text/html;charset=xxx"); 语句指定字符集,但是不能与字符的真正字符集冲突,也不能与 META 标签冲突。(尽管根据测试结果表明,当 header() 和 META 冲突时,header() 比 META 指定的字符集更优先,因为根据 HttpWatch Basic 跟踪显示,header() 指定字符集后,IE 浏览器 Type 会明确的得到字符集指定。但是不能保证其它非主流浏览器也会这样。)
3,不能与数据库取回的字符的字符集冲突,否则页面会出现页面本身的汉字和数据库取回的汉字,全部乱码或部分乱码问题。
分享到:
评论

相关推荐

    PHP检查字符串是否是UTF8编码

    PHP检查字符串是否是UTF8编码(字符集)

    zxing.java源码解析-Specialsymbols:一些字符集编码资料收集

    一些字符集编码资料收集 unicode码钱128位为ASCII码,java中可以通过 int offset = 0; String name = “@”; int codePoint = Character.codePointAt(name, offset); codePoint 等于 64 该篇对字符集编码及java开发...

    php字符集转换

    PHP通过iconv将字符串从GBK转换为UTF8字符集。 1. iconv()介绍 iconv函数可以将一种已知的字符集文件转换成另一种已知的字符集文件。例如:从GB2312转换为UTF-8。 iconv函数在php5中内置,GB字符集默认打开。 2. ...

    Charset_encoding-Burp:利用字符集编码绕过waf的burpsuite插件

    BurpSuite Plugin通过字符集编码绕过waf的burp插件因为小伙伴在实战中有这么个需求(利用字符集编码绕过waf),所以我借着他的这个需求也学习了下burp插件的编写。预览ASP.NET+IIS使用说明其实这种方法很早就出来了...

    PHP编码转换函数 自动转换字符集支持数组转换

    复制代码 代码如下: // 自动转换字符集 支持数组转换 function auto_charset($fContents, $from=’gbk’, $to=’utf-8′) { $from = strtoupper($from) == ‘UTF8’ ? ‘utf-8’ : $from; $to = strtoupper($to) == ...

    PHP iconv()函数字符编码转换的问题讲解

    在php中iconv函数库能够完成各种字符集间的转换,是php编程中不可缺少的基础函数库;但有时候iconv对于部分数据转码会无缘无故的少一些。比如在转换字符”—”到gb2312时会出错。 下面一起慢慢看一下这个函数的用法...

    php_字符集转换类

    * 中文编码集合类库 * * 目前该类库可以实现,简体中文 &lt;-&gt; 繁体中文编码互换,简体中文、繁体中文 -&gt; 拼音单向转换, * 简体中文、繁体中文 &lt;-&gt; UTF8 编码转换,简体中文、繁体中文 -&gt; Unicode单向转换 * * @...

    PHP自动识别字符集并完成转码详解

    因为自己使用字符编码一般的是utf-8编码,但如果对方的博客使用gb2312编码的话,POST过来就会出现乱码(除非对方POST前先转换编码)。在不能保证对方是否一定使用utf-8编码的情况下,自己做一个编码的检查和转换是很...

    php中的字符编码转换函数用法示例

    主要介绍了php中的字符编码转换函数用法示例,非常具有实用价值,需要的朋友可以参考下

    mysql字符集和数据库引擎修改方法分享

    MySQL字符集:cp1252 West European (latin1) ,解决乱码问题 使用虚拟主机空间上的phpmyadmin操作数据库的时候,如果看到phpmyadmin首页上显示的MySQL 字符集为cp1252 West European (latin1),当我们导入数据时就会...

    php各种编码集详解和以及在什么情况下进行使用

    字符集是多个字符的集合,字符集种类较多,每个字符集包含的字符个数不同,常见字符集名称:ASCII字符集、GB2312字符集、BIG5字符集、 GB 18030字符集、Unicode字符集等。计算机要准确的处理各种字符集文字,需要...

    关于PHP自动判断字符集并转码的详解

    话不多说,直接上函数,这个函数是用来对字符串进行检查和转码的。复制代码 代码如下:&lt;?phpfunction safeEncoding($string,$outEncoding =’UTF-8′) { $encoding = “UTF-8”; for($i=0;$i&lt;strlen($string...

    PHP通过iconv将字符串从GBK转换为UTF8字符集

    iconv函数在php5中内置,GB字符集默认打开。 2. iconv()错误 iconv在转换字符”—”到gb2312时会出错,解决方法是在需要转成的编码后加 “//IGNORE”,也就是iconv函数第二个参数后.如下: 复制代码 代码如下: ...

    解析php开发中的中文编码问题

    PHP程序设计中中文编码问题曾经困扰很多人,导致这个问题的原因其实很简单,每个国家(或区域)都规定了计算机信息交换用的字符编码集,如美国的扩展 ASCII 码, 中国的 GB2312-80,日本的 JIS 等。作为该国家/区域内...

    PHP检测字符串是否为UTF8编码的常用方法

    主要介绍了PHP检测字符串是否为UTF8编码的常用方法,列举了四个实例从不同的角度来实现这一功能,是非常实用的技巧,具有一定的学习借鉴价值,需要的朋友可以参考下

    iconv函数用来转换各种字符集

    例://把 从gb2312编码转换到 UTF-8 编码=iconv(&quot;GB2312&quot;,&quot;UTF-8&quot;,)安装到PHP要使用iconv函数,PHP编译时必须跟上: --with-iconv[=DIR]. Note to Windows&reg; Users: In order to enable this ...

    PHP中文编码小技巧

    PHP程序设计中中文编码问题曾经困扰很多人,导致这个问题的原因其实很简单,每个国家(或区域)都规定了计算机信息交换用的字符编码集,如美国的扩展 ASCII 码,中国的 GB2312-80,日本的 JIS 等。作为该国家/区域内...

    php中字符集转换iconv函数使用总结

    iconv函数库能够完成各种字符集间的转换,是php编程中不可缺少的基础函数库。 用法如下: 复制代码 代码如下: $string = “欢迎访问软件开发网!”; iconv(“utf8″,”gbk”,$string)//将字符串string 编码由utf8...

    php截取字符串之截取utf8或gbk编码的中英文字符串示例

    mb_strlen 可以根据字符集计算长度,比如utf8的中文计数为1,但这不符合微博字数限制需求,中文必须计算为2才可以。google了下,找到一个discuz中截取各种编码字符的类,改造了下,已经测试通过.其中参数$charset 只...

Global site tag (gtag.js) - Google Analytics