ares333/php-curl

下载后所有的中文都是Unicode

Closed this issue · 3 comments

luoei commented

网站:http://www.bjszxx.cn

部分源码:

<meta http-equiv="Content-Type" content="text/html;charset=UTF-8">
    <meta charset="UTF-8">
    <!--TODO LSY &#28155;&#21152;&#35270;&#21475;&#26174;&#31034;-->
    <meta name="renderer" content="webkit">
    <meta name="viewport" content="width=device-width,initial-scale=1.0,maximum-scale=1.0,minimum-scale=1.0,user-scalable=no">
    <meta http-equiv="Cache-Control" content="no-transform">
    <meta http-equiv="Cache-Control" content="no-siteapp">
   <title>&#19977;&#21482;&#23567;&#29066;&#20799;&#31461;&#25668;&#24433; - &#19987;&#19994;&#21271;&#20140;&#20799;&#31461;&#25668;&#24433;&#26426;&#26500;</title>
   <meta name="description" content="&#19977;&#21482;&#23567;&#29066;&#20799;&#31461;&#25668;&#24433;,&#26159;&#20840;&#22269;&#30693;&#21517;&#30340;&#19987;&#19994;&#21271;&#20140;&#20799;&#31461;&#25668;&#24433;&#26426;&#26500;&#12290;&#20026;&#23458;&#25143;&#25552;&#20379;&#20799;&#31461;&#25668;&#24433;&#22242;&#36141;,&#20799;&#31461;&#25668;&#24433;&#20316;&#21697;&#27983;&#35272;,&#39044;&#32422;&#22871;&#31995;,&#20146;&#23376;&#25668;&#24433;&#31561;&#26381;&#21153;&#12290;">
    <link rel="stylesheet" href="template/default/css/main.css">

因为源网站有UTF8 BOM,并且有两个导致phpQuery无法正确解析,增加自动移除BOM的功能,已经解决

luoei commented

@ares333 多谢,辛苦。