网站编码 帮助目录 词典
选择网页源码的编码方式。一般情况下使用默认的'自动识别'即可。在解析结果出现乱码时才有必要指定特定编码。但具体编码种类需要详细参考相关资料。
详:
如果当前项目设置过程中发现网页主要内容出现非正常乱码,则需要在此修改网站编码选项。可参考如下方法来确认合适的编码类型:
  • 查看网页源码,找到网页约定的编码类型:在网页中右键选择“查看源文件”,从打开的源文件的开头部分中查找字符串:<meta http-equiv="Content-Type" content="text/html; charset=gb2312"> 该字符串中的标识符"charset="字样后面的字符串"gb2312"即是该网页的编码类型。对于中英文网页,使用最多的编码是utf8gb2312。只是网页中出现的编码字样,未必是实际可用的。也就说存在少数网页指定编码和实际编码类型并不一致的情况,此时就只能做反复尝试了。
  • 反复尝试:根据"网站编码"列表框中的中文提示,依次选择进行尝试。一般总会有一样选项是合适的。
  • 少数网站的不同页面的编码也会出现不一致的情况。在每个模板页面的解析时,都可以各自选择当前页面的网页编码。因此此处的网页编码,实际上仅针对“标题列表页面”。模板页面会默认继承当前的网站编码设置,但可以随时修改。
    网站编码,不区分大小写。