- A+
所属分类:学习总结
最近开发一套采集软件遇到问题,网站的文字编码是:EUC-JP,采集后的源码,部分乱码,经过一番研究,找到以下解决办法,利用ADODB.Stream对象转换的,将访问网页的返回的字节集先用GZIP解压成新的字节集然后在用下面的函数,选择编码为"euc-jp"
易语言代码如下:
调用子程序:
产品名称 = 编码转换EUC_JP (字节集, #编码_EUC_JP)
-
.版本 2
.子程序 编码转换EUC_JP, 文本型, 公开
.参数 被转换字节集, 字节集
.参数 转换后的编码, 文本型, , 默认GBK可以使用本库中定义的以“编码_”开头的编码常量。编码名称不区分字母大小写。
.局部变量 对象, 对象
.局部变量 变体型, 变体型
.局部变量 结果, 文本型
CoInitialize (0)
对象.创建 (“ADODB.Stream”, )
对象.写属性 (“Type”, 1)
对象.写属性 (“Mode”, 3)
对象.方法 (“Open”, )
变体型.赋值 (被转换字节集, )
对象.方法 (“Write”, 变体型)
对象.写属性 (“Position”, 0)
对象.写属性 (“Type”, 2)
对象.写属性 (“Charset”, 转换后的编码)
结果 = 对象.文本方法 (“ReadText”, )
对象.方法 (“Close”, )
对象.清除 ()
CoUninitialize ()
返回 (结果)
- 我的微信
- 这是我的微信扫一扫
- 我的微信公众号
- 我的微信公众号扫一扫