近些日子在处理一些法语文件的时候,总是在Ultraedit里面看到很多非常生僻的汉字,就像乱码一样。原因好像就是那些法语中带帽子的字符附近的编码存在问题。为了解决这个问题,我采用了很多种可能的办法。用python中的encode和Unicode处理过,用mentor撰写的c++版的encode和Unicode转换过,用c#的指定打开格式和输出格式的方法重写文件……。这些方法一一都不奏效。或许我还没有掌握其核心方法。
查看文件编码最好的方法就是用ie打开然后右键单击看自动选择编码方式的结果。今天意外用ie保存一个文本文件时看到了一个编码格式的选择,我把那些自动编码为西欧字符集的文件用Unicode utf-8保存后再用ultraedit发现可以正常显示了。这种方法对于转换小文件非常的高效实用。但是处理大文件时IE打开文件的时间会非常的长。
这种方法还需要进一步的研究一下。
Comment's author: jiangfei
回复删除11/10/2005 10:19:10 AM
Bill
整点照片贴上来。哈哈
Comment's author: Bill_Lang
回复删除11/10/2005 06:54:38 PM
hehe, jiangfei想要看些什么图片呀?呵呵,现在传照片不方便的。等我回来后好好写一篇Picture blog.