Bill_Lang: 法语编码处理经验小结

近些日子在处理一些法语文件的时候，总是在Ultraedit里面看到很多非常生僻的汉字，就像乱码一样。原因好像就是那些法语中带帽子的字符附近的编码存在问题。为了解决这个问题，我采用了很多种可能的办法。用python中的encode和Unicode处理过，用mentor撰写的c++版的encode和Unicode转换过，用c#的指定打开格式和输出格式的方法重写文件……。这些方法一一都不奏效。或许我还没有掌握其核心方法。

查看文件编码最好的方法就是用ie打开然后右键单击看自动选择编码方式的结果。今天意外用ie保存一个文本文件时看到了一个编码格式的选择，我把那些自动编码为西欧字符集的文件用Unicode utf-8保存后再用ultraedit发现可以正常显示了。这种方法对于转换小文件非常的高效实用。但是处理大文件时IE打开文件的时间会非常的长。

这种方法还需要进一步的研究一下。