2005年11月9日

法语编码处理经验小结

近些日子在处理一些法语文件的时候,总是在Ultraedit里面看到很多非常生僻的汉字,就像乱码一样。原因好像就是那些法语中带帽子的字符附近的编码存在问题。为了解决这个问题,我采用了很多种可能的办法。用python中的encode和Unicode处理过,用mentor撰写的c++版的encode和Unicode转换过,用c#的指定打开格式和输出格式的方法重写文件……。这些方法一一都不奏效。或许我还没有掌握其核心方法。

查看文件编码最好的方法就是用ie打开然后右键单击看自动选择编码方式的结果。今天意外用ie保存一个文本文件时看到了一个编码格式的选择,我把那些自动编码为西欧字符集的文件用Unicode utf-8保存后再用ultraedit发现可以正常显示了。这种方法对于转换小文件非常的高效实用。但是处理大文件时IE打开文件的时间会非常的长。

这种方法还需要进一步的研究一下。

2 条评论:

  1. Comment's author: jiangfei
    11/10/2005 10:19:10 AM
    Bill
    整点照片贴上来。哈哈

    回复删除
  2. Comment's author: Bill_Lang
    11/10/2005 06:54:38 PM
    hehe, jiangfei想要看些什么图片呀?呵呵,现在传照片不方便的。等我回来后好好写一篇Picture blog.

    回复删除