魔法系统之家下载 - 系统之家,XP系统之家,GhostXP系统,纯净版XP系统,Windows7下载之家

当前位置:首页 > 系统教程 > Linux教程 > 详细页面

Linux系统查找替换非UTF-8编码文件的方法

时间:2017-08-17 19:57:08来源:魔法系统之家下载作者:zhijie

  UTF-8是Linux系统下的一种可变长度的字符万国码,使用UTF-8码就可以支持多种语言。但是某些文件并不是UTF-8编码的,这个时候我们可以用命令来查找替换非UTF-8码,下面就来介绍一下Linux系统查找替换非UTF-8编码文件的方法。

Linux系统查找替换非UTF-8编码文件的方法

  开始之前,请先安装enca这个软件包。enca是Linux等系统下用来查看文件编码和转换文件编码的工具。

  下面一行Linux命令能够查找当前目录下所有文件中,哪些文件不是UTF-8编码。我对文件加了些限制,用find命令时候,排除了所有目录下的.svn目录,且只查找后缀为.php的文件。

  命令1:

  jw@~/sqlite>

  find 。 ! -iregex ‘.*\.svn.*’ -type f -name ‘*.php’ -exec bash -c “enca -L zh_CN {}|grep GB2312 》 /dev/null && echo {}” \;

  ./sqlite_utility.php

  ./sqlite_result.php

  ./sqlite_forge.php

  ./sqlite_driver.php

  既然找到了这些非UTF8编码的文件,接下来再用一条命令将他们都转换成UTF8编码。

  命令2:

  jw@~/sqlite>

  find . ! -iregex ‘.*\.svn.*’ -type f -name ‘*.php’ -exec bash -c “enca -L zh_CN {} | grep GB2312 》/dev/null && enconv -L zh_CN -x UTF-8 {}” \;

  当你用命令2 全部转换完成后,如果你期待命令1的输出为空,那么你就错了。实际上英语字母的utf8编码和ASCII编码是一样的。当一个全是英文字母的文件用UTF8 w/o BOM编码保存,那么enca会识别他是一个ACSII编码的文件。所以,你猜到了,命令2做了一些无用功。

  以上就是Linux系统查找替换非UTF-8编码文件的方法了,这样一来就不用担心Linux文件不是UTF-8编码而无法显示其他语言了。

分享到:

相关信息

  • Arch Linux不适合当作服务器操作系统的四大原因

    为什么Arch Linux不适合当作服务器操作系统?可能很多用户都发现了,Linux服务器操作系统一般都是Ubuntu Server、Cent OS、Fedora或者Red Hat等,为什么很少看到Arch Linux呢?因为Arch Linux在服务方面确实存在一些劣势,下面...

    2017-08-17

  • Ubuntu 3D桌面特效怎么设置?

    有些用户为了使桌面更好看、更具动感性,于是就想要设置系统的3D桌面特效,不过不少人却不知道Ubuntu 3D桌面特效怎么设置?其实方法很简单,如果你不知道的话,那就赶紧来看看小编整理的Ubuntu 3D桌面特效设置方法吧!...

    2017-08-17

系统教程栏目

栏目热门教程

人气教程排行

站长推荐

热门系统下载