Linux常用的文件处理命令

来源:互联网 发布:初三物理视频教程软件 编辑:程序博客网 时间:2024/06/08 05:32
Linux 系统信息存放在文件里,文件与普通的公务文件类似。每个文件都有自己的名字、内容、存放地址及其它一些管理信息,如文件的用户、文件的大小等。文件可以是一封信、一个通讯录,或者是程序的源语句、程序的数据,甚至可以包括可执行的程序和其它非正文内容。 Linux 文件系统具有良好的结构,系统提供了很多文件处理程序。这里主要介绍常用的文件处理命令。文件处理类命令: file、mkdir、grep、dd、find、mv、ls、diff、cat、ln

一、File

1. 作用

file 通过探测文件内容判断文件类型,使用权限是所有用户。

2.格式

file [options]  文件名

3.[options]主要参数

·v:在标准输出后显示版本信息,并且退出。
-z:探测压缩过的文件类型。
-L:允许符合连接。
-f name:从文件 namefile 中读取要分析的文件名列表。

4.简单说明

使用 file 命令可以知道某个文件究竟是二进制(ELF 格式)的可执行文件, 还是 Shell Script 文件,或者是其它的什么格式。file 能识别的文件类型有目录、Shell 脚本、英文文本、二进制可执行文件、C 语言源文件、文本文件、DOS 的可执行文件。

5.应用实例

如果我们看到一个没有后缀的文件 grap,可以使用下面命令:

$ file grapgrap:  English text

此时系统显示这是一个英文文本文件。需要说明的是,file 命令不能探测包括图形、音频、视频等多媒体文件类型。

二、mkdir

1.作用

mkdir 命令的作用是建立名称为 dirname 的子目录,与 MS DOS 下的 md 命令类似,它的使用权限是所有用户。

2.格式

mkdir [options]  目录名

3.[options]主要参数

-m,- -mode:设定权限<模式>;,与 chmod 类似。
-p,- -parents:需要时创建上层目录:如果目录早己存在,则不当作错误。
-v,- -verbose:每次创建新目录都显示信息。
- -version:显示版本信息后离开。

4.应用实例

在进行目录创建时可以设置目录的权限,此时使用的参数是“- m “。假设要创建的目录名是“tsk” ,让所有用户都有 rwx(即读、写、执行的权限),那么可以使用以下命令:

$ mkdir - m 777 tsk

grep

1.作用

grep 命令可以指定文件中搜索特定的内容,并将含有这些内容的行标准输出。grep 全称是Global Regular Expression Print,表示全局正则表达式版本,它的使用权限是所有用户。

2.格式

grep [options] 

3.主要参数

[options]主要参数:
-c:只输出匹配行的计数。
- I:不区分大小写(只适用于单字符)。
- h:查询多文件时不显示文件名。
- l:查询多文件时只输出包含匹配字符的文件名。
- n:显示匹配行及行号。
- s:不显示不存在或无匹配文本的错误信息。
- v:显示不包含匹配文本的所有行。

pattern 正则表达式主要参数:
\:忽略正则表达式中特殊字符的原有含义。
^:匹配正则表达式的开始行。
$: 匹配正则表达式的结束行。
\<:从匹配正则表达式的行开始。
\>;:到匹配正则表达式的行结束。
[ ]:单个字符,如[A]即 A 符合要求 。
[ - ]:范围,如[A-Z],即 A、B、C 一直到 Z 都符合要求 。
。:所有的单个字符。
* :有字符,长度可以为 0。

正则表达式是 Linux/Unix 系统中非常重要的概念。正则表达式(也称为“regex 或“regexp ) 是一个可以描述一类字符串的模式(Pattern)。如果一个字符串可以用某个正则表达式来描述,我们就说这个字符和该正则表达式匹配(Match)。这和DOS 中用户可以使用通配符“* 代表任意字符类似。在 Linux 系统上,正则表达式通常被用来查找文本的模式,以及对文本执行“搜索 替换 操作和其它功能。

4.应用实例

查询DNS 服务是日常工作之一,这意味着要维护覆盖不同网络的大量 IP 地址。有时 IP 地址会超过 2000 个。如果要查看 nnn.nnn 网络地址,但是却忘了第二部分中的其余部分,只知到有两个句点,例如 nnn nn..。要抽取其中所有 nnn.nnn IP 地址,使用[0- 9 ]\{3 \}\.[0 -0\{3\}\。含义是任意数字出现 3 次,后跟句点,接着是任意数字出现 3 次,后跟句点。

$grep ’[0-9]\{3 \}\.[0-0\{3\}\` ipfile

补充说明,grep 家族还包括 fgrep 和 egrep。fgrep 是fix grep,允许查找字符串而不是一个模式:egrep 是扩展 grep,支持基本及扩展的正则表达式,但不支持\q 模式范围的应用及与之相对应的一些更加规范的模式。

dd

1.作用

dd 命令用来复制文件,并根据参数将数据转换和格式化。

2.格式

dd [options]

3.[opitions]主要参数

bs=字节:强迫 ibs=<字节>;及 obs=<字节>;。
cbs=字节:每次转换指定的<字节>;。
conv=关键字:根据以逗号分隔的关键字表示的方式来转换文件。
count=块数目:只复制指定<块数目>;的输入数据。
ibs=字节:每次读取指定的<字节>;。
if=文件:读取<文件>;内容,而非标准输入的数据。
obs=字节:每次写入指定的<字节>;。
of=文件:将数据写入<文件>;,而不在标准输出显示。
seek=块数目:先略过以 obs 为单位的指定<块数目>;的输出数据。
skip=块数目:先略过以 ibs 为单位的指定<块数目>;的输入数据。

4.应用实例

dd 命令常常用来制作 Linux 启动盘。先找一个可引导内核,令它的根设备指向正确的根分区,然后使用 dd 命令将其写入软盘:

$ rdev vmlinuz /dev/hda$dd  if=vmlinuz of=/dev/fd0

上面代码说明,使用 rdev 命令将可引导内核 vmlinuz 中的根设备指向/dev/hda,请把“hda ”换成自己的根分区,接下来用 dd 命令将该内核写入软盘。

find

1.作用

find 命令的作用是在目录中搜索文件,它的使用权限是所有用户。

2.格式

find [path][options][expression]

path 指定目录路径,系统从这里开始沿着目录树向下查找文件。它是一个路径列表,相互用空格分离,如果不写 path,那么默认为当前目录。

3.主要参数

[options]参数:
depth:使用深度级别的查找过程方式,在某层指定目录中优先查找文件内容。
maxdepth levels:表示至多查找到开始目录的第 level 层子目录。level 是一个非负数,如果 level 是 0 的话表示仅在当前目录中查找。
mindepth levels:表示至少查找到开始目录的第 level 层子目录。
mount:不在其它文件系统(如 Msdos、Vfat 等)的目录和文件中查找。
version:打印版本。
[expression]是匹配表达式,是 find 命令接受的表达式,find 命令的所有操作都是针对表达式的。它的参数非常多,这里只介绍一些常用的参数。
-name:支持统配符*和?。
atime n:搜索在过去 n 天读取过的文件。
ctime n:搜索在过去 n 天修改过的文件。
group grpoupname:搜索所有组为 grpoupname 的文件。
user 用户名:搜索所有文件属主为用户名(ID 或名称)的文件。
size n:搜索文件大小是 n 个 block 的文件。
print:输出搜索结果,并且打印。

4.应用技巧

find 命令查找文件的几种方法:
(1)根据文件名查找

 find / -name lilo.conf  

find 命令后的“/ 表示搜索整个硬盘。
(2)快速查找文件
根据文件名查找文件会遇到一个实际问题,就是要花费相当长的一段时间,特别是大型

Linux 文件系统和大容量硬盘文件放在很深的子目录中时。如果我们知道了这个文件存放在某个目录中,那么只要在这个目录中往下寻找就能节省很多时间。比如 smb.conf 文件, 从它的文件后缀“.conf 可以判断这是一个配置文件,那么它应该在/etc 目录内,此时可以使用下面命令:

find /etc      name smb.conf

这样,使用“快速查找文件 方式可以缩短时间。
(3)根据部分文件名查找方法
有时我们知道只某个文件包含有 abvd 这 4 个字,那么要查找系统中所有包含有这 4 个字符的文件可以输入下面命令:

find /     name ’*abvd*’

输入这个命令以后,Linux 系统会将在/目录中查找所有的包含有abvd 这 4 个字符的文件(其中*是通配符),比如 abvdrmyz 等符合条件的文件都能显示出来。
(4) 使用混合查找方式查找文件
find 命令可以使用混合查找的方法,例如,我们想在/etc 目录中查找大于 500000 字节,并且在 24 小时内修改的某个文件,则可以使用-and (与)把两个查找参数链接起来组合成一个混合的查找方式。

find /etc -size +500000c -and -mtime +1

mv

1.作用

mv 命令用来为文件或目录改名,或者将文件由一个目录移入另一个目录中,它的使用权限是所有用户。该命令如同 DOS 命令中的 ren 和 move 的组合。

2.格式

mv[options] 源文件或目录 目标文件或目录

3.[options]主要参数

-i:交互方式操作。如果mv 操作将导致对己存在的目标文件的覆盖,此时系统询问是否
重写,要求用户回答“y 或“n ,这样可以避免误覆盖文件。
-f:禁止交互操作。mv 操作要覆盖某个己有的目标文件时不给任何指示,指定此参数后
-i 参数将不再起作用。

4.应用实例

( 1 )将/usr/cbu 中的所有文件移到当前目录(用“. 表示)中:

$ mv /usr/cbu/ * .

(2)将文件 cjh.txt 重命名为 wjz.txt:

$ mv cjh.txt wjz.txt

ls

1.作用

ls 命令用于显示目录内容,类似 DOS 下的 dir 命令,它的使用权限是所有用户。

2.格式

ls [options][filename]

3.options 主要参数

-a,- -all:不隐藏任何以“. 字符开始的项目。
-A,- -almost-all:列出除了“ . 及 “.. 以外的任何项目。 - -author:印出每个文件著作者。
-b,- -escape:以八进制溢出序列表示不可打印的字符。- -block-size二大小:块以指定<大小>;的字节为单位。
-B,- -ignore-backups:不列出任何以 ~ 字符结束的项目。
-f:不进行排序,-aU 参数生效,-lst 参数失效。
-F,- -classify:加上文件类型的指示符号 (*/二@| 其中一个)。
-g:like-l, but do not list owner。
-G,- -no-group:inhibit display of group information。
-i,- -inode:列出每个文件的 inode 号。
-I,- -ignore二样式:不印出任何符合 Shell 万用字符<样式>;的项目。
-k: 即 - -block-size=1k 。
-l:使用较长格式列出信息。
-L,- -dereference:当显示符号链接的文件信息时,显示符号链接所指示的对象,而并非符号链接本身的信息
-m:所有项目以逗号分隔,并填满整行行宽。
-n,- -numeric-uid-gid: 类 似-l, 但列出UID及GID号 。
-N,- -literal:列出未经处理的项目名称,例如不特别处理控制字符。
-p,- -file-type:加上文件类型的指示符号 (/二@| 其中一个)。
-Q,- -quote-name:将项目名称括上双引号。
-r,- -reverse:依相反次序排列。
-R,- - recursive:同时列出所有子目录层。
-s,- -size:以块大小为序。

4.应用举例

ls 命令是 Linux 系统使用频率最多的命令,它的参数也是 Linux 命令中最多的。使用 ls 命令时会有几种不同的颜色,其中蓝色表示是目录,绿色表示是可执行文件,红色表示是压缩文件,浅蓝色表示是链接文件,加粗的黑色表示符号链接,灰色表示是其它格式文件。
ls 最常使用的是 ls- l。使用 ls-l 命令
文件类型开头是由 1 0 个字符构成的字符串。其中第一个字符表示文件类型,它可以是下述类型之一: (普通文件)、d(目录)、l(符号链接)、b(块设备文件)、c(字符设备文件)。后面的 9 个字符表示文件的访问权限,分为 3 组,每组 3 位。第一组表示文件属主的权限,第二组表示同组用户的权限,第三组表示其他用户的权限。每一组的三个字符分别表示对文件的读(r)、写(w)和执行权限(x)。对于目录,表示进入权限。s 表示当文件被执行时,把该文件的UID 或GID 赋予执行进程的UID(用户 ID)或GID(组 ID)。
t 表示设置标志位(留在内存,不被换出)。如果该文件是目录,那么在该目录中的文件只能被超级用户、目录拥有者或文件属主删除。如果它是可执行文件,那么在该文件执行后,指向其正文段的指针仍留在内存。这样再次执行它时,系统就能更快地装入该文件。接着显示的是文件大小、生成时间、文件或命令名称。

diff

1.作用

diff 命令用于两个文件之间的比较,并指出两者的不同,它的使用权限是所有用户。

2.格式

diff [options]  源文件  目标文件

3.[options]主要参数

-a:将所有文件当作文本文件来处理。
-b:忽略空格造成的不同。
-B:忽略空行造成的不同。
-c:使用纲要输出格式。
-H:利用试探法加速对大文件的搜索。
-I:忽略大小写的变化。
-n –rcs:输出 RCS 格式。

cmp

1.作用

cmp(“compare 的缩写)命令用来简要指出两个文件是否存在差异,它的使用权限是所有用户。

2.格式

cmp[options] 文件名

3.[options]主要参数

-l: 将字节以十进制的方式输出,并方便将两个文件中不同的以八进制的方式输出。

cat

1.作用

cat(“concatenate 的缩写)命令用于连接并显示指定的一个和多个文件的有关信息,它的使用权限是所有用户。

2.格式

cat [options]  文件    文件 2..

3.[options]主要参数

-n:由第一行开始对所有输出的行数编号。
-b:和-n 相似,只不过对于空白行不编号。
-s:当遇到有连续两行以上的空白行时,就代换为一行的空白行。

4.应用举例

(1 )cat 命令一个最简单的用处是显示文本文件的内容。例如,我们想在命令行看一下
README 文件的内容,可以使用命令:

$ cat README
(2)有时需要将几个文件处理成一个文件,并将这种处理的结果保存到一个单独的输出文件。cat 命令在其输入上接受一个或多个文件,并将它们作为一个单独的文件打印到它的输出。例如,把 README 和 INSTALL 的文件内容加上行号(空白行不加)之后,将内容附加到一个新文本文件 File 中:

$ cat README INSTALL File 

(3) cat 还有一个重要的功能就是可以对行进行编号,这种功能对于程序文档的编制,以及法律和科学文档的编制很方便,打印在左边的行号使得参考文档的某一部分变得容易,这些在编程、科学研究、业务报告甚至是立法工作中都是非常重要的。例如 使用 cat 命令/etc/named.conf 文件进行编号对行进行编号功能有-b(只能对非空白行进行编号)和-n(可以对所有行进行编号)两个参数:

$ cat -b /etc/named.conf

ln

1.作用

ln 命令用来在文件之间创建链接,它的使用权限是所有用户。

2.格式

ln [options]  源文件  [链接名]

3.参数

-f:链结时先将源文件删除。
-d:允许系统管理者硬链结自己的目录。
-s:进行软链结(Symbolic Link)。
-b:将在链结时会被覆盖或删除的文件进行备份。
链接有两种,一种被称为硬链接(Hard Link),另一种被称为符号链接(Symbolic Link)。
默认情况下,ln 命令产生硬链接。
硬连接指通过索引节点来进行的连接。在 Linux 的文件系统中,保存在磁盘分区中的文件不管是什么类型都给它分配一个编号,称为索引节点号(Inode Index)。在 Linux 中,多个文件名指向同一索引节点是存在的。一般这种连接就是硬连接。硬连接的作用是允许一个文件拥有多个有效路径名,这样用户就可以建立硬连接到重要文件,以防止“误删 的功能。其原因如上所述,因为对应该目录的索引节点有一个以上的连接。只删除一个连接并不影响索引节点本身和其它的连接,只有当最后一个连接被删除后,文件的数据块及目录的连接才会被释放。也就是说,文件才会被真正删除。
与硬连接相对应,Lnux 系统中还存在另一种连接,称为符号连接(Symbilc Link),也叫软连接。软链接文件有点类似于 Windows 的快捷方式。它实际上是特殊文件的一种。在符号连接中,文件实际上是一个文本文件,其中包含的有另一文件的位置信息。

动手练习

1.利用符号链接快速访问关键日录

符号链接是一个非常实用的功能。假设有一些目录或文件需要频繁使用,但由于 Linux 的文件和目录结构等原因,这个文件或目录在很深的子目录中。比如,Apache Web 服务器文档位于系统的/usr/local/httpd/htdocs 中,并且不想每次都要从主目录进入这样一个长的路径之中(实际上,这个路径也非常不容易记忆)。
为了解决这个问题,可以在主目录中创建一个符号链接,这样在需要进入该目录时,只需进入这个链接即可。
为了能方便地进入 Web 服务器(/usr/local/httpd/htdocs)文档所在的目录,在主目录下可以使用以下命令:
$ ln -s /usr/local/httpd/htdocs gg
这样每次进入 gg 目录就可访问Web 服务器的文档,以后如果不再访问 Web 服务器的文档
时,删除 gg 即可,而真正的 Web 服务器的文档并没有删除。

2.使用 dd 命令将init.rd 格式的root.ram 内容导入内存

dd if=/dev/fd0 of==floppy.fd dd if=root.ram of=/dev/ram0 #

3.grep 命令系统调用

grep 是 Linux/Unix 中使用最广泛的命令之一,许多 Linux 系统内部都可以调用它。
(1)如果要查询目录列表中的目录,方法如下:

$ ls -l | grep ’/\d’

(2)如果在一个目录中查询不包含目录的所有文件,方法如下:

    $ ls -l | grep ’/\[/\d]’

(3)用 find 命令调用 grep,如所有 C 源代码中的“Chinput ,方法如下:

$find /ZhXwin -name *.c -exec grep -q -s Chinput {} \;-print