Linux grep与正则表达式的简单介绍


本文摘自PHP中文网,作者巴扎黑,侵删。

grep 是一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹配的行打印出来。下面通过本文给大家分享Linux grep与正则表达式的相关知识,感兴趣的朋友一起看看吧

grep简介

  grep 是一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹配的行打印出来。通常grep有三种版本grep、egrep(等同于grep -E)和fgrep。egrep为扩展的grep,fgrep则为快速grep(固定的字符串来对文本进行搜索,不支持正则表达式的引用但是查询极为快速)。grep是Linux文本处理三剑客之一。

grep使用方式

  使用方式:


1

grep [OPTIONS] PATTERN [FILE...]


1

grep [OPTIONS] [-e PATTERN | -f FILE] [FILE...]

  常用选项:

  --color=auto:对匹配到的文本着色后进行高亮显示;

   -i:忽略字符的大小写

  -o:仅显示匹配到的字符串

  -v:显示不能被模式匹配到的行

  -E:支持使用扩展的正则表达式

  -q:静默模式,即不输出任何信息

  -A #:显示被模式匹配的行及其后#行

  -B #:显示被模式匹配的行及其前#行

  -C #:显示被模式匹配的行及其前后各#行

  注:使用grep匹配时需使用双引号引起来(单引号为强引用),防止被系统误认为参数或者特殊命令而报错。

扩展grep使用方式

  使用方式:


1

2

egrep [OPTIONS] PATTERN [FILE...]

grep -E [OPTIONS] PATTERN [FILE...]

  -i:忽略字符的大小写
  -o:仅显示匹配到的字符串本身
  -v:显示不被模式匹配到的行
  -q:静默模式,即不输出任何信息
  -A #:显示被模式匹配的行及其后#行
  -B #:显示被模式匹配的行及其前#行
  -C #:显示被模式匹配的行及其前后各#行
  -G:支持基本正则表达式

grep正则表达式元字符

  ‘^‘: 锚定行首

  ‘$': 锚定行尾

  ‘.‘: 匹配任一一个字符

  ‘*': 匹配零个或多个先前字符

  ‘\?‘:匹配其前面的字符0次或者1次;

  ‘\+':匹配其前面的字符1次或者多次;

  ‘\{m\}‘:匹配其前面的字符m次(\为转义字符)

  ‘\{m,n\}':匹配其前面的字符至少m次,至多n次

  ‘[]‘: 匹配一个指定范围内的字符 | ‘[^]'匹配指定范围外的任意单个字符

  ‘\<‘或‘\b':锚定词首,‘\>'或‘\b':锚定词尾(可用\<PATTERN\>:匹配完整单词)

  ‘\(\)':将多个字符当做一个整体进行处理

  后向引用:引用前面的分组括号中的模式所匹配到的字符

  分组括号中的模式匹配到的内容或被正则表达式引擎自动记录于内部的变量中:

  \1:模式从左侧起,第一个左括号及与之匹配的右括号之间模式匹配到的内容

  \2:模式从左侧起,第二个左括号及与之匹配的右括号之间模式匹配到的内容...

  扩展正则表达式与正则表达式略有不同:

  '[]':依旧匹配指定范围内的任意单个字符;但是有很多特殊匹配方式。

    [:digit:] 匹配任意单个数字

    [:lower:] 匹配任意单个小写字母

    [:upper:] 匹配任意单个大写字母

    [:alpha:] 匹配任意单个字母

    [:alnum:] 匹配任意单个字母或数字

    [:punct:] 匹配任意单个符号

    [:space:] 匹配单个空格

  一些地方取消了转义字符的使用:

  ‘?‘:匹配其前面的字符0次或者1次;

  ‘+':匹配其前面的字符1次或者多次;

  ‘{m}‘:匹配其前面的字符m次(\为转义字符)

  ‘{m,n}':匹配其前面的字符至少m次,至多n次

  ():将一个或多个字符捆绑在一起,当做一个整体进行处理,反向引用照常使用。

  ‘|':或(注:‘C|cat'为C与cat,‘(C|c)at才是Cat与cat')

练习题:

  1、列出当前系统上所有已经登录的用户的用户名,注意:同一个用户登录多次,则只显示一次


1

2

[root@localhost ~]# who | cut -d' ' -f1|uniq

root

  2、取出最后登录到当前系统的用户的相关信息


1

2

[root@localhost ~]# id `last | head -1 | cut -d' ' -f1`

uid=0(root) gid=0(root) groups=0(root)

  3.取出当前系统上被用户当做其默认shell最多的那个shell


1

2

[root@localhost ~]# cut -d':' -f7 /etc/passwd|uniq -c|sort -n|tail -1|cut -d' ' -f7

/sbin/nologin

  4.将/etc/passd中的第三个字段设置最大的后10个用户的信息全部改为大写保存至/tmp/maxuser.txt文件中


1

2

3

4

5

6

7

8

9

10

11

12

[root@localhost ~]# sort -t':' -k3 -n /etc/passwd|tail -10|tr 'a-z' 'A-Z' >/tmp/maxusers.txt

[root@localhost ~]# cat /tmp/maxusers.txt

NOBODY:X:99:99:NOBODY:/:/SBIN/NOLOGIN

SYSTEMD-NETWORK:X:192:192:SYSTEMD NETWORK MANAGEMENT:/:/SBIN/NOLOGIN

NGINX:X:996:994:NGINX WEB SERVER:/VAR/LIB/NGINX:/SBIN/NOLOGIN

CHRONY:X:997:995::/VAR/LIB/CHRONY:/SBIN/NOLOGIN

POLKITD:X:998:996:USER FOR POLKITD:/:/SBIN/NOLOGIN

SYSTEMD-BUS-PROXY:X:999:997:SYSTEMD BUS PROXY:/:/SBIN/NOLOGIN

DINGJIE:X:1000:1000:DINGJIE:/HOME/DINGJIE:/BIN/BASH

JEFF:X:1001:1024:WOSHIDASHUAIBI:/HOME/JEFF:/BIN/BASH

EGON:X:1002:1002::/HOME/EGON:/BIN/BASH

NFSNOBODY:X:65534:65534:ANONYMOUS NFS USER:/VAR/LIB/NFS:/SBIN/NOLOGIN

  5.取出当前主机的IP地址


1

2

[root@localhost ~]# ifconfig | egrep "inet.*broadcast.*"|cut -d' ' -f10

192.168.0.133

  6.列出/etc目录下所有已.conf结尾的文件的文件名,并将其名字转换为大写后保存至/tmp/etc.conf文件中


1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

[root@localhost ~]# find /etc -name '*.conf' | egrep -o "[^/]*(\.conf)$"|tr 'a-z' 'A-Z' >/tmp/etc.conf

[root@localhost ~]# cat /tmp/etc.conf

RESOLV.CONF

CA-LEGACY.CONF

FASTESTMIRROR.CONF

LANGPACKS.CONF

SYSTEMD.CONF

VERSION-GROUPS.CONF

LVM.CONF

LVMLOCAL.CONF

ASOUND.CONF

LDAP.CONF

MLX4.CONF

RDMA.CONF

SMTPD.CONF

  7.显示/var目录下一级子目录或文件的总数


1

[root@localhost ~]# ls /var | wc -l

  8.取出/etc/group第三个字段数值最小的10个组的名字


1

2

3

4

5

6

7

8

9

10

11

[root@localhost ~]# sort -t: -k3 -n /etc/group|head -10 |cut -d':' -f1

root

bin

daemon

sys

adm

tty

disk

lp

mem

kmem

  9.将/etc/fstab和/etc/issue文件的内容合并为同一个内容后保存至/tmp/etc.test文件中


1

2

3

4

5

6

7

8

9

10

11

12

13

14

[root@localhost ~]# cat /etc/fstab /etc/issue > /tmp/etc.test

[root@localhost ~]# cat /tmp/etc.test

#

# /etc/fstab

# Created by anaconda on Sat May 13 10:12:58 2017

#

# Accessible filesystems, by reference, are maintained under '/dev/disk'

# See man pages fstab(5), findfs(8), mount(8) and/or blkid(8) for more info

#

/dev/mapper/cl-root   /            xfs   defaults    0 0

UUID=2789d01a-4e2b-47a5-9c3c-537641648663 /boot          xfs   defaults    0 0

/dev/mapper/cl-swap   swap          swap  defaults    0 0

\S

Kernel \r on an \m

以上就是Linux grep与正则表达式的简单介绍的详细内容,更多文章请关注木庄网络博客

相关阅读 >>

有关Linux中的bash编程讲解

如何使用diskitemtype列举磁盘信息项的类型

Linux中一些常见的设置网络参数的命令

Linux中如何查看内核版本

如何查看Linux信息

Linux系统中su与sudo的用法

详解Linux下“/”和“~”的区别

Linux 系统什么意思

Linux快速查找文件

Linux无法使用telnet登录怎么办

更多相关阅读请进入《Linux》频道 >>



打赏

取消

感谢您的支持,我会继续努力的!

扫码支持
扫码打赏,您说多少就多少

打开支付宝扫一扫,即可进行扫码打赏哦

分享从这里开始,精彩与您同在

评论

管理员已关闭评论功能...