第一部分:Linux命令行
    《Linux命令行与shell脚本编程大全》 第一章:初识Linux shell
    《Linux命令行与shell脚本编程大全》 第二章:走进shell
    《Linux命令行与shell脚本编程大全》 第三章:基本的bash shell命令
    《Linux命令行与shell脚本编程大全》 第四章:更多的bash shell命令
    《Linux命令行与shell脚本编程大全》 第五章:使用Linux环境变量
    《Linux命令行与shell脚本编程大全》 第六章:理解Linux文件权限
    《Linux命令行与shell脚本编程大全》 第七章:管理文件系统
    《Linux命令行与shell脚本编程大全》 第八章:安装软件程序
    《Linux命令行与shell脚本编程大全》 第九章:使用编辑器

    第二部分:shell脚本编程基础
    《Linux命令行与shell脚本编程大全》 第十章:构建基本脚本
    《Linux命令行与shell脚本编程大全》 第十一章:使用结构化命令
    《Linux命令行与shell脚本编程大全》 第十二章:更多的结构化命令
    《Linux命令行与shell脚本编程大全》 第十三章:处理用户输入
    《Linux命令行与shell脚本编程大全》 第十四章:呈现数据
    《Linux命令行与shell脚本编程大全》 第十五章:控制脚本

    第三部分:高级shell编程
    《Linux命令行与shell脚本编程大全》 第十六章:创建函数
    《Linux命令行与shell脚本编程大全》 第十七章:图形化桌面上的脚本编程
    《Linux命令行与shell脚本编程大全》 第十八章:初识sed和gawk
    《Linux命令行与shell脚本编程大全》 第十九章:正则表达式
    《Linux命令行与shell脚本编程大全》 第二十章:sed进阶
    《Linux命令行与shell脚本编程大全》 第二十一章:gawk进阶
    《Linux命令行与shell脚本编程大全》 第二十二章:使用其他shell

    第四部分:高级shell脚本编程主题
    《Linux命令行与shell脚本编程大全》 第二十三章:使用数据库
    《Linux命令行与shell脚本编程大全》 第二十四章:使用Web
    《Linux命令行与shell脚本编程大全》 第二十五章:使用E-mail
    《Linux命令行与shell脚本编程大全》 第二十六章:编写脚本实用工具
    《Linux命令行与shell脚本编程大全》 第二十七章:shell脚本编程进阶


    第十九章:正则表达式

    由于之前我已经写过比较详尽的正则教程

    深入入门正则表达式(java) - 引言

    深入入门正则表达式(java) - 1 - 入门基础
    深入入门正则表达式(java) - 2 - 基本实例

    深入入门正则表达式(java) - 3 - 正则在java中的使用

    深入入门正则表达式(java) - 匹配原理 - 1 - 引擎分类与普适原则

    深入入门正则表达式(java) - 匹配原理 - 2 - 回溯

    并且在 Unix & Linux 大学教程 中的 第20章 也有笔记,所以这里笔记较为简略,一些简单的示例在这里就不在演示了。

    什么是正则表达式

    定义

    正则表达式类型

    Linux中,有两种流行的正则表达式引擎:

    1.POSIX基本正则表达式(BRE)引擎

    2.POSIX扩展正则表达式(ERE)引擎

    大多数Linux工具至少符合BRE引擎规范,能够识别所有模式和符号。

    一些工具,比如sed只实现了BRE引擎规范的子集。gawk实现了ERE引擎。

    定义BRE模式

    纯文本

    特殊字符

    斜线(/)不是正则的元字符,但是在sed和gawk中使用,也需要转义

    锚字符

    下面利用锚点来删除空白行

      $ cat test.txt 
    A:11221133
    B:44115522
    
    
    
    line 5
    $ sed '/^$/d' test.txt 
    A:11221133
    B:44115522
    line 5
     

    (并不是所有程序都可以这么干的)

    点字符

    字符组

    排除字符组

    使用区间

    特殊字符组

    BRE特殊字符组

    含义 类似于
    [[ :lower:]] 小写字母 a-z
    [[ :upper: ] ] 大写字母 A-Z
    [[ :alpha: ] ] 大小写字母 a-zA-Z
    [[ :alnum: ] ] 大小写字母、数字 a-zA-Z0-9
    [[ :digit: ] ] 数字 0-9
    [[ :punct: ] ] 标点符号 --
    [[:print:]] 匹配任意可打印字符 --
    [[ :blank: ] ] 空格或制表符(空白符) --
    [[:space:]] 匹配任意空白字符 空格、制表符、NL、FF、VT和CR

    一个简单的示例:

      $ cat test.txt 
    A:11221133
    B:44115522
    
    
    
    line 5
    $ sed -n '/[[:digit:]]/p' test.txt 
    A:11221133
    B:44115522
    line 5
     

    这里使用\d是无效的

    星号

    扩展正则表达式

    问号

    加号

    花括号

    警告:默认情况下,gawk不识别表达式区间,必须指定--re-interval选项

    注意:gawk只支持下面几种形式

    {m},{m,n},{m,}

    并不支持{,m}

    管道符号

    聚合表达式

    实用中的正则表达式

    目录文件计数

    也和书中一样,我们统计$PATH中的目录含有的文件数目。

    其实这里关键的就是把$PATH里的目录变成数组参数而已。

    下面是书中的例子,不过这个例子是有问题的:

      $ echo $PATH | sed 's/:/ /g'
     

    代码很容易理解。环境变量PATH中的目录是用冒号分割的,现在利用sed,改为空格分割路径,这样就可以直接对此使用循环了。

    但是,PATH中的目录是允许重复的! 也就是说,你可以把同一个目录多次的加入到这个变量中(虽然这么做没有半点好处),当然,很有可能是其他软件设置的PATH与你自己设置的重复了。不管怎样,我们是不需要重复统计的。

    下面是修正后的代码:

      echo $PATH | sed 's/:/
    /g' | sort | uniq
     

    这里用换行替换冒号,这样也能直接对此结果使用循环。这么做的好处就是,我们可以使用sort然后使用uniq去重复

    验证电话号码

    解析邮件地址

    关于正则更多内容,可以参考我之前的写的教程,里面有详尽的正则基础讲解以及示例。

    深入入门正则表达式(java) - 引言

    深入入门正则表达式(java) - 1 - 入门基础
    深入入门正则表达式(java) - 2 - 基本实例

    深入入门正则表达式(java) - 3 - 正则在java中的使用

    深入入门正则表达式(java) - 匹配原理 - 1 - 引擎分类与普适原则

    深入入门正则表达式(java) - 匹配原理 - 2 - 回溯

    《Unix & Linux 大学教程》 - 第二十章 正则表达式

    转贴请保留以下链接

    本人blog地址

    http://su1216.iteye.com/

    http://blog.csdn.net/su1216/