正则表达式使用工具教程 下载本文

八爪鱼·云采集网络爬虫软件

www.bazhuayu.com

图11.3-9 去除空格

添加前缀:将所需要的前缀添加到待处理字符串前面

八爪鱼·云采集网络爬虫软件

www.bazhuayu.com

图11.3-10 添加前缀

添加后缀:将所需要的后缀添加到待处理字符串前面

八爪鱼·云采集网络爬虫软件

www.bazhuayu.com

图11.3-11 添加后缀

HTML转码:将实体引用转化为普通文本

八爪鱼·云采集网络爬虫软件

www.bazhuayu.com

图11.3-12 HTML转码

实体引用如下:

引用符 < > & ' "

表11.3-1 实体引用

综合运用:利用前缀、HTML转码、替换完成格式化数据综合运用

被引用字符

< > & ‘ “

八爪鱼·云采集网络爬虫软件

www.bazhuayu.com

图11.3-1 综合运用

一般来说,对付较为复杂的数据,可能一次简单的格式化处理并不能完成,我们需要在一次处理后再进行再次格式化处理,因此,了解格式化各操作的运用很有必要,合理搭配一定能处理拿到我们想要的数据。

以上为八爪鱼正则工具简单运用,了解正则工具各位置释义与作用,配合后续章节学习正则语法,对正则的掌握有良好的促进作用