正则表达式学习之回溯引用backreference的示例分析-创新互联

这篇文章将为大家详细讲解有关正则表达式学习之回溯引用backreference的示例分析，小编觉得挺实用的，因此分享给大家做个参考，希望大家阅读完这篇文章后可以有所收获。

创新互联专注于中大型企业的成都网站建设、成都网站设计和网站改版、网站营销服务，追求商业策划与数据分析、创意艺术与技术开发的融合，累计客户上千多家，服务满意度达97%。帮助广大客户顺利对接上互联网浪潮，准确优选出符合自己需要的互联网运用，我们将一直专注高端网站设计和互联网程序开发，在前进的路上，与客户一起成长！

一、问题引入

一个在HTML页面中匹配标题标签（H1—H6）的问题：

文本：


Welcome to my page
Content is divided into twosections:

Introduction
Information about me.
Hobby
Information about my hobby.
This is invalid HTML

正则表达式：<[hH][1-6]>.*?

结果：

【

Welcome to my page

】
Content is divided into twosections:

【

Introduction

】
Information about me.
【

Hobby

】
Information about my hobby.
【

This is invalid HTML

】

分析：模式<[hH][1-6]>匹配任何一级标题的开始标签，而且不区分大小写，在这个例子中它匹配到了

、

，匹配到了

、、；这里使用了懒惰型元字符来匹配标签中的文本，否则会匹配到从第一个开始标签到最后一下结束标签之间的内容。但是从结果可以看出，有一个无效的标签也匹配上了，即

，它们根本不能配对。要解决这个问题，就需要使用到回溯引用（backreference）。

二、回溯引用匹配

回溯引用是指模式的后半部分引用在前半部分中定义的子表达式。至于子表达式的使用、划分和引用，在前面已经介绍过了。现在来解决前面的例子：

文本：


Welcome to my page
Content is divided into twosections:

Introduction
Information about me.
Hobby
Information about my hobby.
This is invalid HTML

正则表达式：<[hH]([1-6])>.*?

结果：

【

Welcome to my page

】
Content is divided into twosections:

【

Introduction

】
Information about me.
【

Hobby

】
Information about my hobby.

This is invalid HTML

分析：首先匹配开始标题标签的模式<[hH]([1-6])>，使用括号把[1-6]做为子表达式，而匹配结束标题标签模式为，其中\1表示引用第一个子表达式，即([1-6])，如果([1-6])匹配到的是1，那\1也匹配到1，如果匹配到2，那\1也匹配到2，所以最后一个无效的标题标签就不会被匹配到了。

关于“正则表达式学习之回溯引用backreference的示例分析”这篇文章就分享到这里了，希望以上内容可以对大家有一定的帮助，使各位可以学到更多知识，如果觉得文章不错，请把它分享出去让更多的人看到。

标题名称：正则表达式学习之回溯引用backreference的示例分析-创新互联
URL链接：http://wjwzjz.com/article/djhjsd.html

新网创想网站建设，新征程启航

正则表达式学习之回溯引用backreference的示例分析-创新互联

Welcome to my page

Introduction

Hobby

This is invalid HTML

Welcome to my page

Introduction

Hobby

This is invalid HTML

、

，匹配到了

Welcome to my page

Introduction

Hobby

This is invalid HTML

Welcome to my page

Introduction

Hobby

This is invalid HTML

其他资讯