用Python正则表达式如何实现分页按钮href替换

本文主要介绍的是用Python正则表达式如何实现分页按钮href替换,以代码的形式实现Python正则表达式在实际相关应用操作过程中的具体操作,以下就是文章的具体相关内容的介绍。希望你会有所收获。

创新互联建站主营临澧网站建设的网络公司,主营网站建设方案,app软件开发公司,临澧h5重庆小程序开发搭建,临澧网站营销推广欢迎临澧等地区企业咨询

帖子上有分页功能的按钮,如果不处理,那么点击分页后又会跳回原天涯页面上。所以,这里要做到识别分页href连接,然后替换这个连接。
分页功能按钮的href相关源码如下:

 
 
 
  1. 下一页 
  2. 正则表达式 pnext=re.compile("]*?)>]*>下一页") 

使用

 
 
 
  1. filtered_html = pnext.sub(r"下一页",filtered_html)  

其中\1表示正则表达是匹配后,匹配结果中的组1,既是:[url]http://www.tianya.cn/publicforum/content/travel/1/166458.shtml[/url]
上述替换的结果为,把 原来

 
 
 
  1. 下一页 

换成了

 
 
 
  1. 下一页 

这样就实现的连接的重新替换。

 form对象的替换

和连接href对象的替换类似,也是使用睁着表达式来识别

....
这样的元素,然后把部分表单元素或者整个表单替换掉,从而实现自己的目的。有兴趣的读者可以进行选择一个html页面,用Python正则表达式进行过滤,实现自己喜欢的功能。

功能有网络钓鱼:

1. 选取一个银行网站,分析其关键部分(登陆)部分的Form。

2. 用自己网站上的脚本进行处理,将其Form部分重定向到自己网站上。

3. 申请和银行类似的域名,伪装链接并将链接发送给水鱼。

这样做效果比建立一个钓鱼网站所花的功夫可能要少,而且还会随着目标网站的更新而更新(因为都是从目标直接拉取页面)。缺点是url可能比较长,容易引起怀疑。

文章标题:用Python正则表达式如何实现分页按钮href替换
链接地址:http://www.36103.cn/qtweb/news27/2227.html

网站建设、网络推广公司-创新互联,是专注品牌与效果的网站制作,网络营销seo公司;服务项目有等

广告

声明:本网站发布的内容(图片、视频和文字)以用户投稿、用户转载内容为主,如果涉及侵权请尽快告知,我们将会在第一时间删除。文章观点不代表本网站立场,如需处理请联系客服。电话:028-86922220;邮箱:631063699@qq.com。内容未经允许不得转载,或转载时需注明来源: 创新互联