用户登录
用户注册

分享至

python通过正则表达式分析网页中的图片并进行替换

  • 作者: 达?矢抾哆拉?
  • 来源: 51数据库
  • 2022-08-12

这段代码分析网页中的所有图片表单<img>,分析后为其前后添加相应的修饰标签,并添加到图片的超级链接。

result = value.replace("[page]","").replace('  ',u' ')
p=re.compile(r'''(<img\b[^<>]*?\bsrc[\s\t\r\n]*=[\s\t\r\n]*["']?[\s\t\r\n]*([^\s\t\r\n"'<>]*)[^<>]*?/?[\s\t\r\n]*>)''',re.IGNORECASE)
result = p.sub(r'''<span class="openIcon"><em></em><a href="\2">\1</a></span>''',result)

软件
前端设计
程序设计
Java相关