抓取糗事百科文字笑话
- 作者: 唔day爱
- 来源: 51数据库
- 2022-08-12
# -*- coding:utf-8 -*-
#制作者:archingB
import urllib
import urllib2
import re
readme="按下回车键开始读取,q退出,w写入save.txt"
def getpage(page):
url='http://www.51sjk.com/Upload/Articles/1/0/320/320353_20220812153747605.jpg' + str(page)
user_agent = 'Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)'
headers = { 'User-Agent' : user_agent }
try:
request = urllib2.Request(url,headers = headers)
response = urllib2.urlopen(request)
content = response.read().decode('utf-8')
pattern = re.compile('<div class="content">(.*?)<!--\d{10}-->',re.S)
items=re.findall(pattern,content)
return items
except urllib2.URLError, e:
if hasattr(e,"code"):
print e.code
if hasattr(e,"reason"):
print e.reason
def writes(item):
item_swap=item.encode('utf-8')
try:
f=open('save.txt','a')
f.write(str(M)+'\n'+item_swap+'\n')
finally:
if f:
f.close()
def main():
P=1
N=0
IS=True
print readme.decode('utf-8')
global M
M=1
items=getpage(P)
raw_input()
while(IS):
if(N+1==len(items)):
P+=1
N=0
items=getpage(P)
items[N]=re.sub(r'<br/>','\n',items[N])
print N+1,items[N]
static=str(raw_input())
if(static=='q'or static=='Q'):
IS=False
break
if(static=='w'or static=='W'):
writes(items[N])
M+=1
N+=1
main()
推荐阅读
热点文章
Discord.py(重写)on_member_update 无法正常工作
0
Discord.py 在 vc 中获取用户分钟数
0
discord.py 重写 |为我的命令出错
0
Discord.py rewrite 如何 DM 命令?
0
播放音频时,最后一部分被切断.如何解决这个问题?(discord.py)
0
在消息删除消息 Discord.py
0
如何使 discord.py 机器人私人/直接消息不是作者的人?
0
(Discord.py) 如何获取整个嵌入内容?
0
Discord bot 尽管获得了许可,但不能提及所有人
0
Discord.py discord.NotFound 异常
0
