抓取 题目描述 生成 解题报告 模板 python
来源:互联网 发布:网络电影制作合同 编辑:程序博客网 时间:2024/05/27 19:26
BGround
偷懒是人类进步的阶梯!!
瞎搞是自然选择的必然!!
这绝对是我写过最丑的python代码,但是的确能用,忍忍看吧
Code
# -*- coding: utf-8 -*-import requests, time, reimport HTMLParserdef getPage(html, url, headers, params = {}, timeout = 5, verify = True): response = html.get(url = url, headers = headers, params = params, timeout = timeout, verify = verify) page = response.content return pagedef search(string, page, flags = 0): pattern = re.compile(string, flags = flags) results = re.findall(pattern, page) return resultsdef format(string): results = HTMLParser.HTMLParser().unescape(re.compile(r'<[^>]+>', re.S).sub('', re.sub('</strong>|</h2>', '\n---\n', re.sub('<strong>|<h2>', '\n##', string.decode('UTF-8'))))) return resultsdef main(): html = requests.session() headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 5.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/49.0.2623.22 Safari/537.36 SE 2.X MetaSr 1.0'} probid = raw_input('id: ') url = 'https://www.luogu.org/problem/show?pid=%s#sub' % probid PD = search(r"<div class=\"lg-article am-g\">(.+?)<div class=\'lg-article-sub am-g\' id=\"sub\"></div>", getPage(html, url, headers), flags = re.S)[0] with open('/home/olahiuj/文档/progs/oi/luogu%s.cpp' % probid, 'r') as file: content = ''' %s## Analysis---## Code---` ``%s` `` ''' % (re.sub(' ', '', format(PD).encode('UTF-8')), file.read().encode('UTF-8')) with open('/home/olahiuj/文档/LPD/luogu%s.md' % probid, 'w') as file: file.write(content) print 'Problem %s is Done!' % probidif __name__ == '__main__': main()
0 0
- 抓取 题目描述 生成 解题报告 模板 python
- csp解题报告 模板生成系统
- 最小生成树,POJ和HDU几道题目的解题报告(基于自己的模板)
- 数学题目解题报告
- 数学题目解题报告
- CCF CSP 201509-3 模板生成系统 解题报告
- CCF CSP 201509-3 模板生成系统 解题报告
- 解题报告模板
- C语言解题报告模板
- c语言解题报告模板
- Pku acm 2485 Highways数据结构题目解题报告(三) ----最小生成树:prim算法
- Pku acm 1258 Agri-Net数据结构题目解题报告(四) ----最小生成树:prim算法
- python爬虫抓取LeetCode题目
- [汇总]字符串题目推荐及解题报告
- 顶嵌杯初赛题目的解题报告
- 汇总]搜索题目推荐及解题报告
- [汇总]字符串题目推荐及解题报告
- POJ1207解题报告----极水的题目
- PHP学习笔记——错误处理
- Scrum Master与Project Manager的区别
- codevs 全排列 1294
- Permutations II
- Mysql自动设置时间(自动获取时间,填充时间)
- 抓取 题目描述 生成 解题报告 模板 python
- 洛谷 P1282 多米诺骨牌
- 大大维的游戏机计划2--一个自制的类似2048的小游戏
- cvCreateVideoWriter生成AVI视频时返回为空问题的终极解决方案
- CSS选择器兼容情况
- hihoCoder - 1270 建造基地
- ACPI基础——ASL语言
- maven更新异常
- word count英文文章计数(c语言)&指针