[bigdata-56] py3+selenium 抓取学信网 最简demo

来源:互联网 发布:金蝶软件最新版本 编辑:程序博客网 时间:2024/05/16 00:48

各种情况不考虑,只演示核心功能。


#!/usr/bin/env python3# !-*- coding:utf-8 -*-"""演示如何抓取学信网"""import timefrom selenium import webdriverdef get_sub_regions(browser, url):    #登录页面    browser.get(url)    #输入用户名    elem = browser.find_element_by_id('username')    elem.clear()    elem.send_keys('187xxxxxxxx')    elem = browser.find_element_by_id('password')    #输入密码    elem.clear()    elem.send_keys('99xxxxx')    #点击登录    elem = browser.find_element_by_xpath('//input[@class=\"btn_login btn_login_my\"]')    elem.click()    # 点击进入查看页面    time.sleep(5)    elem = browser.find_element_by_xpath('//a[@class=\"login-btn\"]')    elem.click()    # 高等教育信息    time.sleep(5)    elem = browser.find_element_by_xpath('//a[@href=\"gdjy/xj/show.action\"]')    elem.click()    # 样例查询    time.sleep(5)    # elem = browser.find_element_by_xpath('//div[@class=\"main\"]')    elems = browser.find_elements_by_xpath('//div[@class=\"m-left xj-left main-block border-shadow\"]')    for i in elems:        print(i.text)def main():    #启动浏览器    browser = webdriver.Firefox()    #登录学信网    sh_business_regions = get_sub_regions(browser,      'https://account.chsi.com.cn/passport/login?service=https%3A%2F%2Fmy.chsi.com.cn%2Farchive%2Fj_spring_cas_security_check')if __name__ == '__main__':    main()


0 0
原创粉丝点击