跳至主要内容

python 之 网页自动化测试


https://opensourceforu.com/2017/10/splinter-easy-way-test-web-applications/

https://splinter.readthedocs.io/en/latest/index.html

https://sites.google.com/a/chromium.org/chromedriver/home
下载谷歌浏览器版本对应的chromedriver.exe并将其加入环境变量path中


Anaconda3 (64-bit)
打开Anaconda Prompt,运行以下命令
jupyter nbconvert --to html your_notebook_name.ipynb
可将ipynb格式文件转换为html格式
(base) C:\Users\DZL>jupyter nbconvert --to html Untitled40.ipynb
[NbConvertApp] Converting notebook Untitled40.ipynb to html
[NbConvertApp] Writing 361412 bytes to Untitled40.html


当我打开Jupyter Notebook(以前为IPython)时,默认为C:\Users\USERNAME
打开当前工作目录,中间有空格
(base) C:\Users\DZL>start .

或者在Jupyter Notebook开python页面中输入pwd 或者cd

jupyter notebook --help-all


txt = ",,,,,rrttgg.....banana....rrr"
x = txt.strip(",.grt")
print(x)

>>> banana


  1. from selenium import webdriver
  2. # 添加驱动
  3. driver = webdriver.Chrome(r'D:\chromedriver')
  4. driver.get('https://www.kuaikanmanhua.com/web/topic/1338/')
  5. #driver.page_source
  6. #TopicItem cls
  7. from bs4 import BeautifulSoup
  8. import requests
  9. import time
  10. import os
  11. soup = BeautifulSoup(driver.page_source, 'lxml')
  12. #x=soup.select_one('.TopicList').get('TopicItem cls')
  13. for i in soup.find_all("div", class_="title fl"):
  14.     if i.a['href'] !='javascript:void(0);':
  15.         name = i.text.strip()
  16.         url = 'https://www.kuaikanmanhua.com/'+ i.a['href']
  17.         os.mkdir(r'C:\Users\DANG\Pictures\海贼王\{}'.format(name))
  18.         driver.get(url)
  19.         soup = BeautifulSoup(driver.page_source, 'lxml')
  20. #soup.find_all('img')
  21.         imglist = soup.select_one(".imgList")
  22.         # enumerate返回可迭代对象,元素为两元元组,进而可以用切片获取
  23.         for img in enumerate(imglist, start=1):
  24.             id_num = img[0]
  25.             imgurl = img[1].get('data-src')
  26.             headers ={'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.75 Safari/537.36'}
  27.             res = requests.get(imgurl, headers=headers)
  28.             with open(r'C:\Users\DANG\Pictures\海贼王\{}\{}.jpg'.format(name, id_num), 'wb') as f:
  29.                 f.write(res.content)
  30.             time.sleep(3)

# 打开图片
from PIL import Image
Image.open("test.jpg")

    for i in soup.find_all(class_="ListPicM"):
        img_name = re.sub('[?:\\\/\n]', ' ', i.text)
        img_url = i.img.get('src')
#      img_name = img_url.split('/')[-2]
        headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.111 Safari/537.36'}
        try:
            res = requests.get(img_url, headers=headers, timeout=500)
        except requests.exceptions.ConnectionError:
            print('图片{}因超时无法下载,链接为:{}'.format(img_name, img_url))
            continue


  1. from splinter import Browser
  2. # 如果您没有为该Browser功能提供任何驱动程序参数,则默认firefox将使用
  3. with Browser('chrome') as browser:
  4.     # Visit URL
  5.     url = "http://www.google.com"
  6.     browser.visit(url)
  7.     browser.fill('q', 'splinter - python acceptance testing for web applications')
  8.     # Find and click the 'search' button
  9.     button = browser.find_by_name('btnG')
  10.     # Interact with elements
  11.     button.click()
  12.     if browser.is_text_present('splinter.readthedocs.io'):
  13.         print("Yes, the official website was found!")
  14.     else:
  15.         print("No, it wasn't found... We need to improve our SEO techniques")
  16.  
  17.  
  18.  
  19. # imports the Browser library for Splinter
  20. from splinter import Browser
  21.  
  22. # takes the email address from user as input to login to his/her Facebook account
  23. user_email = input("enter users email address:")
  24.  
  25. # takes the password from user as input to login to his/her Facebook account
  26. user_pass = input("enter users password:")
  27.  
  28. # loads the Chrome browser browser= Browser('chrome')
  29. # stores the URL for Facebook in url variable
  30. url = "https://www.facebook.com/"
  31.  
  32. # navigates to facebook website and load that in the Firefox browser
  33. browser.visit(url)
  34.  
  35. # checks if Facebook web page is loaded else prints an error message
  36. if browser.is_text_present('www.facebook.com'):
  37.  
  38.     # fills the user’s email ID and password in the email and password field of the facebook login section
  39.     # Inbuilt function browser.fill uses the tag name for Email and Password input box i.e. email and pass respectively to identify it    
  40.     browser.fill('email', user_email)    
  41.     browser.fill('pass', user_pass)
  42.      
  43.     # selects the login button using its id value present on the Facebook page to click and log in with the given details    
  44.     button = browser.find_by_id('u_0_d')    
  45.     button.click()
  46.  
  47. else:
  48.     print("Facebook web application NOT FOUND")

评论

此博客中的热门博文

学习地址

清华大学计算机系课程攻略 https://github.com/PKUanonym/REKCARC-TSC-UHT 浙江大学课程攻略共享计划 https://github.com/QSCTech/zju-icicles https://home.unicode.org/ 世界上的每个人都应该能够在手机和电脑上使用自己的语言。 http://codecanyon.net   初次看到这个网站,小伙伴们表示都惊呆了。原来代码也可以放在网上卖的?!! 很多coder上传了各种代码,每个代码都明码标价。看了下销售排行,有的19刀的卖了3万多份,额di神啊。可以看到代码的演示效果,真的很漂亮。代码以php、wordpress主题、Javascript、css为主,偏前台。 https://www.lintcode.com/ 算法学习网站,上去每天刷两道算法题,走遍天下都不怕。 https://www.codecademy.com/ 包含在线编程练习和课程视频 https://www.reddit.com/ 包含有趣的编程挑战题,即使不会写,也可以查看他人的解决方法。 https://ideone.com/ 在线编译器,可运行,可查看代码示例。 http://it-ebooks.info/ 大型电子图书馆,可即时免费下载书籍。 刷题 https://github.com/jackfrued/Python-100-Days https://github.com/kenwoodjw/python_interview_question 面试问题 https://github.com/kenwoodjw/python_interview_question https://www.journaldev.com/15490/python-interview-questions#python-interpreter HTTP 身份验证 https://developer.mozilla.org/zh-CN/docs/Web/HTTP/Authentication RESTful 架构详解 https://www.runoob.com/w3cnote/restful-architecture.html https://www.rosettacode.org/wiki/Rosetta_C...

PDF处理

虚拟pdf打印机 pdfFactory  https://fineprint.com PDFCreator  https://www.pdfforge.org 开源 cutepdf https://www.cutepdf.com/index.htm Doro PDF Writer http://www.the-sz.com/products/doro PdfScribe  https://github.com/stchan/PdfScribe/releases pdf阅读器 Sumatra PDF https://www.sumatrapdfreader.org/ 为什么 Python 用于 PDF 处理  如您所知,PDF 处理属于文本分析。 大多数文本分析库或框架仅使用 Python 设计。 这为文本分析提供了优势。 还有一件事,您永远无法在现有的机器学习或自然语言处理框架中直接处理 pdf。 除非他们为此证明了显式接口。 我们必须先将pdf转换为文本。 我们可以使用下述任何库轻松实现这一点。 在线转换pdf Sejda https://www.sejda.com/pdf-editor 每个文档 200 页的免费限制 https://www.pdf2go.com/ https://tools.pdfforge.org/extract-text PDF24 Tools https://tools.pdf24.org/zh/ 免费且易于使用的在线PDF工具 FreeOCR http://www.paperfile.net/ 适用于Windows的免费光学字符识别软件,支持大多数Twain扫描仪的扫描,还可以打开大多数扫描的PDF和多页Tiff图像以及流行的图像文件格式,FreeOCR输出纯文本,可以直接导出为Microsoft Word格式。 不支持中文 wkhtmltopdf 和 wkhtmltoimage 是使用 QT Webkit 渲染引擎将 HTML 渲染为 PDF 和各种图像格式的命令行工具。这些完全“无头”运行,不需要显示或显示服务。 https://wkhtmltopdf.org/ django-wkhtmltopdf 允许 Django 站点输出动态 PDF。它利用 wkhtmltopdf 库,允许您使用您知道...

安卓 之 apk下载、ADB、 scrcpy

Apk下载 下载离线安装apk https://www.apkmirror.com/ 免费和安全的Android APK下载 https://apkpure.com/ 被暴雷,有植入 https://apps.evozi.com/apk-downloader/ 可以将Google Play( https://play.google.com )中的apk文件所在网址直接下载到台式机和设备上 https://f-droid.org/zh_Hans/ F-Droid 是一个 Android 平台上 FOSS(Free and Open Source Software,自由开源软件)的目录,并提供下载安装支持。使用客户端可以更轻松地浏览、安装及跟进设备上的应用更新。 https://gitlab.com/AuroraOSS/AuroraStore Aurora商店 是Google Play商店的非官方FOSS客户,设计典雅。 Aurora商店不仅下载,更新和搜索Play商店等应用 https://github.com/OpenTracksApp/OpenTracks OpenTracks是一款运动跟踪应用程序,完全尊重您的隐私。 Tasker https://tasker.joaoapps.com/ 是一款适用于Android的应用程序,它可以根据用户定义的配置文件中的上下文、可点击或定时的主屏幕小部件来执行任务。它无需root或特殊的主屏幕就能控制Android设备。 AsciiCam AsciiCam可以从您的相机指向的任何位置实时生成ASCII图像。选择黑白,原色或全彩,拍照,并将其作为图像或HTML共享。您还可以在库中创建ASCII版本的图片,并且每次使用标准相机应用程序拍摄照片时,也可以选择自动生成ASCII版本。 AsciiCam是完全免费和开源的。 Apk1安装器 优化微信apk文件接收体验。 微信收到apk文件会加 ".1" 后缀导致打不开,必须自己手动找到文件重命名去掉后缀。 使用本安装器就可以在微信内,潇洒地点击直接打开。甚至可以在安装器内浏览apk1文件历史接收记录。 ADB ADB全名是 Android Debug Bridge,是开发或使用Android时很常用的工具。可以从电脑通过USB连线到Android手机上 https:...