Python

BeautifulSoup4 详细用法

一、 Beautiful Soup 安装 Beautiful Soup 提供一些简单的、Python 式的函数用来处理导航、搜索、修改分析树等功能。它是一个工具箱,通过解析文档为用户提供需要抓取的数据,因为简单,所以不需要多少代码就可以写出一个完整的应用程序。 Beautiful Soup 3 目前已经停止开发,推荐在现在的项目中使用 Beautiful Soup 4,不过它已经被移植到 BS4 了,也就是说导入时我们需要导入 bs4。 Beautiful Soup 支持 P …

BeautifulSoup4 详细用法 阅读更多 »

XPath 入门实例

XPath(XML Path Language),即 XML 路径语⾔,它是⼀⻔在 XML ⽂档中查找信息的语⾔。最初是⽤来搜寻 XML ⽂档的,但同样适⽤于 HTML ⽂档的搜索,所以在做爬⾍时完全可以使⽤ XPath 做相应的信息抽取。 1. XPath 概览 XPath 的选择功能⼗分强⼤,它提供了⾮常简洁明了的路径选择表达式。另外还提供了超过 100 个内建函数,⽤于字符串、数值、时间的匹配以及节点、序列的处理等,⼏乎所有想要定位的节点 都可以⽤ XPath 来选择。 …

XPath 入门实例 阅读更多 »

Python Requests 库使用指南

Requests 库是用来发标准 HTTP 请求的包,将请求背后的复杂性抽象成一个漂亮,简单的 API,以便可以专注于与服务交互和在应用程序中使用数据。 一、Requests 安装 安装 requests 库,运行以下命令: 如果使用 Pipenv 管理 Python 包,可以运行下面的命令: 一旦安装了 requests 就可以在应用程序中像这样导入 requests : 二、GET …

Python Requests 库使用指南 阅读更多 »

Python 文件读写

一、TXT文件读写 Python 常用的文件读取函数有三种:read()、readline() 与 readlines()。 1. read():一次性读取全部内容 2. readline():只读取第一行内容 3. readlines():一次性读取全部内容并以列表形式返回 4. 写入文件 几种文件读写模式的区别以及对应指针: r:读取文件,若文件不存在则会报错。 w:写入文件,若文件不存在则会先创建再写入,会覆盖原文件。 a:写入文件,若文件不存在则会先创建再写入但不会覆 …

Python 文件读写 阅读更多 »

Python 安装教程

Python是跨平台的,可以运行在Windows、Mac和各种Linux/Unix系统上,也就是说在Windows上写Python程序,放到Linux上也是能够运行的。 很多人会推荐 Anaconda 集成安装包,但实际上原版Python在日常编码使用时候基本够用了,可以直接官网下载。 看版本,x86-64是64位版本、x86是32位版本,你需要下载跟你电脑系统一致的版本。然后看文件类型: embeddable zip file:是压缩包版本,即便携版解压可用。 execut …

Python 安装教程 阅读更多 »

Scroll to Top