python2入门学习第四节使用第三方函数库及简单的爬虫

科技2024-03-15 93

python2入门学习第四节使用第三方函数库及简单的爬虫

函数是已经编写好的一个程序，可以重复使用，在编程中，很注重复用，函数就是这样，重复使用来提高代码复用率，来提高速度。

提示：写完文章后，目录可以自动生成，如何生成可参考右边的帮助文档

文章目录

python2入门学习第四节使用第三方函数库及简单的爬虫一、python函数二、爬虫1.代码如下：

一、python函数

python函数之系统库函数（要了解其他函数可以在我的博客第二节下载文件）

字符函数库

数学函数库

os os函数常见有两个，大家不会可以用help查找到该函数的说明。listdir,getcwd函数，

网络编程库在网络编程中，经常要获取主机IP、主机名等，所以网络编程中gethostbyname函数很重要，这一点跟Java语言类似 python第三方提供的函数 httplib2 和 setuptools其他也有很多，需要再用

httplib2安装包：链接：https://pan.baidu.com/s/1vlsJLZ7Hq4V0dgvhWrPK9Q 提取码：m19s

setuptools安装包：链接：https://pan.baidu.com/s/1xrBtEuYZPov2fogNY_HtdA 提取码：gbk0

二、爬虫

1.代码如下：

代码如下（示例）：

import urllib import webbrowser url='http://www.baidu.com' content=urllib.urlopen(url).read() open('baidu.com.html','w').write(content)

代码解析: 前面先导入函数以便后面使用： url='http://www.baidu.com’这句是设置你要爬的地址，你可以改成你需要的地址，我这里以百度为例 content=urllib.urlopen(url).read()是将你需要爬的网络全部代码存在content open(‘baidu.com.html’,‘w’).write(content)是将content重新写在你的本地磁盘，baidu.com.html是本地磁盘网页的命名结果：在这个上面地址就是本地磁盘的文件。这就是一个简单的爬虫实例

Processed: 0.018, SQL: 9