python2入门学习第四节使用第三方函数库及简单的爬虫

    科技2024-03-15  82

    python2入门学习第四节使用第三方函数库及简单的爬虫

    函数是已经编写好的一个程序,可以重复使用,在编程中,很注重复用,函数就是这样,重复使用来提高代码复用率,来提高速度。


    提示:写完文章后,目录可以自动生成,如何生成可参考右边的帮助文档

    文章目录

    python2入门学习第四节使用第三方函数库及简单的爬虫一、python函数二、爬虫1.代码如下:


    一、python函数

    python函数之系统库函数(要了解其他函数可以在我的博客第二节下载文件)

    字符函数库

    数学函数库

    os os函数常见有两个,大家不会可以用help查找到该函数的说明。listdir,getcwd函数,

    网络编程库 在网络编程中,经常要获取主机IP、主机名等,所以网络编程中gethostbyname函数很重要,这一点跟Java语言类似 python第三方提供的函数 httplib2 和 setuptools其他也有很多,需要再用

    httplib2安装包:链接:https://pan.baidu.com/s/1vlsJLZ7Hq4V0dgvhWrPK9Q 提取码:m19s

    setuptools安装包:链接:https://pan.baidu.com/s/1xrBtEuYZPov2fogNY_HtdA 提取码:gbk0

    二、爬虫

    1.代码如下:

    代码如下(示例):

    import urllib import webbrowser url='http://www.baidu.com' content=urllib.urlopen(url).read() open('baidu.com.html','w').write(content)

    代码解析: 前面先导入函数以便后面使用: url='http://www.baidu.com’这句是设置你要爬的地址,你可以改成你需要的地址,我这里以百度为例 content=urllib.urlopen(url).read()是将你需要爬的网络全部代码存在content open(‘baidu.com.html’,‘w’).write(content)是将content重新写在你的本地磁盘,baidu.com.html是本地磁盘网页的命名 结果: 在这个上面地址就是本地磁盘的文件。这就是一个简单的爬虫实例

    Processed: 0.015, SQL: 8