python从ftp下载数据保存实例_python

《hadoop权威指南》的天气数据可以在ftp://ftp3.ncdc.noaa.gov/pub/data/noaa下载，在网上看到这个数据好开心，打开ftp发现个问题，呀呀，这么多文件啊，我一个个去点另存为，得点到啥时候啊，迅雷应该有批量下载，只是我没找到，估计是我浏览器把迅雷禁掉了，干脆自己用python写一个实现下载好了，网上早了一下，发现很简单啊

复制代码代码如下:

#!/usr/bin/python
#-*- coding: utf-8 -*-

from ftplib import FTP

def ftpconnect():
    ftp_server = 'ftp3.ncdc.noaa.gov'
    username = ''
    password = ''
    ftp=FTP()
    ftp.set_debuglevel(2) #打开调试级别2，显示详细信息
    ftp.connect(ftp_server,21) #连接
    ftp.login(username,password) #登录，如果匿名登录则用空串代替即可
    return ftp

def downloadfile():
    ftp = ftpconnect()
    #print ftp.getwelcome() #显示ftp服务器欢迎信息
    datapath = "/pub/data/noaa/"
    year=1911
    while year<=1930:
        path=datapath+str(year)
        li = ftp.nlst(path)
        for eachFile in li:
            localpaths = eachFile.split("/")
            localpath = localpaths[len(localpaths)-1]
            localpath='weatherdata/'+str(year)+'--'+localpath#把日期放在最前面，方便排序
            bufsize = 1024 #设置缓冲块大小
            fp = open(localpath,'wb') #以写模式在本地打开文件
            ftp.retrbinary('RETR ' + eachFile,fp.write,bufsize) #接收服务器上文件并写入本地文件
        year=year+1
    ftp.set_debuglevel(0) #关闭调试
    fp.close()
    ftp.quit() #退出ftp服务器

if __name__=="__main__":
downloadfile()

时间： 2024-12-01 01:07:47

python从ftp下载数据保存实例_python的相关文章

Python 制作糗事百科爬虫实例_python

早上起来闲来无事做,莫名其妙的就弹出了糗事百科的段子,转念一想既然你送上门来,那我就写个爬虫到你网站上爬一爬吧,一来当做练练手,二来也算找点乐子. 其实这两天也正在接触数据库的内容,可以将爬取下来的数据保存在数据库中,以待以后的利用.好了,废话不多说了,先来看看程序爬取的数据结果值得一提的是,我在程序中想一下子爬取糗事百科 30 页的内容,但是出现了连接错误,当我把页数降到 20 页的时候,程序就可以正常的跑起来了,不知道是什么原因,渴望知道的大神可以告诉我一声,感激不尽. 程序非常简单,直接

Python脚本实现下载合并SAE日志_python

由于一些原因,需要SAE上站点的日志文件,从SAE上只能按天下载,下载下来手动处理比较蛋疼,尤其是数量很大的时候.还好SAE提供了API可以批量获得日志文件下载地址,刚刚写了python脚本自动下载和合并这些文件调用API获得下载地址文档位置在这里设置自己的应用和下载参数请求中需要设置的变量如下复制代码代码如下: api_url = 'http://dloadcenter.sae.sina.com.cn/interapi.php?' appname = 'xxxxx' from_da

python算法学习之计数排序实例_python

python算法学习之计数排序实例复制代码代码如下: # -*- coding: utf-8 -*- def _counting_sort(A, B, k): """计数排序,伪码如下: COUNTING-SORT(A, B, k) 1 for i ← 0 to k // 初始化存储区的值 2 do C[i] ← 0 3 for j ← 1 to length[A] // 为各值计数 4 do C[A[j]] ← C[A

python爬取网站数据保存使用的方法_python

编码问题因为涉及到中文,所以必然地涉及到了编码的问题,这一次借这个机会算是彻底搞清楚了.问题要从文字的编码讲起.原本的英文编码只有0~255,刚好是8位1个字节.为了表示各种不同的语言,自然要进行扩充.中文的话有GB系列.可能还听说过Unicode和UTF-8,那么,它们之间是什么关系呢?Unicode是一种编码方案,又称万国码,可见其包含之广.但是具体存储到计算机上,并不用这种编码,可以说它起着一个中间人的作用.你可以再把Unicode编码(encode)为UTF-8,或者GB,再存储到计算机

Python ORM框架SQLAlchemy学习笔记之数据查询实例_python

前期我们做了充足的准备工作,现在该是关键内容之一查询了,当然前面的文章中或多或少的穿插了些有关查询的东西,比如一个查询(Query)对象就是通过Session会话的query()方法获取的,需要注意的是这个方法的参数数目是可变的,也就是说我们可以传入任意多的参数数目,参数的类型可以是任意的类组合或者是类的名称,接下来我们的例子就说明了这一点,我们让Query对象加载了User实例. 复制代码代码如下: >>> for instance in session.query(User).or

跟老齐学Python之编写类之一创建实例_python

说明:关于类的这部分,我参考了<Learning Python>一书的讲解. 创建类创建类的方法比较简单,如下: 复制代码代码如下: class Person: 注意,类的名称一般用大写字母开头,这是惯例.当然,如果故意不遵循此惯例,也未尝不可,但是,会给别人阅读乃至于自己以后阅读带来麻烦.既然大家都是靠右走的,你就别非要在路中间睡觉了. 接下来,一般都要编写构造函数,在写这个函数之前,先解释一下什么是构造函数. 复制代码代码如下: class Person: def __in

Python的迭代器和生成器使用实例_python

一.迭代器Iterators 迭代器仅是一容器对象,它实现了迭代器协议.它有两个基本方法: 1)next方法返回容器的下一个元素 2)__iter__方法返回迭代器自身迭代器可使用内建的iter方法创建,见例子: 复制代码代码如下: >>> i = iter('abc') >>> i.next() 'a' >>> i.next() 'b' >>> i.next() 'c' >>> i.next() Trace

Python的ORM框架SQLObject入门实例_python

SQLObject和SQLAlchemy都是Python语言下的ORM(对象关系映射)解决方案,其中SQLAlchemy被认为是Python下事实上的ORM标准.当然,两者都很优秀. 一.安装复制代码代码如下: sudo pip install SQLObject 使用SQLObject操作mysql时候报错ImportError: No module named MySQLdb,那便安装MySQLdb: 复制代码代码如下: sudo pip install MySQL-python 没想

Python标准库之sqlite3使用实例_python

Python自带一个轻量级的关系型数据库SQLite.这一数据库使用SQL语言.SQLite作为后端数据库,可以搭配Python建网站,或者制作有数据存储需求的工具.SQLite还在其它领域有广泛的应用,比如HTML5和移动端.Python标准库中的sqlite3提供该数据库的接口. 我将创建一个简单的关系型数据库,为一个书店存储书的分类和价格.数据库中包含两个表:category用于记录分类,book用于记录某个书的信息.一本书归属于某一个分类,因此book有一个外键(foreign key)

猜你喜欢

SQL Server 2000之日志传送功能 - 描述

server 角色变更.角色互换.以及监控服务器所在位置当线上数据库停摆时(可能是计划内维护工作,或是预期外的状况),如果还有备援服务器上的数据库可供存取,您可能会比较安心一点.一个设计良好 ...

asp常用数据库连接方法和技巧

技巧|数据|数据库|数据库连接 asp常用数据库连接方法和技巧转贴:snow 日期:2005-02-28 人气:19 购虚拟主机送U盘送鼠标送30G硬盘---企商在线老牌虚拟主机商 <% dim ...

solidworks二次开发-04-修改数据

数据 solidworks二次开发-04-修改数据上次已经可以访问特征的各参数了,今天我们来修改它: 要修改前面的步骤不能少,当我们已经可以读取一些特征时,我们就可以给他设定一些值.当然有时需要调用 ...

替换vCenter Server 5.0证书

同样是最近的VMware服务器虚拟化的项目,为了vSphere Client连接登录vCenter不提示警号窗口,为了IE浏览器访问Operations Manager不提示此网站安全证书有问题等,于 ...

金山WPS Office 2005自动压缩图片

在使用wps Office 2005时,出于内容和美观的需要,用户在文档中添加了一些图片,发现仅是几页的内容竟然有10M以上,经查是由于插入的图片没有被压缩,最终导致整个文件非常庞大. WPS Off ...

德夫下载器狂下11种盗号木马

近日,记者陆续接到几位网游用户的求助电话,均反映自己的游戏帐号密码莫名被盗."我玩网络游戏已经快3年了,就在昨天,苦心经营的征途与武林外传的帐号密码同时被盗,几万块的装备也不翼而飞.&quo ...

PHP开发框架Yii Framework教程(22) UI组件 Zii组件简介

前面介绍了Yii框架支持的部分UI组件,除了前面介绍的UI组件外,Yii框架还提供了Zii组件库,包括列表视图ListView,表格视图GridView,此外还包括一些基于JQuery的UI组件,如 ...

centos下如何挂载ntfs分区文件里的centos镜像文件

在centos下挂载ntfs分区想必大家都比较熟悉了吧,这就是利用我们的ntfs-3g 安装方法 1 yum install fuse ntfs-3g -y 注:fuse为小内核,ntfs ...

在Word2010中设置信封选项

通过Word2010邮件合并中的信封功能,可以创建用于为每个收件人寄送信函时所使用的信封.用户可以设置信封选项,以使所创建的信封更符合实际需求,操作步骤如下所述: 第1步,打开Word2010文档窗口 ...

PS调出水嫩通透肤色

PS调出水嫩通透肤色注:更多请关注photoshop教程栏目,三联PS教程群:181754111欢迎你的加入分类: PS调色教程

如何输出有效的设计方案

在方案设计时,会出现一种情况:似乎已经输出了所有可能的方案,但讨论定稿时还是觉得不够满意,认为应该有更优方案的输出?什么原因导致了这种情况?如何输出有效的设计方案? ● 什么是有效的设计方案? & ...

如何查看win7电脑硬盘缓存的大小？

什么是硬盘缓存?咱们不妨先来了解一下这个概念,其实所谓的硬盘缓存就是用于预存储和存储临时数据的空间,一般来说,缓存越大,那么可以存储的临时文件就越多,那么对于电脑来说,运行的流畅度也就越高,对于硬 ...

如何在oracle中查询所有用户表的表名、主键名称、索引、外键等

1.查找表的所有索引(包括索引名,类型,构成列): select t.*,i.index_type from user_ind_columns t,user_indexes i where t.in ...

3个月打造10万IP的流量的实战演练

最近很想写一篇这样的文章,想总结出所有常用的和不常用的推广方法．分析如何在短期内打造高流量网站．昨天在公司写了一个前言部分,但是公司的安全系统太强了,超过200字就不能发．所以准备整理一下再发,除了前 ...

人人影视满血复活我说过我还会回来的！

[TechWeb报道]人人影视自从被查封之后不知道伤了多少网友的心,不过昨晚有细心的网友发现,人人影视又复活了并更新了全新的域名:rrys.tv,并且原域名yyets.com也可以正常访问了.在打开 ...

在linux下进行缓冲区溢出实验出现illegal instruction

问题描述在linux下进行缓冲区溢出实验出现illegal instruction int main(int argc, int *argv[]) { char buf[10]; if(argc& ...

云计算发展的几个阶段

经历了野蛮生长阶段的云计算,现需要回归理性. 简要概括下云计算经历过的几个阶段,对未来做一些展望. 0. 史前大型机,中型机,小型机,个人计算机,移动设备.历史文献自查. 1. 虚拟化将计算资源. ...

使用Style自定义ListView快速滑动图标

一.显示ListView快速滑动块图标设想这样一个场景,当ListView的内容有大于100页的情况下,如果想滑动到第80页,用手指滑动到指定位置,无疑是一件很费时的事情,如果想快速滑 ...

在使用vue-cli中遇到的几个问题

前言:框架没有好坏之分,能解决需求就可以.之前没事用vue模仿过BOSS直聘App(纯属娱乐),实际工作中开发过一个后台管理系统,遇到过不少坑,终于闲下来稍微总结几个问题分享一下! 一.所遇到的问题( ...

android-MediaPlayer的setDataSource出错

问题描述 MediaPlayer的setDataSource出错我想用service播放音乐直接上代码: private static final MediaPlayer mp = new Med ...

18_Android中Service的生命周期，远程服务，绑定远程服务，aidl服务调用，综合服务案例，编写一个应用程序调用远程支付宝远程服务场景

============================================================================服务的生命周期: 一.采用start的方式开始服 ...

第6周聚集索引

原文:第6周聚集索引上个星期我向你介绍了堆表(heap tables).我们说过,在SQL Server表可以是堆表(Heap Table)或者聚集表(Clustered Table)--一个在它 ...

Python遍历目录中的所有文件的方法_python

os.walk生成器os.walk(PATH), PATH是个文件夹路径,当然可以用.或者../这样啦. 返回的是个三元元组为元素的列表, 每个元素代表了一个文件夹下的内容.第一个就是当前文件夹下内容 ...

问个问题，一个新闻系统的tags数据库应该怎样设计？

问题描述现在很多文章系统都有Tag标签,这个数据库应该怎样设计来保存这个标签?用一个字段保存吗?那样使用不方便吧. 解决方案解决方案二:我觉得使用一个字段保存还是简单一点解决方案三:有什么不方便呢 ...

在eclipse中连接数据库，出现No suitable driver found for jdbc..

问题描述 Stringdriver="com.microsoft.sqlserver.jdbc.SQLServerDriver";Stringurl="jdbc:micr ...

美国贸易委员会宣布将着手调查任天堂Wii侵权案

本网(编译/Eskimo)近日,美国国际贸易委员会宣布将着手调查任天堂公司的家用游戏主机Wii对美国俄亥俄州Motiva公司的侵权案. Motiva公司指出,任天堂公司在移动测量技术(Human Mo ...

基于PHP给大家讲解防刷票的一些技巧_php实例

刷票行为,一直以来都是个难题,无法从根本上防止. 但是我们可以尽量减少刷票的伤害,比如:通过人为增加的逻辑限制. 基于 PHP,下面介绍防刷票的一些技巧: 1.使用CURL进行信息伪造 $ch = c ...

Javascript判断变量是否定义/赋值

使变量有意义: 1.定义变量即变量声明,类似于:var str; 2.变量赋值即变量初始化,类似于str="test"; 这2步我们可一步到位,即定义变量的同时给变量赋值,类似于: ...

arraylist 内元素排序

问题描述 ArrayListal=newArrayList();al.AddRange(newstring[6]{"A1","A2","A11&quo ...

为什么没有效果？

问题描述 <!DOCTYPEhtmlPUBLIC"-//W3C//DTDXHTML1.0Transitional//EN""http://www.w3.org/TR ...

热搜

© 2024 iVAN | info#iamivan.net | 11 q. 0.022 s.