python – 无需写入磁盘即可下载和解压缩.zip文件

我设法让我的第一个 python脚本工作,从URL下载.ZIP文件列表,然后继续提取ZIP文件并将它们写入磁盘.

我现在无法实现下一步.

我的主要目标是下载并解压缩zip文件,并通过TCP流传递内容(CSV数据).如果我能逃脱它,我宁愿不将任何zip或解压缩的文件写入磁盘.

这是我当前的脚本,但不幸的是必须将文件写入磁盘.

import urllib, urllister
import zipfile
import urllib2
import os
import time
import pickle

# check for extraction directories existence
if not os.path.isdir('downloaded'):
    os.makedirs('downloaded')

if not os.path.isdir('extracted'):
    os.makedirs('extracted')

# open logfile for downloaded data and save to local variable
if os.path.isfile('downloaded.pickle'):
    downloadedLog = pickle.load(open('downloaded.pickle'))
else:
    downloadedLog = {'key':'value'}

# remove entries older than 5 days (to maintain speed)

# path of zip files
zipFileURL = "http://www.thewebserver.com/that/contains/a/directory/of/zip/files"

# retrieve list of URLs from the webservers
usock = urllib.urlopen(zipFileURL)
parser = urllister.URLLister()
parser.feed(usock.read())
usock.close()
parser.close()

# only parse urls
for url in parser.urls: 
    if "PUBLIC_P5MIN" in url:

        # download the file
        downloadURL = zipFileURL + url
        outputFilename = "downloaded/" + url

        # check if file already exists on disk
        if url in downloadedLog or os.path.isfile(outputFilename):
            print "Skipping " + downloadURL
            continue

        print "Downloading ",downloadURL
        response = urllib2.urlopen(downloadURL)
        zippedData = response.read()

        # save data to disk
        print "Saving to ",outputFilename
        output = open(outputFilename,'wb')
        output.write(zippedData)
        output.close()

        # extract the data
        zfobj = zipfile.ZipFile(outputFilename)
        for name in zfobj.namelist():
            uncompressed = zfobj.read(name)

            # save uncompressed data to disk
            outputFilename = "extracted/" + name
            print "Saving extracted file to ",outputFilename
            output = open(outputFilename,'wb')
            output.write(uncompressed)
            output.close()

            # send data via tcp stream

            # file successfully downloaded and extracted store into local log and filesystem log
            downloadedLog[url] = time.time();
            pickle.dump(downloadedLog, open('downloaded.pickle', "wb" ))

最佳答案

我的建议是使用 StringIO对象.它们模拟文件,但驻留在内存中.所以你可以这样做：

# get_zip_data() gets a zip archive containing 'foo.txt', reading 'hey, foo'

from StringIO import StringIO
zipdata = StringIO()
zipdata.write(get_zip_data())
myzipfile = zipfile.ZipFile(zipdata)
foofile = myzipfile.open('foo.txt')
print foofile.read()

# output: "hey, foo"

或者更简单(向Vishal道歉)：

myzipfile = zipfile.ZipFile(StringIO(get_zip_data()))
for name in myzipfile.namelist():
    [ ... ]

在Python 3中使用BytesIO而不是StringIO.

点击查看更多相关文章

转载注明原文：python – 无需写入磁盘即可下载和解压缩.zip文件 - 乐贴网

JAVA c c++go swift javascript Nginx UI/UE 小程序 Python C#php asp GitHub项目推荐

2024年可用、好用、值得推荐的磁力搜索引擎汇总（长期更新）

每日神器 5年前 208683

前端框架LayUI介绍及用法

html 5年前 56

2020.04.01 芒果tv会员共享手机号芒果tv会员账号共亨

芒果TV 6年前 550

豆包也开始抢程序员饭碗了，一个月只要9块9。。

AI工具 4月前 116

乐乐影视TV3.1无限制版：免登陆！去验证！内置片源接口~

每日神器 4年前 7373

电脑看电视魔改：完美自定义！支持电视直播、影视轮播（附教程）

每日神器 4年前 467

Java 8按一对多分组

JAVA 6年前 111

java-Cucumber-JVM 3-使用asMap()将DataTable转换为单个对象

JAVA 6年前 45

新版猫影视TV115解锁版：修复闪退！免登陆！无限制！一个顶17个！

每日神器 4年前 677

antv G6状态保存问题

javascript 5年前 135

java – 计算一个单词中的元音

JAVA 6年前 87

怎样下载ubuntu？

ubuntu 5年前 46

python – x轴matplotlib上的良好日期格式

Python 6年前 117

python – 熊猫读取csv替换#DIV / 0！和#VALUE！与NaN

Python 7年前 71

python – Scikit-学习如何检查模型(例如TfidfVectorizer)是否已经适合

Python 6年前 86

检查元素是否存在python selenium

Python 6年前 249

Python从pandas数据帧中删除停用词

Python 6年前 121

python – 将多列转换为一行(Pandas / Numpy)

Python 6年前 103

python – 无需写入磁盘即可下载和解压缩.zip文件

Python 6年前 30

使用python pandas将hh：mm：ss转换为分钟

Python 6年前 149

python – 图像分析：在图像中查找蛋白质

Python 6年前 23

如何直接从Python使用Alpha Vantage API

Python 6年前 82

python-pip异常：AttributeError：’NoneType’对象没有属性’startswith’

Python 6年前 99

python – 避免在PyYAML中引用

Python 6年前 32

热门推荐

相关推荐