博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
pandas读取大文件时memoryerror的解决办法
阅读量:7073 次
发布时间:2019-06-28

本文共 895 字,大约阅读时间需要 2 分钟。

再用pd.read_csv读取大文件时,如果文件太大,会出现memoryerror的问题。

 

解决办法一:pd.read_csv的参数中有一个chunksize参数,为其赋值后,返回一个可迭代对象TextFileReader,对其遍历即可

reader = pd.read_csv(file_path, chunksize=20)  # 每次读取20条数据

1 import pandas as pd  2  3 def knn(): 4     # 读取数据 5     file_path = './facebook/train.csv' 6      7     reader = pd.read_csv(file_path, chunksize=20)    # 每块为20条数据(index) 8  9     for chunk in reader:10         print(chunk)11         break12 13 if __name__ == '__main__':14     knn()

代码执行结果如下:

 

 解决办法二:pd.read_csv的参数中有一个iterator参数,默认为False,将其改为True,返回一个可迭代对象TextFileReader,使用它的get_chunk(num)方法可获得前num行的数据

import pandas as pd def knn():    '''完成k近邻算法'''    # 读取数据    file_path = './facebook/train.csv'    reader = pd.read_csv(file_path, iterator=True)    chunk = reader.get_chunk(5)    # 获取前5行数据    print(chunk)if __name__ == '__main__':    knn()

代码执行结果如下:

 

转载于:https://www.cnblogs.com/shuaishuaidefeizhu/p/9817872.html

你可能感兴趣的文章
block的回调作用
查看>>
如何实现类似微信朋友圈的feed功能(第一版)
查看>>
安装NODEJS的三种方法
查看>>
如何让Mac完全读写NTFS格式分区
查看>>
百万级很快的分页联合
查看>>
手机内存卡修复工具软件大师免费试用版
查看>>
获取屏蔽符号<!-- -->屏蔽的字符串的代码
查看>>
struct和typedef struct
查看>>
Notification启动Activity, 恢复任务栈
查看>>
使用Python进行并发编程
查看>>
自动机器学习简述(AutoML)
查看>>
iPhone X适配
查看>>
虚拟化笔记
查看>>
[vim]-vim基础
查看>>
JAVA 8入门(一)Lambda表达式
查看>>
resin集成eclipse开发
查看>>
将Excel文件中的数据导入到mysql【Excel中拼sql】
查看>>
H5移动端知识点
查看>>
【js与jquery】网站更换皮肤功能
查看>>
Ubuntu ssh连接root验证错误
查看>>