dataframe保存excel格式比csv格式小很多很多

news/2024/7/21 5:59:04 标签: excel

问题描述:

一个3万行的数据保存成csv大概10个G,但保存成excel格式只有100多M

原因分析:

因为xlsx 实际上就是 zip 压缩包,同时,如果有大量重复的数据,XLSX 会提取文本值,将其存储在查找表中,这意味着每个文本字符串只需要使用一次空间。数据量大了压缩的优势才体现出来。如图所示:压缩后的csv文档仍然有1G多,但xlsx只有100M
而且csv压缩后的大小也远远大于xlsx格式,如图所示:
在这里插入图片描述


http://www.niftyadmin.cn/n/5070415.html

相关文章

Mysql insert也会发生死锁?

大家好,我是peachesTao,今天给大家分享我们前几天线上遇到的一个Mysql死锁的案列,希望在大家碰到类似的问题时有所帮助。 9月28号下午我们线上钉钉报警群报了一个“Error 1213: Deadlock found when trying to get lock”的错误,…

【已解决】Pyecharts折线图,只有坐标轴没有折线数据

【已解决】Pyecharts折线图,只有坐标轴没有折线数据 1、问题复现2、原因3、问题解决 1、问题复现 在做简单的数据通过 Pyecharts 生成折现图的时候,一直只有坐标轴没有折线数据,但是代码一直看不出问题,代码如下: im…

c语言 任意进制数的转换

/* 函数trans将无符号整数n翻译成d&#xff08;2<&#xff1d;d<&#xff1d;16&#xff09;进制表示的字符串s */ #define M sizeof(unsigned int)*8 int trans(unsigned n, int d, char s[]) {static char digits[] "0123456789ABCDEF"; /* 十六进制数字的字…

1.4 系统环境变量

前言&#xff1a; **1.4 系统环境变量** --- **主要内容**: - **系统环境变量的定义**: 系统环境变量是在计算机操作系统中定义的一系列变量。这些变量是全局的&#xff0c;可以被操作系统上的所有应用程序所使用。 - **Java中的环境变量**: - 当学习和使用Java时&am…

2023-10-07 mysql-代号m-同时打开多个database-概要设计

摘要: 此前的代码架构由于对mdb的database和schema的运行机制的知识的缺乏, 导致直接将mysql的database与mdb中的database做了等价处理, 导致代号m项目无法同时打开两个database. 经过此前的调研, 对mdb的database,schema,user,role有了深入的理解, 为了能做大myql的use data…

Linux基本指令(中)——“Linux”

各位CSDN的uu们好呀&#xff0c;今天&#xff0c;小雅兰的内容是Linux基本指令呀&#xff01;&#xff01;&#xff01;下面&#xff0c;让我们进入Linux的世界吧&#xff01;&#xff01;&#xff01; cp指令&#xff08;重要&#xff09; mv指令&#xff08;重要&#xff09…

用户的评分和评论是如何影响ASO的?

大多数用户在下载之前会检查游戏或应用程序的平均评分&#xff0c;拥有的评分和评论越多越好&#xff0c;能够带来更多的下载&#xff0c;所以评级和评论在所有应用市场和电子商务中都发挥着关键作用。 1、把自己代入用户视角。 寻求好评时&#xff0c;首先要做的就是吸取我们…

javascript二维数组(9)toString的用法

在JavaScript中&#xff0c;toString() 是一个内置方法&#xff0c;用于将特定的对象转化为字符串表示形式。 基本使用示例 以下是一些 toString() 方法的基本使用示例&#xff1a; 数字的 toString()&#xff1a; let num 123; console.log(num.toString()); // 输出: &…