pandas8 数据的载入

news/2024/7/21 6:56:18 标签: csv, excel, numpy, python

文章目录

    • 1.数据载入
          • 1.1读写文本文件
            • (1)文本文件的读取:
            • (2)文本文件的存储
          • 1.2读写excel文件t
            • (1).pandas 的read_excel函数可以读取“xls”和“xlsx”两种excel文件
            • (2).Excel文件的存储

1.数据载入

1.1读写文本文件
(1)文本文件的读取:

文本文件是一种由若干个字符构成的计算机文件,典型的一种顺序文件。CSV是一种逗号分隔的文件格式,分隔符不一定是逗号,又叫做字符分隔文件,文件以纯文本形式存储表格数据(数字和文本)。

在pandas中用read_table函数来读取文本文件:

pandas.read_table(filepath_or_buffer, sep="\t", header='infer', names=None, index_col=None, dtype=None, engine=None, nrows=None)

在pandas中用read_csv来读取csv文件:

pandas.read_csv(filepath_or_buffer, sep="\t", header='infer', names=None, index_col=None, dtype=None, engine=None, nrows=None)

参数名称说明
filepath接收string,代表文件路径,无默认
sep接收string,分隔符。csv默认是逗号,table默认是制表符
header接收int或者sequence,表示将某行数据作为列名,默认为infer,表示自动识别
names接收array,表示列名,默认None
index_col接收int,sequence或false,表示索引列的位置,取值为sequence表示多重索引,默认为None
dtype接收dict,代表写入的数据类型,列名为key,数据格式为value,默认为None
engine接收c或python,数据解析引擎,默认c
nrows接收int,表示读前n行,默认None
python">df1 = pd.read_csv("data//sunspots.csv")
 #读取CSV文件到DataFrame中
print(df1.sample(5))

df2 = pd.read_table("data//sunspots.csv",sep = ",")
 #使用read_table,并指定分隔符
print("------------------")
print(df2.sample(5))
df3 = pd.read_csv("data//sunspots.csv",names = ["a","b"])
 #文件不包含表头行,允许自动分配默认列名,也可以指定列名
print("------------------")
print(df3.sample(5))
》》》》》》》》》:结果
     year  counts
54   1754    12.2
174  1874    44.7
150  1850    66.6
12   1712     0.0
84   1784    10.2
------------------
     year  counts
155  1855     6.7
226  1926    63.9
129  1829    67.0
111  1811     1.4
108  1808     8.1
------------------
        a      b
274  1973     38
283  1982  115.9
9    1708     10
43   1742     20
132  1831   47.8
(2)文本文件的存储

与读取很类似,用pandas.to_csv函数实现csv文件的存储。

pandas.to_csv(filepath_or_buffer, sep="\t", na_rep='', columns=None, header=True, index=True, index_label=None, mode='w', encoding=None)

excelt_71">1.2读写excel文件t
excelxlsxlsxexcel_73">(1).pandas 的read_excel函数可以读取“xls”和“xlsx”两种excel文件

pandas.read_excel(io, sheetname, header=0, index_col=None, names=None, dtype)

参数说明
io接收string,表示文件路径,无默认
sheetname接收string,int表示Excel表内数据的分表位置,默认为0
header接收int或者sequence,表示将某行数据作为列名,默认为infer,表示自动识别
index_col接收int,sequence,或者false,表示索引列的位置,取值为sequence则代表多重索引,默认为None
names接收int,sequence,或者false,表示索引列的位置,取值为sequence则代表多重索引,默认为None
dtype接收dict,代表写入的数据类型(key是列名,数据格式为values),默认为None
python">xlsx = "data//data_test.xlsx"
df1 = pd.read_excel(xlsx,"Sheet1")
print(df1)
#也可以直接利用: 
df2 =  pd.read_excel("data//data_test.xlsx","Sheet1")
print("-------------------------------")
print(df2)
》》》》》》》:结果
   00101  长裤  黑色   89
0   1123  上衣  红色  129
1   1010  鞋子  蓝色  150
2    100  内衣  灰色  100
-------------------------------
   00101  长裤  黑色   89
0   1123  上衣  红色  129
1   1010  鞋子  蓝色  150
2    100  内衣  灰色  100
(2).Excel文件的存储

pandas.to_csv(excel_writer=None, sheetnames=None ,na_rep='', columns=None, header=True, index=True, index_label=None, mode='w', encoding=None) 第一个是路径,第二个默认是sheet1,指定存储Excel Sheet的名称。


http://www.niftyadmin.cn/n/1758284.html

相关文章

pandas9 合并数据

文章目录2.合并数据2.1 merge合并数据2.2concat数据连接2.3combine_first合并数据2.合并数据 2.1 merge合并数据 python中的merge函数是通过一个或多个键将两个DataFrame按行合并起来,与SQL中的join用法类似。 merge(left, right, howinner, onNone, left_onNone…

Idea2021版没有struts2模板

文章目录在idea里面点击file点击setting,搜索plugins,搜索struts2,安装,重启!!!

Struts2构建简单登录功能

文章目录ServletServlet概述Servlet架构Servlet 任务Servlet构建步骤MVC架构概述servletJspJavaBean构成一个简单的mvc框架实现购物车功能Struts2Struts概述构建1.工程构建引入本地组件库:2.编写struts2的action控制器类【在com.action包下】3.编写struts2的配置文件…

docker拉取hadoop镜像做集群

该文docker常用命令 docker search imagename:搜索查找镜像 docker pull imagename:拉取镜像到本地仓库 docker images:查看本地镜像 docker ps:查看正在运行的容器 docker ps -a:查看所有容器 docker run --name mast…

在Hyper-v里创建CentOS7

文章目录第一步:安装Hyper-V第二步:创建虚拟机第三步:开启虚拟机第一步:安装Hyper-V 打开window控制面板,选择程序,选择启用或关闭window功能,在Hyper-V前面打勾,确定 选择重启…

搭建单机hadoop并运行自带的分词jar包

这篇实验是紧接着Hyper-V的 前奏是:Hyper-V搭建CentOS7 文章目录第四步:安装单机hadoop【jdk、tomcat】1. 前期准备(1)网络配置(2)修改主机名和添加ip映射重启:(3)关闭防…

python学习易忘易混淆笔记

文章目录python基础1.range()与np.arange()的区别数据采集(爬虫)可视化matplotlibpyecharts大屏可视化数据预处理pandas时间数据处理pd.to_datetime()建模算法python基础 1.range()与np.arange()的区别 range()返回的是range object,而np.a…

Python多线程爬取中国天气网图片

文章目录Python实现多线程Python的前后台线程线程等待多线程与资源多线程爬取中国天气网的图片数据Python实现多线程 线程类似于同时执行多个不同的程序,多线程运行的优点: 1.使用线程可以把占据长时间的程序中的任务放到后台去处理; 2.可能…