python(11):python读取excel、csv文件

news/2024/7/21 7:27:44 标签: python, excel, pandas

pythonexcel_0">1.python读取excel文件

要读取Excel表格的指定行和列范围,可以使用Python中的第三方库pandaspandas库提供了强大的数据分析和处理工具,包括读取和处理Excel文件的功能。以下是一个示例代码,演示了如何使用pandas库读取Excel表格中的指定行和列范围:

python">import pandas as pd

# 读取Excel文件
df = pd.read_excel('path/to/excel_file.xlsx')

# 指定要读取的行和列范围
start_row = 2  # 起始行(索引为0)
end_row = 5  # 结束行
start_col = 'A'  # 起始列
end_col = 'C'  # 结束列

# 根据行和列范围提取数据
selected_data = df.loc[start_row:end_row, start_col:end_col]

# 打印提取的数据
print(selected_data)

在上述代码中,你需要将 'path/to/excel_file.xlsx' 替换为你要读取的Excel文件的实际路径。代码使用 pd.read_excel 函数读取Excel文件并将其存储在一个DataFrame对象中。

然后,通过设置 start_rowend_row 来指定要读取的行范围,起始行索引为0。同时,使用 start_colend_col 来指定要读取的列范围,以字母表示列标签。

接下来,使用 df.loc[start_row:end_row, start_col:end_col]DataFrame中提取指定的行和列范围的数据,并将结果存储在 selected_data 变量中。

最后,使用 print(selected_data) 打印提取的数据。

请注意,在运行代码之前,确保已经安装了pandas库。你可以使用以下命令安装pandas库:

pip install pandas

2. 读取csv文件并转换为numpy数组

要读取CSV文件的指定行和列范围,同样可以使用pandas库。pandas库提供了灵活的方法来读取和处理CSV文件。以下是一个示例代码,演示了如何使用pandas库读取CSV文件中的指定行和列范围:

2.1 读取csv文件

python">import pandas as pd

# 读取CSV文件
df = pd.read_csv('path/to/csv_file.csv')

# 指定要读取的行和列范围
start_row = 2  # 起始行(索引为0)
end_row = 5  # 结束行
start_col = 0  # 起始列(索引为0)
end_col = 2  # 结束列

# 根据行和列范围提取数据
selected_data = df.iloc[start_row:end_row+1, start_col:end_col+1]

# 打印提取的数据
print(selected_data)

在上述代码中,你需要将 'path/to/csv_file.csv' 替换为你要读取的CSV文件的实际路径。代码使用 pd.read_csv 函数读取CSV文件并将其存储在一个DataFrame对象中。

然后,通过设置 start_rowend_row 来指定要读取的行范围,起始行索引为0。同时,使用 start_colend_col 来指定要读取的列范围,起始列索引为0。

接下来,使用 df.iloc[start_row:end_row+1, start_col:end_col+1]DataFrame中提取指定的行和列范围的数据,并将结果存储在 selected_data 变量中。这里需要注意,end_row+1end_col+1 是为了包括指定的结束行和结束列。

最后,使用 print(selected_data) 打印提取的数据。

请注意,在运行代码之前,确保已经安装了pandas库。你可以使用以下命令安装pandas库:

pip install pandas

另外,需要根据实际的CSV文件的分隔符,使用read_csv函数的sep参数来指定分隔符,例如:pd.read_csv('path/to/csv_file.csv', sep=','),如果CSV文件使用的是逗号作为分隔符。默认情况下,read_csv函数会使用逗号作为分隔符。

2.2 转换为numpy数组

要将pandas库读取的数据转换为NumPy数组,可以使用values属性。以下是修改后的示例代码:

python">import pandas as pd
import numpy as np

# 读取CSV文件
df = pd.read_csv('path/to/csv_file.csv')

# 指定要读取的行和列范围
start_row = 2  # 起始行(索引为0)
end_row = 5  # 结束行
start_col = 0  # 起始列(索引为0)
end_col = 2  # 结束列

# 根据行和列范围提取数据
selected_data = df.iloc[start_row:end_row+1, start_col:end_col+1]

# 将提取的数据转换为NumPy数组
array_data = selected_data.values

# 打印转换后的NumPy数组
print(array_data)

在上述代码中,使用selected_data.valuesselected_data转换为NumPy数组,并将结果存储在array_data变量中。然后,使用print(array_data)打印转换后的NumPy数组。

请确保已经安装了NumPy库。你可以使用以下命令安装NumPy库:

pip install numpy

这样,你就可以将pandas读取的数据转换为NumPy数组进行后续的数据处理和分析。

2.3 实例

在这里插入图片描述

终端打印

(nerf) biter@biter:~/dataset/newer_college/transform_format$ python read_excel.py 
         x        y         z        qx        qy        qz        qw
2 -3.34605  8.24457  0.138331  0.003850  0.003713 -0.605999  0.795447
3 -3.35150  8.24461  0.141933  0.003800  0.003917 -0.605870  0.795545
4 -3.34477  8.24422  0.141572  0.003592  0.003960 -0.606074  0.795390
5 -3.35222  8.24647  0.137599  0.003687  0.003883 -0.605986  0.795458

[[-3.34605e+00  8.24457e+00  1.38331e-01  3.84963e-03  3.71254e-03
  -6.05999e-01  7.95447e-01]
 [-3.35150e+00  8.24461e+00  1.41933e-01  3.80030e-03  3.91695e-03
  -6.05870e-01  7.95545e-01]
 [-3.34477e+00  8.24422e+00  1.41572e-01  3.59196e-03  3.95955e-03
  -6.06074e-01  7.95390e-01]
 [-3.35222e+00  8.24647e+00  1.37599e-01  3.68695e-03  3.88267e-03
  -6.05986e-01  7.95458e-01]]

http://www.niftyadmin.cn/n/450749.html

相关文章

VUE——Vue CLI的原理与基本使用

摘要 Vue CLI 是一个基于 Vue.js 进行快速开发的完整系统,提供: 通过 vue/cli 实现的交互式的项目脚手架。通过 vue/cli vue/cli-service-global 实现的零配置原型开发。一个运行时依赖 (vue/cli-service),该依赖: 可升级&…

Linux下Redis 存储

命令使用 目录 命令使用 RDB持久化 AOF持久化 yum安装 [rootlocalhost ~]# yum -y install redis 已加载插件:fastestmirror Loading mirror speeds from cached hostfile* c7-media: * epel: ftp.yz.yamagata-u.ac.jpvim到文件etc/redis.conf 取消注释requirep…

模版方法模式在 JDK 及 spring 源码中的引用

模版方法模式 模板方法模式是一种行为设计模式, 它在超类中定义了一个算法的框架, 允许子类在不修改结构的情况下重写算法的特定步骤。 更多有关于模版方法模式的介绍详见:https://refactoringguru.cn/design-patterns/template-method 模版…

Pytorch常用的函数(二)pytorch中nn.Embedding原理及使用

3、pytorch中nn.Embedding原理及使用 3.1 词向量介绍 图像数据表达不需要特殊的编码,并且有天生的顺序性和关联性,近似的数字会被认为是近似的特征。 正如图像是由像素组成,语言是由词或字组成,可以把语言转换为词或字表示的集…

函数适配器

在for_each()函数的第三个参数位置,将函数对象于给定参数等两个参数绑定为一个参数;那么似乎就是使用继承,参与构造了仿函数对象;那么常用的函数适配器有两个,bind2nd(),bind1st(); for_each(v.begin(),v.end(),bind2…

【Python】数据分析:如何使用 Pandas 的功能

原文作者:我辈李想 版权声明:文章原创,转载时请务必加上原文超链接、作者信息和本声明。 文章目录 前言一、Pandas 的常见功能二、Pandas 的基本操作1.导入 Pandas 库2.读入数据文件3.查看数据4.选择列和行5.过滤数据6.修改数据7.合并数据8.统…

分享几个AI绘图的学习网址

AI绘图是一种使用人工智能技术来创建图形和图像的技术。 从技术角度来看,AI绘图是一个非常有趣和不断发展的领域。随着人工智能技术的不断进步,AI绘图也在不断地发展和创新,现在已经成为数字艺术领域中的一个重要分支。 AI绘图的出现也为许多…

SQLCipher核心思想

加密原理 -------------------------------------------------------------------------- | page data | iv | hmac | --------------------------------------------------------------------------iv是一段随机数&…