处理合并目录下的Excel文件数据并指定列去重

news/2024/7/21 5:29:41 标签: excel, python, 开发语言

处理合并目录下的Excel文件数据并指定列去重

需求:读取指定目录下的Excel文件并给数据做合并与去重处理

Python代码实现

python">import os
import pandas as pd
import warnings
import time
from tqdm import tqdm #进度条展示


def read_excel(path):
    dfs = []
    for file in tqdm(os.listdir(path), desc="Reading Excel Files"):
        if file.endswith(".xlsx"):
            dfs.append(pd.read_excel(os.path.join(path, file)))
    return pd.concat(dfs, ignore_index=True)


if __name__ == '__main__':
    start_time = time.time()
    print("程序开始时间:", time.strftime('%Y-%m-%d %H:%M:%S', time.localtime(start_time)))
    warnings.filterwarnings('ignore')

    file_path = '策略列表'
    file_names = os.listdir(file_path)

    # 打印所有文件名
    for file_name in file_names:
        print(file_name)

    path = r"策略列表"
    print("正在合并表...")
    df = read_excel(path)
    # 根据账号去重数据
    df.drop_duplicates(subset='账号', inplace=True)
    df.to_excel("py合并后数据/合并策略数据-1207.xlsx", sheet_name='Sheet0', header=True, index=False)
    print("合并成功")

    end_time = time.time()
    print("程序结束时间:", time.strftime('%Y-%m-%d %H:%M:%S', time.localtime(end_time)))
    run_time = end_time - start_time
    print("程序运行耗时:%0.2f" % run_time, "s")


http://www.niftyadmin.cn/n/5250073.html

相关文章

RFID在新能源工厂大放异彩

RFID在新能源工厂大放异彩 我国在十四五规划中提出了建设绿色低碳发展的目标,新能源产业成为了国家发展的重点领域之一,开始大力支持各种新能源厂商发展。各个厂商之间不仅比产品、比技术。也比生产想要降本增效,为了实现这一目标&#xff0…

【电路笔记】-电阻器小结

电阻器小结 文章目录 电阻器小结1、电阻器类型2、串联电阻3、并联电阻4、电阻器额定功率 本文将对前面关于电阻器相关的文章内容进行简单的总结。 1、电阻器类型 电阻器的作用是限制流经电路的电流。电阻以欧姆为单位测量,并用符号 Ω碳电阻、薄膜电阻和线绕电阻都是…

K8S学习指南(4)-minikube的使用

文章目录 简介安装 Minikube启动 Minikube 集群基本概念创建和管理资源1. 创建 Pod2. 创建 Deployment3. 创建 Service 监视和调试1. 查看集群状态2. 查看集群信息3. 访问 Kubernetes Dashboard4. 使用 kubectl 命令 清理资源1. 删除 Pod2. 删除 Deployment3. 删除 Service4. 停…

大三上实训内容

项目一:爬取天气预报数据 【内容】 在中国天气网(http://www.weather.com.cn)中输入城市的名称,例如输入信阳,进入http://www.weather.com.cn/weather1d/101180601.shtml#input 的网页显示信阳的天气预报,其中101180601是信阳的…

迅为3588开发板 sudo: 无法解析主机:/DNS配置

环境申明 RK3588 ubuntu 22.04 jammy 迅为开发板 hostname 看是否有Host .,如果没有, sudo vim /etc/hostname在里面加一行,我这就这一个 iTOP-RK3588hosts 修改本地hosts sudo vim /etc/hosts127.0.0.1 localhost localhost iTOP-RK3…

K近邻算法 K近邻算法原理

K近邻算法 K近邻算法原理 k k k近邻算法介绍 k k k近邻法 (k-Nearest Neighbor;kNN) 是一种比较成熟也是最简单的机器学习算法,可以用于基本的分类与回归方法算法的主要思路:如果一个样本在特征空间中与k个实例最为相似(即特征空间中最邻近),…

LINQ【C#】

1LINQ概述: 集成查询,在对象领域和数据领域之间架起了一座桥梁。 LINQ主要由3部分组成:LINQ to ADO.NET、LINQ to Objects和LINQ to XML。其中,LINQ to ADO.NET可以分为两部分:LINQ to SQL 和LINQ to DataSet。 var…

ubuntu 如何修改主机名称

UBUNTU 2018.04 LTS 64位 修改当前电脑的主机名称。 操作步骤如下: 假设你的主机名为AAAAA , 打算修改为BBBBB。开机进入桌面。 打开一个终端。命令行下,使用vi /etc/hostname指令,编辑主机名称。将hostname文件里的AAAAA改为BB…