Python读取Excel文件中指定的列数并生成CSV文件

news/2024/7/21 4:57:47 标签: python, excel, 开发语言

0x00 安装Pandas和OpenPyXL

python">pip install pandas

pip install openpyxl

0x01 Encoding

python">import os
import pandas as pd
import openpyxl
from openpyxl import load_workbook
import csv


def write_dict_to_csv(dict_data, fileName):
    df = pd.DataFrame.from_dict(dict_data)
    # 将DataFrame写入CSV文件
    df.to_csv(fileName, index=False)


def writeCSV(dict_data, fileName):
    # 打开CSV文件
    with open(fileName, 'w', newline='') as file:
        writer = csv.writer(file)

        # writer.writerow(["key", "value"])
        print("====================================")

        # 工况点字典
        msgPoints_dict = {}
        msgPoints_num = 51

        # 遍历字典
        for key, value in dict_data.items():
            print(value)
            # writer.writerow(value)
            if isinstance(value, list):
                for item in value:
                    # 若表格数据为空则过滤掉
                    if isinstance(item, str) and item.startswith('EP') and item is not None:
                        msgPoints_dict[msgPoints_num] = value
                        # writer.writerow(value)
                        msgPoints_num = msgPoints_num + 1

        print("msgPoints_dict_size: " + str(len(msgPoints_dict)))

        for key, value in msgPoints_dict.items():
            print(key, value, end="\n")
            # 检查键值是否以"EP"开头
            if isinstance(value, list) and value and isinstance(value[2], str) and value[2].startswith("EP"):
                # print(value)

                tmp_list = [str(key)]
                tmp_list.extend(value)
                # 写入CSV文件
                # writer.writerow([key, item])
                writer.writerow(tmp_list)

    pass


def main():
    print("=== Read Excel ===")
    fileName = './doc/data.xlsx'

    # 字典类型
    dict_data = {}
    if os.path.exists(fileName):
        # 当前活跃的Sheel页
        wb = load_workbook(fileName)
        print(wb.active)

        shell = wb.active
        # print(ws['B7'].value)
        # print(ws.cell(7, 2).value)
        # rows = ws.rows
        # print(rows)

        columns_to_print = ['B', 'F', 'O']
        index = 1
        for row in shell.iter_rows():
            tmp_list = []
            for col_idx, cell in enumerate(row, start=1):
                column_letter = openpyxl.utils.get_column_letter(col_idx)
                if column_letter in columns_to_print:
                    tmp_list.append(cell.value)
                    # print(cell.value)

            dict_data[index] = tmp_list
            index = index + 1

    writeCSV(dict_data, "output.csv")
    # write_dict_to_csv(dict_data, "msg_points.csv")
    pass


if __name__ == "__main__":
    main()

http://www.niftyadmin.cn/n/5107737.html

相关文章

伊朗相关的OilRig组织在为期8个月的网络攻击中针对中东政府

导语 伊朗相关的OilRig组织最近在中东政府中展开了一场长达8个月的网络攻击行动。这次攻击导致了文件和密码的被窃取,并且在其中一次攻击中,攻击者还使用了一种名为PowerExchange的PowerShell后门。据Symantec的威胁猎人团队称,他们在一份与T…

video记录视频播放时长

一、背景:需要记录视频播放时长 html使用video控件,需每隔一段时间记录前端视频的播放时长。 二、应用:选择timeupdate的监听事件 由于该事件是每隔250毫秒运行一次,太频繁了,而且回传结果是毫秒,需要改…

HZOJ-270:最大子序和

题目描述 ​ 输入一个长度为 n� 的整数序列,从中找出一段不超过 M� 的连续子序列,使得整个序列的和最大。 ​ 例如 1,−3,5,1,−2,31,−3,5,1,−2,3: ​ 当 m4&#x…

MMWHS数据集

Multi-Modality Whole Heart Segmentation (MMWHS) 数据集[1] 是多模态医疗图像数据集,有磁共振(Magnetic Resonance Imaging,MRI)和断层扫描(Computed Tomography,CT)两种,[2] 对数…

作为决策者,谁能拒绝这样一张数据可视化报表

数据分析是决策的一大助力,因此作为企业的管理决策者都会希望获得一份直观易懂、支持灵活自助分析的数据可视化报表,比如说由奥威BI数据可视化软件制作的这张BI报表。 名称:零售业数据分析驾驶舱 来源:奥威BI零售数据分析方案 …

代码随想录打卡第四十四天|● 01 二维背包问题 ●一维背包问题-滚动数组 ● 416. 分割等和子集

什么是01背包 有n件物品和一个最多能背重量为w 的背包。第i件物品的重量是weight[i],得到的价值是value[i] 。每件物品只能用一次,求解将哪些物品装入背包里物品价值总和最大。 01背包的模板 二维dp数组 dp数组的含义 dp[i][j]含义下标为【0-i】之间…

C++ 智能指针常用总结

C 智能指针常用总结 文章目录 C 智能指针常用总结1. 写在对前面2. why 智能指针3. what 智能指针3.1 unique_ptr3.2 shared_ptr3.3 weak_ptr 3. how 指针指针3.1 unique_ptr3.1.1 创建3.1.2 成员函数 3.2 shared_ptr3.2.1创建3.2.2 成员对象 3.3 weak_ptr 4. 碎碎念5.参考资料 …

idea2023配置maven

看过【黑马程序员Maven全套教程,maven项目管理从基础到高级,Java项目开发必会管理工具maven】https://www.bilibili.com/video/BV1Ah411S7ZE?p9&vd_sourceedf9d91e5a0a27db51e3d6d4b9400637 配置的,前提要素配置也在这个课程里有啦&…