当前目录下的excel文件的两列内容的相似度比较

news/2024/7/21 5:12:52 标签: python3.11, excel

# -- coding: utf-8 --**
from sklearn.feature_extraction.text import CountVectorizer
from sklearn.metrics.pairwise import cosine_similarity
import numpy as np
import pandas as pd
import os

# 获取当前目录
current_dir = os.getcwd()

# 获取当前目录下所有xlsx文件名
xlsx_files = [file for file in os.listdir(current_dir) if file.endswith(".xlsx")]
# 打印xlsx文件名
for file in xlsx_files:
print(file)
# 读取Excel文件
excel_file = file
data = pd.read_excel(excel_file)
# 提取第3列和第5列的值
column3_values = data.iloc[:, 1] # 第3列的值
column5_values = data.iloc[:, 3] # 第5列的值

# 打印提取的值
print("第3列的值:")
print(column3_values)

print("\n第5列的值:")
print(column5_values)

print(len(column3_values))
print(len(column5_values))
#
res=[]
# # 两段话
for i in range(len(column3_values)):
# 创建计数向量器
vectorizer = CountVectorizer().fit_transform([column3_values[i], column5_values[i]])
# 计算余弦相似度
cosine_sim = cosine_similarity(vectorizer)

# 提取余弦相似度值
similarity_value = cosine_sim[0][1]
if similarity_value>0.3:
res.append("正确")
elif similarity_value>0.05 and similarity_value<0.3:
res.append("部分正确")
else:
res.append("错误")
# res.append(similarity_value)

print("两段话的余弦相似度:", similarity_value)


# 指定txt文件名
txt_file =excel_file.replace(".xlsx","")+".txt"

# 将列表逐行写入txt文件
with open(txt_file, 'w') as f:
for item in res:
f.write("%s\n" % item)

print("内容已写入到", txt_file)


http://www.niftyadmin.cn/n/4962833.html

相关文章

ssh scp sshpass

ssh命令用于远程连接主机 ssh usernamehostname更多用法参考&#xff1a; ssh常用用法 scp 命令是用于通过 SSH 协议安全地将文件复制到远程系统和从远程系统复制文件到本地的命令 比如&#xff1a; scp /data/log/a.txt root192.168.1.100:/data/log该命令就就将本地的a.t…

当高并发来袭:StarRocks Query Cache 一招搞定!

您是否曾经遇到这样的情况&#xff1f;每天早上或业务活动高峰期&#xff0c;大量用户涌入报表平台或数据应用&#xff0c;希望查看特定业务领域的最新指标或趋势。这些用户可能会基于庞大的数据集进行大量类似的聚合查询&#xff0c;造成集群的 CPU 负载持续攀升&#xff0c;从…

vue 实现腾讯地图搜索选点功能(附加搜索联想功能)

注意&#xff1a;开发环境、正式环境需在腾讯地图配置ip地址白名单、域名白名单 封装map组件&#xff1a; <template><iframe width"100%" style"border: none;width: 100%;height: 100%;" :src"map_src"></iframe> </t…

最新最全的~教你如何搭建高可用Lustre双机集群

1.搭建双机lustre高可用集群: 1.环境说明: 主机名系统挂载情况IP地址Lustre集群名内存mds001Centos7.9(共享磁盘)1个mgs,1个MDT,2个OST192.168.10.21/209.21global1Gmds002Centos7.9(共享磁盘)1个mgs,1个MDT,2个OST192.168.10.22/209.22global1GclientCentos7.9无19…

【multimaster_fkie】多 ros master core 通信库,不配置主从机进行 ros 多机通信

1. 简介 多个 ros 系统之间可以通过配置 ros 主从机实现互相通信&#xff0c;但有的场景每个 ros 系统都需要运行 rosmaster/roscore &#xff0c;这种情况下就需要使用 multimaster_fkie 库来实现 ros 通信。 Github&#xff1a;https://github.com/fkie/multimaster_fkie RO…

友思特分享|太空探索的魅力:让微视觉技术揭开人类衰老之谜

一、引言 太空探索的重要性日益凸显&#xff0c;越来越多的宇航员在太空漫游。然而&#xff0c;失重状态对人体老化究竟有什么影响&#xff1f;在小型卫星和小行星等微重力环境下&#xff0c;某些细胞又如何发展&#xff1f;针对上述问题&#xff0c;瑞士人工重力实验&#xf…

设计模式二十二:策略模式(Strategy Pattern)

定义一系列算法&#xff0c;将每个算法封装成独立的对象&#xff0c;并使这些对象可互相替换。这使得在运行时可以动态地选择算法&#xff0c;而不必改变使用算法的客户端代码。策略模式的主要目标是将算法的定义与使用分离&#xff0c;使得客户端可以根据需要灵活地选择和切换…

window11下关闭防火墙 和 病毒和威胁防护的排除项设置

window11下关闭防火墙 和 病毒和威胁防护的排除项设置 强制关闭防火墙为禁止模式方法 方法一&#xff1a;1、按下键盘“winr”打开运行&#xff0c;输入“services.msc”回车确定打开服务。 2、在其中找到“Windows Defender Firewall”&#xff0c;将它停止。方法二&#xf…