实验3

!/usr/bin/env python

coding: utf-8

In[20]:

import pandas as pd

读取表格中的数据

data=pd.read_excel(r"C:UsersAdministratorDesktop2003624024_刘佳_3超市数据集.xls",header=1)
data.drop(columns=['ListNoPosIDCashierID'],inplace=True)
display(data)

In[21]:

数据集中数据缺失情况

data.isnull().sum()

In[35]:

数据集替换

data=data.replace(["T","F"],[True,False])

In[36]:

from mlxtend.frequent_patterns import fpgrowth
from mlxtend.frequent_patterns import association_rules
apr_result = fpgrowth(data,min_support=0.1,use_colnames=True)
association_rules(apr_result,metric="confidence",min_threshold=0.7)

In[37]:

DataFrame.sort_values(by="support",ascending=False) #by指定列名,即按support列排序。ascending=False表示降序排序,默认为升序。
DataFrame.to_csv('文件名.csv') #将数据保存为csv文件

In[ ]:

本文来自投稿,不代表本站立场,如若转载,请注明出处:https://blog.itliujia.cn/info/20210989.html
-- 展开阅读全文 --
selenium 安装与 chromedriver安装
« 上一篇 09-30
第5次
下一篇 » 10-14

发表评论