数据分享|Python用Apriori算法关联规则分析亚马逊购买书籍关联推荐客户和网络图可视化...

原文链接:http://tecdat.cn/?p=26999

Apriori 算法是一个相当新的算法,由 Agrawal 和 Srikant 于 1994 年提出。它是一种用于频繁项集挖掘的算法,允许公司理解和组织向上销售和交叉销售活动。

最强大的应用程序之一是我们在亚马逊上在线购物时看到的推荐系统 – 以及当今几乎所有电子商务网站上都存在的各种其他版本。

这是为了帮助理解一个非常简单的数据集查看文末了解数据获取方式,其中包含单个国际标准书号 (ISBN),它是一本书的唯一国际出版商标识符号。每行代表购买了所列书籍的唯一客户。

目标是了解基本购买行为,向客户推荐的其他书籍是什么——这样它可以提高公司的收入以及对所提供服务的整体满意度。

我们以网络图结束,该图展示了置信度高于 55% 的关系。

设置和导入数据集

import numpy as np

import pandas as pd



data.head()

data.shape

数据集上的EDA

#执行堆叠的步骤,转换为字符串,包括删除索引

dt2 = pd.DataFrame

dt2 = dt2.reset_index(drop = True)

dt2.nunique()  # 总共有4,999本独特的书籍

#数据集中购买最多的前10本书

top0 = pd.DataFrame(dt2.value_counts(sort= True, ascending=False).head(10))

to10

# 创建条形图 

plt.bar(t0.index, top_10\['Frequency'\])


点击标题查阅往期内容

【视频】关联规则模型、Apriori算法及R语言挖掘商店交易数据与交互可视化|数据分享

左右滑动查看更多

01

02

03

04

预处理

tdf = t.fit(d2).transform(da2)

ted = t.fit(r).transform(tr)

t_f

tdf = df.astype("int")



t_f

oks = d.DataFrame(tf, columns=e.columns_)

bos.head()

建立Apriori模型

runets = apriori(o2, min\_support=0.01, use\_colnames=True)
feqts

fetes.sort_values( by = \['support'\] ,ascending = False)

rls  =  assoc(fret, metric = "lift", min_threshold = 1)

re.solues('confidence', ascending = False)

ruls.head()

rul = rls\[res\['confidence'\] >= 0.55\]

rue

结论网络图

fig, ax = plt.subplots(figsize = (10,6))

G = x.from\_pandas\_edgelist(ul,source = 'antecedents')

n.draw(A)


数据获取

在下面公众号后台回复“书籍数”,可获取完整数据。

点击文末“阅读原文”

获取全文完整资料。

本文选自《Python用Apriori算法关联规则分析亚马逊购买书籍关联推荐客户和网络图可视化》。

点击标题查阅往期内容

【视频】关联规则模型、Apriori算法及R语言挖掘商店交易数据与交互可视化|数据分享

R语言用关联规则和聚类模型挖掘处方数据探索药物配伍中的规律

用SPSS Modeler的Web复杂网络对所有腧穴进行关联规则分析

PYTHON在线零售数据关联规则挖掘APRIORI算法数据可视化

R语言关联规则模型(Apriori算法)挖掘杂货店的交易数据与交互可视化

R语言关联挖掘实例(购物篮分析)

python关联规则学习:FP-Growth算法对药品进行“菜篮子”分析

基于R的FP树fp growth 关联数据挖掘技术在煤矿隐患管理

python关联规则学习:FP-Growth算法对药品进行“菜篮子”分析

通过Python中的Apriori算法进行关联规则挖掘

Python中的Apriori关联算法-市场购物篮分析

R语言用关联规则和聚类模型挖掘处方数据探索药物配伍中的规律

在R语言中轻松创建关联网络

python主题建模可视化LDA和T-SNE交互式可视化

R语言时间序列数据指数平滑法分析交互式动态可视化

用R语言制作交互式图表和地图

如何用r语言制作交互可视化报告图表

相关推荐