数据分析进阶-基于tslearn的单变量时间序列聚类

news/2024/7/3 13:04:18

前言

最近受一篇2015年文章《时间序列用户生命周期的聚类方法》的启发,阅读了很多时间序列聚类相关的方法,用消费行为的时间序列尝试去对用户行为进行分群,虽然现阶段的效果不如预期,就当总结希望后续能有所交流~

基于日消费总额的时间序列聚类

为了更好地保留用户消费行为时间序列特征(包含全局特征&局部特征),采用基于时间序列形状的方式以计算序列相似度进行用户行为区分,其中尝试了两个方向:

一、方法说明

1.DTW

DTW即Dynamic Time Warping,是动态时间规整算法,利用DTW的原因是用户在不同时间点上消费行为存在不一致性,为保证存在相似序列的用户能有效地归类
在这里插入图片描述

2.KShape

KShape 是一种时间序列聚类算法,由论文《k-Shape: Efficient and Accurate Clustering of Time Series》提出,该算法的核心是迭代增强过程,可以生成同质且较好分离的聚类。该算法采用标准的互相关距离衡量方法,基于此距离衡量方法的特性,提出了一个计算簇心的方法,在每一次迭代中都用它来更新时间序列


http://www.niftyadmin.cn/n/4411290.html

相关文章

数据分析进阶-基于tsfresh的多变量时间序列聚类

前言 上一篇博客主要尝试了基于tslearn的单变量时间序列聚类,多变量时间序列的方法经过一番搜索也没有找到合适的方式,因此考虑借助强大的时间序列特征提取工具tsfresh与KMeans尝试多变量时间序列的聚类实验 基于日消费总额+日消费次数的时间序列聚类 一、tsfresh tsfres…

数据分析进阶-cx_Oracle的简单使用

本示例使用pandascx_Oracle完成数据的读取和插入,一开始是想尝试pd.to_sql方法,但是需要借助sqlalchemy,因此本示例单纯使用cx_Oracle import pandas as pd import cx_Oracle as cxconn cx.connect(user_name/passwordhostname:port/servic…

数据分析进阶-Excel绘制分段折线图

前言 今天1024程序员节,虽然好像和我没有特别强的关系,写篇博客蹭个勋章吧~ Excel绘制分段折线图 1、如何凸显折线图中的重点片段 (1)首先将需要重点表示的数值提取出来放置新的一行数据中,如图所示,此…

Windows-设置Python定时任务

定时弹窗提醒 环境: win8Python3.8 代码: import tkinter.messagebox tkinter.messagebox.showwarning(警告,该喝水了)设置定时任务: 1、打开任务计划程序-创建任务 2、填写任务信息 3、报错指南 可查看任务计划程序库中的上次运行结果…

数据分析进阶-Excel自动化工具包openpyxl的基础使用

安装工具包 pip install openpyxl工作簿的使用 注意读取的EXCEL文件只能是xlsx后缀的噢~ # 创建工作簿 wb openpyxl.Workbook() wb.save(demo.xlsx) # 在源文件修改后也可以作为另存为的选项# 打开工作簿 wb openpyxl.load_workbook(test.xlsx, data_onlyTrue) # 读取公式…

数据分析进阶-Python提取Word文档中的表格信息

前言 利用此方法针对大量的报名表进行信息提取~ 安装工具包 pip install python-docx表格信息 代码 注意读取的EXCEL文件只能是docx后缀的噢~若文件太多可利用以下方法批量转化 import os import docx import xlwt import shutil from win32com import client as wc# 把do…

解决ATI显卡在ubuntu 9.10下开特效有点卡的问题

解决ATI 显卡在ubuntu 下开特效有点卡的问题 ATI 3400系列显卡在ubuntu 9.10 karmic 下开特效后,感觉会有点卡,比如说在任务栏切换窗口的时候,可以感觉到明显的停顿。据说9.04 jaunty 下也有同样的问题。 具体的解决办法是通过pp…