Created
Aug 8, 2024 07:03 AM
Favorite
Favorite
Priority
备注
推荐
类型
本文分享知识:
os 模块获取上一级目录的绝对地址pands 读取 sqlite3 数据库中的数据用sklearn中的线性回归模型预测销售额数据pyecharts 绘制柱状图

项目背景

对于商品的销售额预测,小凡之前尝试过许多方法,比如:时间序列模型、线性回归模型等。
使用模型进行数据预测,需要考虑的因素有很多,需要耗费很大的精力,而且效果也不一定好,这里小凡总结了一些简单的方法以供参考:
1、根据销售额的柱形图判断是否需要模型
2、根据任务的重要性决定模型的复杂度
3、近3个月的加权平均值是最好的选择
小凡常用的数据分析工具是 pandas、numpy ,连接数据库常用的工具是 sqlalchemy

获取数据

所使用的数据均放在 data.db 中,代码的上一级目录

线性数据预测

小凡绘制出所有商品的柱状图后,观察这些柱状图发现:
shapid为1的商品在最近9个月内有上升的趋势,适合用线性回归来预测数据
notion image
notion image
notion image
线性模型预测shopid为 1 的商品在2021年11月的销售额为47636万元,结合10月份的销售数据来看,11月份的销售额在 [44715,47636] 之间

非线性数据预测

shopid为2的商品,在近5个月有升有降的,用模型预测会耗费很大的精力,所以采用加权平均值代替预测值的方法
notion image
8月份、9月份、10月份的权重为0.2,0.2,0.6,计算得出11月份的销售额为2093万元,结合10月份的销售数据来看,11月份的销售额在 [2091,2094] 之间
notion image
8月份、9月份、10月份的权重为0.2,0.2,0.6,计算得出11月份的销售额为2093万元,结合10月份的销售数据来看,11月份的销售额在 [2091,2094] 之间

源码地址

链接:https://pan.baidu.com/s/1KRDAKfgWTs14EOBap2UWng?pwd=jx0o
Loading...