大报告spss数据挖掘-电脑 附数据 下载本文

淘宝 大数据部落

《Spss modeler》课程报告

文理学部

题目: ********************* 学生姓名: 褚宏达 学号: 20144862134

学院名称: 文理学部 专业: 应用统计学专业 班级: 14统计A1

指导教师: 詹晓琳

1

淘宝 大数据部落

写作提纲

题 目 一、本课题的研究目的和意义 目的: 1、寻找影响笔记本电脑销量的主要因素。 2、建立基于数据挖掘技术的有关笔记本电脑销量预测模型。 意义: 目前笔记本电脑已经成为每个家庭或者学生必备的产品。了解影响销量的主要因素并进行预测,利于调整电脑上成本方面的资源分配,同时,也可以控制笔记本电脑的产出,避免电脑产量多而堆积,帮助销售方准确地推荐大众化的电脑。 二、本课题的主要研究内容(提纲) 1、通过查阅文献和量化分析确定影响笔记本电脑销量的因素。 2、通过合理的量化方式对定类的自变量进行预处理。 3、收集近期pc电脑销售数据,对数据进行预处理后,建立基于数据挖掘技术的有关笔记本电脑预测模型。 4、通过对比已有模型的预测结果,分析预测模型的优缺点。 三、拟解决的关键问题 1、通过统计建模筛选影响笔记本销量的主要因素。 2、巧妙合理的量化方式使很多定类的自变量转化为连续型自变量,方便统计建模。 3、探索结果,进行分析,如聚类分析,关联分析。

2

淘宝 大数据部落

对笔记本电脑销量的调查研究

一.研究背景:

自2011年全球PC出货量达到历史最高的3.64亿台后,全球PC市场出货量已经连续四年下滑。市场调研公司Gartner最新数据显示,2015年Q3全球PC销量同比降低7.7%,至7370万台。IDC数据更加不乐观,2015年Q3全球PC出货量共计7100万台,同比下降10.8%,相比之前预测的下滑9.2%更夸张。其中,中国市场下滑幅度预计在6%左右。本次调查就是针对笔记本电脑销量运用数据挖掘的方式展开讨论

二.研究数据及范围

本研究以统计学原理为基础,通过网上收集已有的数据并调查,采用数据挖掘技术以及描述性的统计方法,对笔记本电脑销量问题进行研究,分析什么影响群众购买笔记本电脑情况?

本次数据是在数据网站搜集到的spss类型的数据,共有13个变量,5000多份数据资料,没有系统缺失值。其中5个定距变量,8个定类变量

二.研究目的:

1、寻找影响笔记本电脑销量的主要因素。

2、建立基于数据挖掘技术的有关笔记本电脑销量预测模型。

三.研究方法

运用数据挖掘clmtime描述性分析,推断性分析,和建模分析

四.分析过程

1.数据导入与异常值和离群值的处理

3