重庆交通大学信息科学与工程学院
实验报告
班
级:
曙光 1701 班
姓名
学号:
实验项目名称:数据导入与预处理实验一
实验项目性质:
验证性、设计性
实验所属课程:
《数据导入与预处理》
实验室 ( 中心 ) :
语音楼八楼
指导教师:
实验完成时间:
2019
年11
月1
日
一.实验目的
1. 了解和掌握数据库的恢复, 数据库数据的变换, 数据的统计以及可视化;掌握 Json 数据集的 API 下载方法,数据提取,以及导入其他数
据结构的方法。
2. 了解和掌握不同数据格式之间的转换方法; 掌握用计算机编程语 言实现数据的格式转换以及数据信息的提取。
二.实验要求
1. 安装 Mysql 数据库,以及 mysql workbench 客户端,
2. 下载对公众开放的安然 (Enron) 公司的电子邮件数据集。
下载地址:
3. 在 mysql 中恢复 Enron 数据库。 4.
数据统计每一天和每一周发邮件的数量,并用可视化软件实现
可视化。
5. 采用 iTunes API 做个小实验,利用关键词来生成 JSON数据结果集。 iTunes 是由 Apple 公司提供的一个音乐服务,任何人都可以利用
iTunes 服务来查找歌曲、 艺术家和专辑。 在查找的时候需要把搜索关
键词添加到 iTunes API URL的后面。 URL中, =后面的是搜索关键词,
是一个乐队的名字, the Growlers 。 注意: URL中用 +代替空格字符,
URL不允许包含空格字符。
iTunes API 会根据提供的关键词从音乐库中返回 50 个结果。整个结果集形成一个 JSON文件,每一条音乐信息中的元素,以名字 - 值 的格式存放在 JSON文件中。
The Growlers
Apple iTunes 的开发文档:
6. 使用一种熟悉的语言,编写程序,将下载下来的 the Growlers
的
所有音乐的歌名提取出来,并可视化显示。
三、需求分析
1. 提取出安然公司数据集中的每天的阅读量和每周的阅读量,并
画出趋势图
2. 提取出 iTunes 中的 trackname 数据
四、实验过程
1. 安装好 Mysql 和 Mysql Workbench