研究生《大数据技术原理》教学大纲

《大数据技术原理》教学大纲

Big Data Technology

第一部分 大纲说明

1. 课程代码:

2. 课程性质:专业非学位课 3. 学时/学分:20/2

4. 课程目标:本课程以大数据处理技术为主题,旨在让学生理解掌握大数据相关的基础知识及核心技术。掌握大数据处理的概念、大数据处理架构、分布式文件系统、分布式数据库、NoSQL数据库和分布并行Map/Reduce编程模型及编程方法等。课程强调融合云计算技术、大数据处理技术和分布并行编程为一体,力图反映大数据处理领域的最新成就和发展趋势。学生除完成基本理论课程学习外,课程将通过在大数据系统平台上的实践,学习和掌握大数据的基础知识。

5. 教学方式:课堂讲授、实验、自学与讨论相结合 6. 考核方式:考试+平时+实验 7. 先修课程:JAVA程序设计 8. 本课程的学时分配表 序号 1 2 3 4 5 6 7 教学内容 课程介绍及大数据概述 大数据处理架构Hadoop 分布式文件系统HDFS 分布式数据库HBASE NoSQL数据库 云数据库 MapReduce编程模型 理论学时 2 2 4 4 2 2 4 实验 课时 课堂讨论学时 课外自学学时 2 2 2 2 2 2 2

9. 教材及教学参考资料: (一)教材:

《大数据技术原理与应用》 人民邮电出版社 主编 林子雨

(二)教学参考资料:

[1] 深入理解大数据,黄宜华 ,机械工业出版社

1

第二部分 教学内容和教学要求

第一章 课程介绍及大数据概述

教学内容:

对于课程的基本介绍,包括课程特色、教材介绍、篇章安排、主讲教师和助教等,介绍大数据发展历程、基本概念、主要影响、应用领域、关键技术、计算模式和产业发展,并阐述了云计算、物联网的概念及其与大数据之间的紧密关系。

教学要求:

了解大数据课程要求,特色,教学安排以及答疑安排,了解大数据发展历程、基本概念、应用领域、关键技术等。

第二章 大数据处理架构Hadoop

教学内容:

介绍Hadoop的发展历史、重要特性和应用现状,并详细介绍Hadoop项目结构及其各个组件,最后,演示如何在Linux操作系统下安装和配置Hadoop。

教学要求:了解hadoop特性和应用,掌握hadoop的项目结构及组件构成以及hadoop的安装配置等技术。

第三章 分布式文件系统HDFS

教学内容:

介绍分布式文件系统的基本概念、结构和设计需求,然后介绍Hadoop分布式文件系统HDFS,详细阐述它的重要概念、体系结构、存储原理和读写过程,最后,介绍了一些HDFS编程实践方面的知识。

教学要求:了解分布式文件系统的基本概念、结构和设计需求,掌握HDFS的概念,体系结构、存储原理和读写过程,熟练掌握HDFS编程实践技术。

第四章 分布式数据库HBase

教学内容:

介绍了HBase的由来及其与关系数据库的区别,然后,介绍了HBase访问接口、数据模型、实现原理和运行机制,并在最后介绍了HBase编程实践方面的一些知识。

教学要求:熟练掌握HBASE的原理和工作机制、掌握HBASE的编程实现技术。

2

第五章 NoSQL数据库

教学内容:

介绍NoSQL兴起的原因,比较NoSQL数据库与传统的关系数据库的差异;然后,介绍NoSQL数据库的四大类型以及NoSQL数据库的三大基石;最后,简要介绍与NoSQL数据库同样受到关注的NewSQL数据库。

教学要求:熟悉NoSQL数据库的特点以及与传统数据库的差异,构建NoSQL数据库的技术基础,理解新兴的NewSQL数据库等。

第六章 云数据库

教学内容:介绍云数据库的概念、特性及其与其他数据库的关系,然后,介绍云数据库的代表性产品和厂商,最后,以阿里云数据库RDS为实例演示如何使用云数据库。

教学要求:了解云数据库的概念,产品等,掌握如何使用云数据库。

第七章 MapReduce编程

教学内容:介绍MapReduce模型,阐述其具体工作流程,并以单词统计为实例介绍 MapReduce程序设计方法,同时,还介绍了MapReduce的具体应用,最后讲解MapReduce编程实践

教学要求:理解MapReduce模型原理机制与工作流程,掌握MapReduce程序设计方法和编程实践。

编写人: 张晓琳 审核人:杜永兴

3

联系客服:779662525#qq.com(#替换为@) 苏ICP备20003344号-4