Python 学习课程安排表 下载本文

从Python基础到数据清洗,到爬虫,到案例分析实战, 还有Python量化与统计计量,all about Python: 等级

课程

入门,从配置环境到能够上手 数据思维和数据清洗

学会网络爬虫 收集数据

时间

方式 北京/远程 北京/远程 北京/远程 北京/远程 北京/远程 上海/视频

Level1 Python编程基础 5月6-9日四天

Level2 Python数据清洗及统计描述 5月13-15日三天

Level3 Python爬虫 5月20-21日两天

Level4

Python数据挖掘,算法及案 例

5月27-30日四天

专题 Python量化投资基础+实战 4月15-16,22-23日

专题 Python统计计量

4月28-5月1日

(课程详情请参照回复)

Level1-Python编程基础 5月6-9日四天 北京/远程 3200/2600 课程大纲:

一,Python概述 (0.5天)

注: 本部分课程主要为Python语言的介绍及基础环境的安装配置。 0.1Python语言介绍、Anaconda科学计算集成介绍安装 0.2Python编译器、Shell、编辑器介绍 0.3Python的第三方包的管理

0.4Python在数据分析领域的生态介绍

二,Python编程基础 (3.5天)

注: 本部分主要为讲解Python的基础编程知识,侧重于Python数据分析常用的功能和知识点进行讲解。 课程安排:

1.1Python语言特点

1.2Python的数据类型和变量 1.3Python中的运算 1.4Python的数据结构 1.5Python的控制流语句

1.6Python中的异常处理和调试 1.7函数调用和定义以及函数的参数 1.8Python的类和面向对象编程 1.9Python的文件、模块操作 1.10其他高级特性 练习项目:

-蒙特卡罗模拟求圆周率 -冒泡算法和二分查找 -实现计算器

-堆栈和队列的实现 -模拟实现ATM机取钱 -求阶乘

-模拟管理学生成绩信息 -编程实现24点扑克游戏 -会员信息管理的实现 -虚拟水果店进销存系统 -投票系统 -汉诺塔问题 -离散事件模拟 - 堆排序的实现

Level 2:Python数据清洗及统计描述 5月13-15日三天 北京/远程 2400/2000 课程大纲: 一,Numpy(NumericalPython)是高性能科学计算和数据分析的基础包,是数据分析几乎所有的高级工具的构建基础。 Numpy基础

-Numpy的ndarray -数组的索引和切片 -数组的运算 -常用的数组方法

二,Pandas包提供了大量能使我们快速便捷地处理数据的函数和方法,它是Python成为强大而高效的数据分析环境的重要因素之一。 Pandas基础应用 -Series数据结构 -DataFrame数据结构 -基本功能

-汇总和计算统计描述 -缺失值的处理

Pandas数据规整 -数据加载&输出 -数据集的合并

-数据集的重塑 -数据重构

Pandas分组运算 -GroupBy技术 -数据聚合

-分组级运算和转换 -透视表和交叉表

Level 3:Python爬虫 5月20-21日 北京/远程 1600/1300 课程大纲: 一,爬虫初级

-认识HTTP协议和Cookie及HTML介绍

-网络请求(urllib以及requests的介绍和安装) -使用BeautifulSoup4库(静态网页解析) -使用lxml库(XPath语法解析静态网页) -Python连接数据库(数据保存) -logging、time模块的学习 -正则表达式的使用

二,爬虫高级

-动态网页的抓取(PhantomJS和Selenium的使用) -Scrapy爬虫框架的安装和学习 -多线程爬虫

-规避网站信息采集陷阱

Level 4:Python数据挖掘、机器学习算法案例 5月27-30日四天 北京/远程 4200/3600 Python案例分析大全(但不局限于):

1.文本挖掘原理和案例-数据可视化的各种方式

2.预测分析核心算法-Python图片结构和分析(图片的k-means聚类分析) 3.机器学习经典算法-图片的识别和分类:PCA建模 4.Python概率统计-二维手写数字识别(KNN方法)

5.数据可视化-推荐系统的构建(最近邻方法、协同过滤)

6.Python经典金融分析-垃圾短信或邮件的识别与分类(Logistic对文本的分类) 7.Python量化投资-新闻的文本分类(TF-IDF准则、旅游新闻个性化推荐) 8.算法和模型的优化-人脸识别

9.模型精度评估和提升-朴素贝叶斯决策 10.特征选取的方法-酒的品质分类预测

11.最佳k-means分类数-机器学习的格点搜索和参数寻优 12.交叉验证(CV)-惩罚线性回归分类器

13.不平衡数据处理-使用支持向量机识别和分类