从Python基础到数据清洗,到爬虫,到案例分析实战, 还有Python量化与统计计量,all about Python: 等级
课程
入门,从配置环境到能够上手 数据思维和数据清洗
学会网络爬虫 收集数据
时间
方式 北京/远程 北京/远程 北京/远程 北京/远程 北京/远程 上海/视频
Level1 Python编程基础 5月6-9日四天
Level2 Python数据清洗及统计描述 5月13-15日三天
Level3 Python爬虫 5月20-21日两天
Level4
Python数据挖掘,算法及案 例
5月27-30日四天
专题 Python量化投资基础+实战 4月15-16,22-23日
专题 Python统计计量
4月28-5月1日
(课程详情请参照回复)
Level1-Python编程基础 5月6-9日四天 北京/远程 3200/2600 课程大纲:
一,Python概述 (0.5天)
注: 本部分课程主要为Python语言的介绍及基础环境的安装配置。 0.1Python语言介绍、Anaconda科学计算集成介绍安装 0.2Python编译器、Shell、编辑器介绍 0.3Python的第三方包的管理
0.4Python在数据分析领域的生态介绍
二,Python编程基础 (3.5天)
注: 本部分主要为讲解Python的基础编程知识,侧重于Python数据分析常用的功能和知识点进行讲解。 课程安排:
1.1Python语言特点
1.2Python的数据类型和变量 1.3Python中的运算 1.4Python的数据结构 1.5Python的控制流语句
1.6Python中的异常处理和调试 1.7函数调用和定义以及函数的参数 1.8Python的类和面向对象编程 1.9Python的文件、模块操作 1.10其他高级特性 练习项目:
-蒙特卡罗模拟求圆周率 -冒泡算法和二分查找 -实现计算器
-堆栈和队列的实现 -模拟实现ATM机取钱 -求阶乘
-模拟管理学生成绩信息 -编程实现24点扑克游戏 -会员信息管理的实现 -虚拟水果店进销存系统 -投票系统 -汉诺塔问题 -离散事件模拟 - 堆排序的实现
Level 2:Python数据清洗及统计描述 5月13-15日三天 北京/远程 2400/2000 课程大纲: 一,Numpy(NumericalPython)是高性能科学计算和数据分析的基础包,是数据分析几乎所有的高级工具的构建基础。 Numpy基础
-Numpy的ndarray -数组的索引和切片 -数组的运算 -常用的数组方法
二,Pandas包提供了大量能使我们快速便捷地处理数据的函数和方法,它是Python成为强大而高效的数据分析环境的重要因素之一。 Pandas基础应用 -Series数据结构 -DataFrame数据结构 -基本功能
-汇总和计算统计描述 -缺失值的处理
Pandas数据规整 -数据加载&输出 -数据集的合并
-数据集的重塑 -数据重构
Pandas分组运算 -GroupBy技术 -数据聚合
-分组级运算和转换 -透视表和交叉表
Level 3:Python爬虫 5月20-21日 北京/远程 1600/1300 课程大纲: 一,爬虫初级
-认识HTTP协议和Cookie及HTML介绍
-网络请求(urllib以及requests的介绍和安装) -使用BeautifulSoup4库(静态网页解析) -使用lxml库(XPath语法解析静态网页) -Python连接数据库(数据保存) -logging、time模块的学习 -正则表达式的使用
二,爬虫高级
-动态网页的抓取(PhantomJS和Selenium的使用) -Scrapy爬虫框架的安装和学习 -多线程爬虫
-规避网站信息采集陷阱
Level 4:Python数据挖掘、机器学习算法案例 5月27-30日四天 北京/远程 4200/3600 Python案例分析大全(但不局限于):
1.文本挖掘原理和案例-数据可视化的各种方式
2.预测分析核心算法-Python图片结构和分析(图片的k-means聚类分析) 3.机器学习经典算法-图片的识别和分类:PCA建模 4.Python概率统计-二维手写数字识别(KNN方法)
5.数据可视化-推荐系统的构建(最近邻方法、协同过滤)
6.Python经典金融分析-垃圾短信或邮件的识别与分类(Logistic对文本的分类) 7.Python量化投资-新闻的文本分类(TF-IDF准则、旅游新闻个性化推荐) 8.算法和模型的优化-人脸识别
9.模型精度评估和提升-朴素贝叶斯决策 10.特征选取的方法-酒的品质分类预测
11.最佳k-means分类数-机器学习的格点搜索和参数寻优 12.交叉验证(CV)-惩罚线性回归分类器
13.不平衡数据处理-使用支持向量机识别和分类