课程时长
5天(6小时/天)
课程简介
(一)内容丰富
内容丰富:包含9个算法,21个课堂实践或演示,5个案例分析,1次建模大比拼
授课风格多样:算法精讲,模型适用场景阐述,成功案例分析,课堂讨论
理论与实践相结合:学员编码实践,建模大比拼,期终考试测验
(二)效果可验证(结业考试+建模大比拼)
1.“建模大比拼”规则:
每组2人
时间:一小时
使用不同的算法,编写代码,建立AI模型
训练并调优模型
2. 评比标准:
识别图片中的物体,准确率高者获胜
课程对象
数据分析师,数据科学家
软件工程师,运维工程师,系统工程师
产品经理、管理人员,业务人员
学员基础
了解基本统计知识,具备初步的IT基础知识和基本数学理论,可使用python编程
课程大纲
时间 |
内容 |
案例实践与练习 |
Day1 (9:00-12:00) |
一 人工智能概述 & 环境安装 1人工智能和机器学习概述
2 机器学习环境的安装
二 Python语言 & 数据处理与数据可视化 1 Python语言
|
环境的安装与实践
软件包的安装和管理
|
Day1 (14:00-17:00) |
2 数据分析基础
3 Matplotlib进行数据可视化
三 特征工程 & 数据降维 1 特征转换,让特征更有效
2 特征选择,发现”坏“特征
3 生成新特征
4
|
Numpy数据处理实践
Pandas读取文件
Pandas数据处理
Pandas绘图
使用matplotlib绘制数据分布图
清洗泰坦尼克沉船数据
Iris数据集的降维
|
Day2 (9:00-12:00) |
四 监督学习模型-回归分析 1 线性回归模型
2 多项式回归模型
|
案例实践:血液中胆固醇预测 |
Day2 (14:00-17:00) |
五 监督学习-分类模型 1 逻辑回归模型-两分类
2 逻辑回归-多分类
|
建立模型,预测乘客在泰坦尼克船难中是否获救
重要因素分析:分析哪些因素会提高乘客的生存率
员工的离职预测
|
Day3 (9:00-12:00) |
3 支持向量机
4 人工神经网络
|
客户流失预警
|
Day3 (14:00-17:00) |
5 K-近邻算法-无参数的模型
6 朴素贝叶斯算法-基于概率的模型
|
使用贝叶斯模型对新闻分类 |
Day4 (9:00-12:00) |
7 建模大比拼
|
建立逻辑回归,SVM,神经网络模型,识别乳腺癌的良性和恶性 |
Day4 (14:00-17:00) |
六 集成模型--三个臭皮匠,胜过诸葛亮 1 集成学习和模型融合-改善模型准确率的法宝
2 决策树算法
|
|
Day5 (9:00-12:00) |
3 随机森林和GBDT-竞赛的利器
4 建模大比拼-集成多个模型
七 非监督学习 1 聚类算法:K-means
八 选择合适的算法 模型的对比
模型的调优
|
建立逻辑回归,SVM,神经网络,随机森林集成多个模型, 识别乳腺癌的良性和恶性
实例学习和课堂练习:客户分类 |
Day5 (14:00-17:00) |
九 案例实践 1 某智能工厂项目
2 未来销售额的智能预测 – 经典时间序列类项目
3 发现“薅羊毛”- 经典监督学习分类项目
文本的聚类 - 经典非监督学习项目
5 呼叫中心对话分析 - 经典自然语言处理类项目
|
|
在线
咨询
18056868301
电话咨询
微信咨询
公众号