大数据
第一阶段
大数据入门基础课程
Java 语言基础 | Java面向对象编程 | JavaSE核心类库 | Java分析与设计 | 数据库开发 | JDBC技术 | Linux技术 | H5/CSS3/JS技术 | Servlet技术 | JSP技术 | AJAX技术
第二阶段
大数据Hadoop基础
大数据概论 | 访问HDFS | HDFS分布式文件系统的运行机制 | Hadoop I/O详解 | MapReduce应用编程开发 | MapReduce的工作机制与YARN平台
第三阶段
大数据离线分析技术
Hive基础 | Hive数据定义与操作| Hive内置函数和UDF | Azkaban工作流引擎 | Ooize | Impala
第四阶段
大数据实时计算技术
Zookeeper分布式协调系统与HBase安装部署 | HBase核心功能模块和基本概念 | MapReduce批量操作HBase | Redis集群及应用 | MongoDB数据库 | Kudu列式存储系统 | Storm | Kafaka | Flume海量日志采集系统
兄弟连秉承“成为 IT 培训界的黄埔军校”的发展愿景,深耕Python 全栈+人工智能、Java、大数据、PHP、前端全栈、UI 等学科教研。
拥有来自北大、清华和 BAT 等知名校企的专兼职教师数百名,面授、双师、双元和云课堂等多种教学模式并行,教学靠谱、变态严管、素质培养,共同确保了教学质量。
多种学习模式 找到最适合自己的学习“姿势”
线下面授
学员有问题也可以随时找到讲师,学习周期短,以保证以最短的时间,达到可以从事开发的水平
直播授课
课程内容全面完善,贴近实际工作需要!采用案例式教学,现在报名学习直播,免费领取配套图书教材
线上班级
课程的技术点完全采用编码规范,使学员熟练应用,提高编码效率
精品网课
课程中的每个知识点都是程序开发人员必不可少的内容,而且每个技术点的内容都非常全面,深度到位,课程当中不仅有丰富实用的教学案例,而且还融入了软件工程知识的企业级实战项目。
第五阶段 大数据分析 & 人工智能(160+课时) | ||
主要内容 | 涉及技术 | 课程详情 |
数据分析概述 | 数据行业概述, 数据分析方法论 数据分析方法, 数据分析流程 | 让学生大致了解数据行业状况、数据分析方法和数据分析的流程,掌握数据类软件和工具的使用 |
数据可视化 | Matplotlib,Pandas绘图函数,三维图 | 学会统计绘图 |
数值计算 | Numpy:一维到多维数组;利用数组进行数据处理,数组计算;随机数;数组文件的输出与输出切片与花式索引,部分统计函数的学习以及应用 | 让学生掌握数据处理的基本方法和统计学数据分析的基本方法 |
数学基础 | 高等数学,线性代数,概率与统计,应用知识补齐 | 为学生补齐Python数据领域所需数学基础 |
数据预处理与数据分析 | Pandas:Series,DataFrame,数据缺失补齐,筛选去重,清洗整理,合并分割,汇总与计算,层次化索引;数据面板,数据描述性统计分析Pandas实现) | 让学生学会用Pandas处理描述性统计分析的问题 |
数据的加载与存储 | CSV,TXT,JSON,EXcel,HDF5等文件的存储于加载 | 学会这些文件的读取与写入 |
非格式化数据分析 | 中文分词-Jieba,词云-WordCloud,中文情感分析 | 了解非格式和文本数据分析 |
机器学习 | scikit-learn;常用分类、回归、聚类算法原理 | 掌握常用机器学习算法原理和应用 |
深度学习 | 神经网络算法原理及常见库应用 | 掌握深度学习算法原理和案例应用 |
项目:上市公司股票趋势预测 | 利用关联分析(CCA或PCA)进行描述性分析,找出影响股票走势的关键因素。然后通过机器学习LassoLarsCV和LassoPath算法进行优化。借助灰度预测进行特征预测,最后通过高容差深度机器学习神经网络进行该公司股 | l 掌握关联分析,数据预计算。 l 掌握机器学习Lasso回归算法及其Kit-learn实现 l 掌握深度学习反向传播算法及其Keras实现 l 掌握Matplotlib作图以及pandas作图 l 掌握灰度预测算法及其Python实现 |