0基础大数据实战 视频教程 下载
├─01_JavaSE
│ day01.rar
│ day02.rar
│ day03.rar
│ day04.rar
│ day05.rar
│ day06.rar
│ day07.rar
│ day08.rar
│ day09.rar
│ day10.rar
│ day11.rar
│ day12.rar
│ day13.rar
│ day14_异常和常用类.rar
│ day15_集合1.rar
│ day16_集合2.rar
│ day17_集合3.rar
│ day18_集合4.rar
│ day19_泛型与IO.rar
│ day20_IO与多线程.rar
│ day21_多线程与网络编程.rar
│ day22_反射.rar
│ day23_MySQL1.rar
│ day24_MySQL2.rar
│ day25_MySQL3.rar
│
├─02_JDBC
│ │ 3.代码.zip
│ │
│ ├─1.笔记
│ │ 大数据.txt
│ │ 技术之jdbc.doc
│ │
│ ├─2.资料
│ │ commons-dbutils-1.7.jar
│ │ druid-1.1.10.jar
│ │ JDK1.6 API帮助文档.CHM
│ │ JDK1.6 API帮助文档.chw
│ │ mysql-connector-java-5.1.49-bin.jar
│ │
│ └─4.视频
│ 01.jdbc的整体概述.mp4
│ 02.jdbc的概念.mp4
│ 03.jdbc的使用步骤和演示.mp4
│ 04.jdbc的查询的步骤.mp4
│ 05.jdbc的现在方式种存在的问题.mp4
│ 06.jdbc使用预编译对象来对代码进行改善.mp4
│ 07.jdbc进行批处理.mp4
│ 08.jdbc进行事务的处理.mp4
│ 09.jdbc进行事务的处理进行优化.mp4
│ 10.准备学生类.mp4
│ 11.使用jdbc操作学生对象.mp4
│ 12.数据库的连接池技术的相关说明.mp4
│ 13.连接池技术的简单使用.mp4
│ 14.工具类完成连接获取.mp4
│ 15.工具类去关闭资源.mp4
│
├─03_maven
│ │ 3.代码.zip
│ │
│ ├─1.笔记
│ │ 01_大数据技术之Maven(V4.0).doc
│ │
│ ├─2.资料
│ │ │ RepMaven.rar
│ │ │
│ │ └─01_Maven核心程序
│ │ apache-maven-3.5.4-bin.zip
│ │ apache-maven-3.5.4-src.zip
│ │
│ └─4.视频
│ └─day01
│ 01.maven的整体介绍.mp4
│ 02.为什么要使用maven.mp4
│ 03.maven是什么.mp4
│ 04.构建的解释说明.mp4
│ 05.自动化构建.mp4
│ 06.安装并配置好环境变量.mp4
│ 07.修改maven的配置文件.mp4
│ 08.在idea中对maven进行装配.mp4
│ 09.使用idea完成代码.mp4
│ 10.使用maven构建功能.mp4
│ 11.maven使用的过程中的一些问题.mp4
│ 12.maven的核心概念之pom和约定.mp4
│ 13.maven的核心概念之坐标.mp4
│ 14.第二个maven工程.mp4
│ 15.maven核心概念之依赖的范围.mp4
│ 16.maven核心概念之依赖的传递和依赖冲突.mp4
│ 17.maven核心概念之依赖的排除.mp4
│ 18.maven核心概念之依赖的jar包版本.mp4
│ 19.maven核心概念之仓库.mp4
│ 20.maven核心概念之生命周期.mp4
│ 21.maven核心概念之插件与目标.mp4
│ 22.maven核心概念之继承.mp4
│ 23.maven核心概念之聚合.mp4
│ 24.maven酷站.mp4
│ 25.maven打包插件.mp4
│
├─04_linux
│ │ 02.资料.zip
│ │
│ ├─01.笔记
│ │ Linux_课堂笔记.txt
│ │ 安装CentOS.docx
│ │ 安装VMware Workstation.docx
│ │ 大数据技术之Linux(3.1).docx
│ │
│ └─03.视频
│ ├─day01
│ │ 01.linux整体内容的介绍.mp4
│ │ 02.linux的由来.mp4
│ │ 03.linux和windows的比较.mp4
│ │ 04.安装虚拟机之买电脑1.mp4
│ │ 05.安装虚拟机之nat模式和桥接模式的说明.mp4
│ │ 06.安装centos之前的有可能出现的问题.mp4
│ │ 07.安装centos全流程.mp4
│ │ 08.linux系统中一些比较重要的目录.mp4
│ │ 09.linux系统中一些其他目录.mp4
│ │ 10.介绍vi和vim.mp4
│ │ 11.vi和vim的一般模式.mp4
│ │ 12.vi和vim的编辑模式.mp4
│ │ 13.vi和vim的指令模式.mp4
│ │ 14.vi和vim的总结.mp4
│ │ 15.论虚拟机和物理机局域网的.mp4
│ │ 16.修改ip为静态Ip.mp4
│ │ 17.修改主机名.mp4
│ │ 18.修改hosts文件.mp4
│ │ 19.关闭防火墙操作.mp4
│ │ 20.关机重启命令.mp4
│ │ 21.远程登录之xshell.mp4
│ │ 22.远程登录之xftp.mp4
│ │ 23.常用之命令之帮助命令.mp4
│ │
│ ├─day02
│ │ 01.常用基本命令之文件目录1.mp4
│ │ 02.常用基本命令之文件目录2.mp4
│ │ 03.常用基本命令之文件目录3.mp4
│ │ 04.常用基本命令之文件目录4.mp4
│ │ 05.常用基本命令之时间日期类.mp4
│ │ 06.常用基本命令之用户管理和组管理之前的准备.mp4
│ │ 07.常用基本命令之用户管理命令.mp4
│ │ 08.常用基本命令之用户组管理命令.mp4
│ │ 09.常用基本命令之文件权限类说明和演示.mp4
│ │ 10.常用基本命令之修改文件权限和所属人.mp4
│ │ 11.常用基本命令之配置普通用户具有root权限.mp4
│ │ 12.常用基本命令之搜索查找1.mp4
│ │ 13.常用基本命令之搜索查找2.mp4
│ │ 14.常用基本命令之压缩解压类.mp4
│ │ 15.常用基本命令之磁盘和目录使用情况.mp4
│ │ 16.常用基本命令之挂载和卸载.mp4
│ │ 17.常用基本命令之进程线程类1.mp4
│ │ 18.常用基本命令之进程线程类2.mp4
│ │
│ └─day03
│ 01.常用命令之定时任务.mp4
│ 02.软件安装之离线安装.mp4
│ 03.软件安装之在线安装yum使用.mp4
│ 04.软件安装之切换yum的源.mp4
│ 05.克隆虚拟机.mp4
│ 06.Linux的常见面试题.mp4
│
├─05_shell
│ │ 02.资料.zip
│ │ 03.代码.zip
│ │
│ ├─01.笔记
│ │ 大数据技术之Shell(V3.1).docx
│ │ 正则匹配示例.docx
│ │
│ └─4.视频
│ ├─day01
│ │ 01.shell的整体介绍.mp4
│ │ 02.shell的概述.mp4
│ │ 03.shell的解释器的解释.mp4
│ │ 04.shell脚本前两种执行方式.mp4
│ │ 05.shell脚本第三种方式以及父子shell.mp4
│ │ 06.怎么查看系统的变量.mp4
│ │ 07.定义系统变量.mp4
│ │ 08.父子shell的变量说明.mp4
│ │ 09.常见的系统内置变量.mp4
│ │ 10.运算符.mp4
│ │ 11.条件判断.mp4
│ │ 12.流程控制之if.mp4
│ │ 13.流程控制之case.mp4
│ │ 14.流程控制之for循环.mp4
│ │ 15.流程控制之while循环.mp4
│ │ 16.控制台录入值.mp4
│ │ 17.系统函数之basename.mp4
│ │ 18.系统函数之dirname.mp4
│ │ 19.系统函数之自定义函数.mp4
│ │ 20.shell工具之cut.mp4
│ │ 21.shell工具之awk上.mp4
│ │ 22.shell工具之awk下.mp4
│ │
│ └─day02
│ 01.shell命令之sort.mp4
│ 02.shell命令之wc.mp4
│ 03.正则表达式入门.mp4
│ 04.shell面试题1.mp4
│ 05.shell面试题2.mp4
│
├─06_hadoop
│ │ 01.笔记.zip
│ │ 02.资料.zip
│ │ 03.代码.zip
│ │
│ ├─day01
│ │ 01.大数据概念.mp4
│ │ 02.大数据的特点.mp4
│ │ 03.大数据的应用场景.mp4
│ │ 04.大数据的前景.mp4
│ │ 05.大数据的部门架构.mp4
│ │ 06.hadoop是什么.mp4
│ │ 07.hadoop是发展历史.mp4
│ │ 08.hadoop是三大发行版本.mp4
│ │ 09.hadoop的优势.mp4
│ │ 10.hadoop的组成.mp4
│ │ 11.hdfs的架构组成.mp4
│ │ 12.yarn的架构组成.mp4
│ │ 13.mapreduce的组成.mp4
│ │ 14.三大模块怎么配合工作的.mp4
│ │ 15.大数据的技术生态体系.mp4
│ │ 16.运行环境配置虚拟机.mp4
│ │ 17.模板机的要求.mp4
│ │ 18.配置模板机.mp4
│ │ 19.克隆hadoop102并修改配置.mp4
│ │ 20.安装jdk并配置环境变量.mp4
│ │ 21.hadoop的安装并配置环境变量.mp4
│ │ 22.hadoop安装后的本地模式的演示.mp4
│ │ 23.克隆另外两台虚拟机.mp4
│ │
│ ├─day02
│ │ 01.回顾.mp4
│ │ 02.通过scp发送服务器之间的数据.mp4
│ │ 03.通过rsync发送服务器之间的数据.mp4
│ │ 04.xsync脚本的需求说明.mp4
│ │ 05.xsync脚本的讲解.mp4
│ │ 06.xysnc脚本的使用.mp4
│ │ 07.ssh免密登录原理.mp4
│ │ 08.ssh免密登录的配置.mp4
│ │ 09.集群规划.mp4
│ │ 10.修改hadoop的配置文件.mp4
│ │ 11.修改wokers指定小弟的位置.mp4
│ │ 12.演示hdfs的一些功能.mp4
│ │ 13.演示hdfs的可靠性.mp4
│ │ 14.单点启动各组件.mp4
│ │ 15.启动yarn和增加web界面的权限.mp4
│ │ 16.yarn的初见面并跑任务.mp4
│ │ 17.历史服务器的搭建.mp4
│ │ 18.日志的聚集.mp4
│ │ 19.hadoop入门面试1.mp4
│ │ 20.hadoop入门面试2.mp4
│ │ 21.集群的启动脚本.mp4
│ │ 22.集群的jps脚本.mp4
│ │ 23.集群时间同步的概念.mp4
│ │ 24.模仿离线状态怎么进行时间同步.mp4
│ │ 25.联网状态进行时间同步.mp4
│ │
│ ├─day03
│ │ 01.每日一考.mp4
│ │ 02.解决问题的思路.mp4
│ │ 03.hdfs的整体概述.mp4
│ │ 04.hdfs的产出背景和定义.mp4
│ │ 05.hdfs的优缺点.mp4
│ │ 06.hdfs的组成架构.mp4
│ │ 07.hdfs的文件块大小.mp4
│ │ 08.hdfs的shell操作之上传.mp4
│ │ 09.hdfs的shell操作之下载.mp4
│ │ 10.hdfs的shell操作之其他操作.mp4
│ │ 11.hdfs的api之环境准备.mp4
│ │ 12.hdfs的环境准备的问题解决.mp4
│ │ 13.hdfs的环境准备2.mp4
│ │ 14.hdfs的api中代码是怎么运行的.mp4
│ │ 15.hdfs的api代码是怎么运行的2.mp4
│ │ 16.hdfs的代码演示和补充.mp4
│ │ 17.hdfs的代码的升级.mp4
│ │ 18.hdfs的api文件上传.mp4
│ │ 19.hdfs的api文件下载.mp4
│ │ 20.hdfs通过io流进行上传.mp4
│ │ 21.hdfs通过io流进行下载.mp4
│ │ 22.hdfs的写数据流程.mp4
│ │ 23.hdfs的写数据流程故障处理机制.mp4
│ │ hdfs_demo.zip
│ │
│ ├─day04
│ │ 01.每日一考加回顾.mp4
│ │ 02.副本选择策略和机架感知.mp4
│ │ 03.hdfs数据读取.mp4
│ │ 04.hdfs中数据不同块会不会分开存储.mp4
│ │ 05.老板与秘书的爱恨情愁.mp4
│ │ 06.fsimage和edtis文件的解释说明.mp4
│ │ 07.nn和2nn的参数设置.mp4
│ │ 08.datanode的工作机制.mp4
│ │ 09.datanode的数据完整性和掉线参数.mp4
│ │ 10.mapreduce的整体概述.mp4
│ │ 11.mapreduce的定义.mp4
│ │ 12.mapreduce的优点.mp4
│ │ 13.mapreduce的缺点.mp4
│ │ 14.mapreduce的核心思想1.mp4
│ │ 15.mapreduce的核心思想2.mp4
│ │ 16.mapreduce的运行的进程.mp4
│ │ 17.mapreduce类型.mp4
│ │ 18.mapreduce的官方源码.mp4
│ │ 19.mapreduce的编程规范.mp4
│ │ 20.wordcount需求分析.mp4
│ │ 21.wordcount的准备工作.mp4
│ │ 22.wordcount的中mapper代码.mp4
│ │ 23.wordcount的中reducer代码.mp4
│ │ 24.wordcount的中driver代码.mp4
│ │ 25.wordcount的中运行并查看结果.mp4
│ │ 26.wordcount的中代码的优化.mp4
│ │ 27.wordcount通过debug查看运行流程.mp4
│ │ 28.将程序打包到集群上运行.mp4
│ │ mapreduce_demo.zip
│ │
│ ├─day05
│ │ 01.回顾.mp4
│ │ 02.通过windows发送mr任务到yarn上执行.mp4
│ │ 03.java序列化的复习.mp4
│ │ 04.java序列化的步骤.mp4
│ │ 05.hadooop序列化和java序列化的比较和步骤.mp4
│ │ 06.序列化案例的需求分析.mp4
│ │ 07.序列化案例的flowbean代码.mp4
│ │ 08.序列化案例的flowmapper代码.mp4
│ │ 09.序列化案例的flowreduce代码.mp4
│ │ 10.序列化案例的dirver代码.mp4
│ │ 11.序列化案例的运行并查看结果.mp4
│ │ 12.序列化案例的driver代码和debug.mp4
│ │ 13.mr全流程的整体说明.mp4
│ │ 14.inputformat中的切片机制.mp4
│ │ 15.job的提交流程源码.mp4
│ │ 16.job的提交流程源码的总结.mp4
│ │ 17.job中切片的流程源码.mp4
│ │ 18.job中切片debug.mp4
│ │ 19.FileInputformat中的切片总结.mp4
│ │ 20.InputFormat整体介绍.mp4
│ │ 21.默认情况下小文件处理的演示和弊端.mp4
│ │ 22.CombineTextInputformat的处理.mp4
│ │ mapreduce_demo.zip
│ │
│ ├─day06
│ │ 01.每日一考.mp4
│ │ 02.回顾.mp4
│ │ 03.maptask的流程过程1.mp4
│ │ 04.reducetask的流程过程1.mp4
│ │ 05.shuffle的流程.mp4
│ │ 06.分区过程中默认情况.mp4
│ │ 07.分区过程中特殊情况.mp4
│ │ 08.自定义分区代码和结果演示.mp4
│ │ 09.mr中排序的过程和排序的分类.mp4
│ │ 10.mr中全排序的案例分析.mp4
│ │ 11.mr中全排序的代码以及二次排序.mp4
│ │ 12.mr中部分排序.mp4
│ │ 13.mr中combiner的概念.mp4
│ │ 14.mr中combiner的使用以及注意事项.mp4
│ │ 15.Maptask的数据全部抵达环形缓冲区的源码.mp4
│ │ 16.环形缓冲区的排序和溢写源码.mp4
│ │ 17.reduce端流程说明.mp4
│ │ 18.mapreduce相应的总结说明.mp4
│ │ hadoop的mr全流程源码.txt
│ │ mapreduce_demo.zip
│ │
│ ├─day07
│ │ 01.reduce的注意事项.mp4
│ │ 02.使用mr程序将一个文件输出到另外一个文件里.mp4
│ │ 03.自定义outputformat.mp4
│ │ 04.reducejoin需求分析.mp4
│ │ 05.reducejoin的tablebean代码完成.mp4
│ │ 06.reducejoin的tablemapper代码完成.mp4
│ │ 07.reducejoin的tablereducer代码完成.mp4
│ │ 08.reducejoin的运行并发现问题.mp4
│ │ 09.reducejoin的debug的发现问题.mp4
│ │ 10.reducejoin的解决问题并总结.mp4
│ │ 11.说明下反向溢写.mp4
│ │ 12.reducejoin中存在的问题.mp4
│ │ 13.mapjoin的概念和适用场景.mp4
│ │ 14.mapjoin的代码和问题说明.mp4
│ │ 15.整个mr的总结.mp4
│ │ 16.压缩的整体简介.mp4
│ │ 17.压缩的算法对于压缩的选用.mp4
│ │ 18.压缩的位置选择和压缩的使用1.mp4
│ │ 19.压缩的位置选择和压缩的使用2.mp4
│ │ 20.虚拟机的网络故障.mp4
│ │ mapreduce_demo.zip
│ │ 洪锦涛-hadoop_每日一考day06.docx
│ │ 魏亚鹏_hadoop_每日一考day06(1).docx
│ │
│ ├─day08
│ │ 01.回顾.mp4
│ │ 02.yarn的整体介绍.mp4
│ │ 03.yarn的架构.mp4
│ │ 04.yarn的工作机制.mp4
│ │ 05.hadoop的整体流程.mp4
│ │ 06.调度器之fifo调度器.mp4
│ │ 07.调度器之容量调度器.mp4
│ │ 08.调度器之容量调度器的算法.mp4
│ │ 09.调度器之公平调度器1.mp4
│ │ 10.调度器之公平调度器2算法.mp4
│ │ 11.快照拍摄.mp4
│ │ 12.yarn的企业级配置.mp4
│ │ 13.怎么使用sublime修改yarn配置.mp4
│ │ 14.yarn配置后的实验.mp4
│ │ 15.多队列配置的概念.mp4
│ │ 16.多队列配置的配置和使用.mp4
│ │ 17.优化文档的整体说明.mp4
│ │ 18.dn的多目录存储纵向扩容优化.mp4
│ │ 19.快照的还原.mp4
│ │ 20.集群的扩容和缩容之黑白名单.mp4
│ │ 21.克隆虚拟机105.mp4
│ │ 22.将105纳入到集群中.mp4
│ │ 23.服务器之间均衡指令.mp4
│ │ 24.集群缩容之退役服务器.mp4
│ │ 25.集群故障处理之nn紧急恢复.mp4
│ │ 26.集群故障处理之安全模式的说明.mp4
│ │ 27.集群故障处理之安全模式的解决.mp4
│ │ 28.集群故障处理之安全模式的补充.mp4
│ │ 29.mr优化之硬件的影响.mp4
│ │ 30.mr优化之代码层面输入和map和reduce.mp4
│ │
│ └─day09
│ 01.回顾.mp4
│ 02.优化之数据倾斜.mp4
│ 03.优化之调优参数.mp4
│ 04.优化之小文件方案以及uber模式说明.mp4
│ 05.优化之uber模式演示.mp4
│ 06.集群间的数据拷贝.mp4
│ 07.小文件存储之归档存储.mp4
│ 08.回收站机制.mp4
│ 09.zookeeper的整体介绍.mp4
│ 10.zookeeper的机制.mp4
│ 11.zookeeper的特点.mp4
│ 12.zookeeper的结构.mp4
│ 13.zookeeper的应用场景.mp4
│ 14.zookeeper的官网.mp4
│ 15.zookeepr的本地模式安装.mp4
│ 16.zookeepr的配置文件.mp4
│ 17.zookeepr的分布式以及环境变量.mp4
│ 18.zookeepr的分布式的启动.mp4
│ 19.zookeepr的选举机制说明.mp4
│ 20.zookeepr的集群脚本.mp4
│ 21.zookeepr的客户端命令.mp4
│ 22.zookeepr的客户端命令的监听命令.mp4
│ 23.zookeepr的结构体解析.mp4
│ 24.zookeepr的节点类型.mp4
│ 25.zookeepr的监听器原理.mp4
│ 26.zookeepr的写数据流程.mp4
│ 27.hadoop的ha说明.mp4
│ 28.hadoop中ha的环境准备.mp4
│ 29.hadoop中ha的修改相应配置并分发hadoop.mp4
│ 30.hadoop中ha的手动模式.mp4
│ 31.hadoop中存储变化.mp4
│ 32.hadoop中ha的自动模式.mp4
│ hadoop ha.txt
│ hadoop_yarnha_公平调度器.rar
│ zk笔记.txt
│
├─07_flume
│ │ 1.笔记.zip
│ │ 2.资料.zip
│ │ 3.代码.zip
│ │
│ ├─day01
│ │ 01.flume的课程整体介绍.mp4
│ │ 02.flume的定义和作用.mp4
│ │ 03.flume的架构说明.mp4
│ │ 04.flume的架构补充.mp4
│ │ 05.flume的安装.mp4
│ │ 06.官方案例的准备工作.mp4
│ │ 07.官方案例的演示.mp4
│ │ 08.官方案例的补充说明.mp4
│ │ 09.源码说明Logger是怎么打印日志的.mp4
│ │ 10.案例二之使用hdfssink.mp4
│ │ 11.案例二之使用hdfssink的终极版.mp4
│ │ 12.案例二之使用hdfssink的终极版和分区表的关系.mp4
│ │ 13.案例二之使用taildirsource进行上传文件.mp4
│ │ 14.案例二之taildirsource中的注意事项.mp4
│ │ 15.flume进阶之事务.mp4
│ │ 16.flume进阶之内部原理.mp4
│ │ 17.flume企业案例之复制.mp4
│ │ 18.flume企业案例之复制的演示.mp4
│ │ job.zip
│ │
│ └─day02
│ 01.回顾.mp4
│ 02.多路复用的案例的场景和原理.mp4
│ 03.多路复用中拦截器代码的完成.mp4
│ 04.多路复用中拦截器代码的案例演示.mp4
│ 05.聚合的业务需求以及演示.mp4
│ 06.flume监控器.mp4
│ flume_demo.zip
│
├─08_kafka
│ │ 1.笔记.zip
│ │ 2.资料.zip
│ │ 3.代码.zip
│ │
│ ├─day01
│ │ 01.kafka的整体说明.mp4
│ │ 02.kafka的定义.mp4
│ │ 03.消息队列的好处.mp4
│ │ 04.消息队列的两种模式.mp4
│ │ 05.kafka的基础架构.mp4
│ │ 06.kafka的安装.mp4
│ │ 07.kafka的配置文件修改.mp4
│ │ 08.kafka的分布式安装以及启动和停止脚本.mp4
│ │ 09.kafka的主题的增删改查操作.mp4
│ │ 10.kafka的主题的生产者和消费者操作.mp4
│ │ 11.kafka的生产者数据发送流程.mp4
│ │ 12.kafka的生产者异步api.mp4
│ │ 13.kafka代码中对应的流程位置.mp4
│ │ 14.kafka代码中的更进.mp4
│ │ 15.kafka中带回调函数的api.mp4
│ │ 16.kafka中同步的api.mp4
│ │ 17.kafka中分区规则.mp4
│ │ 18.kafka中分区器的书写和演示.mp4
│ │ kafka_demo.zip
│ │
│ ├─day02
│ │ 01.每日一考.mp4
│ │ 02.生产者的内容复习.mp4
│ │ 03.生产者之如何提高吞吐量.mp4
│ │ 04.生产者之怎么保证数据的可靠性.mp4
│ │ 05.生产者之保证精准一次之幂等性.mp4
│ │ 06.生产者之保证精准一次之事务.mp4
│ │ 07.生产者之保证数据有序性.mp4
│ │ 08.集群之zk中的内容说明.mp4
│ │ 09.集群之broker的说明.mp4
│ │ 10.集群之broker的leader的故障转移.mp4
│ │ 11.集群之服役新节点之克隆虚拟机.mp4
│ │ 12.集群之服役新节点均衡主题的数据.mp4
│ │ 13.集群之退役旧节点.mp4
│ │ 14.集群之中副本的作用.mp4
│ │ 15.集群之中leader和follower之间的故障处理细节.mp4
│ │ 16.集群之中分区副本的分配策略.mp4
│ │ 17.集群之中手动调整分区副本策略.mp4
│ │ 18.集群之broker自己的负载均衡.mp4
│ │ 19.集群之broker增加副本因子.mp4
│ │ 20.集群之文件存储机制.mp4
│ │ 21.集群之文件存储机制的再说明.mp4
│ │ 22.集群之文件的清理策略.mp4
│ │ 23.集群之高效读写数据.mp4
│ │ 24.消费者拉取数据的方式.mp4
│ │ 25.消费者消费的原则.mp4
│ │ 26.消费者的初始化流程.mp4
│ │ 27.消费者的消费流程.mp4
│ │ 28.消费者的api之消费某个主题.mp4
│ │ 29.消费者的api之消费某个主题的某个分区.mp4
│ │ 30.消费者的api之消费者组案例.mp4
│ │ kafka_demo.zip
│ │ 每日一考.docx
│ │
│ └─day03
│ 01.回顾.mp4
│ 02.消费者的分区分配策略之range.mp4
│ 03.消费者的分区分配策略之轮循.mp4
│ 04.消费者的分区分配策略之粘性分区.mp4
│ 05.消费者的offset的模样.mp4
│ 06.消费者的offset的提交.mp4
│ 07.消费者的offset的自动提交.mp4
│ 08.消费者的offset的手动提交.mp4
│ 09.消费者的offset的偏移量重置.mp4
│ 10.消费者的offset的指定偏移量消费.mp4
│ 11.消费者的offset的从指定时间消费.mp4
│ 12.消费者的事务.mp4
│ 13.消费者的数据积压问题.mp4
│ 14.kafka的监控器.mp4
│ 15.kafka的kraft模式.mp4
│ kafka_demo.zip
│
├─09_scala
│ │ 1.笔记.zip
│ │ 2.资料.zip
│ │ 3.代码.zip
│ │
│ ├─scala-day01
│ │ 00.idea使用问题修改中文.mp4
│ │ 01.scala的课程介绍.mp4
│ │ 02.SDK在windows上部署.mp4
│ │ 03.scala在idea中hello world编写.mp4
│ │ 04.scala代码中反编译对应java代码.mp4
│ │ 05.scala代码关联源码和文档介绍.mp4
│ │ 06.scala注释介绍.mp4
│ │ 07.scala变量和常量的使用区别.mp4
│ │ 08.scala变量和常量修饰对象的使用介绍.mp4
│ │ 09.scala标识符介绍.mp4
│ │ 10.scala字符串输出介绍.mp4
│ │ 11.java的数据类型设计回顾.mp4
│ │ 12.scala的数据类型总体介绍.mp4
│ │ 13.scala和java语言的本质区别.mp4
│ │ 14.scala的整数类型介绍.mp4
│ │ 15.scala的浮点数字符和布尔类型.mp4
│ │ 16.scala三种空值类型的介绍.mp4
│ │ 17.scala的自动类型提升.mp4
│ │ 18.scala的强制类型转换.mp4
│ │ 19.scala的数值底层存储.mp4
│ │
│ ├─scala-day02
│ │ 00.课前回顾.mp4
│ │ 01.scala算术运算符和关系运算符.mp4
│ │ 02.scala运算符本质.mp4
│ │ 03.scala的条件判断if else.mp4
│ │ 04.scala的for循环的本质和基础语法.mp4
│ │ 05.scala的for循环补充语法.mp4
│ │ 06.scala的while循环介绍.mp4
│ │ 07.scala的循环中断.mp4
│ │ 08.scala流程控制问题提出.mp4
│ │ 09.scala流程控制问题解决.mp4
│ │ 10.scala函数式编程函数和方法的区别.mp4
│ │ 11.scala函数参数的特殊用法.mp4
│ │ 12.scala函数至简原则定义函数化简.mp4
│ │ 13.scala函数至简原则注意事项及转换匿名函数.mp4
│ │ 14.scala匿名函数化简.mp4
│ │ 15.scala匿名函数化简不能写成下划线的情况介绍.mp4
│ │ 16.scala高阶函数的第二种用法函数作为参数传递.mp4
│ │ 17.scala高阶函数的第二种用法具体使用方式.mp4
│ │ 18.scala函数式编程掌握要求.mp4
│ │ 19.scala函数式编程高阶函数的第三种用法.mp4
│ │ 20.scala闭包和柯里化的实际使用.mp4
│ │ scaladay-01.txt
│ │
│ ├─scala-day03
│ │ 00.课前回顾.mp4
│ │ 01.scala递归的基本语法介绍.mp4
│ │ 02.scala递归的优化尾递归.mp4
│ │ 03.sacla控制抽象介绍.mp4
│ │ 04.scala自定义while循环.mp4
│ │ 05.scala惰性函数.mp4
│ │ 06.scala包对象和导包说明.mp4
│ │ 07.scala面向对象封装.mp4
│ │ 08.scala课件问题解答.mp4
│ │ 09.scala访问权限介绍.mp4
│ │ 10.scala构造器的使用介绍.mp4
│ │ 11.scala的主构造器参数.mp4
│ │ 12.scala中的继承的本质.mp4
│ │ 13.scala中抽象属性和方法的使用.mp4
│ │ 14.scala重写属性和方法.mp4
│ │ 15.scala多态介绍.mp4
│ │ 16.scala匿名子类的补充说明.mp4
│ │ 17.scala伴生对象和apply方法介绍.mp4
│ │ 18.scala的特质基本语法.mp4
│ │ 19.scala特质使用的注意介绍.mp4
│ │ 20.scala面向对象拓展内容.mp4
│ │ scaladay-02.txt
│ │
│ ├─scala-day04
│ │ 00.课前回顾.mp4
│ │ 01.scala集合的概述.mp4
│ │ 02.scala不可变集合继承图介绍.mp4
│ │ 03.scala可变集合继承图介绍.mp4
│ │ 04.scala不可变数组array介绍.mp4
│ │ 05.scala集合的多种遍历方式.mp4
│ │ 06.scala可变数组arrayBuffer介绍.mp4
│ │ 07.scala数组的转换和多维数组.mp4
│ │ 08.scala集合不可变list.mp4
│ │ 09.scala可变集合ListBuffer.mp4
│ │ 10.scala的set介绍.mp4
│ │ 11.scala的不可变map使用介绍.mp4
│ │ 12.scala的可变map使用介绍.mp4
│ │ 13.scala元组的使用介绍.mp4
│ │ 14.scala集合问题提出.mp4
│ │ 15.scala集合合并两个map.mp4
│ │ 16.scala基础的集合函数.mp4
│ │ 17.scala衍生集合.mp4
│ │ 18.scala的排序.mp4
│ │ 19.scala的函数式排序sortBy.mp4
│ │ 20.scala的函数式排序sortWith.mp4
│ │ scaladay03.txt
│ │
│ ├─scala-day05
│ │ 00.课前回顾每日一考.mp4
│ │ 01.scala高阶函数filter过滤.mp4
│ │ 02.scala高阶函数map映射.mp4
│ │ 03.scala高阶函数flatMap.mp4
│ │ 04.scala高阶函数分组groupBy.mp4
│ │ 05.scala高阶函数reduce.mp4
│ │ 06.scala高阶函数fold和foldLeft.mp4
│ │ 07.scala的wc案例需求分析.mp4
│ │ 08.scala的wc案例代码编写.mp4
│ │ 09.scala的wc案例熟练写法介绍.mp4
│ │ 10.scala的不可变队列.mp4
│ │ 11.scala的可变队列.mp4
│ │ 12.scala的并行集合使用.mp4
│ │ 13.scala的模式匹配基础语法.mp4
│ │ 14.scala的模式匹配模式守卫.mp4
│ │ 15.scala的模式匹配匹配类型.mp4
│ │ 16.scala模式匹配匹配元组.mp4
│ │ 17.scala匹配对象和样例类的介绍.mp4
│ │ 18.scala偏函数的底层原理.mp4
│ │ 19.scala偏函数的使用介绍.mp4
│ │ 20.scala的下划线的用法.mp4
│ │ scaladay-04.txt
│ │
│ └─scala-day06
│ 00.课前回顾每日一考.mp4
│ 01.scala的异常处理语法.mp4
│ 02.scala异常处理细节介绍.mp4
│ 03.scala隐式函数.mp4
│ 04.scala隐式函数补充说明.mp4
│ 05.scala隐式参数介绍.mp4
│ 06.scala泛型的协变逆变和不变.mp4
│ 07.scala泛型的上下限.mp4
│ 08.scala泛型上下文限定.mp4
│ scala-day05.txt
│
├─10_spark
│ │ 1.课件.zip
│ │ 2.资料.zip
│ │ 3.代码.zip
│ │
│ ├─spark-day01-入门
│ │ 00_spark概述.mp4
│ │ 01_与hadoop的MR程序对比.mp4
│ │ 02_内置模块介绍.mp4
│ │ 03_特点和优势.mp4
│ │ 04_本地模式部署及使用.mp4
│ │ 05_wordCount案例分析.mp4
│ │ 06_使用shell运行wordCount案例.mp4
│ │ 07_进程查看页面4040介绍.mp4
│ │
│ ├─spark-day02-入门
│ │ 00.spark-standalone集群角色介绍.mp4
│ │ 01.standalone模式的安装部署.mp4
│ │ 02.standalone的使用和资源控制.mp4
│ │ 03.配置历史服务器查看DAG.mp4
│ │ 04.配置高可用模式.mp4
│ │ 05.高可用的连接和分布式读数据.mp4
│ │ 06.standalone两种运行模式介绍.mp4
│ │ 07.yarn模式的安装部署.mp4
│ │ 08.yarn模式配置历史日志.mp4
│ │ 09.yarn模式的运行流程.mp4
│ │ 10.spark部署模式总结.mp4
│ │ 11.wordCount案例环境准备.mp4
│ │ 12.wordCount基础代码编写.mp4
│ │ 13.wordCount兼容性问题及代码运行.mp4
│ │ 14.wordCount代码优化修改动态传参.mp4
│ │ 15.wordCount调试代码和关联源码.mp4
│ │ 16.idea运行wordCount解决兼容性问题.mp4
│ │ 17.wordCount代码上传到yarn集群使用.mp4
│ │
│ ├─spark-day03-coreday01
│ │ 00.课前回顾.mp4
│ │ 01.RDD概述和工厂生产类比.mp4
│ │ 02.wordCount工作流程.mp4
│ │ 03.shuffle概述.mp4
│ │ 04.RDD的五大特性.mp4
│ │ 05.从集合创建RDD的方法介绍.mp4
│ │ 06.idea代码模板介绍.mp4
│ │ 07.RDD创建的三种方式介绍.mp4
│ │ 08.从集合创建RDD分区情况介绍.mp4
│ │ 09.从文件创建RDD分区规则.mp4
│ │ 10.单value算子map.mp4
│ │ 11.单Value算子mapPartitions.mp4
│ │ 12.map和MapPartitions的区别.mp4
│ │ 13.单value算子MapPartitionsWithIndex.mp4
│ │ 14.单value算子flatMap.mp4
│ │ 15.单value算子groupBy.mp4
│ │ 16.单value算子filter.mp4
│ │ 17.单value算子Distinct.mp4
│ │ 18.单value算子coalesce.mp4
│ │ 19.单value算子rePartition.mp4
│ │ 20.单value算子sortBy.mp4
│ │ 21.双value算子交并差.mp4
│ │ 22.双value算子拉链.mp4
│ │ spark-coreday1.txt
│ │
│ ├─spark-day04-coreday02
│ │ 00.课前回顾每日一考.mp4
│ │ 01.keyValue算子partitionBy使用系统分区器.mp4
│ │ 02.自定义分区器代码编写.mp4
│ │ 03.keyValue算子groupByKey.mp4
│ │ 04.keyValue算子reduceByKey.mp4
│ │ 05.keyValue算子aggregateByKey.mp4
│ │ 06.keyValue算子sortByKey.mp4
│ │ 07.keyValue算子json和cogroup.mp4
│ │ 08.省份下广告点击top3需求分析.mp4
│ │ 09.省份下广告点击top3代码编写.mp4
│ │ 10.行动算子取对应元素.mp4
│ │ 11.行动算子save.mp4
│ │ 12.行动算子foreach.mp4
│ │ 13.序列化的使用场景.mp4
│ │ 14.序列化的闭包检查.mp4
│ │ 15.Kryo序列化优化介绍.mp4
│ │ 16.血缘关系介绍.mp4
│ │ 17.依赖关系的介绍.mp4
│ │ 18.reduceByKey不走shuffle的优化.mp4
│ │ sparkcoreday2.txt
│ │
│ ├─spark-day05-coreday03
│ │ 00.课前回顾每日一考.mp4
│ │ 01.任务切分流程.mp4
│ │ 02.任务切分总结.mp4
│ │ 03.缓存的基本使用.mp4
│ │ 04.缓存的注意事项.mp4
│ │ 05.检查点的基本使用.mp4
│ │ 06.检查点的注意事项.mp4
│ │ 07.检查点保存数据到hdfs.mp4
│ │ 08.分区器的常规使用.mp4
│ │ 09.hash分区器内容介绍.mp4
│ │ 10.range分区器介绍.mp4
│ │ 11.累加器的使用场景.mp4
│ │ 12.累加器的使用介绍.mp4
│ │ 13.使用累加器完成wordCount.mp4
│ │ 14.广播变量的使用.mp4
│ │ 15.sparkCore的需求分析.mp4
│ │ spark-coreday3.txt
│ │
│ ├─spark-day06-coreday04
│ │ 00.课前回顾.mp4
│ │ 01.三次统计WordCount-点击统计.mp4
│ │ 02.三次统计WordCount-订单统计.mp4
│ │ 03.三次统计WordCount热门品类求top10.mp4
│ │ 04.优化方法只读取一份数据.mp4
│ │ 05.使用样例类处理数据.mp4
│ │ 06.样例类处理代码编写.mp4
│ │ 07.样例类算子优化性能对比.mp4
│ │ 08.spark-sql概述.mp4
│ │ 09.spark-sql特点介绍.mp4
│ │ 10.spark-sql读取打印文件的方式.mp4
│ │ 11.spark-sql的ds和df转换使用演示.mp4
│ │ sparkcore-day4.txt
│ │
│ ├─spark-day07-sparkSQLday01
│ │ 00.spark-SQL函数的使用方法.mp4
│ │ 01.spark-sql的SQL语法使用方法.mp4
│ │ 02.spark-sql的DSL特殊语法.mp4
│ │ 03.spark-sql自定义UDF函数.mp4
│ │ 04.spark-sql自定义UDAF函数.mp4
│ │ 05.spark-sql读取csv文件介绍.mp4
│ │ 06.spark-sql写出到CSV文件.mp4
│ │ 07.spark-sql读写json文件.mp4
│ │ 08.spark-sql读取和写出parquet文件.mp4
│ │ 09.spark-sql从mysql读取数据.mp4
│ │ 10.spark-sql写入数据到mysql.mp4
│ │ 11.spark-sql与Hive的交互.mp4
│ │ 12.spark-sql的hive on spark模式介绍.mp4
│ │ 13.spark-sql实战环境准备和需求介绍.mp4
│ │ 14.spark-sql实战读取3个表格的数据.mp4
│ │ 15.spark-sql实战区域内取热门商品点击top3.mp4
│ │ 16.spark-sql自定义函数解决城市标记问题.mp4
│ │ 17.spark-sql算子替代自定义UDAF函数.mp4
│ │
│ └─spark-day08-内核day01
│ 00.spark内核程序入口介绍.mp4
│ 01.spark内核完整提交流程.mp4
│ 02.spark-yarn的cluster模式数据输出.mp4
│ 03.spark内核通讯框架的发展变化.mp4
│ 04.spark内核3种通讯方式.mp4
│ 05.spark内核底层通讯的原理.mp4
│ 06.spark内核任务切分原理.mp4
│ 07.spark内核任务执行原理.mp4
│ 08.spark内核课件沟通.mp4
│ 09.sparkShuffle机制的HashShuffle.mp4
│ 10.spark的SortShuffle内容介绍.mp4
│ 11.spark的堆外内存介绍.mp4
│ 12.spark的动态内存管理机制.mp4
│ 13.spark的存储内存管理机制.mp4
│ 14.spark的执行内存管理.mp4
│
├─11_zookeeper
│ 在hadoop day09
│
├─12_离线数仓
│ │ 1.笔记.zip
│ │ 2.资料.zip
│ │ 3.代码.zip
│ │
│ ├─day06
│ │ 10_dws数据导入脚本编写.mkv
│ │ 1_昨日回顾.mkv
│ │ 2_dws用户主题每日导入(2).mkv
│ │ 3_用户主题表.mkv
│ │ 4_商品主题表首日导入.mkv
│ │ 5_商品主题表每日导入.mkv
│ │ 6_dws优惠券主题表.mkv
│ │ 7_dws活动主题表.mkv
│ │ 8_dws地区主题表.mkv
│ │ 9_dws访客主题.mkv
│ │
│ ├─day07
│ │ 1_昨日回顾.mkv
│ │ 2_dwt用户主题每日导入.mkv
│ │ 3_dwt用户主题首日导入.mkv
│ │ 4_商品主题首日导入.mkv
│ │ 5_商品主题每日导入.mkv
│ │ 6_访客主题首日和每日导入.mkv
│ │
│ ├─day08
│ │ 1_昨日回顾.mkv
│ │ 2_dwt层其余表格.mkv
│ │ 3_数仓血缘图.mkv
│ │ 4_ads简介.mkv
│ │ 5_近30活动参加情况.mkv
│ │ 6_spu统计.mkv
│ │ 7_品牌复购率.mkv
│ │
│ ├─day1
│ │ 01_数仓项目_回顾_采集架构整体回顾.mp4
│ │ 02_数仓项目_回顾_项目需求和架构设计.mp4
│ │ 03_数仓项目_回顾_两种日志格式回顾.mp4
│ │ 04_数仓项目_回顾_日志采集通道回顾.mp4
│ │ 05_数仓项目_回顾_业务数据34张表回顾.mp4
│ │ 06_数仓项目_回顾_业务数据28张表同步策略.mp4
│ │ 07_数仓项目_回顾_增量表数据采集通道回顾.mp4
│ │ 08_数仓项目_回顾_全量表采集通道回顾.mp4
│ │ 09_数仓项目_回顾_正确姿势采集日志数据.mp4
│ │ 10_数仓项目_回顾_正确姿势采集业务数据.mp4
│ │ 业务数据表熟悉任务.txt
│ │
│ ├─day10
│ │ 01_数仓项目_课程回顾.mp4
│ │ 02_数仓项目_设计_dws_历史至今汇总表设计思路.mp4
│ │ 03_数仓项目_搭建_dws_用户粒度订单历史至今汇总表.mp4
│ │ 04_数仓项目_搭建_dws_用户粒度支付历史至今汇总表.mp4
│ │ 05_数仓项目_搭建_dws_用户粒度登录历史至今汇总表.mp4
│ │ 06_数仓项目_搭建_dws_脚本编写成功.mp4
│ │ 07_数仓项目_搭建_ads_各渠道流量统计建表语句和装载思路.mp4
│ │ 08_数仓项目_搭建_ads_各渠道流量统计数据装载简单版.mp4
│ │ 09_数仓项目_搭建_ads_各渠道流量统计数据装载最终版.mp4
│ │ 10_数仓项目_搭建_ads_路径分析.mp4
│ │ 11_数仓项目_搭建_ads_用户变动统计.mp4
│ │ 12_数仓项目_搭建_ads_用户留存率建表语句和概念介绍.mp4
│ │ 13_数仓项目_搭建_ads_用户留存率数据装载简单版.mp4
│ │ 14_数仓项目_搭建_ads_用户留存率数据装载最终版.mp4
│ │ gmall0309.sql
│ │
│ ├─day11
│ │ 01_数仓项目_课程回顾.mp4
│ │ 02_数仓项目_搭建_ads_用户新增活跃统计.mp4
│ │ 03_数仓项目_搭建_ads_用户行为漏斗分析.mp4
│ │ 04_数仓项目_搭建_ads_新增交易用户统计.mp4
│ │ 05_数仓项目_搭建_ads_品牌复购率.mp4
│ │ 06_数仓项目_搭建_ads_各品牌商品交易统计.mp4
│ │ 07_数仓项目_搭建_ads_各品类商品交易统计.mp4
│ │ 08_数仓项目_搭建_ads_各分类商品购物车存量Top3.mp4
│ │ 09_数仓项目_搭建_ads_交易综合统计.mp4
│ │ 10_数仓项目_搭建_ads_各省份交易统计.mp4
│ │ gmall0309.sql
│ │
│ ├─day12
│ │ 01_数仓项目_课程回顾.mp4
│ │ 02_数仓项目_搭建_ads_最近30日优惠券和活动补贴率.mp4
│ │ 03_数仓项目_搭建_ads_脚本编写和数据环境检查.mp4
│ │ 04_数仓项目_数据导出_dataX回顾.mp4
│ │ 05_数仓项目_数据导出_mysql建库建表.mp4
│ │ 06_数仓项目_数据导出_datax配置文件使用案例测试.mp4
│ │ 07_数仓项目_数据导出_15个json配置文件生成.mp4
│ │ 08_数仓项目_数据导出_15张表导出完成.mp4
│ │ 09_数仓项目_调度_数仓工作流手动梳理.mp4
│ │ 10_数仓项目_调度_DolphinScheduler概述.mp4
│ │ 11_数仓项目_调度_ds架构简介.mp4
│ │ 12_数仓项目_调度_ds三种部署模式.mp4
│ │ 13_数仓项目_调度_ds安装环境准备.mp4
│ │ 14_数仓项目_调度_数据库准备.mp4
│ │ 15_数仓项目_调度_一键安装部署ds.mp4
│ │ 16_数仓项目_调度_ds的启停命令.mp4
│ │ gmall0309.sql
│ │
│ ├─day13
│ │ │ 01_数仓项目_课程回顾.mp4
│ │ │ 02_数仓项目_调度_ds安全中心配置.mp4
│ │ │ 03_数仓项目_调度_ds工作流简单使用.mp4
│ │ │ 04_数仓项目_调度_ds进阶之工作流传参.mp4
│ │ │ 05_数仓项目_调度_ds进阶之引用外部资源.mp4
│ │ │ 06_数仓项目_调度_ds进阶之邮件告警.mp4
│ │ │ 07_数仓项目_调度_ds进阶之恢复失败.mp4
│ │ │ 08_数仓项目_调度_全流程_新数据生成.mp4
│ │ │ 09_数仓项目_调度_全流程_数仓工作流定义.mp4
│ │ │ 10_数仓项目_调度_全流程_集群模式调度环境准备.mp4
│ │ │ 11_数仓项目_调度_全流程_工作流调度成功(全绿成就).mp4
│ │ │ 12_数仓项目_调度_全流程_ds单机模式(了解).mp4
│ │ │
│ │ └─bin
│ │ dwd_to_dws_1d.sh
│ │ dws_1d_to_dws_nd.sh
│ │ dws_1d_to_dws_td.sh
│ │ dws_to_ads.sh
│ │ hdfs_to_mysql.sh
│ │ hdfs_to_ods_db.sh
│ │ hdfs_to_ods_log.sh
│ │ mysql_to_hdfs_full.sh
│ │ ods_to_dim.sh
│ │ ods_to_dwd.sh
│ │
│ ├─day2
│ │ 01_数仓项目_课程回顾.mp4
│ │ 02_数仓项目_概述_数仓概述.mp4
│ │ 03_数仓项目_建模_建模的意义.mp4
│ │ 04_数仓项目_建模_ER模型.mp4
│ │ 05_数仓项目_建模_三范式理论.mp4
│ │ 06_数仓项目_建模_ER模型vs维度模型.mp4
│ │ 07_数仓项目_事实表_事务型事实表设计流程.mp4
│ │ 08_数仓项目_事实表_事务型事实表两个不足.mp4
│ │ 09_数仓项目_事实表_周期型快照事实表.mp4
│ │ 10_数仓项目_事实表_累积型快照事实表.mp4
│ │ 11_数仓项目_维度表_设计步骤.mp4
│ │ 12_数仓项目_维度表_规范化和反规范化.mp4
│ │ 13_数仓项目_维度表_维度变化.mp4
│ │ 14_数仓项目_维度表_多值维度和多值属性.mp4
│ │
│ ├─day3
│ │ 01_数仓项目_课程回顾.mp4
│ │ 02_数仓项目_设计_分层规划.mp4
│ │ 03_数仓项目_设计_数仓构建全流程.mp4
│ │ 04_数仓项目_设计_数据调研.mp4
│ │ 05_数仓项目_设计_数据域划分.mp4
│ │ 06_数仓项目_设计_业务总线矩阵和维度模型设计.mp4
│ │ 07_数仓项目_设计_指标体系和汇总模型设计.mp4
│ │ 08_数仓项目_环境准备_hive on spark部署.mp4
│ │ 09_数仓项目_环境准备_hive on spark测试.mp4
│ │ 10_数仓项目_环境准备_hive on spark队列占用问题解决.mp4
│ │ 11_数仓项目_环境准备_DataGrip连接hive.mp4
│ │ 12_数仓项目_环境准备_hive参数调优.mp4
│ │ hive-site.xml
│ │
│ ├─day4
│ │ 01_数仓项目_课程回顾.mp4
│ │ 02_数仓项目_搭建_ods_设计要点和思路.mp4
│ │ 03_数仓项目_搭建_ods_hive_jsonSerde简介.mp4
│ │ 04_数仓项目_搭建_ods_hive_json表测试.mp4
│ │ 05_数仓项目_搭建_ods_日志表建表语句和数据装载.mp4
│ │ 06_数仓项目_搭建_ods_脚本编写测试成功.mp4
│ │ 07_数仓项目_搭建_ods_15张业务全量表建表语句.mp4
│ │ 08_数仓项目_搭建_ods_13张业务增量表建表语句.mp4
│ │ 09_数仓项目_搭建_ods_业务表脚本编写测试成功.mp4
│ │ gmall0309.sql
│ │ json.txt
│ │
│ ├─day5
│ │ 01_数仓项目_课程回顾.mp4
│ │ 02_数仓项目_搭建_dim_商品维度表建表语句和数据流向.mp4
│ │ 03_数仓项目_搭建_dim_商品维度表数据装载.mp4
│ │ 04_数仓项目_搭建_dim_优惠券维度表.mp4
│ │ 05_数仓项目_搭建_dim_活动维度表.mp4
│ │ 06_数仓项目_搭建_dim_地区维度表.mp4
│ │ 07_数仓项目_搭建_dim_日期维度表.mp4
│ │ 08_数仓项目_搭建_dim_拉链表_用户维度表建表语句和分区规划.mp4
│ │ 09_数仓项目_搭建_dim_拉链表_用户维度表装载过程和数据流向.mp4
│ │ 10_数仓项目_搭建_dim_拉链表_首日装载(拉链表初始化).mp4
│ │ 11_数仓项目_搭建_dim_拉链表_每日装载思路分析.mp4
│ │ 12_数仓项目_搭建_dim_拉链表_每日装载SQL实现.mp4
│ │ 13_数仓项目_搭建_dim_脚本编写成功.mp4
│ │ gmall0309.sql
│ │
│ └─day9
│ 01_数仓项目_课程回顾.mp4
│ 02_数仓项目_设计_dws_最近1日汇总表建表语句.mp4
│ 03_数仓项目_设计_dws_最近1日汇总表数据装载.mp4
│ 04_数仓项目_设计_dws_最近n日汇总表建表语句和数据装载.mp4
│ 05_数仓项目_设计_dws_降低数据粒度解决用户人数问题.mp4
│ 06_数仓项目_设计_dws_再次调低数据粒度增加宽表通用性.mp4
│ 07_数仓项目_搭建_dws_用户商品粒度订单1日汇总表.mp4
│ 08_数仓项目_搭建_dws_用户商品粒度订单n日汇总表.mp4
│ 09_数仓项目_搭建_dws_用户商品粒度退单1日和n日汇总表.mp4
│ 10_数仓项目_搭建_dws_用户粒度订单1日和n日汇总表.mp4
│ 11_数仓项目_搭建_dws_用户粒度加购1日和n日汇总表.mp4
│ 12_数仓项目_搭建_dws_用户粒度支付1日和n日汇总表.mp4
│ 13_数仓项目_搭建_dws_用户粒度退单1日和n日汇总表.mp4
│ 14_数仓项目_搭建_dws_省份粒度订单1日和n日汇总表.mp4
│ 15_数仓项目_搭建_dws_会话粒度页面浏览1日汇总表.mp4
│ 16_数仓项目_搭建_dws_访客页面粒度页面浏览1日和n日汇总表.mp4
│ 17_数仓项目_搭建_dws_优惠券粒度订单n日汇总表.mp4
│ 18_数仓项目_搭建_dws_活动粒度订单n日汇总表.mp4
│ gmall0309.sql
│
├─13_在线教育离线项目实战
│ │ 1.笔记.zip
│ │ 2.资料.zip
│ │ ads数据导入.sql
│ │ dws_1d_to_dws_td_init.sh
│ │ DWS_1d脚本.sh
│ │ DWS_nd脚本.sh
│ │ edu指标体系.xmind
│ │ 考试主题.dmj
│ │
│ └─3.视频
│ 1.购买阿里云ECS(推荐观看采集项目里的视频).mp4
│ 2.代理配置-浏览器-Navicat.mp4
│ 3.代理配置-DataGrip&&修改SSH端口&&免密登录.mp4
│
├─14_flink
│ │ 1.课件.zip
│ │ 2.资料.zip
│ │ 3.代码.zip
│ │
│ ├─day01
│ │ 01-Flink基础-简介.mp4
│ │ 02-Flink基础-Flink的重要特点.mp4
│ │ 03-Flink基础-sparkOrFlink.mp4
│ │ 04-Flink基础-批处理WordCount.mp4
│ │ 05-Flink基础-流处理-有界WordCount.mp4
│ │ 06-Flink基础-流处理-无界WordCount.mp4
│ │ 07-Flink基础-部署模式-LocalCluster.mp4
│ │ 08-Flink基础-部署模式-Standalone.mp4
│ │ 09-Flink基础-部署模式-Yarn模式运行无界流WordCount.mp4
│ │ 10-Flink基础-部署模式-YarnSession模式.mp4
│ │ 11-Flink基础-部署模式-YarnPerJob模式&YarnApplication模式.mp4
│ │ 12-Flink基础-部署模式-Yarn模式提交命令.mp4
│ │
│ ├─day02
│ │ 01-Flink基础-内容回顾.mp4
│ │ 02-Flink基础-Flink部署-Standalone模式高可用.mp4
│ │ 03-Flink基础-Flink部署-Yarn模式高可用&与其他框架的一个对比.mp4
│ │ 04-Flink基础-运行架构-客户端&JobManager.mp4
│ │ 05-Flink基础-运行架构-TaskManager.mp4
│ │ 06-Flink基础-核心概念-TaskManager&Slot.mp4
│ │ 07-Flink基础-核心概念-并行度.mp4
│ │ 08-Flink基础-核心概念-Task与SubTask.mp4
│ │ 09-Flink基础-核心概念-任务链.mp4
│ │ 10-Flink基础-核心概念-共享组.mp4
│ │ 11-Flink基础-核心概念-执行图.mp4
│ │ 12-Flink基础-提交流程.mp4
│ │ 13-Flink基础-核心编程-Source-从集合中读取数据.mp4
│ │ 14-Flink基础-核心编程-Source-从文件读取数据.mp4
│ │ 15-Flink基础-核心编程-Source-从kafka读取数据.mp4
│ │ 16-Flink基础-核心编程从-Source-自定义Source.mp4
│ │
│ ├─day03
│ │ 00-穿插-spark中数据倾斜的广播join.mp4
│ │ 01-Flink基础-内容回顾.mp4
│ │ 02-Flink基础-TransForm-Map&RichFun.mp4
│ │ 03-Flink基础-TransForm-FlatMap.mp4
│ │ 04-Flink基础-TransForm-Filter.mp4
│ │ 05-Flink基础-TransForm-keyby源码解析.mp4
│ │ 06-Flink基础-TransForm-Shuffle.mp4
│ │ 07-Flink基础-Transform-Connect.mp4
│ │ 08-Flink基础-Transform-Union.mp4
│ │ 09-Flink基础-Transform-简单滚动聚合算子.mp4
│ │ 10-Flink基础-Transform-Reduce.mp4
│ │ 11-Flink基础-Transform-Process.mp4
│ │ 12-Flink基础-Transform-重分区算子.mp4
│ │ 13-Flink基础-Sink-Kafka.mp4
│ │ 14-Flink基础-Sink-Redis.mp4
│ │
│ ├─day04
│ │ 01-Flink基础-内容回顾.mp4
│ │ 02-Flink基础-Sink-ES.mp4
│ │ 03-Flink基础-Sink-自定义Sink.mp4
│ │ 04-Flink基础-Sink-JDBC.mp4
│ │ 05-Flink基础-运行时执行模式.mp4
│ │ 06-Flink基础-核心编程实战-订单支付实时监控.mp4
│ │ 07-Flink基础-高阶编程-基于时间的滚动窗口.mp4
│ │ 08-Flink基础-高阶编程-基于时间的滑动窗口.mp4
│ │ 09-Flink基础-高阶编程-窗口源码解析一.mp4
│ │ flink课堂笔记.txt
│ │
│ ├─day05
│ │ 01-Flink基础-内容回顾.mp4
│ │ 02-Flink基础-高阶编程-窗口源码解析-基于时间滑动窗口如何判断一条数据属于哪些窗口.mp4
│ │ 03-Flink基础-高阶编程-会话窗口&源码解析.mp4
│ │ 04-Flink基础-高阶编程-基于元素个数-滚动窗口.mp4
│ │ 05-Flink基础-高阶编程-基于元素个数-滑动窗口.mp4
│ │ 06-Flink基础-高阶编程-窗口函数-增量聚合函数-ReduceFun.mp4
│ │ 07-Flink基础-高阶编程-窗口函数-增量聚合函数-AggFun.mp4
│ │ 08-Flink基础-高阶编程-窗口函数-全窗口函数-Process&Apply.mp4
│ │ 09-Flink基础-高阶编程-keyby之前开窗&之后开窗的区别.mp4
│ │ 10-Flink基础-高阶编程-时间语义&WaterMark.mp4
│ │ 11-Flink基础-高阶编程-哪种时间语义更重要.mp4
│ │ 12-Flink基础-高阶编程-Flink中的WaterMark.mp4
│ │ 13-Flink基础-高阶编程-事件时间&WaterMark的使用.mp4
│ │ 14-Flink基础-高阶编程-事件时间&WaterMark在其他窗口中的应用.mp4
│ │ 15-Flink基础-高阶编程-WaterMark源码解析-上.mp4
│ │ 16-Flink基础-高阶编程-自定义WaterMark(周期性&间歇性).mp4
│ │ flink课堂笔记.txt
│ │ 为什么基于元素个数的滑动窗口是以滑动步长来决定的,每两条计算一次.png
│ │
│ ├─day06
│ │ 01-Flink基础-内容回顾.mp4
│ │ 02-Flink基础-高阶编程-多并行度下WaterMark传递问题.mp4
│ │ 03-Flink基础-高阶编程-允许迟到的数据.mp4
│ │ 04-Flink基础-高阶编程-通过侧输出获取关窗后迟到的数据.mp4
│ │ 05-Flink基础-高阶编程-侧输出流练习.mp4
│ │ 06-Flink基础-高阶编程-基于处理时间的定时器.mp4
│ │ 07-Flink基础-高阶编程-基于事件事件的定时器.mp4
│ │ 08-Flink基础-高阶编程-定时器源码解析.mp4
│ │ 09-Flink基础-高阶编程-WaterMark源码解析-下.mp4
│ │ 10-Flink基础-高阶编程-窗口源码解析-下.mp4
│ │ 11-Flink基础-高阶编程-窗口源码-补充.mp4
│ │ 12-Flink基础-高阶编程-定时器连续-水位5s内连续上升-有Bug.mp4
│ │ 13-Flink基础-高阶编程-状态编程-什么是状态&状态的使用场景.mp4
│ │ 14-Flink基础-高阶编程-状态编程-Flink中状态分类&ManagerState分类.mp4
│ │ 15-Flink基础-高阶编程-状态编程-键控状态的介绍.mp4
│ │ 16-Flink基础-高阶编程-状态编程-键控状态-ValueState.mp4
│ │ 17-Flink基础-高阶编程-状态编程-键控状态-ListState.mp4
│ │ 18-Flink基础-高阶编程-状态编程-键控状态-ReducingState.mp4
│ │ 19-Flink基础-高阶编程-状态编程-键控状态-AggState.mp4
│ │ 20-Flink基础-高阶编程-状态编程-键控状态-MapState.mp4
│ │ 21-Flink基础-高阶编程-状态编程-键控状态-改造水位5s内连续上升案例.mp4
│ │ 22-Flink基础-高阶编程-状态编程-算子状态-广播状态的使用.mp4
│ │ 23-Flink基础-高阶编程-状态编程-状态后端.mp4
│ │ flink课堂笔记.txt
│ │
│ └─day07
│ 01-Flink基础-内容回顾.mp4
│ 02-Flink基础-高阶编程-状态的一致性&端到端的状态一致性.mp4
│ 03-Flink基础-高阶编程-CheckPoint原理-PPT角度.mp4
│ 04-Flink基础-高阶编程-CheckPoint原理-图像角度.mp4
│ 05-Flink基础-高阶编程-CheckPoint原理-文档角度.mp4
│ 06-Flink基础-高阶编程-Savepoint&CheckPoint在程序中的应用.mp4
│ 07-Flink基础-高阶编程-两阶段提交-ppt.mp4
│ 08-Flink基础-高阶编程-两阶段提交-文档.mp4
│ 09-Flink基础-高阶编程-两阶段提交补充.mp4
│ 10-Flink基础-CEP-应用场景.mp4
│ 11-Flink基础-CEP-demo.mp4
│ 12-Flink基础-CEP-循环模式.mp4
│ 13-Flink基础-CEP-条件.mp4
│ 14-Flink基础-CEP-组合模式.mp4
│ 15-Flink基础-CEP-循环模式的连续性.mp4
│ 16-Flink基础-CEP-模式的可选性.mp4
│ 17-Flink基础-CEP-模式组.mp4
│ 18-Flink基础-CEP-超时数据&跳过策略.mp4
│ 19-Flink基础-CEP-需求介绍.mp4
│
├─15_Clickhouse
│ 01-Clickhouse-特点.mp4
│ 02-Clickhouse-安装.mp4
│ 03-Clickhouse-数据类型.mp4
│ 04-Clickhouse-MergeTree&相关参数介绍.mp4
│ 05-Clickhouse-TTL.mp4
│ 06-Clickhouse-ReplacingMergeTree.mp4
│ 07-Clickhouse-SummingMergeTree.mp4
│ 08-Clickhouse-SQL操作.mp4
│ 09-Clickhouse-副本操作.mp4
│ 10-Clickhouse-分片集群.mp4
│ 大数据之实时数仓_ClickHouse_V2.0.docx
│
├─16_redis
│ 01-Redis-NoSql介绍.mp4
│ 02-Redis-Redis简介.mp4
│ 03-Redis-安装部署测试.mp4
│ 04-Redis-RedisKey相关命令.mp4
│ 05-Redis-String类型相关命令.mp4
│ 06-Redis-List类型相关命令.mp4
│ 07-Redis-Set类型相关命令.mp4
│ 08-Redis-Hash类型命令.mp4
│ 09-Redis-Zset类型命令.mp4
│ 10-Redis-Redis相关配置.mp4
│ 11-Redis-Jedis客户端链接.mp4
│ 12-Redis-通过JedisPool获取链接.mp4
│ 13-Redis-Redis持久化方式-RDB.mp4
│ 14-Redis-Redis持久化方式-AOF.mp4
│ 大数据技术之RedisV4.1.docx
│
├─17_Es
│ 01-ES-什么是搜索&用数据库做搜索的弊端.mp4
│ 02-ES-全文检索-倒排索引&lucene.mp4
│ 03-ES-什么是ES&适用场景&特点.mp4
│ 04-ES-核心概念介绍.mp4
│ 05-ES-存入数据和搜索数据机制.mp4
│ 06-ES-安装部署.mp4
│ 07-ES-Kinbana安装部署.mp4
│
├─18_hbase
│ │ 1.笔记.zip
│ │ 2.资料.zip
│ │ 3.代码.zip
│ │
│ ├─day01
│ │ 01-Hbase-Hbase定义&逻辑结构.mp4
│ │ 02-Hbase-Hbase物理存储结构&数据模型.mp4
│ │ 03-Hbase-基本架构.mp4
│ │ 04-Hbase-安装部署.mp4
│ │ 05-Hbase-Shell操作-namespace相关操作.mp4
│ │ 06-Hbase-Shell操作-DDL操作.mp4
│ │ 07-Hbase-Shell操作-DML操作.mp4
│ │ 08-Hbase-关于删除后是否能撤消删除操作的问题解答.mp4
│ │ 09-Hbase-RegionServer详细架构.mp4
│ │ 10-Hbase-写流程.mp4
│ │ 11-Hbase-memStore刷写时机.mp4
│ │ 12-Hbase-读流程.mp4
│ │ 13-Hbase-StoreFile文件合并.mp4
│ │ 14-Hbase-Region切分.mp4
│ │
│ └─day02
│ 01-Hbase-内容回顾.mp4
│ 02-Hbase-单线程使用链接.mp4
│ 03-Hbase-多线程单例使用链接.mp4
│ 04-Hbase-API-DML-Put.mp4
│ 05-Hbase-API-DML-Get.mp4
│ 06-Hbase-API-DML-Delete.mp4
│ 07-Hbase-API-DML-scan扫描数据.mp4
│ 08-Hbase-Hbase使用设计-预分区.mp4
│ 09-Hbase-HbaseRowkey设计-实现需求一.mp4
│ 10-Hbase-HbaseRowkey设计-实现需求二.mp4
│ 11-Hbase-HbaseRowkey设计-结合预分区.mp4
│ rowkey设计课堂笔记.txt
│
├─19_实时数仓
│ │ 1.笔记.zip
│ │ 2.资料.zip
│ │ 3.代码.zip
│ │
│ ├─day01
│ │ 00.flink实时数仓课程介绍.mp4
│ │ 01.数仓建模模型的回顾.mp4
│ │ 02.数仓建模事实表回顾.mp4
│ │ 03.数仓建模分层设计回顾.mp4
│ │ 04.DIM维度层设计介绍.mp4
│ │ 05.DWD明细层设计介绍.mp4
│ │ 06.DWS汇总层设计介绍.mp4
│ │ 07.ADS应用层设计介绍.mp4
│ │ 08.总结实时数仓流程图.mp4
│ │ 09.idea的环境准备.mp4
│ │ 10.采集数据生成方法的回顾.mp4
│ │ 11.DIM层开发主要任务1读取kafka数据.mp4
│ │ 12.DIM层读取kafka数据代码编写.mp4
│ │ 13.DIM层脏数据清洗原理.mp4
│ │ 14.DIM层脏数据清洗过滤代码编写.mp4
│ │ 15.DIM层脏数据写入到侧输出流代码编写.mp4
│ │ 16.DIM层脏数据写到侧输出流测试.mp4
│ │ 17.DIM层维度表来源确认.mp4
│ │ DIM层技术文档总结.docx
│ │ flink的数仓分层
│ │ 原始数据生成
│ │ 实时数仓和离线数仓对比
│ │ 数仓模型
│ │
│ ├─day02
│ │ 01.课前回顾实时数仓.mp4
│ │ 02.维度表过滤方式判断使用配置文件.mp4
│ │ 03.维度表过滤方式判断使用mysql存储.mp4
│ │ 04.修改mysql配置信息导致maxwell无法使用的bug介绍.mp4
│ │ 05.FlinkCDC使用方法介绍.mp4
│ │ 06.读取配置流作为广播流并和主流进行连接.mp4
│ │ 07.处理连接流数据的方法介绍.mp4
│ │ 08.处理配置流的代码编写.mp4
│ │ 09.Phoenix的Druid连接池介绍.mp4
│ │ 10.拼接创建phoenix表格的语句.mp4
│ │ 11.使用druid连接池进行建表语句执行.mp4
│ │ 12.异常处理判断介绍.mp4
│ │ 13.对主流数据进行处理.mp4
│ │ 14.对连接流数据处理的功能展示.mp4
│ │ DIM层技术文档总结.docx
│ │
│ ├─day03
│ │ 01.flinkCDC问题解答.mp4
│ │ 02.配置表使用的内容介绍.mp4
│ │ 03.写出数据到phoenix的需要分析.mp4
│ │ 04.拼接写入phoenix数据的sql.mp4
│ │ 05.DIM层写入维度数据到phoenix执行演示.mp4
│ │ 06.DWD层流量域用户日志预处理需求分析.mp4
│ │ 07.DWD层流量域新老访客标记修复逻辑介绍.mp4
│ │ 08.DWD层流量域日志预处理数据清洗转换.mp4
│ │ 09.DWD层流量域日志预处理新旧访客修复代码编写.mp4
│ │ 10.DWD层流量域日志预处理新旧访客修改测试.mp4
│ │ 11.DWD层流量域日志预处理拆分数据为5条流.mp4
│ │ 12.DWD层流量域日志预处理拆分5条流数据展示.mp4
│ │ 13.DWD层流量域日志预处理写出5条流到kafka主题.mp4
│ │ 14.DWD层流量域日志预处理最终效果展示.mp4
│ │ DIM层技术文档总结.docx
│ │
│ ├─day04
│ │ 01.课前回顾.mp4
│ │ 02.DWD层独立访客基础需求实现分析.mp4
│ │ 03.DWD层独立访客基础去重代码实现.mp4
│ │ 04.DWD层独立访客修改代码当天状态去重.mp4
│ │ 05.DWD层独立访客需求实现测试.mp4
│ │ 06.DWD层独立访客添加存活时间优化状态.mp4
│ │ 07.DWD层独立访客设置存活时间优化代码.mp4
│ │ 08.DWD层独立访客过滤浏览数据优化.mp4
│ │ 09.DWD跳出用户需求逻辑分析.mp4
│ │ 10.DWD跳出用户需求技术逻辑分析.mp4
│ │ 11.DWD跳出用户代码读取过滤数据.mp4
│ │ 12.DWD跳出用户CEP匹配代码编写.mp4
│ │ 13.DWD跳出用户CEP用法的补充说明.mp4
│ │ 14.DWD跳出用户CEP数据测试.mp4
│ │
│ ├─day05
│ │ 01.实时数仓在业务处理遇到的问题.mp4
│ │ 02.flink的join计算介绍.mp4
│ │ 03.flink的intervalJoin代码编写.mp4
│ │ 04.flink的intervalJoin代码测试.mp4
│ │ 05.flink的intervalJoin的水位线总结.mp4
│ │ 06.flink的join对应.mp4
│ │ 07.flinkleft join演示和lookupjoin介绍.mp4
│ │ 08.lookUp join的代码编写介绍.mp4
│ │ 09.kafkaDDL读取kafka数据为表格.mp4
│ │ 10.DWD层加购事实表需求分析.mp4
│ │ 11.DWD层加购事实表过滤出加购数据.mp4
│ │ 12.DWD层加购事实表lookUp join代码编写和测试.mp4
│ │ 13.DWD层加购事实表缓存码表优化.mp4
│ │ 14.DWD层码表作为常量的使用方法.mp4
│ │ 15.DWD层加购事实表写入到kafka中.mp4
│ │
│ ├─day06
│ │ 01.DWD层订单相关时间逻辑介绍.mp4
│ │ 02.DWD层订单相关sql的TTL介绍.mp4
│ │ 03.DWD层订单预处理需求分析.mp4
│ │ 04.DWD层订单预处理过滤4张需要的业务表.mp4
│ │ 05.DWD层订单预处理join5张表格代码编写.mp4
│ │ 06.DWD层kafka写入撤回流的方法介绍.mp4
│ │ 07.DWD层订单预处理写出到kafka测试.mp4
│ │ 08.DWD层下订单事实表需求分析.mp4
│ │ 09.DWD层下单事实表代码编写和测试.mp4
│ │ 10.DWD层取消订单事实表代码编写和测试.mp4
│ │ 11.DWD层支付成功事实表代码编写和演示.mp4
│ │
│ ├─day07
│ │ 01.课前解决问题.mp4
│ │ 02.DWD层退单事实表介绍.mp4
│ │ 03.DWD层退款成功事实表介绍.mp4
│ │ 04.DWD层优惠券领用和使用事实表.mp4
│ │ 05.DWD层后续练习需求操作.mp4
│ │ 06.DWD层简单需求编写的方式介绍.mp4
│ │ 07.DWS层整体需求介绍.mp4
│ │ 08.DWS层关键词统计需求拆词方法介绍.mp4
│ │ 09.DWS层关键词统计过滤出关键词数据.mp4
│ │ 10.DWS层关键词拆分统计自定义UDTF函数.mp4
│ │ 11.DWS层关键词拆分统计常用的时间字符串时间戳转换函数介绍.mp4
│ │ 12.DWS层关键词拆分统计添加时间戳sql写法.mp4
│ │ 13.DWS层关键词开窗聚合统计计算.mp4
│ │ 14.DWS层关键词分词统计clickHouse选择使用介绍.mp4
│ │ 15.DWS层关键词分词统计写入到clickHouse中.mp4
│ │ DWD层技术文档.docx
│ │
│ ├─day08
│ │ 01.DWS层关键字需求使用泛型加反射实现统一clickHouse写出.mp4
│ │ 02.DWS层关键字需要使用反射实现统一写出测试.mp4
│ │ 03.DWS层关键字需求过滤掉bean中的部分字段.mp4
│ │ 04.DWS层访客类别页面浏览汇总需求分析.mp4
│ │ 05.DWS层访客类型浏览需求步骤介绍.mp4
│ │ 06.DWS层访客统计需求数据流的转换和连接.mp4
│ │ 07.DWS层访客统计需求开窗聚合编写.mp4
│ │ 08.DWS层页面浏览信息汇总超时时间影响介绍.mp4
│ │ 09.DWS层首页详情页统计次数过滤和转换代码编写.mp4
│ │ 10.DWS层首页详情页统计次数聚合写出到clickHouse.mp4
│ │ 11.DWS层首页和详情页统计次数状态存活时间优化.mp4
│ │ 12.DWS层跳出数据超时统计演示.mp4
│ │ DWS层技术文档.docx
│ │
│ ├─day09
│ │ 01.DWS层用户登录需求分析.mp4
│ │ 02.DWS层用户登录需求过滤转换代码编写.mp4
│ │ 03.DWS层用户登录聚合窗口写出代码.mp4
│ │ 04.DWS层用户登录代码测试.mp4
│ │ 05.DWS层用户注册统计代码编写.mp4
│ │ 06.DWS层用户注册统计测试.mp4
│ │ 07.DWS层加购汇总转换过滤代码编写.mp4
│ │ 08.DWS层加购汇总聚合代码以及测试.mp4
│ │ 09.DWS层支付汇总转换过滤代码编写.mp4
│ │ 10.DWS层支付汇总聚合写出代码和测试.mp4
│ │ 11.DWS层下单汇总代码编写和测试.mp4
│ │ DWS层技术文档.docx
│ │
│ ├─day10
│ │ 01.测试数据发送kafka的问题介绍.mp4
│ │ 02.DWS层sku粒度下单汇总表需求介绍.mp4
│ │ 03.DWS层sku粒度下单汇总leftJoin造成重复数据问题介绍.mp4
│ │ 04.DWS层sku粒度下单汇总代码结构介绍.mp4
│ │ 05.DWS层sku粒度下单汇总数据重复解决方案.mp4
│ │ 06.DWS层sku粒度下单汇总使用状态去重代码编写.mp4
│ │ 07.DWS层SKU粒度开窗聚合累加代码编写.mp4
│ │ 08.DWS层SKU粒度添加泛型查询维度数据.mp4
│ │ 09.DWS层SKU粒度汇总需求使用泛型反射方式读取维度表数据.mp4
│ │ 10.DWS层SKU粒度汇总读取维度表的sql方法介绍.mp4
│ │ DWS层技术文档.docx
│ │
│ ├─day11
│ │ 01.DWS层sku汇总需要代码回顾.mp4
│ │ 02.DWS层sku汇总需求维度关联结构介绍和效率问题.mp4
│ │ 03.DWS层旁路缓存优化使用redis.mp4
│ │ 04.DWS层旁路缓存优化redis结构介绍.mp4
│ │ 05.DWS层旁路缓存优化redis的性能提示展示.mp4
│ │ 06.DWS层SKU粒度汇总使用redis旁路缓存优化业务代码.mp4
│ │ 07.DWS层SKU粒度汇总使用redis旁路缓存删除缓存的操作.mp4
│ │ 08.DWS层SKU粒度汇总异步IO介绍.mp4
│ │ 09.DWS层SKU粒度汇总异步IO实现逻辑介绍.mp4
│ │ DWS层技术文档.docx
│ │
│ ├─day12
│ │ 01.DWS层SKU粒度异步ID逻辑回顾.mp4
│ │ 02.DWS层SKU粒度异步IO使用模板方法.mp4
│ │ 03.DWS层SKU粒度异步IO添加线程池.mp4
│ │ 04.DWS层SKU粒度异步IO数据测试.mp4
│ │ 05.DWS层SKU粒度关联多个维度表演示.mp4
│ │ 06.DWS层SKU粒度汇总最终演示.mp4
│ │
│ └─day13
│ 01.DWS层省份粒度聚合需求分析.mp4
│ 02.DWS层省份粒度聚合代码编写.mp4
│ 03.DWS层省份粒度汇总演示.mp4
│ 04.DWS层品牌品类用户粒度退单需求分析.mp4
│ 05.DWS层退单业务代码流程.mp4
│ 06.DWS层退单业务关联sku聚合代码编写.mp4
│ 07.DWS层退单业务最终写出代码和演示.mp4
│ DWS层技术文档.docx
│
├─20_在线教育实时项目实战
│ 5个节点电商数仓(1用户行为采集平台).docx
│ 5台节点电商数仓(2业务数据采集平台).docx
│ 5台节点电商数仓(3电商数据仓库系统).docx
│ edu_online_realtime-master.zip
│ sz0309-edu-realtime-master.rar
│ sz0309-edu-realtime-master.zip
│ 在线教育实时数仓任务书.docx
│ 在线教育日志及原始表结构说明文档.docx
│ 在线教育离线数仓任务书.docx
│ 大数据设计方案V1.0.docx
│ 大数据之数仓流程规范.docx
│ 数据生成器data_mocker.rar
│ 时间安排规划图.jpg
│ 阿里云服务器购买.mp4
│
├─21_大数据复习之面试题
│ │ 01_笔记.zip
│ │ 02_资料.zip
│ │
│ └─03_视频
│ ├─day01
│ │ 01-面试题总结-Linux.avi
│ │ 02-面试题总结-Hadoop(入门).avi
│ │ 03-面试题总结-Hadoop(HDFS).avi
│ │ 04-面试题总结-Hadoop(MR).avi
│ │ 05-面试题总结-Hadoop(Yarn工作机制).avi
│ │ 06-面试题总结-Hadoop(Yarn调度器).avi
│ │ 07-面试题总结-Hadoop(生成调优 1-4).avi
│ │ 08-面试题总结-Hadoop(生成调优 5).avi
│ │ 09-面试题总结-Hadoop(生成调优 6).avi
│ │ 10-面试题总结-Hadoop(生成调优 7-10).avi
│ │
│ ├─day02
│ │ 01-面试题总结-Zookeeper.avi
│ │ 02-面试题总结-Flume(基本组成).avi
│ │ 03-面试题总结-Flume(tailDirSource问题说明).avi
│ │ 04-面试题总结-Flume(tailDirSource问题解决).avi
│ │ 05-面试题总结-Flume(拦截器).avi
│ │ 06-面试题总结-Flume(Channel选择器).avi
│ │ 07-面试题总结-Flume(Sink处理器).avi
│ │ 08-面试题总结-Flume(监控器).avi
│ │ 09-面试题总结-Flume(优化).avi
│ │ 10-面试题总结-Kafka(生产者).avi
│ │ 11-面试题总结-Kafka(集群).avi
│ │ 12-面试题总结-Kafka(消费者).avi
│ │ 13-面试题总结-Kafka(其他基本信息).avi
│ │ 14-面试题总结-Kafka(丢数据&重复数据).avi
│ │ 15-面试题总结-Kafka(数据积压).avi
│ │ 16-面试题总结-Kafka(优化&其他).avi
│ │
│ ├─day03
│ │ 01-面试题总结-Hive(组成&翻译为MR的流程).avi
│ │ 02-面试题总结-Hive(与MySQL对比&内外部表&4个By).avi
│ │ 03-面试题总结-Hive(函数).avi
│ │ 04-面试题总结-Hive(优化).avi
│ │ 05-面试题总结-Hive(数据倾斜 问题发现).avi
│ │ 06-面试题总结-Hive(数据倾斜 单表查询).avi
│ │ 07-面试题总结-Hive(数据倾斜 多表查询).avi
│ │ 08-面试题总结-Hive(数据倾斜 场景描述).avi
│ │
│ ├─day04
│ │ 01-面试题总结-HBase-架构.avi
│ │ 02-面试题总结-HBase-数据流程(写).avi
│ │ 03-面试题总结-HBase-数据流程(读).avi
│ │ 04-面试题总结-HBase-数据流程(刷写、合并、切分).avi
│ │ 05-面试题总结-HBase-数据流程(补充).avi
│ │ 06-面试题总结-HBase-RowKey设计(原则&预分区).avi
│ │ 07-面试题总结-HBase-RowKey设计(分区号&拼接字段&校验).avi
│ │ 08-面试题总结-HBase-RowKey设计(项目中的RowKey).avi
│ │ 09-面试题总结-HBase-二级索引.avi
│ │
│ ├─day05_HiveOnSpark优化
│ │ 01_hive on spark 课程介绍.mp4
│ │ 02_yarn 资源调整.mp4
│ │ 03_spark的CPU和内存的配置.mp4
│ │ 04_spark的个数配置.mp4
│ │ 05_spark配置实操.mp4
│ │ 06_介绍hql执行计划.mp4
│ │ 08_join优化之mapjoin.mp4
│ │ 09_join优化之skew join.mp4
│ │ 10_上午回顾.mp4
│ │ 11_hive on spark 的map&reduce端并行度的设置.mp4
│ │ 12_reduce端并行度的调整参数.mp4
│ │ 大数据项目之电商数仓(Hive on Spark调优)V5.0.docx
│ │
│ └─day06
│ 01-面试题总结-Spark(入门).avi
│ 02-面试题总结-SparkCore(五大属性).avi
│ 03-面试题总结-SparkCore(算子).avi
│ 04-面试题总结-SparkCore(算子 扩展面试题).avi
│ 05-面试题总结-SparkCore(分区器、序列化器、持久化、依赖关系).avi
│ 06-面试题总结-SparkCore(任务切分).avi
│ 07-面试题总结-SparkCore(共享变量).avi
│ 08-面试题总结-SparkSQL.avi
│ 09-面试题总结-SparkStreaming.avi
│ 10-面试题总结-Spark内核.avi
│
└─22.用户画像
│ 代码.zip
│ 画像物料.zip
│ 课件.zip
│
└─视频
├─1
│ 1、画像简介.wmv
│ 2、标签分级和分类.wmv
│ 3、画像结构.wmv
│ 4、系统演示.wmv
│ 5、教学目标.wmv
│ 6、搭建画像平台.wmv
│ 7、填写标签定义.wmv
│ 8、字段说明.wmv
│ 9、任务定义.wmv
│ 10、SQL通用任务说明.wmv
│ 11、任务调度流程.wmv
│ 12、工程模块结构.wmv
│ 13、任务分析.wmv
│ 14、定义查询.wmv
│ 15、定义查询2.wmv
│
│
├─2
│ 1、动态建表.wmv
│ 2、插入数据代码.wmv
│ 3、本地调试.wmv
│ 4、发布运行.wmv
│ 5、宽表思路.wmv
│ 6、宽表步骤.wmv
│ 7、代码开发_创建表.wmv
│ 8、行转列pivot.wmv
│ 9、代码开发select.wmv
│ 10、完成宽表的调试.wmv
│
├─3
│ 1、clickhouse简介.wmv
│ 2、clickhouse写操作特点.wmv
│ 3、clickhouse读操作特点.wmv
│ 4、clickhouse其他特点.wmv
│ 5、mysql驱动问题.wmv
│ 6、clickhouse的搭建.wmv
│ 7、clickhouse的数据类型.wmv
│ 8、两个小问题.wmv
│ 9、mergeTree的建表.wmv
│ 10、mergeTree的索引颗粒度.wmv
│ 11、mergeTree的跳数索引.wmv
│ 12、mergeTree的失效.wmv
│ 13、replacingMergeTree.wmv
│ 14、summingMergeTree.wmv
│ 15、SQL操作.wmv
│ 16、高可用.wmv
│ 17、分布式的原理.wmv
│ 18、分布式的搭建.wmv
│
├─4
│ 1、任务三思路.wmv
│ 2、任务三搭建.wmv
│ 3、任务三完成.wmv
│ 4、bitmap介绍.wmv
│ 5、用bitmap计算分群.wmv
│ 6、防火墙的问题.wmv
│ 7、bitmap转储sql.wmv
│
├─5
│ 1、bitmap的查询操作.wmv
│ 2、步骤、创建表.wmv
│ 3、转储bitmap代码完成.wmv
│ 4、发布流程任务.wmv
│ 5、分群需求.wmv
│ 6、web开发基本结构.wmv
│ 7、springboot介绍.wmv
│ 8、springboot启动.wmv
│ 9、分层.wmv
│ 10、接收参数.wmv
│ 11、service层装配.wmv
│
├─6
│ 1、web开发回顾.wmv
│ 2、mybatis开发.wmv
│ 3、mybatis-plus的使用.wmv
│ 4、mybatis-plus代码生成器的使用.wmv
│ 5、多数据源.wmv
│ 6、使用总结.wmv
│ 7、生成分群思路.wmv
│ 8、保存分群的基本信息.wmv
│ 9、拼接查询SQL.wmv
│ 10、拼接查询SQL完成.wmv
│
├─7
│ 1、写入人群包思路.wmv
│ 2、人群包建表 .wmv
│ 3、写入人群包.wmv
│ 4、nosql数据库.wmv
│ 5、redis场景和介绍.wmv
│ 6、redis安装和启动.wmv
│ 7、redis的IO多路复用.wmv
│ 8、redis的IO多路复用2.wmv
│ 9、redis的通用操作.wmv
│ 10、redis的string.wmv
│ 11、redis的list.wmv
│ 12、redis的set.wmv
│ 13、redis的hash.wmv
│ 14.zset.wmv
│ 15.redis相关配置.wmv
│
├─8
│ │ 1、jedis.wmv
│ │ 2、jedis连接池.wmv
│ │ 3、人群包写入redis 思路.wmv
│ │ 4、人群包写入redis 代码.wmv
│ │
│ └─挖掘标签部分
│ 1、挖掘标签简介.wmv
│ 2、模型建立流程.wmv
│ 3、决策树.wmv
│ 4、sparkml流程.wmv
│ 5、数据准备.wmv
│ 6、三个助理.wmv
│ 7、分类器和流水线.wmv
│ 8、训练与预测.wmv
│ 9、查询数据.wmv
│ 10、执行训练和预测.wmv
│ 11、作业.wmv
│
├─9
│ 1、预测结果转换.wmv
│ 2、准确率、精确率、召回率.wmv
│ 3、准确率、精确率、召回率代码.wmv
│ 4、超参数.wmv
│ 5、预测思路.wmv
│ 6、特征提取 SQL1.wmv
│ 7、特征提取 SQL2.wmv
│ 8、完成训练阶段代码.wmv
│ 9、观察模型.wmv
│ 10、存储模型.wmv
│ 11、预测阶段代码.wmv
│
└─10
1、开始.wmv
2、完成预测性别代码.wmv
3、完成测试.wmv
4、预估人数.wmv
5、更新操作.wmv
6、打包部署.wmv
7、总结画像1.wmv
8、总结画像ck.wmv
9、总结画像redis.wmv
10、总结画像web.wmv
11、总结画像机器学习.wmv