夏季是阳光最为灿烂的季节,走在林间的小道上,看着地上斑驳的树影,闭上双眼感受清风拂面,用力呼吸着每一口自由的气息,也许只有在996福报之外,才能体会得到这种感觉吧,但这或许就是人生吧。
哈哈瞎扯了一堆有的没的,下面开始进入正题,现在随着5G时代的到来,信息传输速率大幅提高,对个人来说只不过打开网页快了点,玩游戏延迟低了点,看视频完全不担心卡顿的问题,前提是办理更贵的5G套餐:smile:。但是对于企业来说这个提升,可以带来更高的生产力,带来更高的收益,
但信息传输速率提高,说明单位时间内获得的数据量比以往更多,说明单位时间内系统要承担更大的处理压力,如果没有好的大数据处理框架【框架就是解决方案】,那么信息只能是信息,而不是能带来收益的数据。
现在有很多开发人员都在往大数据领域靠拢,大数据领域也确实是未来IT方向的一个热点或者说是风口。在招聘软件上,大数据岗位现在平均薪资约为25K左右,相比开发岗位大约高了百分之40左右,如果是中高阶的大数据架构师甚至可以达到百万薪资。但这诱人的薪资对于同学来说还有距离,但只要我们知道了这个距离具体是指哪些技能,然后努力去补齐这些技能,我相信大家也都能达到自己想要的目标。【愿与诸君共勉】
大家如果有什么问题,包括学习问题,大数据职业规划,简历书写和项目包装等问题都加我【微信focusbigdata】,或者到【公众号FocusBigData】后台留言给我,看到后都会给大家详细回答的。
-
- Job提交流程
- MapTask运行
- ReduceTask运行
- 切片流程
- Shuffle流程
【源码是做成思维导图的方式,放在公众号里面,恢复hadoop思维导图
即可获得,思维导图部分展示如下】
最近利用工作之余给给大家先更新了Hadoop、Spark、Flink三个大数据中最主要的框架,后面还陆续给大家跟新如下内容:【公众号第一时间发布文章,后面在同步到各个平台】
- Hive数据仓库
- Zookeeper分布式协调框架
- HBase列式存储分布式数据库
- Elasticsearch开源搜索引擎
- Kafka消息队列
- Flume数据传输框架
- Sqoop数据传输框架
- Azkaban调度框架
- Kylin分析型数据仓库
- Impala实时查询分析引擎
- Hue大数据web管理器
- Kudu列式存储分布式数据库
- Kettle开源的ETL工具
- DataX阿里开源ETL工具
- ClickHouse开源列式数据库
- Ambari大数据平台搭建利器
- Ranger大数据权限管理利器
- Airflow调度和监控工作流的平台
- Griffin数据质量监控工具
- Tableau大数据分析工具
- Pulsar大数据分析工具
- Atlas元数据治理工具
- Filebeat数据采集工具
- Saiku数据分析工具
- Superset大数据可视化的利器
- Sentry大数据权限管理框架
- Zabbix集群监控工具
- Zepplin数据交互可视化工具
【待更新】
- 数据仓库概念
- 数据仓库建模
- 数仓分层
- 数据集市和数据中台和数据仓库区别
- 数据治理是什么
- 项目技术选型
- 系统数据流程设计
- 服务器选型
- 集群资源规划
- 数据埋点设计
- 数据采集设计
- 电商业务术语和流程
- 数据同步策略
- 漏斗分析
- 数据监控查询和可视化
可以关注公众号(FocusBigData)
回复
大数据简历
即可获得简历模板回复
大数据面经
即可获得面经回复
大数据面试经历
即可获得面经经历
可以关注公众号(FocusBigData)
回复
大数据学习路线图
即可获得学习路线图回复
大数据书单
即可获得相关书籍回复
数据仓库书单
即可获得相关书籍回复
内功书单
即可获得相关书籍
文章也会同步到公众号中,福利也都放在公众号上面,回复对应关键词即可领取。在公众号后台也可以给我留言,或者直接加我私聊都行【图片加载不出来可以搜索:FocusBigData】
说起来在工作中已经有一段时间没有使用大数据了,被我们总监拉去做人工智能【:cry:】,主要做图像识别和目标物体检测,然后装在tx2小车上跑,太多算法真的看的头都大了,而且关键之前我还没做过,只能硬着头皮学了机器学习和深度学习算法【所以大家想入门AI也可以找我,不过深入就不行了】,过程痛并快乐着,最后也能出了个模型【其实就是调参炼丹,懂的都懂】。未来我想做的技术还是大数据方向的,尤其是流式计算,后面我在星球中会有很大篇幅来讲流式计算,创作不易,希望大家支持一下,愿与诸君共勉。【可加我咨询,记得备注git】【图片加载不出来可以搜索:focusbigdata】