| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 大数据 -> 大数据开发写sql写烦了,要不要转? -> 正文阅读 |
|
[大数据]大数据开发写sql写烦了,要不要转? |
如果说大数据是每天写sql还不太精准(精准的是用各种方式写SQL) **当你不创造东西时,你只会根据自己的感觉而不是能力去看待问题。**会不会转别的,看个人兴趣,大数据方向还有那么多。 瞅瞅方向:如数据分析师、大数据开发工程师、大数据分析师、数据开发工程师、大数据架构师、大数据运维工程师、ELT工程师、数据仓库工程师、大数据BI工程师等。 丰富自己的能力,到处都机会。 现如今,正式为了应对大数据的这几个特点,开源的大数据框架越来越多,越来越强,先列举一些常见的: 文件存储:Hadoop HDFS、Tachyon、KFS 眼花缭乱的上面就有30多种吧,别说精通了,全部都会使用的,估计也没几个。 就我个人而言,主要经验是在第1个方向(开发/设计/架构) 入职了大半年后,经常加班,虽然累但学起来很快,不久就把大数据的相关组件,hadoop,hive,oozie ,shell,sparksql,spark ,sqoop,kylin,等等都学到了,还学会了用python处理数据,shell如何做工具脚本,怎样搭大数据平台,大数据仓库,都有所学习到,自己周末也是拼命的学习,因为在北京,你不努力,随时可能被淘汰。耐下心来慢慢学 关于数仓开发 数仓开发其实主要就是基于数仓模型对数据进行分层建模工作,整合加工数据完成OLAP,数仓分为实时数仓和离线数仓两种。如果公司只有离线数仓,那么其实主要的工作内容用sql就可以完成了,可以用hive ql 或者是 spark sql 完成,当然也不排除需要应用到spark 算子去完成相关计算的逻辑,而且一些复杂的逻辑需要通过实现自定义函数来完成,这就要求不但要会写sql,而且还能有一定的代码功底。如果公司对数据的实时性要求比较高,那么还会有实时数仓的业务,实时部分当前比较流行的是flink去做,当然也有spark streaming去做的,这就要求对代码有比较深厚的掌握了。因为数据往往不是存在hive中的,而是hbase、clickhouse等这种实时性较强的内存数据库中,不但实时计算框架的各种api需要熟练掌握,对数据库的底层和调用也要掌握,而且实时数据一般来自消息队列如kafka,所以也需要对消息队列比较熟悉。 下面的也一定收藏起来有一天你一定会回来谢谢我的。 大数据-分布式数据存储
大数据-框架
大数据-生态圈工具
大数据项目
电信号:
先自我介绍一下,小编13年上师交大毕业,曾经在小公司待过,去过华为OPPO等大厂,18年进入阿里,直到现在。深知大多数初中级java工程师,想要升技能,往往是需要自己摸索成长或是报班学习,但对于培训机构动则近万元的学费,着实压力不小。自己不成体系的自学效率很低又漫长,而且容易碰到天花板技术停止不前。因此我收集了一份《java开发全套学习资料》送给大家,初衷也很简单,就是希望帮助到想自学又不知道该从何学起的朋友,同时减轻大家的负担。添加下方名片,即可获取全套学习资料哦 |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/23 13:26:13- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |