你好,这里是百利留学声,每天为你带来知识大餐。
昨天的节目里,我为你分享了《数据白皮书》里关于数据人才的专业背景、行业分布和技能要求,相信同学们对于数据行业的人才需求和数据人才的发展前景有了一些认识。研究表明预计到2025年全国大数据核心人才缺口将达到230万人。就业前景广阔,很值得同学们投身其中。
今天我们就来说说数据领域里三个最核心的岗位,更加直观地认识一下数据人才。这三个岗位分别是数据分析师、数据科学家和数据工程师。
数据分析师是做什么的?
简单来说,数据分析师是为产品服务的,通过统计、报表维护、数据监测,运用数据分析为产品运营提供有效的建议。具体来说,数据分析师要负责了解客户画像、分析用户行为、分析广告渠道、出具可视化仪表盘,并将重要指标和分析结果形成周报和月报,以便产品决策方调整运营决策。对于数据分析师的要求,除了会用Excel、SQL、Python等获取并清洗整理数据,还需要掌握可视化软件,比如Tableau,PowerBI等。除了这些专业能力,数据分析师对业务要有所了解,并且具有行业洞察能力,可以敏锐地捕捉到关键数据并做分析,所以产品思维对于数据分析师非常重要。
和数据分析师有点类似的另外一个岗位,叫数据科学家。
数据科学家,光听名字就很高大上,这个岗位主要应用先进的统计建模、数据挖掘、机器学习方法建立数据模型解决实际问题,并研发创新的方法以解决常规的算法不能解决的问题。所以说,这类职位的工作内容以高级建模为主,针对复杂的问题来设计技术方案,比如Uber叫车的ETA、各种定价系统、Amazon物流管理, Linkedin的社交网络等。这些例子听上去就不是简单的SQL能解决的,也不是会写代码就能做出来的,需要比较深的领域知识,特别是机器学习算法。
据统计,数据科学家一般都具有高学历,88%的数据科学家至少是硕士学位,46%的数据科学家是博士学位。
无论是数据分析师或数据科学家,都会用到SQL或者Python将数据库里面的数据表提取出来做分析,那么这些在数据库里面的数据表又是谁创建的呢?那就是数据工程师。
数据工程师的主要职责就是经营、维护数据仓库。将所需的数据从不同来源不同格式的数据源中提取出来,转换类型以方便使用,然后归档入数据仓库。在“大数据”时代,面对动辄每天几百G的数据规模,越来越多的数据工程师需要掌握新的技能,比如利用云计算平台的分布式系统来完成对数据的传输和储存。数据工程师需要熟练掌握Spark、Hadoop、Kafka、Hive等大数据技术。
最后,我们来简单讲讲这三个岗位之间的关系。
如果说数据分析师和数据科学家是为业务负责,那么数据工程师就是服务于数据分析师和数据科学家的。从数据的处理流程上看,先有数据工程师的数据注入、处理、存储和存取,然后有数据科学家的数据存取、准备和建模,再有数据分析师的建模和分析。从技能要求上看,数据工程师至少要懂分布式计算系统,数据科学家要懂机器学习,数据分析师要懂数据分析和可视化工具。在这三个岗位中,数据分析师和数据工程师的招聘需求量更大。从薪酬上看,数据科学家的就业要求最高,当然薪酬也最高。
好的,以上就是本期留学声的全部内容,感谢你的聆听,我们明天见。