IT行业的高薪让无数人蜂拥而至,不论是成为码农,网站设计师,只要能与计算机科学搭上边。这两年,热度逐渐减退。尽管薪资依然高于其他行业的平均水平,但已经开始有人提出这样的疑惑,当有一天人人都会写代码,软件工程师该去做什么?

同样的事情也正在发生在数据科学行业。

 

 

这是Google Trends上Computer Science(蓝)与Data Science(红)的搜索热度比较。

人才市场上的供不应求自然造成了数据科学家的高薪。那我们来分析一下“供”与“求”。

 

 

首先来看几个大公司的例子。

Google

说是Google定义了数据科学并不过分。他们所做的一切都是从搜索引擎的数据驱动决策,例如最大化YouTube广告收入。甚至他们的人力资源团队也在使用科学的方法,让员工们在工作中更开心,更高效。Google“员工天堂”这一称号也绝非虚名。

 

 

Amazon

每个你得到的产品推荐都来源于Amazon的复杂数据科学算法。事实上,亚马逊已经实现了一个算法,可以预测你是否要购买某种产品。如果这个概率足够高,他们就把该产品运输到离你最近的仓库。当你购买它的时候,你就能够在一天内收到商品。

 

 

Facebook

Facebook正在疯狂地靠广告获益,因为它拥有所有用户的个人数据。他们知道你在做什么运动,喜欢什么食物,愿意在网上花多少钱。他们可以全方位地精准定位用户,这也是为什么很多公司都喜欢将它作为广告平台。

 

 

不仅大公司有数据科学部门,小企业更需要数据科学来满足他们的需求,几行代码就能执行非常复杂的分析,并从中获得巨大收益。

如果你的竞争对手依靠数据驱动的决策,而你不是,他们将超越你,夺取你的市场份额。因此,小公司也必须开始使用数据科学工具和技术。

 

 

数据科学是由技术变革驱动的,20年前(计算机速度慢,计算能力低,原始的编程语言)它是不可能存在的。

但是,传统教育还没有准备好,所以目前大学里仍然很少有项目能够培养出有非常出色的数据科学家。目前进入数据科学领域的人,主要都是从从其他领域转型,通过自我学习获得必要的技能(包括书籍,研究论文和在线课程等)。也就是说,现在还没有足够的人才能够利用好这个行业的机会,进入这个领域。

 

 

结论

 

无论是从公司的角度还是从员工的角度来看,数据科学家的需求都在不断上升,预计会像CS领域那样 —— 需求长期以来会比供应增长得更快。这使得数据科学成为一个重要领域。

数据科学家会火。但还能火多久?同样的,如果当有一天人人都学会与数据打交道,数据科学家去做什么?

世界正在转变,数据在我们生活的各个方面都变得尤为重要。 5年前,你永远不会想到要拿出手机来打车。而今天,你可能会比较Lyft和Uber的等待时间。

经验丰富的数据科学家将永远存在且解决最复杂的问题,最好的程序员也永远在开发出最好的产品。就像机器学习永远不会让最出色的程序员变得不再重要。Google实现了人工智能和机器学习行业中一些最好的应用,而他们雇用了30,000多个开发人员。

你要担心的不该是这个行业会火多久,而是你自己会火多久。人才市场只要供不应求就会一直火下去。无疑,这是入行数据科学最好的时代。而你要做的是保持不可替代的核心竞争力,不断学习,并学得比别人快。

 

 

入门学习路径推荐

 

我感恩自己处在这个最好的时代。如果你也想要进入这个领域,我想向你推荐入门数据科学最短学习途径:

1. 判断自己是否真的喜欢数据科学行业,是否准备好一头扎进这个行业。

例如:

  • 什么是数据科学家?
  • 数据科学家的市场需求
  • 数据科学行业及职位
  • 不同行业中数据科学职位,工作技能,待遇,发展前景等的异同
  • 数据科学行业所要求的学历,专业,工作经验等

 

 

2. 选择一门或两门语言 –  R或者Python。

以R为例,首先理解R语言的基础知识 – 工作目录, 库, 数据类型, 读取数据等。然后从数据加工,到分析,熟练运用常用包例如dplyr, tidyr, stringr, reshape2,  再使用ggplot2,rbokeh等进行数据可视化。

 

3. 开始机器学习入门,但在这之前,要打好统计知识基础。

 

 

4. 真正开始机器学习:学习用最常用的机器学习(监督/无监督)技术或者算法建模。

  • Linear Regression
  • Logistic Regression
  • Decision Trees
  • KNN (K- Nearest Neighbors)
  • K-Means Clustering
  • Market Basket Analysis (Associative Rule Mining)
  • Naïve Bayes

 

5. 如果你已经成功地做到了这一点,你已经成功地成为了一名入门级数据科学家,你可以继续学习高级机器学习,深入深度学习(人工神经网络,卷积神经网络等)。

 

6. 虽然这都是关于学习的,但是当学习与实践 – 实施 – 反馈周期紧密结合时,学习效果会更好。因此实践颇为重要。列举几个例子:

  • 广告搜索
    • 搜索引擎
    • 搜索广告内部原理
  • 深度学习
    • 大规模深度学习的应用
    • 深度学习与无人车/机器人
    • Google在机器学习的探索
    • 图像问答
  • 推荐系统:AppStore
  • 大数据:Airbnb大数据预测

 

7. 至此,你可以开始真正寻找成为数据科学家的机会,准备求职与面试。

面试常考:

  • Resume 内容
  • Behavioral question
  • Probability
  • Basic statistics
  • Machine learning
  • Case interview
  • Coding – sql, R, SAS & python, hard coding, mapreduce
  • Product question
  • Questions for interviewer

 

 

求职准备需要了解:

  • 一般流程
  • 简历投递技巧
  • 每轮面试的注意事项
  • networking
  • 如何准备申请文书
  • 如何分析Job description
  • 如何从简历出发准备面试
  • 如何做好面试的细节准备
  • 实习的重要性
  • 面试心态调整及offer选择

 

我们看到有很多BitTiger的朋友们也纷纷想要开始学习数据科学,为大家准备了以上资源,全部免费开放点击此处进入数据科学入门免费课程。