什么是Business Analytics?

 

运用统计,数据管理和商业模型,帮助领导做数据驱动的决策。BA在很多行业都有应用。比如零售业、航空、建筑等。

 

Business Analyst和Data Analyst、Data Scientist的区别?

 

这三者之间没有非常明显的界限,Warlmart的DS只招做Operation Research和做统计的Phd,主要是研究在网站上怎么给用户推荐合适的商品,因为这个推荐系统对业务影响十分重要,他们更加倾向于招Phd。而Facebook的DS是挂在Analytics下的,要求相对来说没有那么高,它实质上更像一个DA的角色,我们这里提到的BA、DA和DS,更多的是根据Job Description来区分的,而不是职位的Title。所以大家不要被职位的Title所迷惑,要去仔细看职位的Job Description和技能要求,从而判定该职位到底是严格意义上的BA、DA还是DS。

 

Business Analyst的职责

 

 

Business Analyst的职责可以分为几大部分:

描述性分析(Descriptive Analytics):研究在商业运营过程中已经发生的事。公司在运营过程中会产生很多数据,但是这些数据散落在不同的系统,并且高层看不见这些数据,BA要把这些数据进行整合加工,然后用数据告诉高层公司现在的Business Performance是怎样的

 

诊断性分析(Diagnostic Analytics):下一步是诊断性分析,研究第一步中的这些事为什么会发生。在上一步的基础上叠加了更多的内容,产生的Insights更丰富。描述性分析和诊断性分析是BA最主要涉及的两大领域

 

预测性分析(Predictive Analytics):建立模型预测之后会发生什么。比如,根据现在的情况,预测公司下一年的Business Performance;告知领导我们能不能在指定期限完成给定的目标,或者按照目前的趋势,我们之后的销售情况会是怎样。这一部分工作更多的是Data Analytics的Title的人去做的。BA工作的范围可以很大也可以只注重于一个小范围,具体会根据公司的不同而有所不同。

 

规范性分析(Prescriptive Analytics):研究我们怎样能让我们希望的事发生。这一工作内容已经超出了BA和DA的范围,更可能是DS要去做的。如果大家想要做一名BA,注重于前三个方面的学习 ,基本能满足面试和实际工作的大部分内容

 

Business Analyst如何完成一个项目?

 

 

  • 首先BA会得到一个任务,这个任务一般是一个比较宽泛的主题。
  • 根据这个主题,定义你要解决的商业问题是什么,然后建立假设,采用某种方法,明确你到底要收集怎样的数据,以及从哪里得到这些数据。
  • 拿到数据之后做数据的validation。理解数据的结构,并且用SQL做数据清理。
  • 然后做数据可视化,可以建立dashboard等,将数据结果以可视化的方式呈现给领导。
  • 呈现完结果之后,可能会收到一些反馈或者质疑,领导可能会和你探讨,然后你将根据反馈进行反复更改。
  • 最后将你做的这些形成documentation,并优化模型和结论,形成一个完整的项目,这个项目将被展示给更高层的领导。

 

Business Analyst的技能图

 

 

Programming

占的比重其实是最小的,因为BA是介于Tech和Business中间的角色,BA最终的落脚点是Analytics,所以编程只是一个辅助的工具,对BA这方面的要求不是那么高,但当然还是需要会一些编程的。

 

Database – Infrastructure

对BA这方面的要求是第二弱的。比如,一个Data Engineer一般要懂得怎么设计数据库以及数据库其中的原理,但BA不需要特别懂这些原理,但是BA与数据库打交道非常多,这也涉及到接下来提到的能力。

 

Database – ETL(Extract Transform and Load)

ETL是我们对数据进行提取、转移,最后得到我们想要的数据的过程。它一般来说是跨平台的。通常公司里有很多数据库,数据会从一个地方流到另一个地方,在这个过程中,如何让你的数据从一个地方流到另一个地方,如何搭建一个Data Pipeline,这就涉及到Data ETL。

 

很多人认为在一个大公司里,可能会有工程师帮忙做这些事情,但工程师很多时候有其他优先的事情。如果你的团队想要发展得更好,或者不想依赖别人,可能会自己做Data ETL的工作,这个时候这个技能就显得尤其重要。

 

需要提醒的是,ETL在面试的时候不会被面到,但是如果你的简历里有这项经历会很为你加分。这一点在很多BA求职中提及得比较少,容易被大家忽视,但其实它也是很重要的。因为很多团队的痛点是,获取数据以及控制数据的质量存在很多问题,如果你能承担这项工作,对于一个团队是很有价值的。

 

Statistics

如果你要做customer、site或product analytics,统计知识的掌握是非常重要的。因为这些工作中难免会接触很多关于建模的知识。并且面试中会涉及到很多统计知识,关于建模的问题可能会问的比较详细。如果你离开了学校,统计知识其实很难扎实地学好,所以大家一定要在在校期间学好基础。

 

Visualization

为什么数据的可视化重要呢?因为BA的核心是要把分析结果呈现给领导及团队的其他人看,要让其他的高层从最短的时间里获取到你的分析结果中的insights,这就需要好的数据可视化能力。

 

Business sense

因为BA最终是为商业服务,所以这一方面的能力要求比较高。刚刚毕业的同学可能这方面能力会比较薄弱,但是随着工作阅历的增加,对商业的感觉也会逐渐增强。

 

Business Analyst的重要技能点

 

ETL

这一能力不是强制的,要看具体的Job Description,但是如果有这方面的经历,会给简历加分。此外,要掌握Database Schema,懂得如何建立Database Schema,怎样建最快。

 

Data Manipulation

重中之重。要掌握数据提取的SQL语言,如MySQL,Teradata,Oracle,Hive等。一般只需熟练掌握其中一种,面试过程中,你写的Query的语法并不重要,也就是说,你具体使用的是哪个语言并不重要,重要的是你对SQL语言的熟练程度。

 

Data Modeling/Programming

写SQL不是数据分析的终点,只是数据分析的第一个步骤。一般来说,我们会对提取的数据进行Modeling,这个过程中就会用到Python、R、SAS等语言。Python从长期来看是比较看好的,如果你对数据处理语言没什么基础,想短时间内上手,或者你想从事互联网或电商等行业的数据分析,Python会是很好的选择。R语言比较适合制药公司、生物医疗等一些传统纯粹的Data Science行业。SAS在金融行业用得多一些。因为,大家需要根据自己的背景和以后想从事的行业来选择具体学哪一种语言,当然如果同时掌握这些语言是更好的。

 

Data Visualization Dashboard

  1. Excel:应用范围很广。我们不要瞧不起Excel,很多传统公司,甚至是耳熟能详的大公司都会用Excel,因为很多商业人士是不懂技术的,你的领导可能就想看Excel呈现出来的东西。
  2. PPT:也是呈现数据的常见工具。
  3. Tableau:如果你的数据需要经常更新,可以选择在Tableau中呈现。在Tableau呈现的数据受众可能更广,会有很多人来看,并且他们很多商业活动和这些数据息息相关。
  4. Looker:一个现在炙手可热的数据可视化工具。和Tableau类似,可以做Dashboard发布到网上,只要有链接就可以看,是一个交互性较好的呈现工具。
  5. R的Shiny Package:写起来比较麻烦,公司可能会请专门的人来写。

每个公司情况不一样,选择的工具也不一样。具体选择哪个工具就要具体看Job Description。

 

Special

有些公司可能会要求你会Adobe Analytics(Omniture),比如这个职位是分析网站的,或者是Site Analytics。还有的公司要求你会Salesforce,比如这个职位是做客户的管理的,或Operation Analytics,或和Supply Chain有关的。

 

Experience Match

这一点不会出现在Job Description里,但是如果你之前的经历与团队的工作内容不匹配,HR可能认为你不太了解我们到底在做什么。如果有些同学想转行做BA,本身有一些工作经验,那么你的简历中的Experience Match就更加重要。

 

Communication

沟通能力对于BA的重要性已经是老生常谈了,因为BA是商业和技术的桥梁,和领导、工程师、以及团队里其他人的交流非常多。

 

Project Management

BA有些职位比较偏管理,这就需要你有一些项目管理的技能。常用的项目管理的一个方法是Agile,用于更好地管理项目的进度,使项目如期完成。

 

BA在学校和实际工作中的GAP

 

学校与面试之间有GAP,面试和实际工作间也有GAP,这些GAP主要有以下几个方面:

 

ETL

如果你是信息管理专业或其他挂靠在工程学院的项目,相对来说你会对ETL更了解一些,但如果你学的是商业相关的项目,一般会很少涉及到ETL,那这方面可能是学校和工作间一个比较大的GAP。

 

SQL & Query Efficiency

这一部分也是工作中涉及很多但在学校中会比较缺失的。虽然很多同学觉得自己刷题也刷过了,自己的SQL没问题,但大部分的面试都是挂在SQL上。很多人写SQL都只停留在Select from,Join table这个程度,很少有人能够把Case when灵活运用,当把Group by,Partition by或者一些Aggregation function杂糅在一起的时候,能写好的人还是比较少的。对于Query Efficiency,其实面试官并不会考到让你把SQL写得很高效。但是实际工作中的数据量可能会非常大,如果你的Query不高效,很可能运行不出结果。比如,在工作中一般不用Left join,只用Inner join,因为Left join非常没有效率,当数据量巨大时,可能半个小时也出不来结果。再比如,你想删掉记录中的重复值,可能有人觉得要用Distinct,但是Distinct在实际工作中是很没有效率的。一般如果你只想要唯一值,可以用Group by。

 

所以在工作中,要思考怎样把Query写得运行起来是高效的。如果你在面试中告诉面试官你懂这些,面试官就会觉得你是真的懂SQL,并且你可能有过处理大量数据的经验,那么你自然就会让面试官记住你。

 

Tableau Dashboard

Tableau的入门简单,但是做好很难,有很多门道。有人觉得自己Tableau用得不错,但是你知道Fixed一般怎么用吗?你知道怎么把Database和Tableau连起来,做一些Automate Dashboard吗?如果你能掌握这些技能,可能就会让你在面试中脱颖而出。

 

Business Acumen

即对商业的一种感觉。比如,你分析出一个数据结果,有时候这个结果并不Make Sense,你可能还没有意识到。但一个有多年商业职场经验的人可能看一眼就知道你的结果是对是错,即使他并不懂技术。因为对商业的感觉让他能够去评估商业的结果。这个技能可能也是刚从学校出来的同学们比较欠缺的。

 

Data Quantity and Quality Challenge

工作中涉及的数据量巨大,可能到达百万级别。公司招人时会比较倾向有处理大量数据的经验的人。当数据到达一定量级后,我们有时候没法看到数据的全部面貌,并且很多大公司的大量数据在几十个系统中流转,那怎么去确保数据质量也是工作中的一个挑战。

 

Hands-on Project and Solid Statistical Modeling

同学们尽量去做一些最接近工业界的实际项目,如果只是在简历上写一些在学校做的项目,是没办法在面试中脱颖而出的。并且在学校做的项目中的数据大多是不需要怎么清理的,遇到的情况都是简单的。大家在实际工作中,对数据处理的整个过程中会遇到很多挑战,在每个步骤都可能遇到在学校没有遇到过的问题。