Airbnb Head of Data Science:一文带你看懂数据科学

如果你对新型企业中的数据科学家是做什么的还有疑问,那么这篇翻译的文章一定可以给你答案。本文作者Elena Grewal是现任的Airbnb Head of Data Science,本文于7月24日发表于原作者的LinkedIn主页,原文链接你可以在文章底部看到。 在一家高速增长的企业担任领导工作特别有意思。为什么这么说呢?因为与其他企业不同,你不仅要把握住一个个改变现状的机会,还被赋予了推动企业源源不断推陈出新的使命。而我又从事数据科学,这本就是当下发展最迅速的领域之一,这就对“推陈出新”的速度提出了更上一层的要求。 在Airbnb,我们认为Data不仅仅是数据,而是代表了Airbnb全体用户的一个声音。我们的目标则有两个,一是让Data Scientist(数据科学家,简称DS)将这个声音的影响最大化,二是让我们麾下的这些数据科学家们能够热爱自己的工作。想实现这两个目标,要走的路还很长,但我们正在不断地探索改进的方法。近来,我司针对目标建立了一个定义数据科学角色的框架,在此分享给大家。我们也希望其他公司在寻找数据科学的角色定位时,能够在这个框架的帮助下建立起属于自己的战略模式。 简单来说,这一框架将企业的数据科学工作划分为三个方向:分析方向、推理方向及算法方向。下面,我会向大家讲述Airbnb是如何在数据科学部的发展中这孕育出三个方向的,且听我慢慢道来。 五花八门的title 在Airbnb,数据科学部的源起只是一个做分析工作的小团队。我将这一阶段的团队戏称为“A-team”,这个词在英文中大约是“精英小组”的意思。当公司招募到第一名从事专业分析工作的员工时,“A-team”也就诞生了。2012年的时候,我从事的岗位名称叫做“Data Scientist”。后来公司招了一名“Data Architect”,负责数据质量的相关工作。其后,又招了一个“Data Analytics Specialists”,其主要工作是帮助弥合数据存取及不同工具之间的gap。再后来,随着机器学习研究工作的出现,我们又开始招“Machine Learning Data Scientists”。这些岗位名称的演变不仅反映了不同时期的团队需求,也是市场竞争格局变化的体现。2015年,我司正式成立了数据科学部门,但我们团队依然自称“A-team”,因为这样叫起来更有趣儿,也体现了我们所珍视的那一段团队发展史。 2017年中的时候,我走上了数据科学部的领导岗位,那时我们部大约有80名DS,且按一定人数组成了数个团队。其中有的负责建dashboard,有的负责建NLP,其他人则负责建一些决策及实验设计相关的模型……DS们的工作内容缤纷多样,每个人都各司其职。 一门新兴学科的快速崛起 数据科学的内容之丰富其实是可以想见的。虽然数据科学相对而言是一门较新的学问,但其增长速度却不可小觑。这一点我们通过数据就可以验证。首先,我们可以从Airbnb内部来看。下面这张图表展示了Airbnb从2015年至2018年收到的对数据科学职位的申请数,可以看到这一数字在四年间翻了两番(也即2018年为2015年的四倍)。 (当然,这一数据也受到应聘者对Airbnb公司本身的兴趣以及其他因素的影响) 据GoogleTrends数据显示,datascience的相关搜索次数也有明显增长。 如上图所示,人们对数据科学的兴趣大约于2012年开始增长,六年内同样翻了两番。 除迅速成长为热门行业之外,“数据科学”这个词儿的含义也始终非常丰富。有时它指的是纯粹的机器学习,有时则指一家科技公司的商业智能。尽管“数据科学”本身就是一门新兴的学问,但它却还在不断地演变着、发展着。 数据科学内含的多样性 观察发现,大众对数据科学这门学科的研究目标其实并不太清楚。至于从业者们的工作内容,也就自然不甚了解。 前面说了,数据科学的内含非常丰富,DS的工作内容也是缤纷多样。但这种多样性在公司中会表现为一种负面影响,即组织架构的混乱。由于不了解数据科学,团队中的其他成员不知道DS能承担怎样的工作;而DS们自身也会搞不清自己在团队中的角色定位。有的DS在日常工作中建模做得较多,其同事可能就会认为让他们改做分析工作是一种资源浪费。反之,有的DS平日里分析做得多,其同事可能就会希望让他们多去做建模。 正是这种外界的误解,给DS们的工作带来了挑战:做分析的DS会觉得,虽然自己的工作对企业而言至关重要,但相比负责机器学习的DS而言,他们没有得到足够的尊重。之所以说分析工作重要,是因为企业的决策者们往往最需要的就是分析结果,这些分析结果能让决策者越过技术的门槛,直观地理解各类数据。Airbnb也曾对数据教育做过投资,建立了著名的Data University。但在公司内部,专业数据科学工作人员的数量还远远达不到预期。后来我们才意识到,这可能是我们在招聘启事中的不当表述导致的。在岗位名称上,虽然招募对象是隶属于数据科学部的,但我们却用了“Data Analytics Specialist”,导致这个岗位看起来就不像数据科学岗。但即便岗位名称中写了一个“Analytics”,在具体的工作描述中,我们的某些不当表述似乎反倒暗示了分析工作相比建模工作的不平等地位。 由此可见,数据科学部门在企业中的构建并没有什么一刀切的方法。尽管如此,领导层可以从自己企业的战略及目标出发,定义数据科学工作者的身份以及其提升价值的形式。拿Airbnb来说,我们的目标是“championthe mission”。换句话说,我们要做的,永远是公司最需要的。由此,我们认为我们最需要的数据科学人才,是那些符合当前商业需要的人。但与此同时,我们也会考虑到这个人是否拥有个体独特性、是否对自己有着清晰的未来预期等等。 解决方案:给数据科学设计三种“口味” 经过大量的经验交流和观察研究,我们最终决定打造一个全新的数据科学企业架构,这一架构可细分为三个方向:分析方向、算法方向及推理方向。 – 分析方向:适合那些能提出关键问题、能准确找到数据切入点、能通过dashboard及可视化工具将分析自动化,以及能通过个人建议推动企业变革的人。 – 算法方向:适合拥有机器学习领域的专业知识,能将数据融入产品及服务并创造企业价值的人。 – 推理方向:适合能运用数据改进我们的决策、测度我们工作影响力的统计学、经济学、社会学研究者。 作为我们团队中的DS,你必须至少在以上三个方向中的一个拥有足够的专业知识。此外,我们还要求你能根据企业需要或个人兴趣,“跨方向”掌握多种不同技能。当然了,在具体的每个方向内还会有更深层、更专业的分支。数据科学部的所有成员的岗位称号都是“DataScientist”,而在岗位后的详细描述中,则会进一步阐明其工作方向。 数据科学和其他行业不同,它没有那些描述细分岗位的专业词汇。比如工程师可以分为“前端”和“后端”。加上其中一个词儿,你就会对这个人的技能及研究领域有更清楚的了解。虽然这种简单的划分并非完美,但相比简单的一个“Engineering”而言,至少能更清楚地体现一个人的专业知识。数据科学就没有这种语言上的便利,但也正因如此,我们才更要努力去推动、去创造。 Airbnb数据科学家们的方向选择 新的考评机制 重塑部门架构之后,我们还根据新架构修改了对员工的绩效考评标准,这其中又包含了不同层级的DS及管理人员。总体而言,我们的评判是根据每个人给企业带来的影响做出的。针对技术性员工,我们在以下这些方面对评估框架做出了修改: 技术能力评估 – 分析方向:定义、监测指标,描述数据,设计能够推动决策的工具 – 算法方向:设计、阐释能够支持数据产品的算法 – 推理方向:运用统计学建立因果关系 – […]

All Rights Reserved ©2017 BitTiger, Inc.