本文共 3676 字,大约阅读时间需要 12 分钟。
本文为 AI 研习社编译的技术博客,原标题 :
3 common data science career transitions, and how to make them happen
作者 | Jeremie Harris
翻译 | Eli伊莱
校对 | 邓普斯•杰弗 整理 | 菠萝妹
原文链接:
https://towardsdatascience.com/3-common-data-science-career-transitions-and-how-to-make-them-happen-588c3618942f
记得以前我学习物理的时候,我经常去google那些看起来很高级的专业术语,而且大多数时候,维基百科总是第一个出来的。
但是随着维基百科词条数量越来越多,它们的解释好像都达不到我想要的水平,尤其对于很多我个人需求来说,它们解释的都太过难或者太简单了,这件事情发生的频率太高,以至于我总结出了一个互联网规则:“维基百科的专业术语词典不能在容易理解和提供有用信息之间很好的平衡”。
我相信很多的数据科学家职业咨询(工作搜寻/面试准备建议)都遵循一条简单的原理:有面向初学者的招聘职位,也有面向经验丰富的软件工程师招聘职位,也有帮助初级数据科学家快速打磨他们技巧的职位。太多的杂音使这些有望致力于数据科学家的的人越来越难的选择自己应该把有限的时间和经理投入到哪个部分,来获取职业生涯的转变。
这是我在SharpestMinds和mentees研究的主要课题。虽然不会有一个适应于所有人的解决方案,但是我发现以下3类建议是我在做咨询时不停的提供给别人的建议。
第一类:数据科学小白(完完全全的小白)
如果你刚接触数据科学,请牢记这单:这个领域变化很快,所有在这个时刻我给你的意见与建议,当你准备应用在实际工作的时候,可能就已经过时了。2017年那些招募员工考察的点在今天已经不适用了,而且,那些衡量在当下申请数据科学家岗位的工作标准与那些未来(1-2年后)准备申请数据科学家岗位的工作标准肯定会截然不同,而且会差距更大。
如果你没有编程或者STEM(科学、科技、工程、数学)的背景,这里有些建议可以帮助你进入到数据科学领域:
保持开放。如字面意思,你是一个小白,你不知道数据科学是什么鬼东西,所以有很大可能数据科学并不是你想象中想要的那份工作。试试在领英上找一些数据科学家,买杯咖啡同他们聊一聊是个很好的帮你了解这份工作的选择。去follow一个数据科学家的podcast,对于成为一个数据科学家来说,这意味你要花大量的时间和经历在上班,从这个角度讲,如果仅仅是觉得自动驾驶汽车很酷就选择这条路,可能这并不是你的一个好选择。另外就是你要明白数据科学家并不是每天都有高光时刻,更多的时候是在清晰数据,建立数据通道。
如果你看完以上信息还决定继续前进,那么你要做的第一件事情就是学习Python。选择一个MOOC平台(优达学城,慕课等),然后尽快学完,再做一个小项目。当你熟悉你的Python编程技巧后,就去学习如何使用Jupyter Notebooks(译者注:一个Python编译器,很好用),然后再在MOOC平台上学习一些数据科学课程。如果你想要更多的详细信息,可以看看这个blog,它给出了一个很好的学习路径。
在学习初期将你目标定位在数据科学家这个岗位上并没有太多必要,你可以先从更基础的地方开始,比如:数据可视化,数据分析都是大量需要人才的岗位,也是最快进入市场的选择。这些岗位会同数据科学家一起工作,而且会提供晋升数据科学家的通道。
如果打造你自己的个人品牌呢:如果你到了可以申请工作的那一步,你会发现建立个人品牌对数据科学来说非同寻常的重要。你可能会恐慌说自己没有一点点专业经验,也没有一个CS方向的研究生学位,个人品牌会成一个大问题。但是,这些其实可以成为你最大的品牌优势:你是一个自驱动型的开发/数据人才,不仅学的快,而且工作努力,公司完全可以信赖你。这是一个陡峭的攀登路线,但是它带来的汇报绝对超值,这是你唯一的期望,也是在身上催促你前行的重担。
第二类:软件工程师
我碰到的大概有20%有志于成为数据科学家朋友都曾是软件工程师。一方面,如果有软件编程和实施方面的经验,而且擅长团队工作,这将是你简历中很重要的组成部分。另外一方面,随着全栈工程师的需求越来越大,企业也会推动软件工程师向全栈工程师发展,尽管招聘简历中写的职位是“数据科学”。所以,作为一个软件工程师而不是一个数据科学家,你肯定希望避免被企业套路。
其他一些想法:
如果你还没考虑在近期把自己的岗位向后端/数据库方向转,那么去尝试了解数据管道是一个很好的开始,它可以帮助你构建你核心的数据控制技能。同样,这也会让你的个人品牌转向一个有实际工作经验的数据牧羊人。
机器学习工程师应该是同数据科学家最接近的角色了,它可以很快的帮你转入数据科学家序列。你的工作目标就是去找那些强调部署模型,或者调试他们接入App的岗位,这些会让你现有的技术能力成为杠杆从而帮助你转型。当然,你也可以同时涉足模型的研发,不过前者是你入门的最好选择。
你很可能需要建立机器学习或数据科学项目来吸引公司。利用你的软件工程技能,将这些技能集成到可以向招聘人员和技术主管展示的应用程序中。这可能特别有效,因为它是实实在在的作品,并完全展示出来你作为一个全栈数据科学家的实力。
有些你必须铭记在心的:你在转型的过程中肯定会经历一次掉薪,即便你曾是高级软件工程师,在你转型后你只能做初级岗位的事情。他们之中很多人并没有做好这个心理准备,然后在收到offer的时候会感到很失望。
如何打造你自己的品牌:
最简单的一个方式就是通过你在软件开发方面的经验作为一个杠杆。你已经知道如何写出一个符合要求的干净、注释清晰的代码,同其他这个岗位的初级人员比,你已经知道如何同其他人合作了,这是你的优势。但是,为了更高效的展示你的编程技巧,你还得学习数据科学的编码方式及注释方式。
第三类:新的计算机科学、数学或者物理学研究生
如果你是一个本科生或者是STEM(科学、科技、工程、数学)的硕士或者博士,你在数学和统计方面应该会有一个很好的基础。但是你可能从来没有申请过一份科技业的工作,你也不知道如何准备面试。同样的,如果你在学习阶段有做过编程,很大概率你也不知道如何写出一个干净、有很好组织的代码。
那么,这些事情你最好记住:
你在学校学习的R语言知识不够用啦,如果你是物理学毕业生,你可能会以为你的Matlab或者数学技巧能帮助你在工业界拿到一份工作,这些也不够用。赶快去学习Python!
这是一些你需要赶快学习的而且你很可能不知道的东西:合作版本控制(如何在GitHub上同大家协作),容器技术,devops(学习如何在云端部署模型)。SQL也是必须要会的。
学习测试驱动的Python开发,学习如何文档流,学习模块化编程,如果你还没准备好,学习如何使用Jupyter notebooks编程。
如果你在特定的数学方向,深度学习或许对你来说是一个很好的方向去探索。但是你会发现从一个更常规的“scikit-learn"数据科学角色开始,然后再转型深度学习会更简单一点。对你来说最重要的事情就是进入到行业里,然后开始动手生产产品级的代码。
如何打造个人品牌:如果你是数学或者物联专业的,你最好的策略就是把自己包装成一个具备丰富理论知识的人,要成为这样的人,你需要能够自信的解释多个模型是如何运行的,最好是能熟悉最近、最热的论文!(尤其你未来打算做深度学习的话)
注意:
我提供的这份建议并没有为每一种模式提供非常清晰的路径。有些软件工程师可能要比其他人付出跟多努力,有些初学者可能具备独特的数学能力而更适合成为一个深度学习专家。但是,无论如何,你都需要规划好一个偏向你能力发展方向的开始。
最后,无论你是一个软件工程师,一个刚毕业的研究生或者一个小白。一个你要自己问自己的问题就是:到底哪个职业轨迹才是最接近于你终极目标的。如果数据分析师和可视化专家能带你入门,那么它们就是对你职业生涯,一个长期的规划的的最好的开始。
想要继续查看该篇文章相关链接和参考文献?
长按链接点击打开或点击【三种常见的数据科学职业转型及其实现路径】:
https://ai.yanxishe.com/page/TextTranslation/1302
AI研习社每日更新精彩内容,观看更多精彩内容:雷锋网雷锋网(公众号:雷锋网)雷锋网
用PyTorch来做物体检测和追踪
用 Python 做机器学习不得不收藏的重要库
算法基础:五大排序算法Python实战教程
从零开始用Python写一个聊天机器人(使用NLTK)
等你来译:
强化学习:通往基于情感的行为系统
高级DQNs:利用深度强化学习玩吃豆人游戏
一文带你读懂 WaveNet:谷歌助手的声音合成器
用于深度强化学习的结构化控制网络 (ICML 论文讲解)
转载地址:http://decta.baihongyu.com/