由于两个月前写了一篇文章叫《自己找数据分析师时犯的错误》,然后这期间就一直有人问我找到工作了吗?面试的时候,面试官都是问你的什么呢?你从事数据分析工作之后主要干什么呢?所以想在这里为大家分别解答下。
首先回答下,我确实是找到数据分析工作了(感谢我遇到的贵人)。这是我辞职回到家写的一篇文章----为什么转行数据分析。其中写了一个计划,让自己有了方向,希望大家也尽量写一个详尽的计划,这在学习的过程中不会因为方向不明确而产生焦虑。仔细的一算,我是大概辞职两个月后找到了工作,难道我真的是从零基础学习两个月找到数据分析工作的吗?当然不是,我不能为了吹嘘自己给大家带来误导。
下面我会尽可能的为大家描述下自己学习的整个过程,以及我自己犯得一些错误。然后回答面试数据分析的一些问题,以及大家想知道的数据分析工作到底是怎么样的问题(以自己的工作为例)
一:开始接触编程
大概介绍下自己,一个在2021年6月份毕业的工科男生,专业是建筑环境与能源应用工程。开始正题了,说到开始接触Python应该是2020年12月26日(刚刚考完研),这一天主要做的就是安装Python,当时安装的是Python的原生包,麻烦一些,在配置环境变量的时候一直出错,结果安装了两天,才打印出了Hello World!,其实说真的自己差点放弃。学习Python这也是起源于知乎的一期文章,提到了编程,说编程是如此之美,比学习钢琴绘画还能提高人的审美。幸运的是我的启蒙老师,主动带领我们一起学习了Python,他要求我们如果碰到了问题,要先把问题给弄清楚了,这也就要求我们把问题一步步的分解,然后使用搜索工具一步步的解决 ,其实在这个过程中,思路将会越来越清楚,最后问题也就能解决了一大半了,这时再问别人的时候也能特别有效率的。所以大家在学习的时候,一定经常使用搜索工具(谷歌),自己每进行搜索一次,就能提高自己搜索关键词能力。另一方面你向别人请教问题的时候,别人能够方便的问答你的问题,为别人着想,其实也就是在为自己着想,难道不是吗?
学习Python时应该注意的问题
-
如果大家刚接触Python,碰到的第一个问题肯定是安装问题,这其中遇到的麻烦估计就是配置环境变量了(不难,就是一不小心会错);所以建议大家,直接安装Anaconda(官网下载),在安装的过程中,会有类似是否默认设置环境变量,点击是,剩下的默认就可以。
-
我刚开始学习的时候,当时的目标是把别人的代码抄下来,只要不报错就好了。那时间自己有一个非常不好的习惯,就是抄代码,从来不自己亲手写代码。总是想快速学习完,其实是没有经过自己思考的沉淀,过不了两天就会忘记了代码的逻辑。所以也建议大家能够自己写,然后再与别人的代码比较进行修改。点击Python的菜鸟世界会有一些简单的例子,大家可以用来参考学习的。
-
学习编程,真的不要怕麻烦,肯定会出错,但是只要能够把错误的原因找出,一点点积累,肯定是进步很大。
-
对于从事数据分析工作的话,刚开始先掌握函数式编程即可了。
二:对于学习爬虫建议
我原来是按照崔庆才博主的视频课程学习的,把他视频课程的代码给抄了一遍,当时自己真是太愚蠢了,只是想得到结果,没有自己找一个网站爬虫练习下,更加没有思考。 其实简单来讲爬虫就分为三个部分:
- 取出要爬取的URL
- 根据URL请求服务器,下载HTML页面
- 分析页面内容,找出网页中里的其他URL,继续爬虫直到结束
如果大家打算写一个爬虫程序作为自己找工作的项目实践,推荐使用requests库和Beautiful Soup,再加上QQ浏览器上扩展程序XPath Helper,将会是非常的方便。如果大家没有这个学习资料的话,点击传智播客就业班视频。有一点还请注意,这是一个LINUX下的教程,关于学习爬虫方面,其实涉及到的LINUX命令只有进入一个文件进行编写,复制一个文件,简单的几个命令。
三:对于学习数据分析建议
在我快要辞职的时候(九月十几日左右),我就开始想要从事什么职业,当时确实想做开发的,因为当时自己知道只要努力学习,半年之后是有很大的机会找到一份不错的工作的,可是自己并不是太想做开发。在自己无助的时候,幸运的是,我到知乎上看到卡牌大师还有秦路老师关于转行数据分析的回答,让自己有了数据分析的学习方向。如何快速成为数据分析师?,这张帖子确实帮助了像我一样无助的好多人。
总结下来主要学习概率统计、Excel、SQL、python基础知识、numpy包、pandas包、matplotlib包。我的做法是直接按照博主秦路的文章学习,按照他的文章代码实现下(抄了几遍),然后自己想想看看有没有其他需求给实现下。对于SQL的学习可能在安装上会遇到问题,这篇文章-SQL入门学习能够给你写帮助;在这里多说一句,很多人认为数据挖掘的机器学习部分,是需要很好的数学基础的,其实并不是。这篇文章会给你解答--入门机器学习到底需要多少数学知识
四:初级数据分析学习书单及网站
Python基础:《利用Python进行数据分析》SQL:《SQL必知必会》以及MySQL的官方教程统计基础:《深入浅出统计学》、《商务与经济统计(第12版)》电子行业业务知识:《数据化管理:洞悉零售及电子商务运营》分析理论和Excel:《谁说菜鸟不会数据分析》机器学习:《统计学方法》(李航)爬虫:崔庆才个人网站
对我们转行的同学,对于上面的知识学习也要有所侧重,看下技能侧重点
说明下:机器学习部分是我们找工作的加分项目,可以先了解到逻辑回归、决策树、随机森林、Kmeans算法;爬虫的话,也是我们的加分项目,学习Requests库、Beautiful Soup这两个即可。
五:不同种类的数据分析工作要求(根据面试所得)
第一种: 我是感觉类似于数据运营,就是学会EXCEL,SQL、概率统计也就好了。我的了解是,这样的工作基本上是在互联网公司,给没有数据部门的产品经理打个下手,要求的技术并不是太高,主要是针对产品经理提出的需求来做分析。比如说,我当时面试的一家互联网教育机构,他们的要求就是用EXCEL整理学生买课的信息,看看哪一门课程最受大家喜欢之类的。这种职位的大概薪资在一线城市的话大概税前有6000到7000块(以下说的薪资范围也都是针对一线城市的。这里的结论是我面试时、或与朋友讨论、或是在某些课程上看到的,可能观察的样本不大,大家也应该多面试几家,感受下数据分析工作到底需要哪些技能。)
第二种: 是真正的数据分析职业,最起码是公司里有专门的数据分析部门,并且还能用到编程语言。这时候需要掌握的技能算着EXCEL,SQL,概率统计,还有一门编程语言Python或者是R语言,建议大家先学习Python语言,我碰到一个面试官说其实公司里面使用Python做数据分析的较多。这样一阵下来,公司就能上升到8000-1000,如果能够学习几个机器学习算法模型肯定都是加分项。
第三种: 就是数据挖掘职位了,这个就需要掌握的技能比较多了,EXCEL,SQL,概率统计,Python或者R语言,数据挖掘、机器学习 Hadoop,Spark Java,python,c++ 推荐系统、自然语言处理等。编程语言,还有熟练掌握机器学习的算法(这个一定要自己推导几遍),这个工资就不用说了,15000+。
关于这方面,自己写过一篇文章——《自己找数据分析工作时所犯的错误》。其实面试的时候,前两种类要求业务知识要一些,后一种就偏向技术多一些,面试官问的时候也是按照对应的顺序。
六:对于购买课程或者加入数据分析社群
我现在关于购买课程或是加入社群有一点点见解。我认为现在的数据分析社群之所以存在是帮助大家解决了下面三个问题:
- 学习的方向,对于一个好的社群,能够为你提供一个学习路线。(其实按照我上文提到完全是可以的)
- 可以解决大家的恐慌问题,因为我们都是要转行的人,对会未来会感到很大的不确定性。(有一点大家要注意,这只能解决自己暂时的恐慌,关键是一定要坚信做对的事情,长期来看一定会带来更大的复利,并且长期一定是没有自己想的那么长)
- 加入数据分析社群之后,社群里总会有一些活跃的人能够帮你解答问题,在社群里确实降低了与人的沟通成本。
关于加入数据分析社群,我自己犯得错误是,本来按照自己原定的计划在学习,学习两周之后就看到和别人学习的内容和自己不一样,就开始怀疑自己这样学习可以找到工作吗?然后其中的知识点学习到什么程度呢?这时候就开始到问群里小伙伴和到知乎或者到简书上寻找答案,结果反倒是越看越恐慌,再后来为了解决恐慌就又买课程加群,然后立下誓言,又努力了两周,紧接着又是恐慌,到后来就只剩下了一堆资料了。大家可以看下,我给数据蛙DataFrog社群的学习建议
总而言之,加入一个社群也是可以的,大家还是要记住关键只能靠自己。
七:第一份数据分析工作用到了什么技能
工作中我的主要职责是,根据甲方提供的数据和需求,或是根据甲方的数据提出对他们有价值的需求,然后选择建立的算法模型,并进行数据分析。由于现在工作是刚入职一个月,工作是不太固定的,这段时间都用到了下面的知识。
- python 爬虫
- Linux 命令
- Python 的正则表达式
- 聚类算法和spark MLlib
自己罗嗦着说了这么多,真的希望能够给大家一些帮助。其实,转行数据分析的文章,大家估计也是看了不少,但是有时可能是缺少一些鼓励,心里总是有些恐慌,不知道自己这样是不是可行的。朋友们,想信我,只要按照自己学习就可以了,那一天肯定会到来的。(PS:如果大家需要鼓励,还要再了解下我的情况的话,可发私信加我微信,如果你方便的话,我会语音解答你的疑问。)
八:数据分析工作一年后的感受
想想自己工作快一年的时间了,再来更新下自己的工作情况和一些感受,给找工作的同学们一个参考。1: 自己的工作情况
去年12月份的时候,自己由于巧合和贵人的帮助入职算法职位工作,由于部门服务的客户主要是在非互联网行业(工业行业、零售行业、地产行业等),这些客户也是想使用算法为自己的公司创造利润或是节省成本,可是他们自己大多不明白他们的需求是什么,然后我们算法小组竭尽全力找到他们的需求,给客户展示,客户嘴上说还是挺好的,但也一直张望行业中有没有真正的落地案例,于是这样自己一直没有做过真正的项目。
对于上面自己的这段经历,自己的理解是,自从"人工智能"这个名词火了之后,很多现有公司和刚起步的公司都指望能够通过人工智能创造价值,于是纷纷成立算法部门,可是领导也不清楚算法是什么东西,到底怎么样落地,大概是认为看先搞搞,能搞出来的话就是赚的。 (这里给转行的朋友建议是,如果是刚接触数据不久,私下做了几个开源项目,然后就找到了算法工作,这样的工作可能多半是不靠谱的,或许只是领导跟风,但互联网大厂是绝对可以的)
然后根据自身的优劣势进行了调整,由于自己是本科学历,如果是一直只求算法的路线的话,和研究生比起来优势不大。所以,自己重新做了规划,从事数据工程(ETL、BI)或是高级数据分析,把算法当作自己的一个额外技能,增加优势。于是,现在自己开始了新的工作ETL、BI(公司没有细分这两个职位)2: 给转行数据分析的朋友一些建议
(1):不要被‘人工智能’,‘大数据分析’这些词汇给忽悠了,不要听信培训机构的学习3-6个月,年薪30万+(2)针对不同情况的同学给一些建议a:专业和编程、数据没有一点关系的同学,应该暂时先给自己定位到数据分析职位上,如果数据库知识学习的比较好的话,可以考虑数据工程方向b:专业或工作和编程、数据有些关系(比如java开发之类的),或是计算机专业的同学不想做开发,做做数据工程也是挺好的。c:数学功底比较扎实的同学(最好是硕士),可以先考虑下数据挖掘 上面的这些自己仅是抛砖引玉,认为秦璐老师说得比较详细
最后免费分享给大家一份Python全套学习资料,包含视频、源码,课件,希望能帮到那些不满现状,想提升自己却又没有方向的朋友。
CSDN最全的Python全套学习资料已经打包好,需要的小伙伴可以戳下方链接免费领取
👉CSDN大礼包🎁:全网最全《Python学习资料》免费赠送🆓!(安全链接,放心点击)
学好 Python 不论是就业还是做副业赚钱都不错,但要学会 Python 还是要有一个学习规划。最后大家分享一份全套的 Python 学习资料,给那些想学习 Python 的小伙伴们一点帮助!
一、Python所有方向的学习路线
Python所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。
二、Python必备开发工具
三、Python视频合集
观看零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。
四、实战案例
光学理论是没用的,要学会跟着一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
五、Python练习题
检查学习结果。
六、面试资料
我们学习Python必然是为了找到高薪的工作,下面这些面试题是来自阿里、腾讯、字节等一线互联网大厂最新的面试资料,并且有阿里大佬给出了权威的解答,刷完这一套面试资料相信大家都能找到满意的工作。
CSDN最全的Python全套学习资料已经打包好,需要的小伙伴可以戳下方链接免费领取