本文目录一览:
- 1、零基础学数据分析应该怎么入门
- 2、如何自学数据分析
- 3、如何自学数据分析
- 4、数据分析怎么学习呢?需要学习什么?
- 5、如何自学成为数据分析师
- 6、如何自学成为数据分析师
- 7、我想转行做数据分析师,怎么入门?
- 8、自学转行数据分析类岗位需要掌握哪些知识框架?
- 9、自学数据分析需要看哪些书的
零基础学数据分析应该怎么入门
想要入行数据分析师,那么有两个部分必须掌握:工具 + 数据分析方法论。
先谈工具。
学习过程应该由易入难。从认识表结构、懂得表连接、掌握小数据量处理,到表在心中、只需要代码批量自动化处理、并且会通过算法实现相关性分析,这两个状态之间有三个层次。
第一个层次:当数据分析师只用面对小量数据时(一般来说小于几万行),他/她应当先学会从MySQL(一种部署在本地计算机的数据库)的Sql语法提取数据,然后用excel进行做表做图的处理,亦或是用FinbeBI或者是PowerBI做出更为精美的指标看板,以供决策者看到公司销售、运营、人力等指标的变化趋势。
第二个层次:当数据分析师面对中量级数据(也就是百万千万级数据)时,他/她会发现:excel和BI无法打开这一庞大数据集。那么怎么办呢?这时Python的批量处理数据能力就变成了入门最简单且处理最高效的工具了。Python是一种入门简单,语法简洁的编程语言,它拥有丰富的"工具库“。就像英语具有“日常英语”和“商务英语”等不同的语句库,python也有具有不同功能的工具库。比如python的pandas库就能够轻易地,对千万级表的数据做到,将第10行到第20万行的所有1都替换成0;python的numpy库又能轻易地进行N维空间的矩阵运算。另外python的matplotlib和seaborn可以短时高效地绘制跟excel和BI一样精美的指标图。
第三个层次:当数据分析师处理超大数据量的时候,hadoop和spark等等大数据工具及组件就会派上用场。这时学习的就是从多台服务器上调取大量数据,并且要将这大量数据做出高效运算,和用算法进行分析。
先打地基,后建高楼。万楼皆从平地起。Excel,MySQL,BI就是处理小数据的地基。Python可处理中量级。Hadoop和spark等工具则是处理大数据的利器。
沿着这个思路往下,结合刻意联系的原则(量化的特定目标+实践+及时反馈),你一定会收获入门数据分析师的果实。
数据科学是一门应用学科,需要系统提升数据获取、数据分析、数据可视化、机器学习的水平。下面就简单提供一个数据分析入门的路径:
第一阶段:Excel数据分析
每一位数据分析师都脱离不开Excel。excel是日常工作中最常用的工具,如果不考虑性能和数据量,可以应付绝大部分分析工作。虽然现在机器学习满地走,Excel依旧是无可争议的第一工具。
第二阶段:SQL数据库语言
作为数据分析人员,首先要知道如何去获取数据,其中最常见的就是从关系型数据库中取数,因此可以不会R,不会python,但是不能不会SQL。DT时代,数据正在呈指数级增长。Excel对十万条以内的数据处理起来没有问题,但是往小处说,但凡产品有一点规模,数据都是百万起。这时候就需要学习数据库。
第三阶段:数据可视化&商业智能
数据可视化能力已经越来越成为各岗位的基础技能。领英的数据报告显示,数据可视化技能在历年年中国最热门技能中排名第一。
学习数据分析可以到CDA数据分析认证中心了解一下,CDA是大数据和人工智能时代面向国际范围全行业的数据分析专业人才职业简称,具体指在互联网、金融、咨询、电信、零售、医疗、旅游等行业专门从事数据的采集、清洗、处理、分析并能制作业务报告、提供决策的新型数据人才。
如何自学数据分析
第1本《谁说菜鸟不会数据分析入门篇》
很有趣的数据分析书!基本看过就能明白,以小说的形式讲解,很有代入感。包含了数据分析的结构化思维、数据处理技巧、数据展现的技术,很能帮我们提升职场竞争能力。找不到工作的,学好了它,自然没问题。
第2本《拯救你的Excel数据的分析、处理、展示(动画版)》
一本用手机看的Excel操作书,大部分例子都配置了二维码,手机扫扫就能看,基本上可以躺着把书学了。所有数据的分析、处理也都带了职场范例(有会计、HR、销售场景),很贴合实际。拯救我们小白的Excel,职场加薪不是梦想!
第3本《Excel图表之道:如何制作专业有效的商务图表》
职场大牛的书,教我们做图表的,好看到不能再好看。可以设计和制作达到杂志级质量的、专业有效的商务图表。相信平时我们很难做到吧,看了你就知道,也许一切没那么难。
第4本《绝了!Excel可以这样用:数据分析经典案例实战图表书》
挺好的一个系列,都是Excle常用的技巧,适合销售和HR。也是职场故事,很接地气,带视频的,全都是Excel数据分析的常用理念和方法。
第5本《深入浅出数据分析》
深入浅出系列是对新手非常友好的丛书,用生动但啰嗦的语言讲解案例。厚厚的一本书翻起来很快。本书涉及的基础概念比较广,包含一点统计学知识,学下来对数据分析思维会有一个大概了解。
第6本《MySQL必知必会》
如果真想买书看,可以看这本,适合新手向的学习,看基础概念和查询相关的章节即可。网络上大部分MySQL都是偏DBA的。
第7本《深入浅出统计学》
大概是最啰嗦的深入浅出系列,从卖橡皮鸭到赌博机的案例,囊括了常用的统计分析如假设检验、概率分布、描述统计、贝叶斯等。
第8本《网站分析实战》
互联网不再是网站的天下,但是移动端依旧有Web,我们在朋友圈看到的所有H5活动、第三方内容等,都是依托网页实现。网站的数据分析依旧有存在空间,网站的数据指标还是能够指导我们运营!
第9本《深入浅出Python》
还是深入浅出系列,完全适合零基础的新人。需要注意的是,编程学习不同于其他知识,如果计算机基础不稳固,在使用中会遇到各类问题。知其然不知其所以然!
第10本《Python学习手册》
对于拥有编程基础的人,这本书系无巨细的有些啰嗦,不过对新人,可以避免不必要的坑。把它当作一本工具文档吧,当遇到不理解的内容随时翻阅。
第11本《利用Python进行数据分析》
这本书是你学习python不二之选,对着书,着重学习numpy,pandas两个包!每段代码都敲打一遍,千万行的数据清洗基本不会有大问题了。
第12本《R语言实战》
R语言的入门书籍,从数据读取到各类统计函数的使用。虽然没有涉及机器学习,依靠这本书入门R是绰绰有余了。
第13本《统计学:从数据到结论》
这本书是将R语言和统计学结合的教材,可以利用这本书再复习一遍统计知识。
第14本《深入浅出SQL》
带你进入SQL语言的心脏地带,从使用INSERT和SELECT这些基本的查询语法到使用子查询(subquery)、连接(join)和事务(transaction)这样的核心技术来操作数据库。到读完《深入浅出SQL》之时,你将不仅能够理解高效数据库设计和创建,还能像一个专家那样查询、归一(normalizing)和联接数据。你将成为数据的真正主人。
第15本《数据挖掘导论》
这本书绝对是一本良心教材,拿到手从第一章开始阅读,能看多少就看多少。但是要尽量多看点,因为此书你可能要看一辈子的~~
第16本《算法导论中文版》
本书将严谨性和全面性融为一体,深入讨论各类算法,并着力使这些算法的设计和分析能为各个层次的读者接受。算法以英语和伪代码的形式描述,具备初步程序设计经验的人就能看懂;说明和解释力求浅显易懂,不失深度和数学严谨性。
上面的书籍都是PDF版
视频教材的有:
Python入门教程完整版(懂中文就能学会)资料
Python入门教程完整版(懂中文就能学会)视频
Mysql从入门到精通全套视频教程
8天深入理解python教程
大数据Hadoop视频教程,从入门到精通
Python就业班
Python标准库(中文版)
数学建模0基础从入门到精通,全套资源
0基础Python实战-四周实现爬虫系统
麦子学院招牌课程[明星python编程视频VIP教程][200G](价值9000元)
从零基础到数据分析师,帮你拿到年薪50万!
炜心:xccx158
数据分析这个岗位可以说很宽泛很杂,从数据录入员到行业分析师专家都可以认为是数据分析,甚至一些搞数据挖掘、人工智能的都可以包括到数据分析的范畴里,但是这些工作所做的事情却相差甚远,当然待遇也天壤之别。所以大家在应聘时不要只看岗位名称,重要的是看看清岗位职责和要求。言归正传,咱们谈谈如何学习数据分析。
一、知识技能
1、学科知识:从数据分析涉及到的专业知识点上看,他包含的比较多,包含但不仅限于以下学科:
(1)统计学:参数检验、非参检验、回归分析……等
(2)数学:线性代数、微积分等
(3)社会学:主要是一些社会学量化统计的知识,如问卷调查与统计分析;还有就是一些社会学的知识,这些对于从事营销类的数据分析人员比较有帮助
(4)经济金融:如果是从事这个行业的数据分析人员,经济金融知识是必须的,这里就不多说了
(5)计算机:从事数据分析工作的人必须了解你使用的数据是怎么处理出来的,要了解数据库的结构和基本原理,同时如果条件充足的话,你还能有足够的能力从数据库里提取你需要的数据(比如使用SQL进行查询),这种提取数据分析原材料的能力是每个数据从业者必备的。此外,如果要想走的更远,还要能掌握一些编程能力,从而借住一些专业的数据分析工具,帮助你完成工作。
这些专业知识不是一时半会能够全面掌握的,学习的唯一捷径就是看书、看视频讲解,看权威的书籍、看全面的知识。学习基础知识没有一蹴即就的方法,因为基础,所以学起来会比较枯燥、比较漫长。如何你想在数据分析方面有长远的发展,希望你能在基础知识上长期坚持的学习下去。
2、软件操作:从事数据分析方面的工作必备的工具是什么,我大致罗列以下几类:
(1)分析报告类:Microsoft Office软件(excel、word、powerpoint、visio……)、水晶易表等,如果连excel表格基本的处理操作都不会,连PPT报告都不会做,那我只好说离数据分析的岗位还差的很远。
(2)专业数据分析软件:OFFICE并不是全部,要从在数据分析方面做的比较好,你必须会用(至少要了解)一些比较常用的专业数据分析软件工具,比如SPSS、SAS、R、Matlab等等,这些软件可以很好地帮助我们完成专业性的算法或模型分析。
(3)辅助工具:比如思维导图软件(如MindManager、MindMapper等)也可以很好地帮助我们整理分析思路。
在此需要说明的一点是:软件只是帮助我们完成任务的工具。并不是我们只要学好的软件操作就能很好地完成任务,因为与操作相比,如何解释最后的结果要重要的多。即使软件操作的再熟,如果看不懂结果,那跟不会才做没有两样。而看看懂结果就需要扎实的专业知识才行。
很多人都觉得,自己是文科类出身,或者对数理专业不熟悉,会很难上手数据分析。其实不是这样子的,学习数据分析,不同于程序员,它不会专门要求我们一定要掌握编程,只是理解熟悉就可以。个人的逻辑思维能力、个人兴趣所在,以及自身的决心毅力,这些才是构成一个人学成与否的关键和最重要因素。
小编觉得最重要的一点就是,我们得清楚企业对数据分析师的基础技能需求是什么。这样我们才能有的放矢。我大抵总结如下:
(1)SQL数据库的基本操作,会基本的数据管理
(2)会用Excel/SQL做基本的数据分析和展示
(3)会用脚本语言进行数据分析,Python or R
(4)有获取外部数据的能力,如爬虫
(5)会基本的数据可视化技能,能撰写数据报告
(6)熟悉常用的数据挖掘算法:回归分析、决策树、随机森林、支持向量机等
之后,怎么安排自己的业余时间就看个人了。总体来说,先学基础,再学理论,最后是工具。基本上,每一门语言的学习都是要按照这个顺序来的。
1、学习数据分析基础知识,包括概率论、数理统计。基础这种东西还是要掌握好的啊,基础都还没扎实,知识大厦是很容易倒的哈。
2、你的目标行业的相关理论知识。比如金融类的,要学习证券、银行、财务等各种知识,不然到了公司就一脸懵逼啦。
3、学习数据分析工具,软件结合案列的实际应用,关于数据分析主流软件有(从上手度从易到难):Excel,SPSS,stata,R,Python,SAS等。
4、学会怎样操作这些软件,然后是利用软件从数据的清洗开始一步步进行处理,分析,最后输出结果,检验及解读数据。
自学数据分析,难度比较大。数据分析是一种能力,无论学多久学多少,都学不完。想要快速而且更专业系统的学习,还是推荐选择学习机构,比如十方融海的数据分析课程很不错。分别说说这两种方向共同需要的技术面,当然以下只是按照数据分析入门的标准:1、SQL(数据库),我们都知道数据分析师每天都会处理海量的数据,这些数据来源于数据库,怎么从数据库取数据,如何建立两表、三表之间的关系,2、统计学基础,数据分析的前提要对数据有感知。从以上来看,入行数据分析之后会发现数据分析其实可以分为两种:一种类似产品经理、一种偏向数据挖掘,类似产品经理向更加注重业务,对业务能力要求比较高;数据挖掘向更加注重技术,对算法代码能力要求比较高。自学的话会非常难理解。因此,建议同学还是需要报班学习。想要了学习数据分析课程,推荐选择十方融海。十方融海的教师教导课程氛围轻松愉快,知识点简单易懂,教师专业、亲和使学生感受到学无止境的意义,每周都有专业的视频课、小班课、课外辅导,每个阶段都有专业的考试帮助学生了解自己的学习进度,帮助学生更好地提升个人实力和职场竞争力。
一、数据分析前世今生
近年来,越来越多的企业开始出现数据分析师这个岗位,无非可以分为技术类和非技术类,技术类要运用算法搭建模型,非技术类对模型结果进行可视化展现、数据报告撰写等。
二、数据分析的未来
不要把自己单纯地定义为一名数据分析师,企业不乏做表的(初级数据分析师)、搞模型的(高级数据分析师),财务做报表更厉害,程序员比你更容易上手。数据分析一定是一项必备技能,就和PPT、Excel一样,它是来辅助你工作的,而不是你工作的全部。
三、学习路线
技术:
Excel
SQL
Python/Spss
可视化
理论:
数据分析思维和方法
统计学
对业务的理解
四、推荐书籍/网站
1、Excel学习:
没有什么推荐的书籍和网站,网上有很多大神的教程,如果时间充裕,就系统的学习一下,如果时间紧张,就用临阵用度娘也是可以解决问题的,当然,学什么都最好能够系统地学习。要记住一点,我们是用Excel进行数据分析的,所以应当从数据获取、数据处理、数据分析和输出几个方面来学习Excel。
2、SQL学习
建议在B站找视频观看,有很多,我们就有同名号定期上传学习视频哦。如果想要练习的话,可以从SQLZoo去练习,在线版的SQL练习教程。书的话《SQL必知必会》还不错,很精简,基本可以满足日常表的查询和维护了,想要不仅满足于查询的话,还可以参考《深入浅出MySQL》,数据库开发、优化与管理,600多页。
3、Python学习
对于非程序员出身的新手小白来说入门很简单,精通还是不容易的。如果你仅仅是停留在用Python进行数据处理和分析的阶段上,建议《利用Python进行数据分析》这本书非常不错,不要去学python开发、python编程之类的书,Python可以用来做很多事情,但对于数据分析师而言,我们可能不需要用Python来开发什么游戏、网站等,我们只需要进行数据控制、处理、整理和分析即可,系统地学一下python中的数据科学库是非常有必要的,如:Numpy、pandas等。
4、可视化
有很多可视化的工具,用Excel可以实现可视化,powerBI、Tableau、Python也可以可视化。工具的选择是一方面,另一方面是对于图表的理解,什么场合适用什么样的图表。
用Excel做排列图
5、数据分析的思维和方法
参考书籍《深入浅出数据分析》,把道理方法讲的很透彻的一本书,对于深入理解底层逻辑很友好。《谁说菜鸟不会数据分析》系列,主要是对于方法和工具使用的学习。可参考之前的文章 数据分析方法论 来大概了解。
6、统计学
《深入浅出统计学》非常棒的一本书,对于统计学的基本概念的解释非常直白到位,让小白能够清楚地理解这个公式为什么是这样子的,而不是直接摆公式。底层逻辑明白后,可以参考李航的《统计学习方法》,这是大学课本,有时间的话还是应该好好研究一下系统逻辑的。
7、对业务的理解
推荐《数据挖掘与数据化运营实战》,这本书对业务与数据分析怎么结合有很详细的说明和实例。
第一方面是数学基础,第二方面是统计学基础,第三方面是计算机基础。要想在数据分析的道路上走得更远,一定要注重数学和统计学的学习。数据分析说到底就是寻找数据背后的规律,而寻找规律就需要具备算法的设计能力,所以数学和统计学对于数据分析是非常重要的。
而想要快速成为数据分析师,则可以从计算机知识开始学起,具体点就是从数据分析工具开始学起,然后在学习工具使用过程中,辅助算法以及行业致死的学习。学习数据分析工具往往从Excel工具开始学起,Excel是目前职场人比较常用的数据分析工具,通常在面对10万条以内的结构化数据时,Excel还是能够胜任的。对于大部分职场人来说,掌握Excel的数据分析功能能够应付大部分常见的数据分析场景。
在掌握Excel之后,接下来就应该进一步学习数据库的相关知识了,可以从关系型数据库开始学起,重点在于Sql语言。掌握数据库之后,数据分析能力会有一个较大幅度的提升,能够分析的数据量也会有明显的提升。如果采用数据库和BI工具进行结合,那么数据分析的结果会更加丰富,同时也会有一个比较直观的呈现界面。
数据分析的最后一步就需要学习编程语言了,目前学习Python语言是个不错的选择,Python语言在大数据分析领域有比较广泛的使用,而且Python语言自身比较简单易学,即使没有编程基础的人也能够学得会。通过Python来采用机器学习的方式实现数据分析是当前比较流行的数据分析方式。
对大数据分析有兴趣的小伙伴们,不妨先从看看大数据分析书籍开始入门!B站上有很多的大数据教学视频,从基础到高级的都有,还挺不错的,知识点讲的很细致,还有完整版的学习路线图。也可以自己去看看,下载学习试试。
如何自学数据分析
第1本《谁说菜鸟不会数据分析入门篇》
很有趣的数据分析书!基本看过就能明白,以小说的形式讲解,很有代入感。包含了数据分析的结构化思维、数据处理技巧、数据展现的技术,很能帮我们提升职场竞争能力。找不到工作的,学好了它,自然没问题。
第2本《拯救你的Excel数据的分析、处理、展示(动画版)》
一本用手机看的Excel操作书,大部分例子都配置了二维码,手机扫扫就能看,基本上可以躺着把书学了。所有数据的分析、处理也都带了职场范例(有会计、HR、销售场景),很贴合实际。拯救我们小白的Excel,职场加薪不是梦想!
第3本《Excel图表之道:如何制作专业有效的商务图表》
职场大牛的书,教我们做图表的,好看到不能再好看。可以设计和制作达到杂志级质量的、专业有效的商务图表。相信平时我们很难做到吧,看了你就知道,也许一切没那么难。
第4本《绝了!Excel可以这样用:数据分析经典案例实战图表书》
挺好的一个系列,都是Excle常用的技巧,适合销售和HR。也是职场故事,很接地气,带视频的,全都是Excel数据分析的常用理念和方法。
第5本《深入浅出数据分析》
深入浅出系列是对新手非常友好的丛书,用生动但啰嗦的语言讲解案例。厚厚的一本书翻起来很快。本书涉及的基础概念比较广,包含一点统计学知识,学下来对数据分析思维会有一个大概了解。
第6本《MySQL必知必会》
如果真想买书看,可以看这本,适合新手向的学习,看基础概念和查询相关的章节即可。网络上大部分MySQL都是偏DBA的。
第7本《深入浅出统计学》
大概是最啰嗦的深入浅出系列,从卖橡皮鸭到赌博机的案例,囊括了常用的统计分析如假设检验、概率分布、描述统计、贝叶斯等。
第8本《网站分析实战》
互联网不再是网站的天下,但是移动端依旧有Web,我们在朋友圈看到的所有H5活动、第三方内容等,都是依托网页实现。网站的数据分析依旧有存在空间,网站的数据指标还是能够指导我们运营!
第9本《深入浅出Python》
还是深入浅出系列,完全适合零基础的新人。需要注意的是,编程学习不同于其他知识,如果计算机基础不稳固,在使用中会遇到各类问题。知其然不知其所以然!
第10本《Python学习手册》
对于拥有编程基础的人,这本书系无巨细的有些啰嗦,不过对新人,可以避免不必要的坑。把它当作一本工具文档吧,当遇到不理解的内容随时翻阅。
第11本《利用Python进行数据分析》
这本书是你学习python不二之选,对着书,着重学习numpy,pandas两个包!每段代码都敲打一遍,千万行的数据清洗基本不会有大问题了。
第12本《R语言实战》
R语言的入门书籍,从数据读取到各类统计函数的使用。虽然没有涉及机器学习,依靠这本书入门R是绰绰有余了。
第13本《统计学:从数据到结论》
这本书是将R语言和统计学结合的教材,可以利用这本书再复习一遍统计知识。
第14本《深入浅出SQL》
带你进入SQL语言的心脏地带,从使用INSERT和SELECT这些基本的查询语法到使用子查询(subquery)、连接(join)和事务(transaction)这样的核心技术来操作数据库。到读完《深入浅出SQL》之时,你将不仅能够理解高效数据库设计和创建,还能像一个专家那样查询、归一(normalizing)和联接数据。你将成为数据的真正主人。
第15本《数据挖掘导论》
这本书绝对是一本良心教材,拿到手从第一章开始阅读,能看多少就看多少。但是要尽量多看点,因为此书你可能要看一辈子的~~
第16本《算法导论中文版》
本书将严谨性和全面性融为一体,深入讨论各类算法,并着力使这些算法的设计和分析能为各个层次的读者接受。算法以英语和伪代码的形式描述,具备初步程序设计经验的人就能看懂;说明和解释力求浅显易懂,不失深度和数学严谨性。
上面的书籍都是PDF版
视频教材的有:
Python入门教程完整版(懂中文就能学会)资料
Python入门教程完整版(懂中文就能学会)视频
Mysql从入门到精通全套视频教程
8天深入理解python教程
大数据Hadoop视频教程,从入门到精通
Python就业班
Python标准库(中文版)
数学建模0基础从入门到精通,全套资源
0基础Python实战-四周实现爬虫系统
麦子学院招牌课程[明星python编程视频VIP教程][200G](价值9000元)
从零基础到数据分析师,帮你拿到年薪50万!
炜心:xccx158
数据分析怎么学习呢?需要学习什么?
想要学习数据分析,首先你要知道成为一名数据分析师所需要具备的技能:
数学知识
对于初级数据分析师来说,则bai需要了解统计相关的基础性内容,公式计算,统计模型等。当你获得一份数据集时,需要先进行了解数据集的质量,进行描述统计。
而对于高级数据分析师,必须具备统计模型的能力,线性代数也要有一定的了解。
分析工具
对于分析工具,SQL 是必须会的,还有要熟悉Excel数据透视表和公式的使用,另外,还要学会一个统计分析工具,SAS作为入门是比较好的,VBA 基本必备,SPSS/SAS/R 至少要熟练使用其中之一,其他分析工具(如 Matlab)可以视情况而定。
编程语言
数据分析领域最热门的两大语言是 R 和 Python。涉及各类统计函数和工具的调用,R无疑有优势。但是大数据量的处理力不足,学习曲线比较陡峭。Python 适用性强,可以将分析的过程脚本化。所以,如果你想在这一领域有所发展,学习 Python 也是相当有必要的。
当然其他编程语言也是需要掌握的。要有独立把数据化为己用的能力, 这其中SQL 是最基本的,你必须会用 SQL 查询数据、会快速写程序分析数据。当然,编程技术不需要达到软件工程师的水平。要想更深入的分析问题你可能还会用到:Exploratory analysis skills、Optimization、Simulation、Machine Learning、Data Mining、Modeling 等。
业务理解
对业务的理解是数据分析师工作的基础,数据的获取方案、指标的选取、还有最终结论的洞察,都依赖于数据分析师对业务本身的理解。
对于初级数据分析师,主要工作是提取数据和做一些简单图表,以及少量的洞察结论,拥有对业务的基本了解就可以。对于高级数据分析师,需要对业务有较为深入的了解,能够基于数据,提炼出有效观点,对实际业务能有所帮助。对于数据挖掘工程师,对业务有基本了解就可以,重点还是需要放在发挥自己的技术能力上。
逻辑思维
对于初级数据分析师,逻辑思维主要体现在数据分析过程中每一步都有目的性,知道自己需要用什么样的手段,达到什么样的目标。对于高级数据分析师,逻辑思维主要体现在搭建完整有效的分析框架,了解分析对象之间的关联关系,清楚每一个指标变化的前因后果,会给业务带来的影响。对于数据挖掘工程师,罗辑思维除了体现在和业务相关的分析工作上,还包括算法逻辑,程序逻辑等,所以对逻辑思维的要求也是最高的。
数据可视化
数据可视化主要借助于图形化手段,清晰有效地传达与沟通信息。听起来很高大上,其实包括的范围很广,做个 PPT 里边放上数据图表也可以算是数据可视化。
对于初级数据分析师,能用 Excel 和 PPT 做出基本的图表和报告,能清楚地展示数据,就达到目标了。对于稍高级的数据分析师,需要使用更有效的数据分析工具,根据实际需求做出或简单或复杂,但适合受众观看的数据可视化内容。
协调沟通
数据分析师不仅需要具备破译数据的能力,也经常被要求向项目经理和部门主管提供有关某些数据点的建议,所以,你需要有较强的交流能力。
通过了解数据分析需要具备的技能,学习的方向也就迎刃而解了。
对于高级数据分析师,需要开始独立带项目,或者和产品做一些合作,因此除了沟通能力以外,还需要一些项目协调能力。
如何自学成为数据分析师
很多人都觉得,自己是文科类出身,或者对数理专业不熟悉,会很难上手数据分析。其实不是这样子的,学习数据分析,不同于程序员,它不会专门要求我们一定要掌握编程,只是理解熟悉就可以。个人的逻辑思维能力、个人兴趣所在,以及自身的决心毅力,这些才是构成一个人学成与否的关键和最重要因素。
小编觉得最重要的一点就是,我们得清楚企业对数据分析师的基础技能需求是什么。这样我们才能有的放矢。我大抵总结如下:
(1)SQL数据库的基本操作,会基本的数据管理
(2)会用Excel/SQL做基本的数据分析和展示
(3)会用脚本语言进行数据分析,PythonorR
(4)有获取外部数据的能力,如爬虫
(5)会基本的数据可视化技能,能撰写数据报告
(6)熟悉常用的数据挖掘算法:回归分析、决策树、随机森林、支持向量机等
之后,怎么安排自己的业余时间就看个人了。总体来说,先学基础,再学理论,最后是工具。基本上,每一门语言的学习都是要按照这个顺序来的。
1、学习数据分析基础知识,包括概率论、数理统计。基础这种东西还是要掌握好的啊,基础都还没扎实,知识大厦是很容易倒的哈。
2、你的目标行业的相关理论知识。比如金融类的,要学习证券、银行、财务等各种知识,不然到了公司就一脸懵逼啦。
3、学习数据分析工具,软件结合案列的实际应用,关于数据分析主流软件有(从上手度从易到难):Excel,SPSS,stata,R,Python,SAS等。
4、学会怎样操作这些软件,然后是利用软件从数据的清洗开始一步步进行处理,分析,最后输出结果,检验及解读数据。
如何自学成为数据分析师
数据分析师的基本工作流程:
1.定义问题
确定需要的问题,以及想得出的结论。需要考虑的选项有很多,要根据所在业务去判断。常见的有:变化趋势、用户画像、影响因素、历史数据等。
2.数据获取
数据获取的方式有很多种:
一是直接从企业数据库调取,需要SQL技能去完成数据提取等的数据库管理工作。
二是获取公开数据,政府、企业、统计局等机构有。
三是通过Python编写网页爬虫。
3.数据预处理
对残缺、重复等异常数据进行清洗。
4.数据分析与建模
这个部分需要了解基本的统计分析方法、数据挖掘算法,了解不同统计方法适用的场景和适合的问题。
5.数据可视化和分析报告撰写
学习一款可视化工具,将数据通过可视化最直观的展现出来。
数据分析入门需要掌握的技能有:
1. SQL(数据库):
怎么从数据库取数据?怎么取到自己想要的特定的数据?等这些问题就是你首要考虑的问题,而这些问题都是通过SQL解决的,所以SQL是数据分析的最基础的技能。
2. excel
分析师更多的时候是在分析数据,分析数据时需要把数据放到一个文件里,就是excel。
熟练excel常用公式,学会做数据透视表,什么数据画什么图等。
3.Python或者R的基础:
必备项,也是加分项,在数据挖掘方向是必备项,语言相比较工具更加灵活也更加实用。
4.学习一个可视化工具
如果你想往更高层次发展,上面的东西顶多只占20%,剩下的80%则是业务理解能力,目标拆解能力,根据数据需求更多新技能的学习能力。
我想转行做数据分析师,怎么入门?
需要一定的知识储备和对业务的基本了解及运用。对于希望转行数据分析的零基础小白们,在对于进入数据分析行业需要学什么、数据分析行业薪酬待遇如何、如何更好地掌握数据分析领域的技能,都是一脸茫然。因此本文给出一些建议,针对想要转行数据分析行列且是零基础转行的小伙伴们。
一、知识储备
数据分析作为一门交叉学科,需要掌握多方面的知识。
数学与统计基础,数据分析是指运用统计方法和分析工具对大量数据进行分析,挖掘出其潜在规律及价值,为经营决策提供科学严谨的理性依据。其中当然离不开数学与统计学的知识,需要有微积分、线性代数、概率论与数理统计等相关的知识储备才行。
数据的存储便离不开使用数据库,需掌握SQL数据库语言在关系型数据库系统中进行增删改查等操作才行。数据分析的进阶需要会使用一门或多门编程语言,如Python和R,这将会使你的数据分析变得更加高效。如果需要的话可以学习常用的分类、回归、聚类和降维等的常用算法以及它们的优缺点和使用场景,这将是你转行进入公司的加分项哦。
二、行业分析
在学习数据分析的知识方面也不能落下对各个数据岗位的了解,接下来介绍数据分析行业中岗位,大致分为四个方向:数据分析、数据挖掘、数据开发、数据产品。
数据分析师从事数据采集、整理、分析,发现问题,分析问题,得出结论,为公司的决策层提供数据支持。偏向于业务。数据挖掘工程师或者算法工程师利用模型训练数据,从海量数据中挖掘规律,预测或分类对象,主要偏向编程和算法,对统计理论知识要求偏高。数据开发工程师设计、搭建并维护基础设施,以提供数据收集、存储、处理、计算等平台。偏代码开发,需要在代码能力上弥补,但与纯技术栈的程序员相比需要一定的业务逻辑。
三、心态历练
1、一定要用细心、耐心、和平静的心态去做数据分析。数据分析是个细活,根据二八原则,其中数据的处理将占去数据分析中的八成时间,如果数据处理不当将影响接下来的分析,需要良好的心态减少犯错误的概率。
2、具有独立思考与换位思考的能力。数据分析并不仅仅是为了完成一些业务上面的数据需求和论证。数据分析者应该在理解业务的基础上,要有自己独特的见解,扩大自己的思考范围,提升洞察力。同时要换位思考,从多角度看待数据和使用数据。不同的人,不同的角度看问题都能得到不同的效果。
注意事项:
1、互联网本身具有数字化和互动性的特征,这种属性特征给数据搜集、整理、研究带来了革命性的突破。以往“原子世界”中数据分析师要花较高的成本(资金、资源和时间)获取支撑研究、分析的数据,数据的丰富性、全面性、连续性和及时性都比互联网时代差很多。
2、与传统的数据分析师相比,互联网时代的数据分析师面临的不是数据匮乏,而是数据过剩。因此,互联网时代的数据分析师必须学会借助技术手段进行高效的数据处理。更为重要的是,互联网时代的数据分析师要不断在数据研究的方法论方面进行创新和突破。
3、就行业而言,数据分析师的价值与此类似。就新闻出版行业而言,无论在任何时代,媒体运营者能否准确、详细和及时地了解受众状况和变化趋势,都是媒体成败的关键。
4、此外,对于新闻出版等内容产业来说,更为关键的是,数据分析师可以发挥内容消费者数据分析的职能,这是支撑新闻出版机构改善客户服务的关键职能。
自学转行数据分析类岗位需要掌握哪些知识框架?
Excel
Excel这个不必说了吧,一定是是数据分析师必须学的工具之一。目前只要做过数据分析的用户基本上都绕不过Excel。它以强大的公式函数图形能力、应用动态的透视表分析、简洁的操作界面受到喜爱。如有兴趣的用户可以学习的更加深入一点,把Excel的可视化图表、宏等知识都掌握。
SQL
这里的SQL包括两种,一是SQL工具,二是SQL语句。SQL工具是进行数据统计最基础的工具,学会SQL工具我们可以用SQL语句来查询获取数据,这样就可以进行数据的分析了。通常我们认为Excel可以应对较少数据的分析,而SQL工具可以应对较多数据。
Python
编程类数据分析,可以对一些非结构化的数据进行处理。学习Python,可以开阔视野,如果遇到一些数据模型、算法之类的项目,学习Python就可以避免无从下手的尴尬局面。
行业知识
数据分析师工作最终的目标就是通过对数据的分析和帮助企业来解决问题,实现业绩增长。所以一定要对相关的业务一定的能力。数据分析师需要掌握企业拥有的产品、企业的客户、所属行业的市场情况和地位等信息,还需要掌握本公司数据分析目前所属的阶段和具体的情况,业务瓶颈在哪里等等。掌握这些内容才能更好地把握企业的整体运营情况,对企业的数据分析进行指导,辅助企业进行运营决策。
BI产品
随着数据的增长,业务的发展,越来越多的公司认识到BI产品的真要性,开始采购BI产品。因此,数据分析师还需要掌握至少一种BI产品的使用才行。目前市场比较流行的BI产品有Tableau、Smartbi等。其中Smartbi产品是一站式大数据分析平台,一个产品涵盖BI分析的所有阶段,而且它的报表功能是基于Excel来实现的,对于初学者来说,在熟悉的界面进行数据分析,可以节省学习成本。
数据分析类岗位有两个大的职业方向选择:业务方向和技术方向。
业务方向的数据分析岗位可以从初级数据分析师入手,逐渐成长为业务负责人;而如果你更偏好技术性工作,那么数据相关岗位中可以选择数据挖掘工程师、大数据开发工程师、数据建模师。无论选择哪一种岗位,数据分析能力都是对求职者最基础的要求。正确规划数据分析学习路径从而自学,也要从数据分析能力入手,学习的内容包括但不限于数据分析思维、统计学知识、数据分析技术、数据建模能力以及可视化能力。
一、数据库语言SQL
SQL语言作为一门编程语言,是数据分析师的必备能力,也是数据分析师必须要熟练掌握的基本功,可以作为数据分析的入门学习内容之一。对于SQL语言的编程基本特性,初学者们首先需要掌握基础的查询语句,从而进行复杂查询的学习。学习期间,不要忘了穿插各类函数的使用,如聚合函数、数值函数等。基于不同数据库,SQL语法可能会略有差异,但不会影响我们对基本功的掌握。
二、统计学基础
统计学是数据分析的理论基础,描述性统计以及各类统计图表的使用也早已深入到数据分析师的工作日常。在数据分析师的工作场景中,日常的基础原理便是统计学中的假设检验分析方法。此外,在后期的学习过程中,良好的统计学基础也可以为机器学习内容做铺垫。
三、机器学习
机器学习更多作为数据建模师和数据科学家的必要能力,在日常工作中常和语言混合应用,对数据及属性进行预测和分类。对于初级数据分析师来说,机器学习知识并不是工作场景中的必要内容,但对于高级数据。分析师来说,掌握机器学习却是必经之路。此外,在现阶段数据分析的笔面试过程中,机器学习基础知识往往作为必要考点出现。因此在机器学习阶段,求职者们可以借用学习一些基础的算法。
自学数据分析需要看哪些书的
一、整体了解数据分析——5小时
新人们被”大数据“、”人工智能“、”21世纪是数据分析师的时代“等等信息吸引过来,立志成为一名数据分析师,于是问题来了,数据分析到底是干什么的?数据分析都包含什么内容?
市面上有很多讲数据分析内容的书籍,在此我推荐《深入浅出数据分析》,此书对有基础人士可称消遣读物, 但对新人们还是有一定的作用。阅读时可不求甚解,重点了解数据分析的流程、应用场景、以及书中提到的若干数据分析工具,无需纠结分析模型的实现。5个小时,足够你对数据分析工作建立初步的印象,消除陌生感。
二、了解统计学知识——10小时
15个小时只够你了解一下统计学知识,作为入门足够,但你要知道,今后随着工作内容的深入,需要学习更多的统计知识。
本阶段推荐书籍有二:《深入浅出统计学》《统计学:从数据到结论》,要了解常用数理统计模型(描述统计指标、聚类、决策树、贝叶斯分类、回归等),重点放在学习模型的工作原理、输入内容和输出内容,至于具体的数学推导,学不会可暂放一边,需要用的时候再回来看。
三、学习初级工具——20小时
对于非技术类数据分析人员,初级工具只推荐一个:EXCEL。推荐书籍为《谁说菜鸟不会数据分析》,基础篇必须学习,提高篇不一定学(可用其他EXCEL进阶书籍),也可以学习网上的各种公开课。
本阶段重点要学习的是EXCEL中级功能使用(数据透视表,函数,各类图表适用场景及如何制作),如有余力可学习VBA。
四、提升PPT能力——10小时
作为数据分析人员,PPT制作能力是极其重要的一项能力,因此需要花一点时间来了解如何做重点突出,信息明确的PPT,以及如何把各类图表插入到PPT中而又便于更新数据。10个小时并不算多,但已经足够(你从来没做过PPT的话,需要再增加一些时间)。具体书籍和课程就不推荐了,网上一抓一大把,请自行搜索。
五、了解数据库和编程语言——10小时
这个阶段有两个目标:学习基础的数据库和编程知识以提升你将来的工作效率,以及测试一下你适合学习哪一种高级数据分析工具。对于前者,数据库建议学MySQL(虽然Hadoop很有用但你不是技术职位,初期用不到),编程语言建议学Python(继续安利《深入浅出Python》,我真没收他们钱……)。数据库学到联合查询就好,性能优化、备份那些内容用不到;Python则是能学多少学多少。
六、学习高级工具——10小时
虽然EXCEL可以解决70%以上的问题,但剩下30%还是需要高级工具来做(不信用EXCEL做个聚类)。高级分析工具有两个选择:SPSS和R。虽然R有各种各样的好处,但我给的建议是根据你在上一步中的学习感觉来定学哪一个工具,要是学编程语言学的很痛苦,就学SPSS,要是学的很快乐,就学R。不管用哪一种工具,都要把你学统计学时候学会的重点模型跑一遍,学会建立模型和小幅优化模型即可。
七、了解你想去的行业和职位——10+小时
这里我在时间上写了个”+“号,因为这一步并不一定要用整块时间来学习,它是贯穿在你整个学习过程中的。数据分析师最需要不断提升的能力就是行业和业务知识,没有之一。你将来想投入哪个行业和哪个职位的方向,就要去学习相关的知识(比如你想做网站运营,那就要了解互联网背景知识、网站运营指标体系、用户运营知识等内容)。
八、做个报告——25小时
你学习了那么多内容,但现在出去的话你还是找不到好工作。所有的招聘人员都会问你一句话:你做过哪些实际项目?(即使你是应届生也一样) 如果你有相关的项目经验或者实习经验,当然可以拿出来,但是如果没有,怎么办?答案很简单,做个报告给他们看,告诉招聘者:我已经有了数据分析入门级(甚至进阶级)职位的能力。同时,做报告也会是你将来工作的主要内容,因此也有可能出现另外一种情况:你费尽心血做了一个报告,然后发现这不是你想要的生活,决定去干别的工作了……这也是件好事,有数据分析能力的人做其他工作也算有一项优势。
21世纪不用那么执着于书本,可以多试试几个数据分析的软件啊,像大数据之类的,还有表单大师专门对数据制作报表管理的就可以
第一大类:理论类。 理论层面的书籍,比如《大数据时代》 、《数据之巅》 。
第二大类:技术类。 技术层面的书籍,比如《Hadoop技术内幕》系列。这一类的书籍,主要是指系统技术类,在构建大数据系统时,系统如何运作,各系统组件的设计目标、框架结构、适用场景、工作原理、运作机制、实现功能等等。这类书籍,适合于IT系统部,开发部的技术人员。他们需要明白系统的运作机制,利用系统来实现大数据的应用开发,以及系统运维优化等。
第三大类:应用类。 应用层面的书籍,比如《数据挖掘技术》 、《基于SPSS的数据分析》等等。 这一类的书籍,主要是指应用技术类,告诉你如何应用工具和方法,从海量数据中提取有用的信息,来解决真实的业务问题。这类书籍,适合于业务部门、市场营销部门及与业务结合比较紧密的人员。他们更关注业务问题的解决,围绕业务问题来构建分析和解决方案。