数据源:
- 妈妈产前产后用品行业数据2016-2017;
- 孕妇枕搜索数据;
- 孕妇装-孕产妇用品-营养行业数据2016-2017;
- 护腰枕品牌数据2016-2017;
- 护腰枕属性数据2016-2017;
在进行数据分析之前,我们需要先了解一下,数据分析的整体步骤。只有了解了整体步骤,思维才能更加清晰、更具有逻辑性、目的性的去做分析,而不至于对每个分析点都浅尝辄止,没有分析到位,这就会导致我们找不出问题发生的根本原因。我们需要找出问题的本质原因,然后寻找解决方案,这才是数据分析的目的。 数据分析整体步骤:
- 确定项目需求。在公司的数据分析职位需要跟业务人员、运营人员、甚至是数据管理相关人员进行沟通,确定业务部门的需求,对项目需求 进行分析。之后需要将分析结果与相关人员进行沟通,是否有分析不到位或者是有误的地方,哪些地方是他们不需要的,哪些地方需要更改,还有什么需要补充等等,这些都是我们需要考虑的问题。当然了,沟通将会贯穿整个数据分析的过程。在此说一句题外话,个人硬技术能力和表达能力实在是一个人能否走得远的主要技能。所以,平时大家一定要学习和锻炼自己这方面的能力,如果你只是个人技术能力比较强,你可以成为某个行业的大牛,但是,你表达能力不强的话,就没有办法去带领大家打天下,因为你说不出来,别人不知道你在想什么,怎么跟随你,怎么知道你是否是可靠的。如果个人硬实力和表达能力都很好,那就可以带团队。那就可以上一个层级了呀,铁子们!拿出你们忽悠对象的本事,去忽悠~哈哈哈,表达能力顿时上来了。
- 言归正传,第二点,收集数据。你可以从公司的业务部门获取数据,或者是跟数据管理人员沟通,从数据库中获取数据。当然了,如果公司没有的话,你就可以通过爬虫或者是八爪鱼等工具获取网络数据。在你获取数据之后,需要对数据进行相应的业务理解(就是我们能对这些数据做什么分析,了解哪些字段是不需要的,我们好在接下来的数据清洗阶段进行删除),进行数据的清洗预处理(包括空值、重复值、异常值的处理。如果数据维度太少,你需要进行增维,这是为了我们的结果更具有准确性,保证我们的结果是在一定数据量的基础上得出的。如果数据量太少的,不能排除会有某些偶然因素的影响,只有在较大数据量的支持下,我们的结果才会更有说服力。)
- 数据建模。当PowerBI自动检测出两表之间存在模型关系的时候,它会自动创建模型,但它所创建的模型并不一定就是我们需要的,在我们创建表之间的关系的手,我们会主观的考虑多表之间的连续建模。其中箭头指向的就是多端的数据,我们可以在一端调用多端的数据。
- 数据计算。PowerBI中的数据计算包括数据分析指标涉及的度量值、新列。
- 数据分析。这一部分会涉及到数据透视表和数据透视图。其实,二者在Excel中也会经常使用到,算是职场人员的必备小技能了。
- 数据可视化。在PowerBI中可以使用以下界面完成可视化操作,操作起来非常方便呢。我们可以利用右边栏目中的可视化图形进行可视化展示。这里需要注意的一点就是,这些图形能够展示的数据信息是有差别的,一定要选择正确的图标表达你要说明的问题。
这里我们针对图标来一个简单的说明: (1)柱形图、条形图:它能够表达元素之间的对比; (2)环形图、饼图、面积图:它能够表达的就是占比、比例; (3)折线图:它能够表示的就是随时间的变化,指标的走势、趋势; (4)散点图:它可以表达指标之间的相关关系,这一点可以在我们的平时网购中就可以看出来,商品的销售量与销售额或者说单价与品牌、主播(带货一哥)的影响力都是有关的; (5)组合图:比如折线图和柱形图经常会一起使用。比如,在我们在对数据进行帕雷托图分析的时候回用到。 另外,附上一个超级详细的图表,自己好好消化…祝你早日飞升“数据分析上神”… - 最后一点,整理分析报告(尤其是结果以及建议)。如果你前面的几点都做的非常完美,无可挑剔,但是你最后这个竟然没有做,那我只能遗憾的告诉你:铁子,你只做了你该做的事,最重要的能够让你升职加薪,展现价值的事儿,你没做…
接下来,我们对数据进行简单的可视化分析… 可以留言互相交流,最近,准备组织一个数据分析、人工智能、计算机视觉群进行学习交流,有意向的铁子们可留言~~让我们在小白的路上渐行渐远吧~
|