()
一、数据从哪里来?
当你迷茫的时候,会问自己3个问题:
我从哪里来?
我要到哪里去?
我的人生价值是什么?
我们把这3个问题对应到数据上就是:
我从哪里来(数据从哪里来)
我要到哪里去(数据放在哪里)
我的人生价值是什么(数据有什么用)
要回答这3个问题,就不得不提到大数据家庭里的3个兄弟姐妹:数据收集、数据工程、数据分析。
它们之间是像下图这样协作的。
下面我们来分别看下,什么是数据收集、数据工程、数据分析。
1.数据收集
俗话说「巧妇难为无米之炊」,没有米是做不出米饭的,同样的,没有数据是没办法分析的。数据收集就是负责采集数据,解决「数据从哪里来的问题」。一般数据来自以下几种途径:
1)日常业务积累下来的数据。
日常业务中会产生数据。例如为了调查用户对产品的使用意见,公司制作了「用户满意度」表格让用户来填写,最后把收集到的数据保存到Excel表格里。如果你在公司里报销过,那么你报销的数据会被财务人员填写到财务系统里,这样这样日积月累下来就是财务数据。
2)通过埋点来获取数据
埋点顾名思义就是埋伏地点,是指在产品中提前规划好在哪个地方想获取到什么数据。例如,某款电商App,为了采集到用户点击收藏按钮的次数,需要提前使用技术手段在收藏按钮的地方(埋伏地点)规划好,这样就可以获取到对应的数据。
3)爬虫
当工作中没有需要的数据,又必须要从网上采集一些数据时,这时候就可以利用爬虫模拟浏览器打开网页,获取网页中我们想要的那部分数据。
2.数据工程
收集来的数据放在哪里呢?这就是数据工程干的事情,也就是使用技术手段把收集的数据以最优的方式存储起来,方便后面使用数据。一般是把数据存放到数据库中。
那什么是数据库呢?米缸是用来放大米的地方。同样的,数据库是存放数据的地方。正是因为有了数据库后,我们可以直接查找数据。例如你每天使用微信零钱通看自己的账户收益,就是从数据库中读取数据(收益)后给你的。只不过,你每天看到的是微信零钱通的前端可视化页面,你看不到的是后台存放数据的数据库。
3数据分析
一堆数据存放在那里是没有价值的,需要应用起来,这就是数据分析干的事情,也就是通过分析数据来解决业务问题。例如,本周发现新增用户数比上周减少10%,为什么减少?这就需要通过分析数据来解决。
如果把数据比如米的话,数据收集就是从稻田里找到米,数据工程就是把米放到米缸里存放好,数据分析就是从米缸里拿出米做出香喷喷的米饭。
二、什么是数据分析?
从「是否会数据分析」这个维度,可以把人分为两类。
不会数据分析的人,生活或者职场里在遇到问题,是「我觉得、我认为」这种个人经验的思维模式。
而会数据分析的人,是「通过数据发现」这种用数据说话的思维模式。
在数据时代,你愿意成为哪一种人呢?
数据分析作为一门科学被正式地提出来,是统计学家JohnW.Tukey在1962年的文章《TheFutureofDataAnalysis》里边提到:「数据分析以及其中的统计学知识,必须具有科学的特征而不是数学特征,数据分析本质上是一种经验科学。」
统计学家JohnW.Tukey
在《云计算与大数据》一书中,对数据分析的定义是:用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。
这样的学术语言来描述一个陌生的知识,其实会很多人会更加迷惑。
如何通俗易懂的理解什么是数据分析呢?我们重点来看上面这句话里的「数据分析本质上是一种经验科学」。
在之前数据匮乏的年代,人类依据的是个人之前的经验来得出结论。比如」燕子低飞要落雨「,这是古人总结出来的经验,依靠这个经验来判断是否要下雨。
现在我们进入了大数据时代,数据越来越多,过去靠「个人经验」就变成了「依靠数据」来得出结论。所以,现在天气预报是否下雨,不再是依据古人那种「个人经验」,而是通过获得的地面数据和高空数据,然后分析这些数据,最后得出是否要下雨的结论。
请勿开启浏览器阅读模式,否则将导致章节内容缺失及无法阅读下一章。
相邻推荐:职场青年进阶指南:6 大维度全面提升个人竞争力 凶案再现:全球重案现场还原手记 学好股票投资:轻松跑赢通胀 猛龙过江:拳手李景亮的战役 满门炮灰读我心后,全家造反了 在拼多多开店:中小卖家运营实战指南 2021 相机推荐与选购:这款相机该不该买?看看硬核摄影科普 空中浩劫:8 场震惊世界的致命危机 危机时刻:重返灾难现场 真爱至上:决绝复仇、温馨脑洞和最纯的爱 一切爱情都为时不晚 面试官的自我修养:快速提升识人技能 所爱隔山海:娘子!你怎么这么能跑! 生而不凡 在外太空和女孩子贴贴 PPT 演讲力:关键时刻,不要输在表达上 红颜宰辅:大唐女官养成记 阿耐职场四部曲 嫡女归来兮:真假千金的较量 迎男而上:她们都撩到了高冷男神