网站首页
手机版

大数据分析与传统统计分析的区别

更新时间:作者:佚名

大家好,今天来为大家分享大数据分析与传统统计分析的区别的一些知识点,和的问题解析,大家要是都明白,那么可以忽略,如果不太清楚的话可以看看本篇文章,相信很大概率可以解决您的问题,接下来我们就一起来看看吧!

大数据分析与传统统计分析的区别:首先,数据分析不再采用抽样,而是采用全样本(n=all);其次,分析方法不再采用传统的假设检验。

1、统计方法:

大数据分析与传统统计分析的区别

基于一般统计方法的中值定理和大数定律表明,我们可以增加样本量并多次提取样本,以使结果更加准确。但得出这个结论的条件是所有样本的提取都满足i.i.d。 (独立同分布,即假设变量分布独立同分布),而这个假设在现实中很难满足。样本的选择很难做到完全随机。一般业务案例中采用的以数位为间隔选取样本的方法,不能满足统计意义上的随机要求,所得到的结果不可避免地存在误差。

同样,对于多大的样本才算足够大也存在争议。大数据可以直接利用全样本(总体)进行分析,消除这部分造成的误差。

2、分析方法:

传统的分析方法是对需要回答的问题做出一定的假设,比如教育背景对购买保险金额的影响,然后在基于这个假设抽取的样本上进行检验。检验假设的方法充满了实际数据无法满足的先决假设,例如最著名的正态分布。正态分布是一个很好的假设,因为它简化了计算,并且通过对数据的各种变形,基本上可以将其视为一定置信区间内的正态分布。

第三,假设检验的结果只能否定原假设,而不能得出完全支持的结论。

但大数据的情况就不同了。在分析大数据时,我们不需要对问题提出假设,而是利用算法来寻找变量之间的相关性。在上面的例子中,如果教育背景和保险购买金额两个变量之间的相关性很高(例如接近1),那么保险公司应该更加注重向教育背景较高的人销售保险。

大数据的应用可以说减少了人类在处理数据时带来的主观假设的影响,而完全依靠数据之间的相关性来阐述。由于消除了人为因素引入的误差,分析师的假设受到了限制(如果教育背景和保险购买金额相关,而分析师没有预料到,那么就不会分析出这个结论,这在实际案例中很容易出现)。大数据的核心在于它能够更充分地挖掘数据的全部真实含义。

原文链接:

https://www.zhihu.com/question/23273263/answer/90758820

推荐:

【中国风动漫】除了《哪吒》,这些良心国产动画也应该被更多人知道!

人工智能产业链联盟

为您推荐

《内部审计实务》大数据统计分析方法及其应用

文章来源:中国内部审计协会微信公众号以A商业银行基于信贷担保模式的小微企业信贷创新效果评价审计调查项目为例,审计A商业银行是否有效履行了社会责任,是否有效提升了

2025-12-14 01:59

@艺考生:2022年1月5日起,可查询省统考笔试成绩

顶端新闻·河南商报记者 马俊峰@艺考生,查询省统考笔试成绩的日期定了!12月7日,顶端新闻·河南商报记者从河南省教育考试院了解到,应届高三艺考生在省统考笔试结束

2025-12-14 01:58

重的!艺术统考成绩可以查,附一点分表→

刚刚,山东省教育招生考试院发布了2024年艺术类统考成绩,考生可扫描下方二维码查询成绩。扫码查询成绩成绩查询时间为:成绩发布当日发布之时至21:00,2月1日至

2025-12-14 01:58

重的!艺术统考成绩可查询,分值表即将公布!

成绩查询:山东省2024年普通高等学校招生艺术类专业统一考试成绩查询艺术类统考各类划线情况一分一段表扫描二维码 即可查看一分一段表

2025-12-14 01:57

绍兴又一所学校即将整体搬迁!

日前,绍兴市公共资源交易网上发布《耀华建设管理有限公司关于绍兴市职业教育中心(绍兴技师学院)学校整体搬迁项目的公开招标公告》,这意味着绍兴市职业教育中心(绍兴技

2025-12-14 01:57

绍兴2024年普通高中录取分数线公布

2024年嵊州市普高录取分数线说明:1.嵊州中学、马寅初中学的分配生按《嵊州市2024年高中招生实施意见》中的相关规定录取。2.各普高于7日前将录取信息通知考生

2025-12-14 01:56