数据分析之描述性统计

12 篇文章 0 订阅
订阅专栏

当我们打开一份有十几列,几万行的明细数据时,那种感觉我相信用铺天盖地、头晕目眩来形容是再合适不过了。

面对如此令人崩溃的场景,必须要求我们要求能够快速找到数据的特征。描述性统计正是为此而生,它通过几个简单的分析方法就能在几秒钟内提取出指标背后的数据特征,快速建立整体全面的认知,并帮助我们寻找到分析的突破口。

为了能够高效的发现数据的特征,描述性统计为我们提供了三个非常有用的分析工具,分别是:

  • 中位数/平均数

  • 方差/标准差

分析工具1:用中位数和平均数分析数据分析布情况

平均数一般包括算数平均数和几何平均数:

        算数平均数:适用于指标是绝对值的数据;比如(1+2+3+4)/4

        几何平均数:适用于指标是百分比的数据。比如 (11%+12%+13%+14%)开5次方

中位数和平均数一般结合着使用。先看下面一组数据。

  • 产品 A 的日均销售额为 281.11,每日销售额的中位数是 234,即平均数大于中位数。
    意味着产品 A 的每日销售额偏高的居多,可能是产品 A 的客单价较高,可能是某一天的销售额很高,拉高了平均数。

  • 产品 B 的日均销售额为 281.11,每日销售额的中位数是 315,即平均数小于中位数。
    意味着产品 B 的每日销售额偏低的居多,可能是产品 B 的客单价较低,可能是某一天的销售额很低,拉低了平均数。

分析工具 2:用“方差和标准差”来分析指标的波情况

方差,是指数据的离散程度,是一组数据与这组数据平均数之差的平方值的平均数;而标准差,是方差的开方值。

  • 方差和标准差代表了业务指标的波动情况,即业务稳定性的高低,也即业务经营风险的大小;

  • 当方差和标准差变大,意味着指标波动变大,业务稳定性降低,业务经营风险升高;

  • 当方差和标准差变小,意味着指标波动变小,业务稳定性升高,业务经营风险降低;

 我们用方差来计算,分别计算这三个渠道的每日获客量的方差和标准差:

  • 渠道 A 的每日新增用户数的方差是 305.6,标准差是 17.48;

  • 渠道 B 的每日新增用户数的方差是 834.6,标准差是 28.89;

  • 渠道 C 的每日新增用户数的方差是 630.6,标准差是 25.11。

我们发现:因为渠道 B 的每日新增用户数方差和标准差最大,可以认为在这 3 个渠道中,渠道 B 的获客能力波动最大,稳定性最差,后续的风险也在 3 个渠道中最高(相对),接下来的运营需要更多的关注渠道 B 的运营情况;而渠道 A 和渠道 C 的获客能力相对波动较小,获客较稳定,保持中优先级的关注即可。

最后附上wps的操作,公式-》插入函数-》搜索相应的函数代码

中位数:median

算术平均数:average

几何平均数:GEOMEAN

方差:VAR

标准差:STDEVPA

 

数据描述性统计
weixin_43992800的博客
07-21 3384
数据描述性统计 标签(空格分隔): 对数据描述性统计主要是指对结构化数据描述分析,可从三个维度进行分析数据的集中趋势、数据的离散程度和数据的分布形态。 描述数据集中趋势的指标有:众数、中位数、平均数(包含算数平均数、加权平均数、集合平均数)和分位数。 描述数据的离散程度的指标有:方差、标准差、极差和平均差(数值型数据);四分位差(顺序数据);异众比率(分类数据);离散系数 (相对离散程度)...
统计学之数据描述性统计(基础)
aimian8731的博客
07-21 1695
数据描述性统计 一篇笔记,至少我还在努力 目录: 数据的集中趋势: 众数,中位数,平均数,分位数,极差 算术平均数,加权平均数,几何平均数 数据的离中趋势: 数值型数据:方差,标准差,极差,平均差 顺序数据:四分位差 分类数据:异众比率 相对离散程度: 离散系数 分布的形状: 偏态系数,峰态系数 描述性统计...
描述数据分析
qq_21961655的博客
03-21 411
拿到一个新的数据集,当搞清楚变量后,首先应该做的就是描述数据分析啊!!!到后来再返工就都忘记了啊
数据分析师一定要掌握的基础——描述性统计分析
01-21
以下博客内容讲解了描述性统计分析的所有知识点,以及利用鸢尾花数据集的分析加强对各个统计量的理解。 数理统计基础-描述性统计分析1、数理统计基础2、描述性统计分析概述(1)概念(2)变量的类型3、统计量(1)...
python数据分析描述性统计实践
恋恋风尘的博客
04-12 2034
1、加载相关库和数据集 使用的库主要有:pandas、numpy、sklearn、matplotlib、seaborn 使用的数据集:sklearn库中的鸢尾花数据集 import pandas as pd import numpy as np from sklearn.datasets import load_iris import matplotlib.pyplot as plt impo...
SPSS数据分析描述性统计、区间估计与假设检验【操作详解】
Viewinfinitely的博客
03-31 2万+
文章目录一、描述统计2、区间估计 一、描述统计 (1)依次点击分析描述性统计描述。 (2)选项可以选择需要进行描述统计的统计变量。 (3)描述性统计分析结果 范围统计为极大值与极小值之间的范围; 标准差为平均值的标准偏差; 偏度与峰度统计结果。 2、区间估计 (1)操作步骤 依次点击分析,比较平均值,单样本T检验 (2)<选项>处可以调整置信区间百分比,也就是α,当未95时,则α=0.05 (3)可以设置检验值,即为在检验时,需要输入的原假设值。当检验值为0时,则表示在进行区间估计
SPSS中的数据分析描述性统计分析【1】
热门推荐
小白数据营的博客
06-17 5万+
从今天开始,小白将深入给大家带来关于数据分析工具SPSS的使用和讲解,在这段时间里我会带着大家来一起学习了解如何使用SPSS进行描述性统计分析、假设检验、相关分析、回归分析、聚类分析、主成份分析、因子分析等。在分享的途中会出现大量的分析实例,通过实例来解析数据分析的技术和技巧,最后提高SPSS数据分析的技能。今天小白先从描述性统计分析开始给大家介绍,话不多说,直接进入主题。 在工作和生活中,我们...
描述性统计分析案例题_SPSS问卷数据统计分析之项目分析
weixin_39904268的博客
11-22 4954
我们在用SPSS进行问卷数据的统计分析时,通常要首先对问卷量表的信度和效度进行检验。​ 对于未划分维度的量表来说,在做因子分析之前,首先需要做项目分析。 首先做项目分析,目的主要在于检验量表中的各个题项的区分性,具体是检验被调研对象是否有一部分可以在量表中给出高分,同时也有一部分被调研者可以在量表中给出低分,意味着量表中的每一个题项具有较好的区分性。本质是探究高低分的受试者在每...
04数据分析- 描述分析方法
半路出家,立地为猿
04-22 2997
描述分析方法 描述分析目的是描述现实,发现问题 全链路描述性方法的步骤: 1. 确定描述对象 2. 明确业务目标,熟悉业务逻辑 3. 分割业务环节,确定关键节点 4. 利益关系人及关系人的关注点 5. 确定可以描述分析对象的指标 6. 确定指标的评价标准 指标的评价方法: 1、事件结果的评价: 结果是好还是坏 同评价标准比 同目标比 相同级别对象之间的比较 行业水平的比较 2、事件变化趋势的评...
3. 描述性统计分析
BerMaker
06-10 4615
描述性统计分析 描述性统计分析 描述定性数据的图形法和数值法 描述定量数据的图形法 点图 茎叶图 直方图 描述定量数据的数值法 中心趋势的度量 变异性的度量 相对位置的度量 百分位数 z得分 检测异常值的方法 使用z得分来检测异常值 使用盒子图来检测异常值 Reference 描述定性数据的图形法和数值法 对给定的类,类(或组)频数是指落入这个类中的观测值的个数。 ...
统计学极简入门——描述性统计
最新发布
shiguangre的博客
09-04 387
对不同变量或不同数组的离散程度进行比较时,如果它们的平均水平和计量单位都相同,才能利用上述指标进行分析,否则需利用变异系数来比较它们的离散程度。,括号里面的参数:0代表最小值,1代表25%分位数,2代表50%分位数,3代表75%分位数,4代表最大值,由于标准正态分布的峰度系数为0,所以当峰度系数大于0时为尖峰分布,当峰度系数小于0时为平峰分布。变异系数又称为离散系数,是一组数据中的极差、四分位差或标准差等离散指标与算术平均数的比率。方差是一组数据中的各数据值与该组数据算术平均数之差的平方的算术平均数。
统计学基础1- 描述性统计
只是甲的博客
04-25 869
文章目录一. 统计学概述二. 集中趋势2.1 均值2.2 中位数2.3 众数2.4 均值、中位数、众数比较三. 离散程度与方差及标准差3.1 离散程度的描述3.2 方差3.3 标准差四. 图形化表示4.1 直方图4.2 箱线图4.3 茎叶图4.4 线图4.5 柱形图4.6 饼图参考: 一. 统计学概述 统计学可以分为: 描述统计学 使用特定的数字或图表来体现数据的集中程度和离散程度。例: 每次考试的平均分,最高分,各个分段的人数等,也是属于描述性统计学的范围。 推断统计学 根据样本数据推断总体数据
数据描述性统计
qq_38920340的博客
11-17 3230
一、描述性统计含义 来自:描述性统计 维基百科的定义是:“描述性统计是一种汇总统计,用于定量描述或总结信息集合的特征”。从这个定义,我们不难看出,描述性统计包含两个重要的特征,描述和总结。 通常情况下,我们把描述性统计分为两大类:离散趋势和集中趋势,两种分类常见的统计量如下: 一般情况下,我们首先将收集到的大量数据归纳整理到一张表格,我们把这张表格称之为数据集,数据集一般包含很多类型的数据。通过描述性统计,我们可以根据自己的研究需要,从大量不同类型的数据中,筛选出具有代表性的数据来进行初步的研究
CDA学习-------描述性统计分析
HLL1421的博客
08-03 1371
描述性统计分析
WPS进行分类汇总计算,并且提取统计结果的详细步骤
飘羽的博客
05-22 3万+
1, 首先选中要进行分类统计的数据,2,选择‘数据’选项,3,然后找到‘分类汇总’选项,再次弹出对话框,选择按照那一列进行分类汇总,并选择统计的计算方法。点击确定。5,默认统计结果都会在每一组的下一行,点击‘隐藏明细数据’选项,即可仅显示统计结果数据。6,然后按  ctrl + G 键会弹出对话框,选择‘可见单元格’,点击‘定位’。 7.ctrl + C 进行将最后的统计结果复制,并粘贴在另一个工...
运用Excel实现描述性统计分析
zlxxxx123的博客
07-26 1万+
上篇文章介绍了描述性统计分析的常用指标及其计算公式(上篇文章链接:描述性统计分析),这次介绍一下如何运用Excel实现描述性统计分析。 下图为一张商品信息表,现对商品的价格、销量、评论数进行描述性统计分析。 1、加载数据分析模块: 点击文件—选项,调出"选项"对话框,点击加载项,在管理处选择"Excel 加载项",点击转到,调出"加载宏"对话框,在对话框中选择"分析工具库",点击确定。 2、计...
写文章

热门文章

  • jquery操作select(取值,设置选中) 17415
  • openmediavault安装配置docker和portainer 10730
  • openmediavault配置文件共享 10007
  • firewall-cmd常用命令 8960
  • 镜像站(整理各个镜像站资源) 8232

分类专栏

  • redis 3篇
  • 数据建模分析 12篇
  • springboot 35篇
  • linux 25篇
  • rasa 2篇
  • javascript 2篇
  • react 2篇
  • 一起学ansible 3篇
  • mariadb 19篇
  • omv 3篇
  • 项目经理 8篇
  • 设计模式 3篇
  • python 18篇

最新评论

  • 用Transformers 库来完成中文文本摘要任务

    m0_73810807: 这个真的可以生成出来吗?为什么我得到了一堆逗号

  • Layui框架的select下拉框实现二级联动

    A-angular: form.render('select');哇哦!!!

  • 如何配置docker通过代理服务器拉取镜像

    gurencai2050: IP是多少啊?

  • 如何配置docker通过代理服务器拉取镜像

    小小代码团: 文章写的很好,一下子就跑通了

  • Ubuntu的中文乱码问题

    大傻子,呜呜.com: 需要把环境变量那个东西删除

大家在看

  • 【后端开发】JavaEE初阶—Theard类及常见方法—线程的操作(超详解) 81
  • AIGC时代算法工程师的面试秘籍(第二十二式2024.9.2-9.15) |【三年面试五年模拟】 462
  • Python量化分析2024年最新整理的免费获取股票数据接口集合以及API数据接口说明文档 2441
  • Java基于SpringBoot的电力员工安全施工培训管理系统+Vue[毕业设计]
  • C语言-编写一个函数使数组循环左移(指针实现) 440

最新文章

  • Buzz语音转文字安装使用(含Whisper模型下载)
  • 如何利用 Selenium 对已打开的浏览器进行爬虫
  • Redis原子计数器incr,防止并发请求
2024年30篇
2023年46篇
2022年54篇
2021年4篇
2018年2篇

目录

目录

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43元 前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

一个高效工作的家伙

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或 充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值

天下网标王宜昌网站推广优化公司网站框架的优化可分为网站优化排名易下拉程序网站百度优化推广有哪些优势网站优化外包网站快速优化选火21星南洋花园南昌网站推广优化汕头网站优化关键词工具饶阳县网站优化公司灯塔优化网站哪里有网站优化代理加盟项目平台东莞百度seo网站优化网站搜索优化擞泳丿云速捷淄博济南网站优化工具分析盐田优化网站哈尔滨百度快照网站优化网站建设seo怎么优化靠谱的珠宝行业网站优化团队搜索引擎优化了网站哪些方面河南家纺行业网站优化推广可靠吗宝塔网站优化漳州网站优化找哪家网站制作优化推广seo网站优化软件兰州网站排名优化服务淄博高端网站优化公司开发区网站优化推广寻甸网站优化运营潍坊网站建设优化推广广元网站优化服务香港通过《维护国家安全条例》两大学生合买彩票中奖一人不认账让美丽中国“从细节出发”19岁小伙救下5人后溺亡 多方发声卫健委通报少年有偿捐血浆16次猝死汪小菲曝离婚始末何赛飞追着代拍打雅江山火三名扑火人员牺牲系谣言男子被猫抓伤后确诊“猫抓病”周杰伦一审败诉网易中国拥有亿元资产的家庭达13.3万户315晚会后胖东来又人满为患了高校汽车撞人致3死16伤 司机系学生张家界的山上“长”满了韩国人?张立群任西安交通大学校长手机成瘾是影响睡眠质量重要因素网友洛杉矶偶遇贾玲“重生之我在北大当嫡校长”单亲妈妈陷入热恋 14岁儿子报警倪萍分享减重40斤方法杨倩无缘巴黎奥运考生莫言也上北大硕士复试名单了许家印被限制高消费奥巴马现身唐宁街 黑色着装引猜测专访95后高颜值猪保姆男孩8年未见母亲被告知被遗忘七年后宇文玥被薅头发捞上岸郑州一火锅店爆改成麻辣烫店西双版纳热带植物园回应蜉蝣大爆发沉迷短剧的人就像掉进了杀猪盘当地回应沈阳致3死车祸车主疑毒驾开除党籍5年后 原水城县长再被查凯特王妃现身!外出购物视频曝光初中生遭15人围殴自卫刺伤3人判无罪事业单位女子向同事水杯投不明物质男子被流浪猫绊倒 投喂者赔24万外国人感慨凌晨的中国很安全路边卖淀粉肠阿姨主动出示声明书胖东来员工每周单休无小长假王树国卸任西安交大校长 师生送别小米汽车超级工厂正式揭幕黑马情侣提车了妈妈回应孩子在校撞护栏坠楼校方回应护栏损坏小学生课间坠楼房客欠租失踪 房东直发愁专家建议不必谈骨泥色变老人退休金被冒领16年 金额超20万西藏招商引资投资者子女可当地高考特朗普无法缴纳4.54亿美元罚金浙江一高校内汽车冲撞行人 多人受伤

天下网标王 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化