MGM3165 · Business Analytics
by FAN BEN
Q10
累积频率分布
已知频率分布表(区间10–19到50–59),请构建累积频率分布。
1
理解概念
累积频率(Cumulative Frequency)= 将每个区间的频率逐行相加。第一行等于自身,第二行等于第一行+自身,以此类推。
2
验证方法
最后一行的累积频率必须等于所有频率之和(即总样本量 n)。可以用这个来检验自己有没有算错。
✏️ 试试看
频率为 10, 14, 17, 7, 2,前两行相加后第三行的累积频率是多少?
完整答案
区间频率累积频率
10–191010
20–291424
30–391741
40–49748
50–59250
合计5050 ✓
最后一行 = 50 = 总样本量,验证正确 ✓
Q13
均值与中位数
a) 数据:10, 20, 12, 17, 16,求均值和中位数。b) 加入12后,新数据如何变化?
1
计算均值
均值公式:x̄ = Σxᵢ / n,即所有数相加除以个数。
2
计算中位数
中位数必须先排序!奇数个数据取中间值;偶数个数据取中间两个的平均。
3
加入新数据后的判断
加入的12比均值15小,所以均值会被拉低。这是判断方向的关键技巧。
✏️ 试试看
数据 10, 12, 16, 17, 20 排好序后,中位数是第几个?
完整答案
Part a:
x̄ = (10+20+12+17+16) / 5 = 75 / 5 = 15
排序:10, 12, [16], 17, 20 → 中位数 = 16
均值
15
中位数
16
Part b:
x̄ = (10+20+12+17+16+12) / 6 = 87 / 6 = 14.5
排序:10, 12, [12, 16], 17, 20 → 中位数 = (12+16)/2 = 14
均值
14.5
中位数
14
💡 关键认知:加入一个低于均值的数,会让均值和中位数都下降。加入高于均值的数则反之。
Q14
百分位数
数据:27, 25, 20, 15, 30, 34, 28, 25,求第20、25、65、75百分位数。
1
先排序
排序结果:15, 20, 25, 25, 27, 28, 30, 34(n = 8)
2
计算位置 L
公式:L = (P / 100) × n,P是百分位,n是数据个数。
3
判断整数还是非整数
L 不是整数 → 向上取整,取那个位置的值。
L 是整数 → 取第L和第L+1位的平均值。
✏️ 试试看
第25百分位:L = 2(整数),取排序后第2和第3位平均,即 (20+25)/2 = ?
完整答案
百分位L规则答案
20th1.6非整数→第2位20
25th (Q1)2.0整数→均(2,3)22.5
65th5.2非整数→第6位28
75th (Q3)6.0整数→均(6,7)29
Q15
均值、中位数与众数
数据:53, 55, 70, 58, 64, 57, 53, 69, 57, 68, 53,求均值、中位数、众数。
1
众数
众数 = 出现次数最多的数。53出现3次,57出现2次,其余1次。众数 = 53。
2
中位数(先排序)
n=11(奇数),中间是第6个数。排序后找第6位。
✏️ 试试看
排序后:53,53,53,55,57,?,58,64,68,69,70,n=11,中位数是第几位?
完整答案
x̄ = 657 / 11 = 59.73
排序:53,53,53,55,57,[57],58,64,68,69,70 → 中位数 = 57
众数 = 53(出现3次,最多)
均值
59.73
中位数
57
众数
53
Q16
几何平均数 — 年均增长率
资产从 $5,000 降至 $3,500,历时9年,求年均增长率。
1
为什么不用普通均值?
普通均值对百分比变化会产生误导。几何平均数才能正确反映复利增长率
2
公式
x̄g = (终值 / 初值)^(1/n) − 1
3
计算器操作
计算器输入:0.7 ^ 0.1111(即 0.7 的 1/9 次方)
✏️ 试试看
资产从5000跌到3500,年均增长率应该是正数还是负数?
完整答案
x̄g = (3500/5000)^(1/9) − 1 = (0.7)^0.1111 − 1 = −0.0374
年均增长率
−3.74%
资产每年平均贬值 3.74%。
Q17
基金业绩比较
Stivers基金:$10,000 → $18,000(8年);Trippi基金:$5,000 → $10,600(8年)。哪个更好?
1
关键理解
不能直接比较总回报,初始本金不同。要用几何平均年化增长率来公平比较。
2
分别套公式
两个基金都用:(终值/初值)^(1/8) − 1,n = 8年
✏️ 试试看
Trippi:(10600/5000)^(1/8) − 1 = (2.12)^0.125 − 1 ≈ ?
完整答案
Stivers: (18000/10000)^(1/8) − 1 = (1.8)^0.125 − 1 = 7.63%
Trippi: (10600/5000)^(1/8) − 1 = (2.12)^0.125 − 1 = 9.85%
Stivers
7.63%
Trippi
9.85%
结论:Trippi表现更好(9.85% > 7.63%)
Q19
候诊时间分析(方差、标准差、箱线图)
比较有/无等待追踪系统诊所的候诊时间。求均值、中位数、方差、标准差,并绘制箱线图。
1
方差的含义
方差衡量数据的分散程度。方差越大,数据越不稳定。
2
方差计算步骤
① 算均值 x̄   ② 每个数减均值   ③ 平方   ④ 全部相加   ⑤ 除以 (n−1)
3
箱线图的5个数
Min · Q1 · Median · Q3 · Max
离群值判断:小于 Q1 − 1.5×IQR 或大于 Q3 + 1.5×IQR
✏️ 试试看
With系统:Q1=12,Q3=18,IQR=6,上界 = 18 + 1.5×6 = ?
完整答案
统计量有系统无系统
均值17.229.1
中位数13.523.5
方差 s²86.18275.66
标准差 s9.2816.60
Q1 / Q312 / 1817 / 37
IQR620
离群值3137
💡 有等待追踪系统的诊所候诊时间更短且更稳定,系统显著改善了候诊体验。
Q24
协方差与相关系数
x = {4, 6, 11, 3, 16},y = {50, 50, 40, 60, 30}。散点图 · 协方差 · 相关系数。
1
协方差的意义
协方差 > 0:正相关;< 0:负相关;≈ 0:无关。
2
协方差公式
s_xy = Σ(xᵢ−x̄)(yᵢ−ȳ) / (n−1)
3
相关系数
r = s_xy / (sₓ × s_y),范围在 −1 到 +1 之间。越接近±1线性关系越强。
✏️ 试试看
x越大y越小,协方差应该是正数还是负数?
完整答案
x̄ = 8 | ȳ = 46
xᵢyᵢxᵢ−x̄yᵢ−ȳ(xᵢ−x̄)(yᵢ−ȳ)
450−44−16
650−24−8
11403−6−18
360−514−70
16308−16−128
Σ−240
s_xy = −240 / 4 = −60
sₓ = 5.43 | s_y = 11.40
r = −60 / (5.43 × 11.40) ≈ −0.97
协方差
−60
相关系数 r
−0.97
💡 r = −0.97 说明 x 和 y 之间存在极强的负线性关系,几乎完全反向变动。
Q11
汽车产量 — 折线图与簇状条形图
丰田、通用、大众、现代5年产量(百万辆)。a) 折线图   b) 讨论趋势   c) 簇状条形图
1
折线图适合什么数据?
折线图最适合展示时间序列趋势。X轴放年份,Y轴放产量,每个品牌一条线。
2
簇状条形图的作用
簇状条形图让同一年内各品牌并排对比,方便看出哪个品牌在某年领先。
图表答案
各年领先:Y1、Y2 — 通用GM  |  Y3、Y4、Y5 — 丰田Toyota
💡 通用第4年大幅下滑;现代增速最快,几乎翻倍;丰田从第3年起持续领先。
📊 Excel操作步骤
① 数据输入Excel(行=品牌,列=年份)
② 选中全部数据 → 插入 → 图表 → 折线图 → 带标记的折线图
③ 添加图表标题 "Vehicle Production by Manufacturer"
④ 簇状图:同样数据 → 插入 → 柱形图 → 簇状柱形图
Q13
保险销售 — 柱状图
6名销售员:Harish(24), David(41), Kristina(19), Steven(23), Tim(53), Mona(39)。创建柱状图 · 排序 · 添加数据标签。
1
排序数据
排序:Tim(53) → David(41) → Mona(39) → Harish(24) → Steven(23) → Kristina(19)
2
数据标签
数据标签 = 每个柱子上方显示数值。Excel:右键柱子 → 添加数据标签。
图表答案
📊 Excel操作步骤
① 输入姓名和合同数 → ② 数据 → 排序 → 按合同数从大到小
③ 插入 → 柱形图 → 簇状柱形图
④ 右键点击柱子 → 添加数据标签
⑤ 添加图表标题:Top Salespeople by Contracts Sold
Q16
智能手机持有率 — 堆叠与簇状图
按年龄段统计手机持有类型。a) 堆叠图   b) 簇状图   c) 哪种更适合?
1
堆叠图 vs 简状图
堆叠图:看整体构成比例。簇状图:各类别并排,更容易比较个别差异
✏️ 试试看
想清楚对比不同年龄段的智能手机持有率变化,用哪种图更好?
图表答案
c) 簇状图更好——能清楚看出随年龄增长智能手机持有率持续下降。
📊 Excel操作步骤
堆叠图:选中数据 → 插入 → 柱形图 → 堆叠柱形图 → 添加标题和轴标签
簇状图:同样数据 → 插入 → 柱形图 → 簇状柱形图
Q17
门店经理时间分配
6个门店,4类任务时间占比。a)堆叠图   b)簇状图   c)多重图   d)哪种最好   e)推断
1
三种图的区别
堆叠图:整体构成;簇状图:各任务并排对比;多重图:每个门店单独一张。
2
哪种最好?
簇状图最好:可以跨门店比较同一任务,也可以在同一门店内比较不同任务。
图表答案
d) 簇状图最佳  |  e) Boise/Olympia客户互动最多;Portland开会最多(52%);Missoula空闲最高(30%)
📊 Excel操作步骤
① 数据:行=门店,列=任务类别
② 堆叠:插入 → 条形图(Bar) → 堆叠条形图
③ 簇状:插入 → 条形图(Bar) → 簇状条形图
⚠️ 注意:Bar = 横向;Column = 纵向。此题要横向条形图。