diff --git a/task1/README.md b/task1/README.md index b54de58..c4979d9 100644 --- a/task1/README.md +++ b/task1/README.md @@ -464,19 +464,68 @@ $$\Delta_i^* = \frac{365}{k_i}$$ ### 7.2 敏感性分析结果 -**C (有效容量) 敏感性**: -``` -C = 350: 修正9站点, E1=141,300, F1=0.3141 -C = 375: 修正7站点, E1=140,476, F1=0.3115 -C = 400: 修正5站点, E1=140,121, F1=0.3140 ← 基准 -C = 425: 修正3站点, E1=139,692, F1=0.3146 -C = 450: 修正2站点, E1=139,487, F1=0.3153 -``` +本节基于 `08_sensitivity.xlsx`(含 `sensitivity_C / sensitivity_p_thresh / sensitivity_c_bar / combo_scan / baseline` 等工作表)对**效率(E1/E2)**与**公平性(F1/F2/F3)**的变化做更细致解读。数值默认四舍五入展示。 -**稳健性结论**: -- C 变化 [350, 450] 时,E1 变化范围仅 1813 (1.29%) -- p_thresh 变化 [0.01, 0.10] 时,E1 变化范围仅 80 (0.06%) -- **模型对参数变化不敏感,结果稳健** +**基准结果(C=400, p_thresh=0.02, $\bar{C}=250$)**: + +| 指标 | 值 | 解读 | +|------|----|------| +| 修正站点数 | 5 | 发生截断修正的站点数量 | +| E1 | 140,121 | 总服务量 $\sum k_i\mu_i$ | +| E2 | 131,673 | 质量加权服务量 $\sum k_i\mu_i q(\mu_i)$ | +| F1 (Gini) | 0.3140 | 满足率分布不均衡程度(越小越公平) | +| F2 (min r) | 2.00 | 最低满足率(本次扫描恒为2) | +| F3 (CV of r) | 0.5569 | 满足率变异系数(越小越均衡) | +| 频次范围 | k_min=2, k_max=32 | 头部频次(k_max)反映资源集中度 | + +#### 7.2.1 C(有效容量):主要影响“修正站点数”和“头部频次” + +| C | 修正站点数 | E1 | ΔE1 | E2 | ΔE2 | F1(Gini) | k_max | +|---|------------|----|-----|----|-----|----------|-------| +| 350 | 9 | 141,300 | +0.84% | 132,236 | +0.43% | 0.3141 | 35 | +| 375 | 7 | 140,476 | +0.25% | 131,687 | +0.01% | 0.3115 | 34 | +| 400 | 5 | 140,121 | +0.00% | 131,673 | +0.00% | 0.3140 | 32 | +| 425 | 3 | 139,692 | -0.31% | 131,538 | -0.10% | 0.3146 | 30 | +| 450 | 2 | 139,487 | -0.45% | 131,462 | -0.16% | 0.3153 | 29 | + +**机制解释**: +- C 越小,越多站点满足 $p_{trunc}\ge p_{thresh}$,其 $\tilde{\mu}$ 被上调;Hamilton 分配会把更多频次给这些“被修正的高需求站点”,因此 **k_max 上升**、E1/E2 轻微上升。 +- C 越大,修正更少、k_max 更低,资源更分散;但 **E1 最大相对波动仅 1.29%**,说明结论对 C 很稳健。 + +#### 7.2.2 p_thresh(截断阈值):影响“是否修正”,但对总指标几乎无影响 + +| p_thresh | 修正站点数 | E1 | ΔE1 | E2 | ΔE2 | F1(Gini) | F3(CV) | +|----------|------------|----|-----|----|-----|----------|--------| +| 0.01 | 5 | 140,121 | +0.00% | 131,673 | +0.00% | 0.3140 | 0.5569 | +| 0.02 | 5 | 140,121 | +0.00% | 131,673 | +0.00% | 0.3140 | 0.5569 | +| 0.05 | 3 | 140,121 | +0.00% | 131,673 | +0.00% | 0.3143 | 0.5574 | +| 0.10 | 1 | 140,200 | +0.06% | 131,764 | +0.07% | 0.3161 | 0.5603 | + +**解读**: +- p_thresh 从 0.01 提高到 0.10,修正站点数从 5 降到 1,但 **E1 仅 +0.06%(变化范围 0.0567%)**,E2 也仅 +0.07%。 +- 说明“截断修正的启用边界”主要影响边缘站点是否被修正,但对总体分配格局(以及效率/公平性指标)影响很小。 + +#### 7.2.3 质量阈值 $\bar{C}$:只影响 E2(评价口径),不影响分配与公平性 + +| $\bar{C}$ | E2 | ΔE2 | 说明 | +|----|----|-----|------| +| 200 | 119,828 | -9.00% | $q(\mu)=\min(1,\bar{C}/\mu)$ 折扣更强 | +| 225 | 126,622 | -3.84% | | +| 250 | 131,673 | +0.00% | 基准 | +| 275 | 135,068 | +2.58% | | +| 300 | 136,707 | +3.82% | 折扣更弱,E2 更高 | + +**关键点**:在当前实现中,c̄ 只进入 E2 的质量折扣因子,不参与频次分配(k 的求解);因此 E1/F1/F2/F3 与 k 的分布保持不变,E2 的变化反映的是**指标口径**而非**决策结果**。 + +### 7.3 组合扫描(C×p_thresh)与稳健性小结 + +- 20 组组合扫描(固定 $\bar{C}=250$)整体范围:E1 ∈ [139,487, 141,300],F1 ∈ [0.3114, 0.3161],k_max ∈ [29, 35],修正站点数 ∈ [1, 10](且全程 k_min=2、F2=2 恒定)。 +- 影响主导项是 C:同一 C 下不同 p_thresh 的 E1/F1 波动远小于不同 C 之间的差异。 +- 若用“E1 越大越好、F1 越小越好”的视角看非支配(Pareto)点,组合扫描中出现的代表性折中包括: + - (C=375, p_thresh=0.01): 最低 Gini(更公平) + - (C=350, p_thresh=0.10): 在更高 E1 的同时保持较低 Gini + - (C=350, p_thresh=0.01): 最大 E1,但公平性略弱 + 差异量级整体较小,不改变“按需分配 + 约束可行”的主结论。 ---