P3: main

2026-01-19 11:57:19 +08:00
parent c6e22729c7
commit ffc51b2927
13 changed files with 1542 additions and 0 deletions
--- a/task3/01_distance.py
+++ b/task3/01_distance.py
@@ -0,0 +1,119 @@
+"""
+Task 3 - Step 1: 距离矩阵计算
+=============================
+
+输入: task1/03_allocate.xlsx (70个站点的坐标信息)
+输出: task3/01_distance.xlsx (70×70距离矩阵 + 站点信息)
+
+距离计算公式 (Haversine简化):
+l_ij = 69.0 * sqrt((lat_i - lat_j)^2 + cos^2(lat_avg * pi/180) * (lon_i - lon_j)^2)
+
+单位: 英里
+"""
+
+import pandas as pd
+import numpy as np
+
+# ============================================
+# 参数设置
+# ============================================
+INPUT_FILE = '../task1/03_allocate.xlsx'
+OUTPUT_FILE = '01_distance.xlsx'
+
+# ============================================
+# 读取数据
+# ============================================
+print("=" * 60)
+print("Task 3 - Step 1: 距离矩阵计算")
+print("=" * 60)
+
+df = pd.read_excel(INPUT_FILE)
+print(f"\n读取站点数据: {len(df)} 个站点")
+print(f"列名: {df.columns.tolist()}")
+
+# 提取关键列
+sites = df[['site_id', 'site_name', 'lat', 'lon', 'mu', 'sigma', 'mu_tilde', 'k']].copy()
+print(f"\n站点数据概览:")
+print(sites.head())
+
+# ============================================
+# 距离计算函数
+# ============================================
+def calc_distance(lat1, lon1, lat2, lon2):
+    """
+    计算两点间的近似距离（英里）
+    使用Haversine公式的简化版本，适用于小范围地域
+    """
+    lat_avg = (lat1 + lat2) / 2
+    lat_avg_rad = np.radians(lat_avg)
+
+    delta_lat = lat1 - lat2
+    delta_lon = lon1 - lon2
+
+    # 69.0 miles per degree of latitude
+    # cos(lat) correction for longitude
+    distance = 69.0 * np.sqrt(delta_lat**2 + (np.cos(lat_avg_rad) * delta_lon)**2)
+
+    return distance
+
+# ============================================
+# 构建距离矩阵
+# ============================================
+n = len(sites)
+distance_matrix = np.zeros((n, n))
+
+for i in range(n):
+    for j in range(n):
+        if i != j:
+            distance_matrix[i, j] = calc_distance(
+                sites.iloc[i]['lat'], sites.iloc[i]['lon'],
+                sites.iloc[j]['lat'], sites.iloc[j]['lon']
+            )
+
+# 转换为DataFrame
+site_ids = sites['site_id'].values
+df_distance = pd.DataFrame(distance_matrix, index=site_ids, columns=site_ids)
+
+# ============================================
+# 统计信息
+# ============================================
+# 提取上三角（排除对角线）
+upper_tri = distance_matrix[np.triu_indices(n, k=1)]
+
+print(f"\n距离矩阵统计:")
+print(f"  - 站点对总数: {len(upper_tri)}")
+print(f"  - 最小距离: {upper_tri.min():.2f} 英里")
+print(f"  - 最大距离: {upper_tri.max():.2f} 英里")
+print(f"  - 平均距离: {upper_tri.mean():.2f} 英里")
+print(f"  - 中位数距离: {np.median(upper_tri):.2f} 英里")
+
+# 按阈值统计
+thresholds = [30, 40, 50, 60, 70]
+print(f"\n距离阈值统计:")
+for th in thresholds:
+    count = np.sum(upper_tri <= th)
+    print(f"  - ≤ {th} 英里: {count} 对 ({count/len(upper_tri)*100:.1f}%)")
+
+# ============================================
+# 保存结果
+# ============================================
+with pd.ExcelWriter(OUTPUT_FILE, engine='openpyxl') as writer:
+    # Sheet 1: 站点信息
+    sites.to_excel(writer, sheet_name='sites', index=False)
+
+    # Sheet 2: 距离矩阵
+    df_distance.to_excel(writer, sheet_name='distance_matrix')
+
+    # Sheet 3: 距离统计
+    stats = pd.DataFrame({
+        'metric': ['min', 'max', 'mean', 'median', 'std', 'total_pairs'],
+        'value': [upper_tri.min(), upper_tri.max(), upper_tri.mean(),
+                  np.median(upper_tri), upper_tri.std(), len(upper_tri)]
+    })
+    stats.to_excel(writer, sheet_name='statistics', index=False)
+
+print(f"\n结果已保存至: {OUTPUT_FILE}")
+print("  - Sheet 'sites': 站点信息")
+print("  - Sheet 'distance_matrix': 70×70距离矩阵")
+print("  - Sheet 'statistics': 距离统计")
+print("\n" + "=" * 60)
--- a/task3/01_distance.xlsx
+++ b/task3/01_distance.xlsx
--- a/task3/02_pairing.py
+++ b/task3/02_pairing.py
@@ -0,0 +1,209 @@
+"""
+Task 3 - Step 2: 共生站点配对筛选与选择
+=======================================
+
+输入: 01_distance.xlsx (距离矩阵 + 站点信息)
+输出: 02_pairing.xlsx (筛选后的配对列表 + 最终选择)
+
+配对筛选条件:
+1. 距离约束: l_ij ≤ l_max (50英里)
+2. 容量约束: μ_i + μ_j ≤ 450
+3. 稳定性约束: CV_i ≤ 0.5 且 CV_j ≤ 0.5
+
+配对价值函数:
+V_ij = α * (μ_i + μ_j) / Q - β * l_ij / l_max - γ * (σ_i² + σ_j²) / (μ_i + μ_j)²
+
+配对选择: 贪心算法，每个站点最多配对一次
+"""
+
+import pandas as pd
+import numpy as np
+
+# ============================================
+# 参数设置
+# ============================================
+INPUT_FILE = '01_distance.xlsx'
+OUTPUT_FILE = '02_pairing.xlsx'
+
+# 约束参数
+L_MAX = 50          # 距离阈值 (英里)
+MU_SUM_MAX = 450    # 需求和上限
+CV_MAX = 0.5        # 变异系数上限
+Q = 400             # 卡车容量
+
+# 价值函数权重
+ALPHA = 1.0         # 容量利用率权重
+BETA = 0.3          # 距离惩罚权重
+GAMMA = 0.5         # 风险惩罚权重
+
+# ============================================
+# 读取数据
+# ============================================
+print("=" * 60)
+print("Task 3 - Step 2: 共生站点配对筛选与选择")
+print("=" * 60)
+
+# 读取站点信息
+sites = pd.read_excel(INPUT_FILE, sheet_name='sites')
+print(f"\n读取站点数据: {len(sites)} 个站点")
+
+# 读取距离矩阵
+dist_matrix = pd.read_excel(INPUT_FILE, sheet_name='distance_matrix', index_col=0)
+print(f"读取距离矩阵: {dist_matrix.shape}")
+
+# 计算变异系数
+sites['cv'] = sites['sigma'] / sites['mu']
+print(f"\nCV范围: [{sites['cv'].min():.3f}, {sites['cv'].max():.3f}]")
+print(f"CV > {CV_MAX} 的站点数: {(sites['cv'] > CV_MAX).sum()}")
+
+# ============================================
+# 配对筛选
+# ============================================
+print(f"\n" + "-" * 40)
+print("配对筛选")
+print("-" * 40)
+
+candidates = []
+n = len(sites)
+
+for i in range(n):
+    for j in range(i + 1, n):  # 只考虑上三角
+        site_i = sites.iloc[i]
+        site_j = sites.iloc[j]
+
+        # 获取距离
+        dist = dist_matrix.iloc[i, j]
+
+        # 约束检查
+        # 1. 距离约束
+        if dist > L_MAX:
+            continue
+
+        # 2. 容量约束
+        mu_sum = site_i['mu'] + site_j['mu']
+        if mu_sum > MU_SUM_MAX:
+            continue
+
+        # 3. 稳定性约束
+        if site_i['cv'] > CV_MAX or site_j['cv'] > CV_MAX:
+            continue
+
+        # 通过所有约束，计算配对价值
+        sigma_sq_sum = site_i['sigma']**2 + site_j['sigma']**2
+
+        # 价值函数
+        value = (ALPHA * mu_sum / Q
+                 - BETA * dist / L_MAX
+                 - GAMMA * sigma_sq_sum / mu_sum**2)
+
+        candidates.append({
+            'site_i_id': site_i['site_id'],
+            'site_j_id': site_j['site_id'],
+            'site_i_name': site_i['site_name'],
+            'site_j_name': site_j['site_name'],
+            'distance': dist,
+            'mu_i': site_i['mu'],
+            'mu_j': site_j['mu'],
+            'mu_sum': mu_sum,
+            'sigma_i': site_i['sigma'],
+            'sigma_j': site_j['sigma'],
+            'cv_i': site_i['cv'],
+            'cv_j': site_j['cv'],
+            'k_i': site_i['k'],
+            'k_j': site_j['k'],
+            'value': value
+        })
+
+df_candidates = pd.DataFrame(candidates)
+print(f"通过约束的候选配对数: {len(df_candidates)}")
+
+if len(df_candidates) > 0:
+    print(f"配对价值范围: [{df_candidates['value'].min():.3f}, {df_candidates['value'].max():.3f}]")
+    print(f"平均距离: {df_candidates['distance'].mean():.2f} 英里")
+    print(f"平均需求和: {df_candidates['mu_sum'].mean():.1f}")
+
+# ============================================
+# 贪心配对选择
+# ============================================
+print(f"\n" + "-" * 40)
+print("贪心配对选择")
+print("-" * 40)
+
+# 按价值降序排序
+df_candidates_sorted = df_candidates.sort_values('value', ascending=False).reset_index(drop=True)
+
+# 贪心选择
+selected_pairs = []
+used_sites = set()
+
+for _, row in df_candidates_sorted.iterrows():
+    site_i = row['site_i_id']
+    site_j = row['site_j_id']
+
+    # 检查是否已被使用
+    if site_i not in used_sites and site_j not in used_sites:
+        selected_pairs.append(row.to_dict())
+        used_sites.add(site_i)
+        used_sites.add(site_j)
+
+df_selected = pd.DataFrame(selected_pairs)
+print(f"最终选择配对数: {len(df_selected)}")
+print(f"涉及站点数: {len(used_sites)} (占总站点 {len(used_sites)/n*100:.1f}%)")
+print(f"未配对站点数: {n - len(used_sites)}")
+
+if len(df_selected) > 0:
+    print(f"\n选中配对的价值范围: [{df_selected['value'].min():.3f}, {df_selected['value'].max():.3f}]")
+    print(f"选中配对的距离范围: [{df_selected['distance'].min():.2f}, {df_selected['distance'].max():.2f}] 英里")
+    print(f"选中配对的需求和范围: [{df_selected['mu_sum'].min():.1f}, {df_selected['mu_sum'].max():.1f}]")
+
+# ============================================
+# 显示选中的配对
+# ============================================
+print(f"\n" + "-" * 40)
+print("选中的配对列表")
+print("-" * 40)
+
+if len(df_selected) > 0:
+    display_cols = ['site_i_name', 'site_j_name', 'distance', 'mu_sum', 'k_i', 'k_j', 'value']
+    print(df_selected[display_cols].to_string(index=False))
+
+# ============================================
+# 保存结果
+# ============================================
+with pd.ExcelWriter(OUTPUT_FILE, engine='openpyxl') as writer:
+    # Sheet 1: 站点信息（含CV）
+    sites.to_excel(writer, sheet_name='sites', index=False)
+
+    # Sheet 2: 所有候选配对
+    df_candidates_sorted.to_excel(writer, sheet_name='all_candidates', index=False)
+
+    # Sheet 3: 最终选择的配对
+    df_selected.to_excel(writer, sheet_name='selected_pairs', index=False)
+
+    # Sheet 4: 参数记录
+    params = pd.DataFrame({
+        'parameter': ['L_MAX', 'MU_SUM_MAX', 'CV_MAX', 'Q', 'ALPHA', 'BETA', 'GAMMA'],
+        'value': [L_MAX, MU_SUM_MAX, CV_MAX, Q, ALPHA, BETA, GAMMA],
+        'description': ['距离阈值(英里)', '需求和上限', 'CV上限', '卡车容量',
+                       '容量利用率权重', '距离惩罚权重', '风险惩罚权重']
+    })
+    params.to_excel(writer, sheet_name='parameters', index=False)
+
+    # Sheet 5: 汇总统计
+    summary = pd.DataFrame({
+        'metric': ['total_sites', 'candidate_pairs', 'selected_pairs',
+                  'paired_sites', 'unpaired_sites', 'avg_distance', 'avg_mu_sum'],
+        'value': [n, len(df_candidates), len(df_selected),
+                 len(used_sites), n - len(used_sites),
+                 df_selected['distance'].mean() if len(df_selected) > 0 else 0,
+                 df_selected['mu_sum'].mean() if len(df_selected) > 0 else 0]
+    })
+    summary.to_excel(writer, sheet_name='summary', index=False)
+
+print(f"\n结果已保存至: {OUTPUT_FILE}")
+print("  - Sheet 'sites': 站点信息（含CV）")
+print("  - Sheet 'all_candidates': 所有候选配对")
+print("  - Sheet 'selected_pairs': 最终选择的配对")
+print("  - Sheet 'parameters': 参数记录")
+print("  - Sheet 'summary': 汇总统计")
+print("\n" + "=" * 60)
--- a/task3/02_pairing.xlsx
+++ b/task3/02_pairing.xlsx
--- a/task3/03_allocation.py
+++ b/task3/03_allocation.py
@@ -0,0 +1,220 @@
+"""
+Task 3 - Step 3: 第一站点最优分配计算
+=====================================
+
+输入: 02_pairing.xlsx (选中的配对列表)
+输出: 03_allocation.xlsx (含最优分配量q*的配对列表)
+
+最优分配公式:
+q* = (σ_j * μ_i + σ_i * (Q - μ_j)) / (σ_i + σ_j)
+
+鲁棒性约束:
+q_final = clip(q*, μ_i - σ_i, Q - μ_j + σ_j)
+
+物理意义:
+- 波动大的站点需要更多"缓冲"
+- 当σ_j >> σ_i时，q* → μ_i（精确分配给站点i）
+- 当σ_i >> σ_j时，q* → Q - μ_j（为站点j预留更多）
+"""
+
+import pandas as pd
+import numpy as np
+from scipy import stats
+
+# ============================================
+# 参数设置
+# ============================================
+INPUT_FILE = '02_pairing.xlsx'
+OUTPUT_FILE = '03_allocation.xlsx'
+
+Q = 400             # 卡车容量
+K_ROBUST = 1        # 鲁棒性水平 (84%保护)
+
+# ============================================
+# 读取数据
+# ============================================
+print("=" * 60)
+print("Task 3 - Step 3: 第一站点最优分配计算")
+print("=" * 60)
+
+# 读取选中的配对
+df_pairs = pd.read_excel(INPUT_FILE, sheet_name='selected_pairs')
+print(f"\n读取配对数据: {len(df_pairs)} 对")
+
+# ============================================
+# 计算最优分配
+# ============================================
+print(f"\n" + "-" * 40)
+print("计算最优分配 q*")
+print("-" * 40)
+
+def optimal_allocation(mu_i, sigma_i, mu_j, sigma_j, Q=400):
+    """
+    计算双站点访问时第一站点的最优分配量
+
+    公式: q* = (σ_j * μ_i + σ_i * (Q - μ_j)) / (σ_i + σ_j)
+    """
+    if sigma_i + sigma_j == 0:
+        # 边界情况：两站点都无波动
+        return mu_i
+
+    q_star = (sigma_j * mu_i + sigma_i * (Q - mu_j)) / (sigma_i + sigma_j)
+    return q_star
+
+
+def robust_allocation(q_star, mu_i, sigma_i, mu_j, sigma_j, Q=400, k=1):
+    """
+    应用鲁棒性约束
+
+    约束: μ_i - k*σ_i ≤ q ≤ Q - μ_j + k*σ_j
+    """
+    q_lower = max(0, mu_i - k * sigma_i)
+    q_upper = min(Q, Q - mu_j + k * sigma_j)
+
+    # 确保上下界合理
+    if q_lower > q_upper:
+        # 如果约束冲突，取中点
+        q_final = (q_lower + q_upper) / 2
+    else:
+        q_final = np.clip(q_star, q_lower, q_upper)
+
+    return q_final, q_lower, q_upper
+
+
+def expected_service(q, mu, sigma):
+    """
+    计算截断期望 E[min(D, q)]
+
+    E[min(D, q)] = μ * Φ(z) - σ * φ(z) + q * (1 - Φ(z))
+    where z = (q - μ) / σ
+
+    当q > μ时，大部分时候D < q，期望接近μ
+    当q < μ时，经常D > q，期望接近q但略低
+    """
+    if sigma == 0:
+        return min(mu, q)
+
+    z = (q - mu) / sigma
+    phi_z = stats.norm.pdf(z)
+    Phi_z = stats.norm.cdf(z)
+
+    return mu * Phi_z - sigma * phi_z + q * (1 - Phi_z)
+
+
+# 计算每个配对的分配
+results = []
+
+for idx, row in df_pairs.iterrows():
+    mu_i = row['mu_i']
+    sigma_i = row['sigma_i']
+    mu_j = row['mu_j']
+    sigma_j = row['sigma_j']
+
+    # 计算最优分配
+    q_star = optimal_allocation(mu_i, sigma_i, mu_j, sigma_j, Q)
+
+    # 应用鲁棒性约束
+    q_final, q_lower, q_upper = robust_allocation(
+        q_star, mu_i, sigma_i, mu_j, sigma_j, Q, K_ROBUST
+    )
+
+    # 计算期望服务量
+    E_Si = expected_service(q_final, mu_i, sigma_i)
+    E_Sj = expected_service(Q - q_final, mu_j, sigma_j)
+    E_total = E_Si + E_Sj
+
+    # 计算分配比例
+    alloc_ratio = q_final / Q if Q > 0 else 0
+
+    results.append({
+        **row.to_dict(),
+        'q_star': q_star,
+        'q_lower': q_lower,
+        'q_upper': q_upper,
+        'q_final': q_final,
+        'q_ratio': alloc_ratio,
+        'E_Si': E_Si,
+        'E_Sj': E_Sj,
+        'E_total': E_total,
+        'efficiency': E_total / (mu_i + mu_j) if (mu_i + mu_j) > 0 else 0
+    })
+
+df_allocation = pd.DataFrame(results)
+
+# ============================================
+# 统计信息
+# ============================================
+print(f"\n分配统计:")
+print(f"  - q* 范围: [{df_allocation['q_star'].min():.1f}, {df_allocation['q_star'].max():.1f}]")
+print(f"  - q_final 范围: [{df_allocation['q_final'].min():.1f}, {df_allocation['q_final'].max():.1f}]")
+print(f"  - 分配比例范围: [{df_allocation['q_ratio'].min():.2%}, {df_allocation['q_ratio'].max():.2%}]")
+print(f"  - 平均分配比例: {df_allocation['q_ratio'].mean():.2%}")
+
+print(f"\n期望服务量统计:")
+print(f"  - E[S_i] 范围: [{df_allocation['E_Si'].min():.1f}, {df_allocation['E_Si'].max():.1f}]")
+print(f"  - E[S_j] 范围: [{df_allocation['E_Sj'].min():.1f}, {df_allocation['E_Sj'].max():.1f}]")
+print(f"  - E[total] 范围: [{df_allocation['E_total'].min():.1f}, {df_allocation['E_total'].max():.1f}]")
+print(f"  - 平均效率: {df_allocation['efficiency'].mean():.2%}")
+
+# 检查是否有被约束裁剪的情况
+clipped_lower = (df_allocation['q_final'] <= df_allocation['q_lower'] + 0.01).sum()
+clipped_upper = (df_allocation['q_final'] >= df_allocation['q_upper'] - 0.01).sum()
+print(f"\n鲁棒性约束影响:")
+print(f"  - 触及下界: {clipped_lower} 对")
+print(f"  - 触及上界: {clipped_upper} 对")
+print(f"  - 未被裁剪: {len(df_allocation) - clipped_lower - clipped_upper} 对")
+
+# ============================================
+# 显示关键配对的分配
+# ============================================
+print(f"\n" + "-" * 40)
+print("高价值配对的分配方案 (Top 10)")
+print("-" * 40)
+
+display_cols = ['site_i_name', 'site_j_name', 'mu_i', 'mu_j', 'q_final', 'E_Si', 'E_Sj', 'E_total']
+df_top = df_allocation.nlargest(10, 'value')[display_cols].copy()
+df_top['site_i_name'] = df_top['site_i_name'].str[:25]
+df_top['site_j_name'] = df_top['site_j_name'].str[:25]
+print(df_top.to_string(index=False))
+
+# ============================================
+# 保存结果
+# ============================================
+with pd.ExcelWriter(OUTPUT_FILE, engine='openpyxl') as writer:
+    # Sheet 1: 完整分配结果
+    df_allocation.to_excel(writer, sheet_name='allocation', index=False)
+
+    # Sheet 2: 简化视图
+    simple_cols = ['site_i_id', 'site_j_id', 'site_i_name', 'site_j_name',
+                   'mu_i', 'mu_j', 'sigma_i', 'sigma_j', 'k_i', 'k_j',
+                   'q_final', 'E_Si', 'E_Sj', 'E_total', 'value']
+    df_allocation[simple_cols].to_excel(writer, sheet_name='allocation_simple', index=False)
+
+    # Sheet 3: 参数记录
+    params = pd.DataFrame({
+        'parameter': ['Q', 'K_ROBUST'],
+        'value': [Q, K_ROBUST],
+        'description': ['卡车容量', '鲁棒性水平(k*σ)']
+    })
+    params.to_excel(writer, sheet_name='parameters', index=False)
+
+    # Sheet 4: 汇总统计
+    summary = pd.DataFrame({
+        'metric': ['total_pairs', 'avg_q_ratio', 'avg_E_total', 'avg_efficiency',
+                  'min_E_total', 'max_E_total', 'clipped_lower', 'clipped_upper'],
+        'value': [len(df_allocation),
+                 df_allocation['q_ratio'].mean(),
+                 df_allocation['E_total'].mean(),
+                 df_allocation['efficiency'].mean(),
+                 df_allocation['E_total'].min(),
+                 df_allocation['E_total'].max(),
+                 clipped_lower, clipped_upper]
+    })
+    summary.to_excel(writer, sheet_name='summary', index=False)
+
+print(f"\n结果已保存至: {OUTPUT_FILE}")
+print("  - Sheet 'allocation': 完整分配结果")
+print("  - Sheet 'allocation_simple': 简化视图")
+print("  - Sheet 'parameters': 参数记录")
+print("  - Sheet 'summary': 汇总统计")
+print("\n" + "=" * 60)
--- a/task3/03_allocation.xlsx
+++ b/task3/03_allocation.xlsx
--- a/task3/04_reschedule.py
+++ b/task3/04_reschedule.py
@@ -0,0 +1,237 @@
+"""
+Task 3 - Step 4: 访问次数重分配
+================================
+
+输入:
+  - 03_allocation.xlsx (配对及分配方案)
+  - ../task1/03_allocate.xlsx (原始频次分配)
+
+输出: 04_reschedule.xlsx (重分配后的访问次数)
+
+重分配逻辑:
+1. 对于每个配对(i,j)，计算双站点访问次数: k_ij = floor(min(k_i, k_j) / 2)
+2. 更新单独访问次数: k'_i = k_i - k_ij, k'_j = k_j - k_ij
+3. 释放的槽位: ΔN = Σ k_ij
+4. 将ΔN按需求比例分配给所有站点
+
+约束:
+- 双站点访问算1次"访问事件"
+- 每天仍然2次访问事件（单站点或双站点）
+- 总访问事件数 = 730
+"""
+
+import pandas as pd
+import numpy as np
+
+# ============================================
+# 参数设置
+# ============================================
+ALLOCATION_FILE = '03_allocation.xlsx'
+TASK1_FILE = '../task1/03_allocate.xlsx'
+OUTPUT_FILE = '04_reschedule.xlsx'
+
+MERGE_RATIO = 0.5   # 合并比例: min(k_i, k_j) * ratio
+TOTAL_EVENTS = 730  # 年度总访问事件数
+
+# ============================================
+# 读取数据
+# ============================================
+print("=" * 60)
+print("Task 3 - Step 4: 访问次数重分配")
+print("=" * 60)
+
+# 读取配对数据
+df_pairs = pd.read_excel(ALLOCATION_FILE, sheet_name='allocation')
+print(f"\n读取配对数据: {len(df_pairs)} 对")
+
+# 读取原始分配
+df_original = pd.read_excel(TASK1_FILE)
+print(f"读取原始分配: {len(df_original)} 个站点")
+print(f"原始总访问次数: {df_original['k'].sum()}")
+
+# ============================================
+# 计算双站点访问次数
+# ============================================
+print(f"\n" + "-" * 40)
+print("计算双站点访问次数")
+print("-" * 40)
+
+# 创建站点访问信息的副本
+sites = df_original[['site_id', 'site_name', 'mu', 'sigma', 'mu_tilde', 'k']].copy()
+sites['k_original'] = sites['k']
+sites['k_single'] = sites['k']  # 将被更新
+sites['k_dual'] = 0  # 作为配对中的一员参与双站点访问的次数
+sites['is_paired'] = False
+sites['pair_partner'] = None
+
+# 记录配对信息
+pair_visits = []
+paired_sites = set()
+
+for idx, row in df_pairs.iterrows():
+    site_i = row['site_i_id']
+    site_j = row['site_j_id']
+    k_i = row['k_i']
+    k_j = row['k_j']
+
+    # 计算双站点访问次数
+    k_ij = int(min(k_i, k_j) * MERGE_RATIO)
+
+    # 确保至少保留1次单独访问
+    if k_ij >= min(k_i, k_j):
+        k_ij = min(k_i, k_j) - 1
+
+    if k_ij < 1:
+        k_ij = 0  # 如果无法合并，跳过
+
+    # 更新单独访问次数
+    k_i_single = k_i - k_ij
+    k_j_single = k_j - k_ij
+
+    # 更新sites表
+    sites.loc[sites['site_id'] == site_i, 'k_single'] = k_i_single
+    sites.loc[sites['site_id'] == site_i, 'k_dual'] = k_ij
+    sites.loc[sites['site_id'] == site_i, 'is_paired'] = True
+    sites.loc[sites['site_id'] == site_i, 'pair_partner'] = site_j
+
+    sites.loc[sites['site_id'] == site_j, 'k_single'] = k_j_single
+    sites.loc[sites['site_id'] == site_j, 'k_dual'] = k_ij
+    sites.loc[sites['site_id'] == site_j, 'is_paired'] = True
+    sites.loc[sites['site_id'] == site_j, 'pair_partner'] = site_i
+
+    paired_sites.add(site_i)
+    paired_sites.add(site_j)
+
+    pair_visits.append({
+        'pair_id': idx + 1,
+        'site_i_id': site_i,
+        'site_j_id': site_j,
+        'site_i_name': row['site_i_name'],
+        'site_j_name': row['site_j_name'],
+        'k_i_original': k_i,
+        'k_j_original': k_j,
+        'k_dual': k_ij,
+        'k_i_single': k_i_single,
+        'k_j_single': k_j_single,
+        'q_final': row['q_final'],
+        'E_total': row['E_total']
+    })
+
+df_pair_visits = pd.DataFrame(pair_visits)
+
+# ============================================
+# 计算释放的槽位和重分配
+# ============================================
+print(f"\n" + "-" * 40)
+print("计算释放槽位")
+print("-" * 40)
+
+# 当前访问事件统计
+total_single = sites['k_single'].sum()
+total_dual = df_pair_visits['k_dual'].sum()
+total_events_current = total_single + total_dual
+
+print(f"单站点访问次数: {total_single}")
+print(f"双站点访问次数: {total_dual}")
+print(f"当前总访问事件: {total_events_current}")
+
+# 需要填补的槽位
+delta_N = TOTAL_EVENTS - total_events_current
+print(f"需要填补的槽位: {delta_N}")
+
+# 按需求比例重分配
+if delta_N > 0:
+    print(f"\n重分配 {delta_N} 次额外访问...")
+
+    # 计算每个站点的需求权重
+    total_demand = sites['mu_tilde'].sum()
+    sites['demand_weight'] = sites['mu_tilde'] / total_demand
+
+    # 按比例分配（使用Hamilton方法）
+    sites['k_extra_float'] = delta_N * sites['demand_weight']
+    sites['k_extra'] = sites['k_extra_float'].apply(np.floor).astype(int)
+
+    # 处理余数
+    remainder = delta_N - sites['k_extra'].sum()
+    if remainder > 0:
+        # 按小数部分降序分配余数
+        fractional = sites['k_extra_float'] - sites['k_extra']
+        top_indices = fractional.nlargest(int(remainder)).index
+        sites.loc[top_indices, 'k_extra'] += 1
+
+    # 更新最终单站点访问次数
+    sites['k_single_final'] = sites['k_single'] + sites['k_extra']
+else:
+    sites['k_extra'] = 0
+    sites['k_single_final'] = sites['k_single']
+
+# ============================================
+# 验证和统计
+# ============================================
+print(f"\n" + "-" * 40)
+print("验证和统计")
+print("-" * 40)
+
+# 最终统计
+final_single = sites['k_single_final'].sum()
+final_dual = df_pair_visits['k_dual'].sum()
+final_total = final_single + final_dual
+
+print(f"最终单站点访问: {final_single}")
+print(f"最终双站点访问: {final_dual}")
+print(f"最终总访问事件: {final_total}")
+print(f"目标访问事件: {TOTAL_EVENTS}")
+print(f"差异: {final_total - TOTAL_EVENTS}")
+
+# 站点级别统计
+print(f"\n站点访问次数变化:")
+sites['k_total_final'] = sites['k_single_final'] + sites['k_dual']
+print(f"  - 原始k范围: [{sites['k_original'].min()}, {sites['k_original'].max()}]")
+print(f"  - 最终k范围: [{sites['k_total_final'].min()}, {sites['k_total_final'].max()}]")
+print(f"  - 额外分配范围: [{sites['k_extra'].min()}, {sites['k_extra'].max()}]")
+
+# 配对统计
+if len(df_pair_visits) > 0:
+    print(f"\n配对访问统计:")
+    print(f"  - 配对数: {len(df_pair_visits)}")
+    print(f"  - 双站点访问总次数: {df_pair_visits['k_dual'].sum()}")
+    print(f"  - 每对双站点访问范围: [{df_pair_visits['k_dual'].min()}, {df_pair_visits['k_dual'].max()}]")
+
+# ============================================
+# 保存结果
+# ============================================
+with pd.ExcelWriter(OUTPUT_FILE, engine='openpyxl') as writer:
+    # Sheet 1: 站点最终访问次数
+    sites_output = sites[['site_id', 'site_name', 'mu', 'sigma', 'mu_tilde',
+                          'k_original', 'k_single', 'k_extra', 'k_single_final',
+                          'k_dual', 'k_total_final', 'is_paired', 'pair_partner']]
+    sites_output.to_excel(writer, sheet_name='sites_schedule', index=False)
+
+    # Sheet 2: 配对访问明细
+    df_pair_visits.to_excel(writer, sheet_name='pair_visits', index=False)
+
+    # Sheet 3: 参数记录
+    params = pd.DataFrame({
+        'parameter': ['MERGE_RATIO', 'TOTAL_EVENTS', 'delta_N'],
+        'value': [MERGE_RATIO, TOTAL_EVENTS, delta_N],
+        'description': ['合并比例', '年度总访问事件', '额外分配次数']
+    })
+    params.to_excel(writer, sheet_name='parameters', index=False)
+
+    # Sheet 4: 汇总统计
+    summary = pd.DataFrame({
+        'metric': ['total_sites', 'paired_sites', 'unpaired_sites',
+                  'total_pairs', 'total_dual_visits', 'total_single_visits',
+                  'total_events', 'original_total_visits'],
+        'value': [len(sites), len(paired_sites), len(sites) - len(paired_sites),
+                 len(df_pair_visits), final_dual, final_single,
+                 final_total, sites['k_original'].sum()]
+    })
+    summary.to_excel(writer, sheet_name='summary', index=False)
+
+print(f"\n结果已保存至: {OUTPUT_FILE}")
+print("  - Sheet 'sites_schedule': 站点最终访问次数")
+print("  - Sheet 'pair_visits': 配对访问明细")
+print("  - Sheet 'parameters': 参数记录")
+print("  - Sheet 'summary': 汇总统计")
+print("\n" + "=" * 60)
--- a/task3/04_reschedule.xlsx
+++ b/task3/04_reschedule.xlsx
--- a/task3/05_calendar.py
+++ b/task3/05_calendar.py
@@ -0,0 +1,332 @@
+"""
+Task 3 - Step 5: 日历排程生成
+=============================
+
+输入:
+  - 04_reschedule.xlsx (站点访问次数 + 配对访问明细)
+
+输出: 05_calendar.xlsx (365天的完整排程)
+
+排程逻辑:
+1. 生成所有访问事件（单站点 + 双站点）
+2. 为每个事件计算理想日期（均匀分布）
+3. 贪心分配到365天，每天2个事件槽位
+4. 优先安排双站点访问（时间较长）
+
+约束:
+- 每天恰好2个访问事件
+- 同一站点的访问尽量均匀分布
+"""
+
+import pandas as pd
+import numpy as np
+from collections import defaultdict
+
+# ============================================
+# 参数设置
+# ============================================
+INPUT_FILE = '04_reschedule.xlsx'
+OUTPUT_FILE = '05_calendar.xlsx'
+
+DAYS_PER_YEAR = 365
+EVENTS_PER_DAY = 2
+TOTAL_EVENTS = DAYS_PER_YEAR * EVENTS_PER_DAY  # 730
+
+# ============================================
+# 读取数据
+# ============================================
+print("=" * 60)
+print("Task 3 - Step 5: 日历排程生成")
+print("=" * 60)
+
+# 读取站点访问次数
+df_sites = pd.read_excel(INPUT_FILE, sheet_name='sites_schedule')
+print(f"\n读取站点数据: {len(df_sites)} 个站点")
+
+# 读取配对访问
+df_pairs = pd.read_excel(INPUT_FILE, sheet_name='pair_visits')
+print(f"读取配对数据: {len(df_pairs)} 对")
+
+# ============================================
+# 生成访问事件
+# ============================================
+print(f"\n" + "-" * 40)
+print("生成访问事件")
+print("-" * 40)
+
+events = []
+event_id = 0
+
+# 1. 生成单站点访问事件
+for _, row in df_sites.iterrows():
+    site_id = row['site_id']
+    site_name = row['site_name']
+    k_single = int(row['k_single_final'])
+
+    for visit_num in range(k_single):
+        # 计算理想日期（均匀分布）
+        ideal_day = (visit_num + 0.5) * DAYS_PER_YEAR / k_single
+
+        events.append({
+            'event_id': event_id,
+            'event_type': 'single',
+            'site_i_id': site_id,
+            'site_j_id': None,
+            'site_i_name': site_name,
+            'site_j_name': None,
+            'visit_num': visit_num + 1,
+            'total_visits': k_single,
+            'ideal_day': ideal_day,
+            'priority': 0  # 单站点优先级较低
+        })
+        event_id += 1
+
+# 2. 生成双站点访问事件
+for _, row in df_pairs.iterrows():
+    site_i_id = row['site_i_id']
+    site_j_id = row['site_j_id']
+    site_i_name = row['site_i_name']
+    site_j_name = row['site_j_name']
+    k_dual = int(row['k_dual'])
+
+    for visit_num in range(k_dual):
+        ideal_day = (visit_num + 0.5) * DAYS_PER_YEAR / k_dual
+
+        events.append({
+            'event_id': event_id,
+            'event_type': 'dual',
+            'site_i_id': site_i_id,
+            'site_j_id': site_j_id,
+            'site_i_name': site_i_name,
+            'site_j_name': site_j_name,
+            'visit_num': visit_num + 1,
+            'total_visits': k_dual,
+            'ideal_day': ideal_day,
+            'priority': 1  # 双站点优先级较高
+        })
+        event_id += 1
+
+df_events = pd.DataFrame(events)
+print(f"总访问事件数: {len(df_events)}")
+print(f"  - 单站点: {(df_events['event_type'] == 'single').sum()}")
+print(f"  - 双站点: {(df_events['event_type'] == 'dual').sum()}")
+
+# ============================================
+# 贪心排程算法
+# ============================================
+print(f"\n" + "-" * 40)
+print("执行贪心排程")
+print("-" * 40)
+
+# 按理想日期和优先级排序
+df_events_sorted = df_events.sort_values(
+    ['ideal_day', 'priority'],
+    ascending=[True, False]
+).reset_index(drop=True)
+
+# 初始化日历槽位
+calendar = {day: [] for day in range(1, DAYS_PER_YEAR + 1)}
+
+# 记录每个站点最后访问的日期
+last_visit = defaultdict(lambda: -float('inf'))
+
+# 贪心分配
+assigned_day = []
+
+for idx, event in df_events_sorted.iterrows():
+    ideal = event['ideal_day']
+    site_i = event['site_i_id']
+    site_j = event['site_j_id']
+
+    # 寻找最佳可用日期
+    best_day = None
+    best_score = float('inf')
+
+    # 搜索范围：理想日期附近
+    search_start = max(1, int(ideal) - 30)
+    search_end = min(DAYS_PER_YEAR, int(ideal) + 30)
+
+    for day in range(search_start, search_end + 1):
+        # 检查槽位是否可用
+        if len(calendar[day]) >= EVENTS_PER_DAY:
+            continue
+
+        # 检查同一站点是否已在当天访问
+        sites_on_day = set()
+        for e in calendar[day]:
+            sites_on_day.add(e['site_i_id'])
+            if e['site_j_id'] is not None:
+                sites_on_day.add(e['site_j_id'])
+
+        if site_i in sites_on_day:
+            continue
+        if site_j is not None and site_j in sites_on_day:
+            continue
+
+        # 计算得分（理想日期偏差 + 间隔惩罚）
+        day_diff = abs(day - ideal)
+
+        # 间隔惩罚：鼓励与上次访问保持距离
+        min_gap = min(
+            day - last_visit[site_i],
+            day - last_visit[site_j] if site_j is not None else float('inf')
+        )
+        gap_penalty = max(0, 7 - min_gap) * 2  # 7天内再次访问有惩罚
+
+        score = day_diff + gap_penalty
+
+        if score < best_score:
+            best_score = score
+            best_day = day
+
+    # 如果附近没找到，扩大搜索范围
+    if best_day is None:
+        for day in range(1, DAYS_PER_YEAR + 1):
+            if len(calendar[day]) < EVENTS_PER_DAY:
+                sites_on_day = set()
+                for e in calendar[day]:
+                    sites_on_day.add(e['site_i_id'])
+                    if e['site_j_id'] is not None:
+                        sites_on_day.add(e['site_j_id'])
+
+                if site_i not in sites_on_day:
+                    if site_j is None or site_j not in sites_on_day:
+                        best_day = day
+                        break
+
+    if best_day is None:
+        print(f"警告: 无法分配事件 {event['event_id']}")
+        best_day = 1  # 强制分配
+
+    # 分配到日历
+    calendar[best_day].append(event.to_dict())
+    assigned_day.append(best_day)
+
+    # 更新最后访问日期
+    last_visit[site_i] = best_day
+    if site_j is not None:
+        last_visit[site_j] = best_day
+
+df_events_sorted['assigned_day'] = assigned_day
+
+# ============================================
+# 生成日历视图
+# ============================================
+print(f"\n" + "-" * 40)
+print("生成日历视图")
+print("-" * 40)
+
+calendar_rows = []
+for day in range(1, DAYS_PER_YEAR + 1):
+    events_on_day = calendar[day]
+
+    row = {'day': day}
+
+    for slot in range(EVENTS_PER_DAY):
+        if slot < len(events_on_day):
+            e = events_on_day[slot]
+            row[f'slot_{slot+1}_type'] = e['event_type']
+            row[f'slot_{slot+1}_site_i'] = e['site_i_id']
+            row[f'slot_{slot+1}_site_j'] = e['site_j_id']
+            row[f'slot_{slot+1}_name_i'] = e['site_i_name']
+            row[f'slot_{slot+1}_name_j'] = e['site_j_name']
+        else:
+            row[f'slot_{slot+1}_type'] = None
+            row[f'slot_{slot+1}_site_i'] = None
+            row[f'slot_{slot+1}_site_j'] = None
+            row[f'slot_{slot+1}_name_i'] = None
+            row[f'slot_{slot+1}_name_j'] = None
+
+    calendar_rows.append(row)
+
+df_calendar = pd.DataFrame(calendar_rows)
+
+# ============================================
+# 统计和验证
+# ============================================
+print(f"\n排程统计:")
+
+# 每天事件数
+events_per_day = [len(calendar[d]) for d in range(1, DAYS_PER_YEAR + 1)]
+print(f"  - 每天事件数: min={min(events_per_day)}, max={max(events_per_day)}, avg={np.mean(events_per_day):.2f}")
+
+# 理想日期偏差
+df_events_sorted['day_diff'] = abs(df_events_sorted['assigned_day'] - df_events_sorted['ideal_day'])
+print(f"  - 理想日期偏差: avg={df_events_sorted['day_diff'].mean():.2f}, max={df_events_sorted['day_diff'].max():.0f}")
+
+# 访问间隔分析
+print(f"\n访问间隔分析:")
+
+site_visits = defaultdict(list)
+for _, event in df_events_sorted.iterrows():
+    site_visits[event['site_i_id']].append(event['assigned_day'])
+    # 只有双站点访问才有site_j_id
+    if event['site_j_id'] is not None and not (isinstance(event['site_j_id'], float) and np.isnan(event['site_j_id'])):
+        site_visits[event['site_j_id']].append(event['assigned_day'])
+
+gaps = []
+for site_id, days in site_visits.items():
+    days_sorted = sorted(days)
+    for i in range(1, len(days_sorted)):
+        gaps.append(days_sorted[i] - days_sorted[i-1])
+
+if gaps:
+    print(f"  - 间隔范围: [{min(gaps)}, {max(gaps)}] 天")
+    print(f"  - 平均间隔: {np.mean(gaps):.1f} 天")
+    print(f"  - 中位数间隔: {np.median(gaps):.1f} 天")
+
+# ============================================
+# 保存结果
+# ============================================
+with pd.ExcelWriter(OUTPUT_FILE, engine='openpyxl') as writer:
+    # Sheet 1: 日历视图
+    df_calendar.to_excel(writer, sheet_name='calendar', index=False)
+
+    # Sheet 2: 事件详情（含分配日期）
+    df_events_sorted.to_excel(writer, sheet_name='events', index=False)
+
+    # Sheet 3: 站点访问日期汇总
+    site_schedule = []
+    for site_id, days in site_visits.items():
+        # 跳过None/NaN值
+        if site_id is None or (isinstance(site_id, float) and np.isnan(site_id)):
+            continue
+        # 处理可能的类型不匹配
+        site_row = df_sites[df_sites['site_id'] == int(site_id)]
+        if len(site_row) > 0:
+            site_name = site_row['site_name'].values[0]
+        else:
+            site_name = f"Site_{site_id}"
+        days_sorted = sorted(days)
+        site_schedule.append({
+            'site_id': int(site_id),
+            'site_name': site_name,
+            'total_visits': len(days),
+            'visit_days': ','.join(map(str, days_sorted)),
+            'first_visit': days_sorted[0],
+            'last_visit': days_sorted[-1]
+        })
+    df_site_schedule = pd.DataFrame(site_schedule)
+    df_site_schedule.to_excel(writer, sheet_name='site_visits', index=False)
+
+    # Sheet 4: 汇总统计
+    summary = pd.DataFrame({
+        'metric': ['total_days', 'total_events', 'single_events', 'dual_events',
+                  'avg_day_diff', 'max_day_diff', 'avg_gap', 'min_gap', 'max_gap'],
+        'value': [DAYS_PER_YEAR, len(df_events),
+                 (df_events['event_type'] == 'single').sum(),
+                 (df_events['event_type'] == 'dual').sum(),
+                 df_events_sorted['day_diff'].mean(),
+                 df_events_sorted['day_diff'].max(),
+                 np.mean(gaps) if gaps else 0,
+                 min(gaps) if gaps else 0,
+                 max(gaps) if gaps else 0]
+    })
+    summary.to_excel(writer, sheet_name='summary', index=False)
+
+print(f"\n结果已保存至: {OUTPUT_FILE}")
+print("  - Sheet 'calendar': 365天日历视图")
+print("  - Sheet 'events': 事件详情")
+print("  - Sheet 'site_visits': 站点访问日期汇总")
+print("  - Sheet 'summary': 汇总统计")
+print("\n" + "=" * 60)
--- a/task3/05_calendar.xlsx
+++ b/task3/05_calendar.xlsx
--- a/task3/06_evaluate.py
+++ b/task3/06_evaluate.py
@@ -0,0 +1,348 @@
+"""
+Task 3 - Step 6: 效果评估
+=========================
+
+输入:
+  - 04_reschedule.xlsx (访问次数)
+  - 03_allocation.xlsx (配对分配方案)
+  - ../task1/03_allocate.xlsx (Task 1结果，用于对比)
+  - ../task1/04_metrics.xlsx (Task 1指标，用于对比)
+
+输出: 06_evaluate.xlsx (评估指标对比)
+
+评估指标:
+- E1': 期望总服务量
+- E2': 质量加权服务量（总量计算衰减）
+- F1': 满足率Gini系数
+- F2': 最低满足率
+- R1: 服务缺口风险
+- RS: 资源节省率
+
+有效性衰减公式（总量计算）:
+q(μ_i + μ_j) = min(1, 250 / (μ_i + μ_j))
+"""
+
+import pandas as pd
+import numpy as np
+from scipy import stats
+
+# ============================================
+# 参数设置
+# ============================================
+RESCHEDULE_FILE = '04_reschedule.xlsx'
+ALLOCATION_FILE = '03_allocation.xlsx'
+TASK1_ALLOC_FILE = '../task1/03_allocate.xlsx'
+TASK1_METRIC_FILE = '../task1/04_metrics.xlsx'
+OUTPUT_FILE = '06_evaluate.xlsx'
+
+Q = 400             # 卡车容量
+QUALITY_THRESHOLD = 250  # 质量衰减阈值
+SHORTFALL_THRESHOLD = 0.8  # 服务缺口阈值
+
+# ============================================
+# 辅助函数
+# ============================================
+def quality_factor(mu_total):
+    """质量折扣因子（总量计算）"""
+    return min(1.0, QUALITY_THRESHOLD / mu_total) if mu_total > 0 else 1.0
+
+
+def expected_service(q, mu, sigma):
+    """E[min(D, q)]"""
+    if sigma == 0:
+        return min(mu, q)
+    z = (q - mu) / sigma
+    return mu * stats.norm.cdf(z) - sigma * stats.norm.pdf(z) + q * (1 - stats.norm.cdf(z))
+
+
+def gini_coefficient(values):
+    """计算Gini系数"""
+    values = np.array(values)
+    values = values[~np.isnan(values)]
+    if len(values) == 0:
+        return 0
+    values = np.sort(values)
+    n = len(values)
+    cumsum = np.cumsum(values)
+    return (2 * np.sum((np.arange(1, n + 1) * values)) - (n + 1) * cumsum[-1]) / (n * cumsum[-1]) if cumsum[-1] > 0 else 0
+
+
+def shortfall_probability(q, mu, sigma, threshold=0.8):
+    """P(S/D < threshold)，即服务不足的概率"""
+    # 简化计算：P(min(D,q) / D < 0.8) ≈ P(D > q/0.8)
+    if sigma == 0:
+        return 0 if q >= mu * threshold else 1
+    critical_demand = q / threshold
+    return 1 - stats.norm.cdf((critical_demand - mu) / sigma)
+
+
+# ============================================
+# 读取数据
+# ============================================
+print("=" * 60)
+print("Task 3 - Step 6: 效果评估")
+print("=" * 60)
+
+# Task 3 数据
+df_sites = pd.read_excel(RESCHEDULE_FILE, sheet_name='sites_schedule')
+df_pairs = pd.read_excel(ALLOCATION_FILE, sheet_name='allocation')
+df_pair_visits = pd.read_excel(RESCHEDULE_FILE, sheet_name='pair_visits')
+
+print(f"\n读取Task 3数据:")
+print(f"  - 站点数: {len(df_sites)}")
+print(f"  - 配对数: {len(df_pairs)}")
+
+# Task 1 数据（用于对比）
+df_task1 = pd.read_excel(TASK1_ALLOC_FILE)
+try:
+    df_task1_metrics = pd.read_excel(TASK1_METRIC_FILE)
+    has_task1_metrics = True
+except:
+    has_task1_metrics = False
+    print("  - 未找到Task 1指标文件，将重新计算")
+
+# ============================================
+# 计算 Task 3 指标
+# ============================================
+print(f"\n" + "-" * 40)
+print("计算 Task 3 指标")
+print("-" * 40)
+
+# 合并配对访问信息
+pair_k = {(row['site_i_id'], row['site_j_id']): row['k_dual']
+          for _, row in df_pair_visits.iterrows()}
+
+# === E1': 期望总服务量 ===
+E1_prime = 0
+
+# 单站点贡献
+for _, row in df_sites.iterrows():
+    k_single = row['k_single_final']
+    mu = row['mu']
+    E1_prime += k_single * mu
+
+# 双站点贡献
+for _, row in df_pairs.iterrows():
+    pair_key = (row['site_i_id'], row['site_j_id'])
+    k_dual = pair_k.get(pair_key, 0)
+    E_total = row['E_total']
+    E1_prime += k_dual * E_total
+
+print(f"E1' (期望总服务量): {E1_prime:.0f}")
+
+# === E2': 质量加权服务量 ===
+E2_prime = 0
+
+# 单站点贡献
+for _, row in df_sites.iterrows():
+    k_single = row['k_single_final']
+    mu = row['mu']
+    q_factor = quality_factor(mu)
+    E2_prime += k_single * q_factor * mu
+
+# 双站点贡献（总量计算衰减）
+for _, row in df_pairs.iterrows():
+    pair_key = (row['site_i_id'], row['site_j_id'])
+    k_dual = pair_k.get(pair_key, 0)
+    mu_sum = row['mu_i'] + row['mu_j']
+    E_total = row['E_total']
+    q_factor = quality_factor(mu_sum)  # 总量计算
+    E2_prime += k_dual * q_factor * E_total
+
+print(f"E2' (质量加权服务量): {E2_prime:.0f}")
+
+# === 满足率计算 ===
+# Task 1定义: r_i = k_i * μ_i / μ̃_i (等效服务次数)
+# Task 3: 需要分别计算单站点和双站点的贡献
+
+site_satisfaction = {}
+
+for _, row in df_sites.iterrows():
+    site_id = row['site_id']
+    mu = row['mu']
+    mu_tilde = row['mu_tilde']
+    k_single = row['k_single_final']
+
+    # 单站点贡献: k_single * μ / μ̃
+    r_single = k_single * mu / mu_tilde if mu_tilde > 0 else 0
+    site_satisfaction[site_id] = r_single
+
+# 加上双站点贡献
+for _, row in df_pairs.iterrows():
+    pair_key = (row['site_i_id'], row['site_j_id'])
+    k_dual = pair_k.get(pair_key, 0)
+
+    # 双站点贡献: k_dual * E[S_i] / μ̃_i
+    mu_tilde_i = df_sites[df_sites['site_id'] == row['site_i_id']]['mu_tilde'].values[0]
+    mu_tilde_j = df_sites[df_sites['site_id'] == row['site_j_id']]['mu_tilde'].values[0]
+
+    r_dual_i = k_dual * row['E_Si'] / mu_tilde_i if mu_tilde_i > 0 else 0
+    r_dual_j = k_dual * row['E_Sj'] / mu_tilde_j if mu_tilde_j > 0 else 0
+
+    site_satisfaction[row['site_i_id']] += r_dual_i
+    site_satisfaction[row['site_j_id']] += r_dual_j
+
+# 计算满足率列表
+satisfaction_rates = list(site_satisfaction.values())
+
+# === F1': Gini系数 ===
+F1_prime = gini_coefficient(satisfaction_rates)
+print(f"F1' (满足率Gini): {F1_prime:.4f}")
+
+# === F2': 最低满足率 ===
+F2_prime = min(satisfaction_rates) if satisfaction_rates else 0
+print(f"F2' (最低满足率): {F2_prime:.4f}")
+
+# === R1: 服务缺口风险 ===
+# 双站点访问时，任一站点服务不足的概率
+shortfall_probs = []
+for _, row in df_pairs.iterrows():
+    q_final = row['q_final']
+    mu_i, sigma_i = row['mu_i'], row['sigma_i']
+    mu_j, sigma_j = row['mu_j'], row['sigma_j']
+
+    # 站点i的缺口概率
+    p_i = shortfall_probability(q_final, mu_i, sigma_i, SHORTFALL_THRESHOLD)
+    # 站点j的缺口概率
+    p_j = shortfall_probability(Q - q_final, mu_j, sigma_j, SHORTFALL_THRESHOLD)
+
+    # 至少一个站点缺口的概率
+    p_either = 1 - (1 - p_i) * (1 - p_j)
+    shortfall_probs.append(p_either)
+
+R1 = np.mean(shortfall_probs) if shortfall_probs else 0
+print(f"R1 (平均缺口风险): {R1:.4f}")
+
+# === RS: 资源节省率 ===
+total_dual = df_pair_visits['k_dual'].sum()
+RS = total_dual / 730 * 100
+print(f"RS (资源节省率): {RS:.2f}%")
+
+# ============================================
+# 计算 Task 1 指标（用于对比）
+# ============================================
+print(f"\n" + "-" * 40)
+print("计算 Task 1 指标（对比基准）")
+print("-" * 40)
+
+# E1: 总服务量
+E1_task1 = (df_task1['k'] * df_task1['mu']).sum()
+print(f"E1 (Task 1 总服务量): {E1_task1:.0f}")
+
+# E2: 质量加权
+E2_task1 = 0
+for _, row in df_task1.iterrows():
+    q_factor = quality_factor(row['mu'])
+    E2_task1 += row['k'] * q_factor * row['mu']
+print(f"E2 (Task 1 质量加权): {E2_task1:.0f}")
+
+# F1: Gini系数 - 使用与Task 3相同的r定义
+# r_i = k_i * μ_i / μ̃_i
+task1_rates = []
+for _, row in df_task1.iterrows():
+    r = row['k'] * row['mu'] / row['mu_tilde'] if row['mu_tilde'] > 0 else 0
+    task1_rates.append(r)
+F1_task1 = gini_coefficient(task1_rates)
+print(f"F1 (Task 1 Gini): {F1_task1:.4f}")
+
+# F2: 最低满足率
+F2_task1 = min(task1_rates) if task1_rates else 0
+print(f"F2 (Task 1 最低满足率): {F2_task1:.4f}")
+
+# ============================================
+# 对比分析
+# ============================================
+print(f"\n" + "-" * 40)
+print("Task 3 vs Task 1 对比")
+print("-" * 40)
+
+comparison = pd.DataFrame({
+    'Metric': ['E1 (总服务量)', 'E2 (质量加权)', 'F1 (Gini系数)', 'F2 (最低满足率)'],
+    'Task 1': [E1_task1, E2_task1, F1_task1, F2_task1],
+    'Task 3': [E1_prime, E2_prime, F1_prime, F2_prime],
+    'Change': [E1_prime - E1_task1, E2_prime - E2_task1,
+               F1_prime - F1_task1, F2_prime - F2_task1],
+    'Change %': [(E1_prime - E1_task1) / E1_task1 * 100,
+                 (E2_prime - E2_task1) / E2_task1 * 100,
+                 (F1_prime - F1_task1) / F1_task1 * 100 if F1_task1 != 0 else 0,
+                 (F2_prime - F2_task1) / F2_task1 * 100 if F2_task1 != 0 else 0]
+})
+
+print(comparison.to_string(index=False))
+
+# ============================================
+# 保存结果
+# ============================================
+with pd.ExcelWriter(OUTPUT_FILE, engine='openpyxl') as writer:
+    # Sheet 1: 指标对比
+    comparison.to_excel(writer, sheet_name='comparison', index=False)
+
+    # Sheet 2: Task 3 详细指标
+    task3_metrics = pd.DataFrame({
+        'metric': ['E1_prime', 'E2_prime', 'F1_prime', 'F2_prime',
+                  'R1', 'RS', 'total_pairs', 'total_dual_visits'],
+        'value': [E1_prime, E2_prime, F1_prime, F2_prime,
+                 R1, RS/100, len(df_pairs), total_dual],
+        'description': ['期望总服务量', '质量加权服务量', '满足率Gini系数', '最低满足率',
+                       '平均缺口风险', '资源节省率', '配对数', '双站点访问次数']
+    })
+    task3_metrics.to_excel(writer, sheet_name='task3_metrics', index=False)
+
+    # Sheet 3: 站点级别满足率
+    site_rates = []
+    for site_id, r in site_satisfaction.items():
+        site_row = df_sites[df_sites['site_id'] == site_id]
+        if len(site_row) > 0:
+            site_name = site_row['site_name'].values[0]
+            mu = site_row['mu'].values[0]
+            mu_tilde = site_row['mu_tilde'].values[0]
+            k_single = site_row['k_single_final'].values[0]
+            k_dual = site_row['k_dual'].values[0]
+        else:
+            site_name = f"Site_{site_id}"
+            mu, mu_tilde, k_single, k_dual = 0, 0, 0, 0
+
+        site_rates.append({
+            'site_id': site_id,
+            'site_name': site_name,
+            'mu': mu,
+            'mu_tilde': mu_tilde,
+            'k_single': k_single,
+            'k_dual': k_dual,
+            'satisfaction_rate_r': r
+        })
+    df_site_rates = pd.DataFrame(site_rates)
+    df_site_rates = df_site_rates.sort_values('satisfaction_rate_r')
+    df_site_rates.to_excel(writer, sheet_name='site_satisfaction', index=False)
+
+    # Sheet 4: 配对风险分析
+    pair_risk = []
+    for idx, row in df_pairs.iterrows():
+        pair_key = (row['site_i_id'], row['site_j_id'])
+        k_dual = pair_k.get(pair_key, 0)
+        q_final = row['q_final']
+        mu_i, sigma_i = row['mu_i'], row['sigma_i']
+        mu_j, sigma_j = row['mu_j'], row['sigma_j']
+
+        p_i = shortfall_probability(q_final, mu_i, sigma_i, SHORTFALL_THRESHOLD)
+        p_j = shortfall_probability(Q - q_final, mu_j, sigma_j, SHORTFALL_THRESHOLD)
+
+        pair_risk.append({
+            'site_i_name': row['site_i_name'],
+            'site_j_name': row['site_j_name'],
+            'k_dual': k_dual,
+            'q_final': q_final,
+            'shortfall_prob_i': p_i,
+            'shortfall_prob_j': p_j,
+            'shortfall_prob_either': 1 - (1 - p_i) * (1 - p_j)
+        })
+    df_pair_risk = pd.DataFrame(pair_risk)
+    df_pair_risk = df_pair_risk.sort_values('shortfall_prob_either', ascending=False)
+    df_pair_risk.to_excel(writer, sheet_name='pair_risk', index=False)
+
+print(f"\n结果已保存至: {OUTPUT_FILE}")
+print("  - Sheet 'comparison': Task 1 vs Task 3 对比")
+print("  - Sheet 'task3_metrics': Task 3 详细指标")
+print("  - Sheet 'site_satisfaction': 站点满足率")
+print("  - Sheet 'pair_risk': 配对风险分析")
+print("\n" + "=" * 60)
--- a/task3/06_evaluate.xlsx
+++ b/task3/06_evaluate.xlsx
--- a/task3/README.md
+++ b/task3/README.md
@@ -663,3 +663,80 @@ flowchart TB
 | 未满足惩罚 | $\lambda$ | 0.5 | 敏感性分析 |
 | 最大缺口惩罚 | $\eta$ | 0.3 | 敏感性分析 |
 | 鲁棒性水平 | $k$ | 1 | 84%保护 |
+| **合并比例** | $r_{merge}$ | 1/2 | 保留50%独立访问 |
+
+---
+
+## 附录D：实现决策记录
+
+### D.1 关键设计决策
+
+| 决策项 | 选择 | 理由 |
+|--------|------|------|
+| 数据来源 | Task 1结果 (`task1/03_allocate.xlsx`) | 复用已验证的需求修正和频次分配 |
+| 有效性衰减计算 | **总量计算** $q(\mu_i + \mu_j)$ | 双站点共享同一卡车，总负载决定服务质量 |
+| 合并比例 | $k_{max} = \lfloor \min(k_i, k_j) / 2 \rfloor$ | 保留50%独立访问，平衡效率与风险 |
+| 配对策略 | 每站点最多配对一次 | 简化实现，足以说明方法论 |
+| 双站点访问计数 | 算1次访问事件 | 释放槽位给其他站点 |
+
+### D.2 有效性衰减公式（总量计算）
+
+双站点访问时，质量折扣因子按总服务量计算：
+
+$$q_{ij} = \min\left(1, \frac{250}{\mu_i + \mu_j}\right)$$
+
+**E2'的计算**：
+$$E_2' = \sum_{\text{单站点}} k_i \cdot q(\mu_i) \cdot \mu_i + \sum_{\text{双站点}} k_{ij} \cdot q(\mu_i + \mu_j) \cdot E[S_i + S_j]$$
+
+### D.3 合并比例详述
+
+对于配对 $(i, j)$，原频次为 $k_i, k_j$：
+
+| 项目 | 公式 |
+|------|------|
+| 双站点访问次数 | $k_{ij} = \lfloor \min(k_i, k_j) / 2 \rfloor$ |
+| 站点i剩余单独访问 | $k_i' = k_i - k_{ij}$ |
+| 站点j剩余单独访问 | $k_j' = k_j - k_{ij}$ |
+| 释放的访问槽位 | $\Delta N = \sum k_{ij}$ |
+
+---
+
+## 附录E：敏感性分析计划
+
+### E.1 待分析参数
+
+| 参数 | 基准值 | 扫描范围 | 预期影响 |
+|------|--------|---------|---------|
+| **合并比例** $r_{merge}$ | 1/2 | [1/3, 1/2, 2/3] | 配对数量、资源节省 |
+| 距离阈值 $l_{max}$ | 50 mi | [30, 40, 50, 60, 70] | 可行配对数 |
+| 容量上限 $\mu_i + \mu_j$ | 450 | [400, 425, 450, 475, 500] | 配对选择范围 |
+| CV阈值 | 0.5 | [0.3, 0.4, 0.5, 0.6] | 配对稳定性 |
+
+### E.2 敏感性分析输出
+
+- 各参数对 E1', E2', F1', R1 的影响曲线
+- 参数交互效应热力图
+- 稳健性结论
+
+---
+
+## 附录F：程序流水线
+
+```
+task3/
+├── 01_distance.py      # 距离矩阵计算
+│   └── 01_distance.xlsx
+├── 02_pairing.py       # 配对筛选与选择
+│   └── 02_pairing.xlsx
+├── 03_allocation.py    # 最优分配计算
+│   └── 03_allocation.xlsx
+├── 04_reschedule.py    # 访问次数重分配
+│   └── 04_reschedule.xlsx
+├── 05_calendar.py      # 日历排程生成
+│   └── 05_calendar.xlsx
+├── 06_evaluate.py      # 效果评估
+│   └── 06_evaluate.xlsx
+├── 07_sensitivity.py   # 敏感性分析（待实现）
+│   └── 07_sensitivity.xlsx
+└── figures/            # 可视化输出
+```