% ============================================================ % 第五章 关键实现 % 对应评审维度:技术深度、技术可行性 % ============================================================ \chapter{关键实现} \section{截图理解与交易抽取} 系统采用多模态大模型 API 完成截图分类与交易字段抽取。首先识别截图所属 APP(微信、支付宝、银行、数字钱包等)及页面类型(账单列表、详情、转账回执等),再根据页面类型调用相应抽取策略,输出标准化交易记录。 抽取字段包括:交易时间、金额、收支方向、对手方名称/账号、本方账户尾号、订单号、备注、识别置信度。输出为结构化数据,支持可计算、可追溯、可比对、可复核。 % 图 5-1 占位 \placeholderfigure{Fig-extract-fields.pdf}{交易抽取字段与置信度示意} \section{跨平台关联与去重} 去重逻辑基于规则引擎实现,主要包括:订单号一致则判定为重复;金额与时间窗口相近且对手方一致时可聚类。聚类后保留置信度最高的一条为主记录,其余标记为重复。本人账户中转识别通过比对对手方与本方已知账户实现,标记为「中转」的交易不纳入被骗金额累计。 % 图 5-2 占位 \placeholderfigure{Fig-dedup-transit.pdf}{去重与中转识别逻辑示意} \section{被骗金额认定} 认定逻辑结合规则与 LLM 辅助:规则负责纳入/排除边界控制(如本人账户中转排除、收入方向排除等);LLM 负责生成更规范的认定理由与问询建议。每笔交易输出高/中/低置信分层,低置信记录进入人工复核流程。 \section{报告生成} 报告服务支持导出 Excel、Word、PDF 三种格式,内容可包含:被骗金额汇总、交易明细、认定理由与排除说明、笔录辅助问询建议。报告保留版本快照,支持证据索引与审计追踪。 \section{交易结构化字段定义} 表\ref{tab:tx-fields} 定义交易结构化字段。 \begin{table}[H] \centering \caption{交易结构化字段定义} \label{tab:tx-fields} \begin{tabular}{llp{5cm}} \toprule \textbf{字段} & \textbf{类型} & \textbf{说明} \\ \midrule trade\_time & datetime & 交易时间,格式 YYYY-MM-DD HH:MM:SS \\ amount & decimal & 金额(元) \\ direction & enum & in / out \\ counterparty\_name & string & 对手方名称 \\ counterparty\_account & string & 对手方账号 \\ self\_account\_tail\_no & string & 本方账户尾号 \\ order\_no & string & 订单号 \\ remark & string & 备注 \\ confidence & float & 识别置信度 0--1 \\ \bottomrule \end{tabular} \end{table} \section{认定置信度分层} 表\ref{tab:confidence} 说明认定置信度分层及对应处理策略。 \begin{table}[H] \centering \caption{认定置信度分层说明} \label{tab:confidence} \begin{tabular}{llp{4cm}} \toprule \textbf{等级} & \textbf{含义} & \textbf{处理策略} \\ \midrule 高 & 明确可纳入被骗金额 & 可直接确认 \\ 中 & 需结合案情判断 & 建议人工复核 \\ 低 & 建议排除或待核实 & 必须人工复核 \\ \bottomrule \end{tabular} \end{table}