75 lines
3.2 KiB
TeX
75 lines
3.2 KiB
TeX
% ============================================================
|
||
% 第五章 关键实现
|
||
% 对应评审维度:技术深度、技术可行性
|
||
% ============================================================
|
||
|
||
\chapter{关键实现}
|
||
|
||
\section{截图理解与交易抽取}
|
||
|
||
系统采用多模态大模型 API 完成截图分类与交易字段抽取。首先识别截图所属 APP(微信、支付宝、银行、数字钱包等)及页面类型(账单列表、详情、转账回执等),再根据页面类型调用相应抽取策略,输出标准化交易记录。
|
||
|
||
抽取字段包括:交易时间、金额、收支方向、对手方名称/账号、本方账户尾号、订单号、备注、识别置信度。输出为结构化数据,支持可计算、可追溯、可比对、可复核。
|
||
|
||
% 图 5-1 占位
|
||
\placeholderfigure{Fig-extract-fields.pdf}{交易抽取字段与置信度示意}
|
||
|
||
\section{跨平台关联与去重}
|
||
|
||
去重逻辑基于规则引擎实现,主要包括:订单号一致则判定为重复;金额与时间窗口相近且对手方一致时可聚类。聚类后保留置信度最高的一条为主记录,其余标记为重复。本人账户中转识别通过比对对手方与本方已知账户实现,标记为「中转」的交易不纳入被骗金额累计。
|
||
|
||
% 图 5-2 占位
|
||
\placeholderfigure{Fig-dedup-transit.pdf}{去重与中转识别逻辑示意}
|
||
|
||
\section{被骗金额认定}
|
||
|
||
认定逻辑结合规则与 LLM 辅助:规则负责纳入/排除边界控制(如本人账户中转排除、收入方向排除等);LLM 负责生成更规范的认定理由与问询建议。每笔交易输出高/中/低置信分层,低置信记录进入人工复核流程。
|
||
|
||
\section{报告生成}
|
||
|
||
报告服务支持导出 Excel、Word、PDF 三种格式,内容可包含:被骗金额汇总、交易明细、认定理由与排除说明、笔录辅助问询建议。报告保留版本快照,支持证据索引与审计追踪。
|
||
|
||
\section{交易结构化字段定义}
|
||
|
||
表\ref{tab:tx-fields} 定义交易结构化字段。
|
||
|
||
\begin{table}[H]
|
||
\centering
|
||
\caption{交易结构化字段定义}
|
||
\label{tab:tx-fields}
|
||
\begin{tabular}{llp{5cm}}
|
||
\toprule
|
||
\textbf{字段} & \textbf{类型} & \textbf{说明} \\
|
||
\midrule
|
||
trade\_time & datetime & 交易时间,格式 YYYY-MM-DD HH:MM:SS \\
|
||
amount & decimal & 金额(元) \\
|
||
direction & enum & in / out \\
|
||
counterparty\_name & string & 对手方名称 \\
|
||
counterparty\_account & string & 对手方账号 \\
|
||
self\_account\_tail\_no & string & 本方账户尾号 \\
|
||
order\_no & string & 订单号 \\
|
||
remark & string & 备注 \\
|
||
confidence & float & 识别置信度 0--1 \\
|
||
\bottomrule
|
||
\end{tabular}
|
||
\end{table}
|
||
|
||
\section{认定置信度分层}
|
||
|
||
表\ref{tab:confidence} 说明认定置信度分层及对应处理策略。
|
||
|
||
\begin{table}[H]
|
||
\centering
|
||
\caption{认定置信度分层说明}
|
||
\label{tab:confidence}
|
||
\begin{tabular}{llp{4cm}}
|
||
\toprule
|
||
\textbf{等级} & \textbf{含义} & \textbf{处理策略} \\
|
||
\midrule
|
||
高 & 明确可纳入被骗金额 & 可直接确认 \\
|
||
中 & 需结合案情判断 & 建议人工复核 \\
|
||
低 & 建议排除或待核实 & 必须人工复核 \\
|
||
\bottomrule
|
||
\end{tabular}
|
||
\end{table}
|