Files
fund-tracer/docs/project-book/chapters/05-implementation.tex
2026-03-13 14:48:32 +08:00

75 lines
3.2 KiB
TeX
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
% ============================================================
% 第五章 关键实现
% 对应评审维度:技术深度、技术可行性
% ============================================================
\chapter{关键实现}
\section{截图理解与交易抽取}
系统采用多模态大模型 API 完成截图分类与交易字段抽取。首先识别截图所属 APP微信、支付宝、银行、数字钱包等及页面类型账单列表、详情、转账回执等再根据页面类型调用相应抽取策略输出标准化交易记录。
抽取字段包括:交易时间、金额、收支方向、对手方名称/账号、本方账户尾号、订单号、备注、识别置信度。输出为结构化数据,支持可计算、可追溯、可比对、可复核。
% 图 5-1 占位
\placeholderfigure{Fig-extract-fields.pdf}{交易抽取字段与置信度示意}
\section{跨平台关联与去重}
去重逻辑基于规则引擎实现,主要包括:订单号一致则判定为重复;金额与时间窗口相近且对手方一致时可聚类。聚类后保留置信度最高的一条为主记录,其余标记为重复。本人账户中转识别通过比对对手方与本方已知账户实现,标记为「中转」的交易不纳入被骗金额累计。
% 图 5-2 占位
\placeholderfigure{Fig-dedup-transit.pdf}{去重与中转识别逻辑示意}
\section{被骗金额认定}
认定逻辑结合规则与 LLM 辅助:规则负责纳入/排除边界控制如本人账户中转排除、收入方向排除等LLM 负责生成更规范的认定理由与问询建议。每笔交易输出高/中/低置信分层,低置信记录进入人工复核流程。
\section{报告生成}
报告服务支持导出 Excel、Word、PDF 三种格式,内容可包含:被骗金额汇总、交易明细、认定理由与排除说明、笔录辅助问询建议。报告保留版本快照,支持证据索引与审计追踪。
\section{交易结构化字段定义}
\ref{tab:tx-fields} 定义交易结构化字段。
\begin{table}[H]
\centering
\caption{交易结构化字段定义}
\label{tab:tx-fields}
\begin{tabular}{llp{5cm}}
\toprule
\textbf{字段} & \textbf{类型} & \textbf{说明} \\
\midrule
trade\_time & datetime & 交易时间,格式 YYYY-MM-DD HH:MM:SS \\
amount & decimal & 金额(元) \\
direction & enum & in / out \\
counterparty\_name & string & 对手方名称 \\
counterparty\_account & string & 对手方账号 \\
self\_account\_tail\_no & string & 本方账户尾号 \\
order\_no & string & 订单号 \\
remark & string & 备注 \\
confidence & float & 识别置信度 0--1 \\
\bottomrule
\end{tabular}
\end{table}
\section{认定置信度分层}
\ref{tab:confidence} 说明认定置信度分层及对应处理策略。
\begin{table}[H]
\centering
\caption{认定置信度分层说明}
\label{tab:confidence}
\begin{tabular}{llp{4cm}}
\toprule
\textbf{等级} & \textbf{含义} & \textbf{处理策略} \\
\midrule
& 明确可纳入被骗金额 & 可直接确认 \\
& 需结合案情判断 & 建议人工复核 \\
& 建议排除或待核实 & 必须人工复核 \\
\bottomrule
\end{tabular}
\end{table}