Files
fund-tracer/docs/competition-book/chapters/04-mechanism.tex
2026-03-17 22:39:05 +08:00

141 lines
8.2 KiB
TeX
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
\chapter{核心能力与关键机制}
\section{多APP截图识别与字段抽取}
系统首先面向微信、支付宝、银行APP、数字钱包等不同来源截图进行页面识别与字段抽取重点获取交易时间、金额、收付款方向、对手方名称、本人账户尾号、订单号、备注等结构化要素。该过程的目的不只是“把图上的字识别出来”而是为后续跨平台关联和金额认定提供统一数据底座。
\begin{table}[H]
\centering
\caption{截图识别关键字段表}
\begin{tabularx}{\textwidth}{p{0.2\textwidth}p{0.22\textwidth}Y}
\toprule
字段名称 & 典型来源位置 & 主要用途 \\
\midrule
交易时间 & 账单详情、流水页、支付结果页 & 交易排序、时间窗归并、路径恢复 \\
交易金额 & 支付结果页、交易明细页 & 金额认定与汇总统计 \\
交易方向 & 转出、转入、收入、支出等标识 & 区分被骗支付、中转与返还 \\
对手方信息 & 收款方、商户名、账户名 & 收款方聚合与风险识别 \\
本人账户标识 & 银行尾号、支付账户标识 & 中转识别与账户关系恢复 \\
订单号/商户单号 & 详情页、通知页 & 重复展示识别与证据关联 \\
备注信息 & 交易说明、附言、商品名 & 风险关键词识别与认定辅助 \\
\bottomrule
\end{tabularx}
\end{table}
\placeholderwidefigure{建议放置“多APP截图识别示意图”按“原始截图 - 抽取字段 - 结构化结果”三栏展示。}
\section{关键词回溯驱动的自我完善机制}
传统OCR流程往往在第一次页面分类后即固定结果但在真实办案场景中截图模糊、裁切不完整、平台UI相似等情况都可能导致初始识别误差。本项目引入“证据识别后关键词回溯”的优化机制即在完成一轮交易字段抽取和部分认定后利用高置信证据重新回看前序页面类型判断对可能误判的截图进行二次校正。
该机制的基本思路如下:
\begin{enumerate}
\item 首次识别时完成页面分类与字段抽取;
\item 在归并、认定过程中收集高置信字段和高价值关键词;
\item 将“支付成功”“账单详情”“订单号”“退款”“充值”“银行卡”等关键词回溯到原始截图分类判断中;
\item 若后验信息与原始页型不一致,则触发页面类型再验证;
\item 将修正后的结果重新参与后续归并和认定。
\end{enumerate}
\begin{table}[H]
\centering
\caption{关键词回溯优化机制说明表}
\begin{tabularx}{\textwidth}{p{0.18\textwidth}p{0.25\textwidth}Y}
\toprule
回溯维度 & 典型信号 & 优化作用 \\
\midrule
行为关键词 & 转账、支付、收款、充值、退款 & 修正交易性质判断 \\
页面结构词 & 账单详情、交易记录、支付成功、到账通知 & 修正页面类型识别 \\
证据字段词 & 订单号、商户单号、收款方、尾号 & 增强截图与交易的绑定关系 \\
认定结果信号 & 对外支付证据、中转凭证、待复核记录 & 用后验高置信结果反向约束前序识别 \\
\bottomrule
\end{tabularx}
\end{table}
这一机制体现了项目的自我完善特征:系统不是一次识别后静态输出,而是在任务执行过程中利用中间结果持续修正前序判断,使账单类型识别更贴近真实办案需求。
\section{跨平台交易归并与去重}
同一笔交易可能在多个APP和多个页面中反复出现。系统围绕订单号、金额、时间窗口、对手方名称、账户尾号等线索进行综合归并在保证召回率的同时降低重复累计风险。
\begin{table}[H]
\centering
\caption{交易归并与去重规则表}
\begin{tabularx}{\textwidth}{p{0.18\textwidth}p{0.28\textwidth}Y}
\toprule
规则维度 & 判断依据 & 目的 \\
\midrule
标识一致性 & 订单号、商户单号一致 & 直接识别同一交易重复展示 \\
金额一致性 & 金额完全一致或处于可接受误差范围 & 辅助无订单号场景下的归并判断 \\
时间窗口 & 交易时间接近 & 缩小候选匹配范围,提升准确率 \\
对手方相似性 & 收款方名称或账号高度相似 & 识别跨平台展示的同一对手方 \\
账户特征 & 本人账户尾号、支付渠道一致 & 提升去重与中转识别精度 \\
\bottomrule
\end{tabularx}
\end{table}
\placeholderwidefigure{建议放置“交易归并前后对比图”,展示同一笔转账在多个截图中重复出现,系统归并后只保留一条有效记录。}
\section{本人账户中转识别}
本人账户中转识别是本项目区别于普通账单OCR工具的关键设计之一。系统通过对手方信息、备注关键词、支付平台特征及交易方向判断识别受害人账户之间的内部流转行为避免将内部资金搬移误计为被骗金额。
\begin{table}[H]
\centering
\caption{本人账户中转识别逻辑表}
\begin{tabularx}{\textwidth}{p{0.17\textwidth}p{0.25\textwidth}Y}
\toprule
判断规则 & 典型特征 & 处理方式 \\
\midrule
本人关键词命中 & 本人、自己、余额、充值、提现等字样 & 标记为中转候选 \\
平台间内部流转 & 银行卡转入微信、支付宝充值等 & 识别为本人账户内部转移 \\
已知账户匹配 & 与已知本人账户标识相匹配 & 不直接计入被骗金额 \\
方向辅助判断 & 转出后紧接转入同类账户 & 作为路径恢复的重要线索 \\
\bottomrule
\end{tabularx}
\end{table}
\placeholderwidefigure{建议放置“本人账户中转示意图”,展示“银行卡→支付账户→外部收款方”的资金路径,并标记哪一段属于中转、哪一段属于实际对外支付。}
\section{被骗金额分层认定}
系统不直接给出不可质疑的“唯一金额结论”,而是将交易分为高、中、低置信三类,以适应警务场景对审慎性和可复核性的要求。
\begin{table}[H]
\centering
\caption{被骗金额分层认定表}
\begin{tabularx}{\textwidth}{p{0.16\textwidth}p{0.22\textwidth}Y}
\toprule
置信等级 & 典型条件 & 处理建议 \\
\midrule
高置信 & 对外支付明确、无重复、证据链完整 & 可优先计入被骗金额 \\
中置信 & 证据不完整或背景信息不足 & 提示民警补充问询后确认 \\
低置信 & 疑似重复、退款、中转或证据不足 & 暂不计入,待后续核实 \\
\bottomrule
\end{tabularx}
\end{table}
系统同时为每笔交易输出认定理由和排除说明,使结果具备可解释性、可汇报性和可复核性。
\section{笔录辅助生成、问询建议与证据化输出}
在识别和认定基础上,系统进一步根据待复核交易、中置信记录和案件交易摘要生成笔录辅助内容。该功能嵌入认定复核页,在民警完成逐笔确认或排除后,可自动汇总关键信息,生成适合直接插入受害人笔录的结构化描述,如转账时间、金额、支付渠道、收款对象、诱导背景和需进一步核实的问题点,从而减少重复输入和整理负担。
除笔录内容外,系统还会根据待复核交易生成笔录辅助问询建议,如是否还有其他支付平台、是否存在退款返还、是否有未提供截图的记录等。最终输出包括交易明细、认定结果、笔录内容、资金流图、时间轴、收款方聚合和导出报告,从而实现从截图材料到办案结果的闭环转换。
\begin{table}[H]
\centering
\caption{认定复核页笔录功能说明表}
\begin{tabularx}{\textwidth}{p{0.19\textwidth}p{0.24\textwidth}Y}
\toprule
功能环节 & 主要内容 & 实战价值 \\
\midrule
内容汇总 & 自动汇总已确认交易的时间、金额、渠道和对象 & 减少民警重复摘录工作 \\
语句生成 & 形成适合笔录使用的规范化描述文本 & 提升笔录书写效率和一致性 \\
直接插入 & 可直接复制或插入到笔录文本中 & 缩短从复核到成文的时间 \\
问题提示 & 标识仍需补问或核实的交易点位 & 辅助完善证据链与询问重点 \\
\bottomrule
\end{tabularx}
\end{table}