样例

面向复杂中文转写的证明型样例。

这些脱敏样例展示 FingerPower 如何处理中英混杂、术语密集、说话人与数字敏感,以及保密离线范围确认。

样例

按转写风险组织的样例。

每个样例都说明录音难点、处理方式,以及粗糙输出和可用于研究或决策的文档之间的差异。

中英混杂中文转写

难点

双语或多语录音的难点在于转写者必须判断声音到底是英文、缩写、品牌名,还是中文近音词。ASR 可能把英文识别成荒唐的中文。

处理方式

由具备双语素养的审校者结合上下文恢复英文术语,同时把周围中文整理成可读表达,不把原话强行译掉。

ASR 初稿

他们的扣和瑞腾神到 D30 看是可以的,但是爱了提维偏低,主要是猫的奶贼深没有做起来,特别是因爱普破车子和爱字这两块。

人工审校稿

在 D30 维度,他们的 cohort retention 表现尚可,但 LTV 偏弱。核心原因是 monetization 仍未跑通,尤其是 in-app purchase 与广告变现两条路径。

恢复英文术语
双语语境复核
分析师可用表达

术语密集中文转写

难点

金融、医疗、制造、半导体等领域的术语密集录音,ASR 错误率会明显上升。难点不是润色,而是关键术语可能被识别成毫不相干的词。

处理方式

审校重点放在术语校准、缩写规范和行业上下文核对,再把句子整理成可读文档。

ASR 初稿

管理层提到一笔他下降,哥四马军承压,半导体那边的佛托利草菲和 CNP 环节还在爬坡。

人工审校稿

管理层提到 EBITDA 下降,gross margin 承压。半导体业务中,photolithography 与 CMP 环节仍处于爬坡阶段。

术语错误校准
缩写格式规范
行业语境复核

说话人和数字敏感转写

难点

有些转写必须明确是谁说了哪句话,数字也绝对不能错。ASR 可能混淆发言人,也可能把“13.2 亿元”识别成“是 3.2 亿元”。

处理方式

人工审校会拆分发言人,恢复问答结构,并重点核对收入、百分比、单位和时间段。

ASR 初稿

Speaker 1: Q2 收入是 3.2 亿元,同比增长 8.6%。Speaker 2: 毛利率为什么下降?Speaker 1 李四主要是原材料和汇率影响。

人工审校稿

张三:Q2 收入为 13.2 亿元,同比增长 8.6%。 李四:毛利率为什么下降? 张三:主要因为原材料和汇率影响。

发言人清晰区分
关键数字复核
问答结构还原

保密离线人工转写

难点

有些录音包含敏感研究、内部决策或未公开业务信息,不适合上传通用云端 ASR 或 AI 工具。

处理方式

这不是输出文风差异,而是工具流程差异:除非客户明确同意使用工具,否则由人工在本地听音并直接键盘逐字录入,不借助云端 ASR 或 AI 校对。

云端工具流程

录音上传到通用云端 ASR 或 AI 工具,由系统生成初稿,再由审校者修改机器输出。

离线人工流程

转写者在本地听音,用键盘直接录入转写稿。文件传输前先约定访问权限、存储方式、删除规则和是否排除工具使用。

不使用通用云端 ASR
默认不使用 AI 校对
工具使用提前确认