覆盖中英日文等不同书写系统中的名、姓和全名。
Privacy Filter 在线版
在浏览器中检测姓名、邮箱、电话、地址、账号、日期、URL 与密钥,并一键生成脱敏文本。
未加载模型
首次运行会从 Hugging Face 下载模型文件,建议使用支持 WebGPU 的 Chrome 或 Edge。输入文本
检测结果
0原文标注
脱敏文本
等待检测。
图片输入
先在浏览器本地 OCR,再把隐私标签映射回图片对应位置。
图片 OCR 结果
0选择 demo 图片或上传自己的图片。
OCR 调试
Privacy Filter 工作原理
- 在浏览器中加载模型
openai/privacy-filter 权重首次会从 Hugging Face 下载,并在浏览器中缓存供后续使用。
- 本地完成 Token 分类
Transformers.js 优先使用 WebGPU 推理,不支持时自动回退到 WebAssembly。
- 查看并复制
查看高亮的实体,复制脱敏后的文本,或粘贴新内容——所有数据始终留在你的设备上。
支持的实体类型
模型可以在任意文本中识别的 8 类个人信息。
个人和企业邮箱地址,包括各国 TLD 后缀。
手机、座机和国际格式,支持各种分隔符。
包含邮编、省市区在内的邮政和门牌地址。
客户编号、银行账号、商户编号、订单号等。
可能识别到具体个人或事件的日历日期。
私有发票、一次性会话链接等敏感链接。
API Key、访问令牌等凭证类字符串。
应用场景
在粘贴到 ChatGPT、Claude、Gemini 等大模型之前,先去除文中的个人信息。
从客服工单、错误日志、Bug 报告中清除客户敏感信息后再共享。
在发送截图或文本片段前,先把姓名、地址、账号等内容打码。
排查文档、README 或聊天记录中误粘贴的 API Key 和访问令牌。
常见问题
我的文本会被上传到服务器吗? +
不会。推理通过 Transformers.js 完全在浏览器中完成,除了从 Hugging Face 下载模型文件之外,你的文本不会离开本地设备。
可以识别哪些个人信息? +
姓名、邮箱、电话、地址、账号、日期、URL,以及 API Key、访问令牌等 secret。
支持哪些浏览器? +
推荐使用支持 WebGPU 的 Chrome 或 Edge 以获得最佳性能。其他现代浏览器会自动回退到 WebAssembly。
为什么第一次检测比较慢? +
首次运行需要从 Hugging Face 下载 openai/privacy-filter 模型文件。后续访问会从浏览器缓存读取,速度明显更快。
Privacy Filter 是免费的吗? +
是的。页面完全免费使用,所基于的 openai/privacy-filter 模型也以开放权重的形式发布在 Hugging Face 上。
可以替代正则表达式脱敏吗? +
对于自然语言文本,基于上下文的模型可以识别正则难以匹配的多语言姓名、自由格式地址等内容;两者结合使用可获得最佳覆盖率。