OpenAI开源Privacy Filter：1.5B参数本地脱敏模型，精准识别8类敏感信息，Apache 2.0

2026-04-27 23:20:22 | 唐薇 | 1545

4月27日，OpenAI于4月22日发布了一款用于脱敏文本中个人身份信息的前沿模型Privacy Filter。该模型已以Apache 2.0许可协议在Hugging Face和GitHub平台同步开源，供开发者下载、定制及商业部署。这一举措旨在帮助开发者在训练管线、索引流程、日志记录和审核环节中构建更强的隐私保护机制。

Privacy Filter采用双向Token分类架构，总参数规模为15亿，但每次仅激活约5000万个参数。这种混合专家设计使其能够运行于笔记本电脑甚至浏览器等资源受限的设备上。模型支持高达12.8万个Token的上下文窗口，单次前向传播即可对整个输入序列完成标注，并采用受限维特比算法解码出连贯的片段。

与传统依赖规则匹配的隐私过滤工具不同，Privacy Filter内置了更深层次的语言理解能力，能够根据上下文语境识别非结构化文本中的个人信息，在准确保留公开信息的同时，对与特定个体相关联的敏感数据进行遮盖或脱敏。

在隐私分类体系方面，Privacy Filter可识别八类个人敏感信息：姓名、地址、邮箱地址、电话号码、URL链接、日期、账号信息（涵盖银行卡号、信用卡号等金融信息）以及机密信息（如密码和API密钥）。

评估过程中，该模型在PII-Masking-300k基准测试中取得了96%的F1分数（准确率94.04%，召回率98.04%）。在对测试集标注问题进行修正后，F1分数进一步提升至97.43%。OpenAI指出，该模型在少量数据上进行微调即可快速提升特定领域的准确性，且能够在高精度与高召回率之间按需调整。

OpenAI承认，Privacy Filter并非匿名化工具，亦不替代合规认证。在法律、医疗和金融等高敏感性场景中，人工审核及领域特定的评估与微调依然是必要的。

针对用户日常使用中不慎将包含个人信息的文本粘贴到AI工具的常见场景，Privacy Filter定位为在本地即可运行的预过滤层——数据在不离开用户设备的前提下即可完成PII的检测与脱敏处理，此后再将已脱敏内容发送至云端大模型，从而在使用强大AI服务的同时有效控制个人信息的暴露风险。

从15亿参数到笔记本电脑运行，从96%的识别精度到Apache 2.0开源，OpenAI正在用Privacy Filter为AI时代的隐私保护提供一种“本地优先”的解决方案。对于开发者和企业而言，这或许是在享受云端AI能力的同时，守住用户隐私底线的关键一步。

特别提醒：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字、图片等内容的真实性、完整性、及时性本站不作任何保证或承诺，请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益，请及时发送相关信息至bireading@163.com，本站将会在48小时内处理完毕。