不敢把个人信息喂给 AI?OneAIFW 简单搞定隐私保护!

最近,在做几个落地的 AI 项目,发现"隐私"是无法绕开的一个关键挑战。

不是简单的达到"合规",而是真正的避免客户的手机号、姓名等个人信息上传到云端大模型。

本文暂不讨论私有部署大模型和端侧模型------它们虽理想,但并非所有场景都适用。

我也了解了挺多方案,但是感觉都不那么自然或者简单,直到我看到 OneAIFW (一个AI防火墙?)。

OneAIFW

连名字都是那么的朴实无华。

OneAIFW 开源在 GitHub 上,采用 MIT 协议。

虽然目前 star 还不多,但我感觉前途可期。

它的原理简单概括就是:

  1. 脱敏:将发给大模型的文字中的隐私数据替换为为结构化占位符。
  2. 大模型接收的数据依然保留原有结构,不影响语义理解。
  3. 还原:将大模型返回的文字中的为结构化占位符替换为原始文字。

是不是很简单,了解原理后我只有一个感觉:这么简单的思路,我为什么没有想出来。

保护内容

目前支持脱敏的内容:

  • 物理地址
  • 邮箱地址
  • 姓名 / 用户名
  • 公司 / 组织名
  • 电话号码
  • 银行账户 / 卡号
  • 支付信息
  • 验证码
  • 密码
  • 随机种子
  • 私钥
  • URL 地址

在线体验

光说不练假把式,不如直接上手试试。

官方提供了一个线上 demo,可以在线体验。

地址:https://oneaifw.com/

可以直接分析敏感信息,也可以直接尝试脱敏的效果。

使用方式

该项目另一个很赞的点就是,它提供了我们常用的各种方式使用,包括本地 Web、浏览器插件、本地 API、本地命令行。

本地 Web

一个轻量前端,依赖 @oneaifw/aifw-js 库,在浏览器里跑完整流程。

适合快速验证或嵌入现有 Web 应用。

浏览器插件

提供 Chrome/Edge 扩展示例,可以注入到各类大模型网站,在你点击"发送"前自动脱敏。

这个估计是日常使用最佳的方式了。

本地 API

通过 py-origincli/python 启动一个本地 HTTP 服务,提供 /api/mask_text/api/restore_text/api/call 等接口。

如果你和我一样正在开发 AI 项目,可以考虑通过 API 方式接入。

本地命令行

装好 Python 包后,支持命令行直接调用,比如:

perl 复制代码
python -m aifw call "请把如下文本翻译为中文: My email address is test@example.com, and my phone number is 18744325579."

非常适合脚本调用或自动化流程。

结语

今天主要给大家分享了一个 AI 项目中解决隐私问题的产品,重点是设计思路,希望可以帮到大家。

我已经在跑通了 Web 版本,部署体验将在后续更新。

基座模型或许遥不可及,但 AI 时代的真正机会,往往藏在像 OneAIFW 这样的"小而关键"的环节里------它不炫技,只是让智能变得更安全、更可用。而这,正是我们每个人都能参与的方向。

相关推荐
Coder_Boy_2 小时前
【人工智能应用技术】-基础实战-环境搭建(基于springAI+通义千问)(二)
数据库·人工智能
爱加糖的橙子2 小时前
Dify升级到Dify v1.10.1-fix修复CVE-2025-55182漏洞
人工智能·python·ai
齐齐大魔王2 小时前
OpenCV
人工智能·opencv·计算机视觉
老蒋新思维3 小时前
创客匠人峰会实录:创始人 IP 变现的 “人 + 智能体” 协同范式 —— 打破知识变现的能力边界
大数据·网络·人工智能·网络协议·tcp/ip·创始人ip·创客匠人
_codemonster3 小时前
深度学习实战(基于pytroch)系列(四十八)AdaGrad优化算法
人工智能·深度学习·算法
AI即插即用3 小时前
即插即用系列 | Attention GhostUNet++:基于多维注意力和 Ghost 模块的高效 CT 图像脂肪与肝脏分割网络
网络·图像处理·人工智能·深度学习·神经网络·计算机视觉·视觉检测
猎人everest3 小时前
LangChain 与其他大语言模型框架有什么区别
人工智能·语言模型·langchain
jkyy20144 小时前
端到端生态闭环:智能硬件+云平台+应用终端,最大化穿戴设备价值
大数据·人工智能·物联网·健康医疗