您的位置：首页 >评测 >

Facebook 开源数据增强库：可令 AI 精准识别盗版图文音视频

来源：量子位时间：2021-07-18 17:05:12

7 月 18 日消息，只要稍微动点手脚，就会给 AI 模型的鲁棒性带来挑战。在 AI 眼里，下面这两张图片可能毫无关联。

不过，Facebook AI 在近日开源了用于数据增强的新 Python 库 ——AugLy。

使用 AugLy 数据增强训练 AI 模型，训练后 AI 可以对用户上传的内容，进行更精确的识别，有助于识别盗版图文音视频。

它支持音频、图像、视频和文本 4 种模态，提供了超过 100 种数据增强功能，可以对输入内容进行多种处理。

比如，改变文字的大小写、字体、编码方式，给文本添加标点、调整字母位置、模拟错别字，以及裁剪、旋转图片，给图片加文字、增加饱和度、增加亮度、改变清晰度等。

Facebook 开源数据增强库：可令 AI 精准识别盗版图文音视频

这一项目已经获得 1.8k 颗星，并且登上了 GitHub 热榜。

Facebook 开源数据增强库：可令 AI 精准识别盗版图文音视频

让 AI 识别「截屏转发」

AugLy 的目的是涵盖现实网络中具体的数据增强，用来创建样本，从而训练和测试模型。

根据 Facebook 和 Instagram 等平台上的生活图像和视频，AugLy 在统一的库和 API 下转换项目的所有数据，提供了超过 100 种数据增强方式。

其中包括 4 个子库，分别对应音频、图像、视频和文本 4 种模态。

这些子库包括基于函数和类的变换、组合，并且可以选择所应用的元数据及其强度。

Facebook 开源数据增强库：可令 AI 精准识别盗版图文音视频

以图片处理为例，AugLy 可以对图片进行裁剪、旋转、添加噪声、模糊处理、灰度处理等。

就像这样：

Facebook 开源数据增强库：可令 AI 精准识别盗版图文音视频

或者图片或视频上叠加文字和 emojis：

Facebook 开源数据增强库：可令 AI 精准识别盗版图文音视频

除了包含许多通用的增强功能，AugLy 更大的特点在于 —— 提供“互联网用户”类型的数据增强方式。

比如，把图片转换成屏幕截图的样式，更加符合生活中常见的样子。

Facebook 开源数据增强库：可令 AI 精准识别盗版图文音视频

使用 AugLy 数据增强训练 AI 模型，这些内容相同而形式不同的信息，能帮助模型提高鲁棒性。

在复制检测、言论检测或版权侵权等工作中，训练后 AI 可以对用户上传的内容，进行更精确的识别。

此外，AugLy 已经被用于 Deepfake 检测挑战赛，用来评估模型的鲁棒性。

网友热议

这个新的 Python 库也受到了网友们的关注，在 Reddit 上获得了 350 + 赞。

Facebook 开源数据增强库：可令 AI 精准识别盗版图文音视频

有网友提出疑问：文本模块只支持英语吗？

一位热心网友表示：

看起来文本模块在很大程度上是对 nlpaug 的一种包装，因此 AugLy 支持其他语言，只需修改几个参数。

也有网友提出，为什么不直接把它加到 pytorch 里？

对此，有人回复道：

这样在安装的时候会很慢，有需要的的人单独安装就可以了，没必要让 pytorch 那么臃肿。

Facebook 开源数据增强库：可令 AI 精准识别盗版图文音视频

AugLy 要求 Python 3.6 以上版本，通过 pip 安装，但是在虚拟环境和系统环境中，还需要用 conda 和 sudo apt-get 命令单独安装 python-magic。

比较遗憾的是，AugLy 目前不支持输入批量图像，不过开发人员表示，以后将会完善这一功能。

Facebook 开源数据增强库：可令 AI 精准识别盗版图文音视频

返回物联之家 - 物联观察新视角,国内领先科技门户首页 >>

　　版权及免责声明：凡本网所属版权作品，转载时须获得授权并注明来源“物联之家 - 物联观察新视角,国内领先科技门户”，违者本网将保留追究其相关法律责任的权力。凡转载文章，不代表本网观点和立场。

延伸阅读

Facebook 开源数据增强库：可令 AI 精准识别盗版图文音视频

7 月 18 日消息，只要稍微动点手脚，就会给 AI 模型的鲁棒性带来挑战。在 AI 眼里，下面这两张图片可能毫无关联。不过，Faceboo
2021-07-18
小米在下周宣布超薄旗舰智能手机

小米推出了计划为新的超薄旗舰智能手机举办发布会。该公司于1月15日在北京全国会议中心举行该活动，并突出了一款令人畏缩的图
2021-07-18
技嘉推出了三种新的Android智能手机

Gigabyte今天宣布了一款新的Android智能手机，涵盖高端，中档和入门级市场段。他们“重新成为GSM
2021-07-18
路透社：索尼开放销售其手机业务

根据路透社的一份报告，索尼高管对所有选项开放，以转向巨人的斗争手机。包括销售和合资。潜在路径包括与另一个伴侣的销售或合资
2021-07-18
搭载 AI 的真・物理自瞄外挂，宣称不会被发现，动视：已连锅端

都说主机游戏难以开挂，最近却有人称他们实现了“全平台制霸”，无论是在 PC 里，还是 PS、Xbox 上，都可以成为“神枪手”：在各种 FP
2021-07-18
消息称 LG 化学计划与日本东丽在欧洲成立合资电池厂

7 月 18 日消息据韩媒报道，有业内人士透露，LG 化学计划与日本东丽在欧洲成立合资厂，生产锂电池湿法隔膜。了解到，日本东丽成立于 19
2021-07-18
AT＆T向HTC One M8滚出更新，但它不是棒棒糖

在HTC One M8用户在马来西亚的一个M8用户开始接收到Android 5 0更新后，AT＆T还向美国的设备推出了更
2021-07-18
网络媒体：三星仍然是印度顶级智能手机供应商

上周，市场研究公司Canalys的一份报告称，MicroMax已将三星作为印度领先的智能手机制造商。然而，韩国公司很快就
2021-07-18

最新文章

零跑汽车冲刺 IPO：大华的千亿市值梦，傅利泉最后的倔强

精彩推荐

产业新闻

比亚迪连遭减持，市值蒸发 1000 亿

热门推荐