- 发布日期:2024-12-24 08:13 点击次数:103
比年来人妖 telegram,生成式东说念主工智能在文本、图像、音乐等鸿沟大放异彩。但是,跟着生成式东说念主工智能变得越来越刚劲,东说念主们越来越难以鉴别 AI 生成的内容。
近日,Google DeepMind 洽商团队在《当然》(Nature)上发表的封面著述提供了一种文本水印决策,不错提高 AI 生成文本的检测精度。
图库版权图片,转载使用可能激励版权纠纷
AI 生成内容检测的必要性
在文本、图像和音乐中,AI 生成的文本是最难以检测的。因为现存的图像和音乐生成时代尚未像文本生成时代不异推崇,AI 生成的图像和音乐通常有某些非当然的视觉或听觉特征。AI 生成的内容在举座上后果较好,但具体到细节就显得不够当然。在图像和音乐中,也不错东说念主工添加东说念主类难以发现的水印,在后期检测中通过水印筛选出 AI 生成的作品。
但是在文本中难以平直添加东说念主类不可见的水印,这是因为文本与图像和音乐不同,每一个笔墨都是透澈可见的。同期,可用于磨练 AI 的文本数据也远多于图像和音乐。在庞大的、基于东说念主类写稿的语料库的磨练之下,AI 一经特等擅长模拟东说念主类的抒发容颜和话语俗例,致使或者调理文本的作风和口吻,这使得 AI 生成的文本难以平直检测。
尽管 AI 生成的文本与东说念主类创作的文本难以分辨,但 AI 生成的内容可能带有事实性的无理,并不成保证可靠性。无法辩别起首的内容可能会导致作假信息的传播,也带来了学术舞弊、版权争议等各样问题。
比如,在"杭州取消活泼车依尾号限行"假新闻事件中,网友用 AI 时代生成的"假新闻"行文严谨、口吻措辞稳当,也基本合乎官方通报的体式,导致了无理信息大范畴传播。好意思国科技新闻网站 CNET 在三个月之内上线了 70 多篇用 AI 时代生成的新闻报说念,却被发现其中存在大都基础性无理,包括缠绵无理、金融见解诬告等,不得不暂时叫停 AI 名堂重新审核。
为了幸免 AI 时代的奢侈,咱们需要一种要领辩别文本是否由 AI 生成。
主流检测要领:预先与过后检测人妖 telegram
检测 AI 生成的文本是一个分类问题,咱们的主要方针是分离一个文本片断是由 AI 生成的如故由东说念主类创作的。通常一个文本检测器关于一个给定的文本片断会给出一个评分,当这个评分超越阈值时,这个片断被以为是 AI 生成的,反之则是东说念主类创作的。
文本检测框架(图片起首:证据参考文件 [ 1 ] 翻译)
现存的主流检测要领不错分为两大类:预先检测和过后检测。预先检测不错进一步分为基于水印的检测和基于检索的检测。过后检测不错分为基于零样本学习的检测和基于磨练的检测。
主流检测要领分类(图片起首:证据参考文件 [ 1 ] 翻译)
1
预先检测
基于水印的检测是指在 AI 生成的文本中覆盖某些信息以便后续检测。但由于文本的闹翻性,在文本中添加水印比在图像和音乐中添加水印艰巨好多。常用的要领是让 AI 生成的文本使用特定的话语作风或者偏向性地使用某些特定的词汇,但这么可能会裁减 AI 生成文本的质料。
基于检索的要领是指 AI 作事的提供者将用户通过 AI 生成的文本保存在数据库中。当需要检测方针文本是否由 AI 生成时,将方针文本与数据库中的文本进行匹配,如若相似度较高,则很可能是 AI 生成的。但这种要领需要保存用户数据,可能带来心事知道的问题。
2
过后检测
基于零样本学习的检测是指不需要进行任何的磨练,仅证据 AI 生成文本的脾气来检测一段文本是否是 AI 生成的。通常 AI 生成的文本倾向于使用常见的词汇,句子的长度和结构也愈加合资。而东说念主类创作的文本则显得愈加予求予取,每一句的水平也散乱不皆。与东说念主类比拟,AI 在牵记细节上能力较强而在逻辑推理上能力较弱。期骗这些脾气不错在一定进程上分离 AI 生成的文本和东说念主类创作的文本。
基于磨练的检测是指使用东说念主类创作的文本和 AI 生成的文本构建一个数据集,用这个数据集磨练一个分类器来识别 AI 生成的文本。但这需要网罗弥散的数据用于磨练,况且跟着 AI 能力的高出,这么的分离也变得越来越艰巨。
不错看到,过后检测比预先检测要艰巨许多。为了高精度地筛选出 AI 生成的文本,在预先 AI 生成文本时就添加水印是一个很好的处罚决策。
Google DeepMind 的率性:
SynthID-Text 水印时代
Google DeepMind 洽商团队提议了一种新的水印生成决策,称为 SynthID-Text。它基于之前的水印生成组件,但使用了一种新的"锦标赛采样"要领。SynthID-Text 不错非扭曲(保留文本体量)或者扭曲(以就义文本体量为代价耕种水印的可检测性)地添加水印。在扭曲和非扭曲援手下,与现存的最好要领比拟,SynthID-Text 都耕种了水印的检出率。
水印生成框架(图片起首:证据参考文件 [ 2 ] 翻译)
上图中展示了空话语模子生成文本的旨趣以及之前水印生成的框架。空话语模子的文本生成是基于高下文的,它会证据输入的文本序列缠绵下一个词汇的散播,然后从这个散播中抽样出下一个词汇。
一个生成式的水印决策通常包含三个部分:一个立时数生成器、一个采样算法以及一个评分函数。水印生成的经过是:率先使用立时数生成器证据前边的文本以及水印键生成一个立时数,然后采样算法期骗这个立时数从词汇的散播中抽样出下一个词汇。给出一段文本以及一个水印键,评分函数提供一个分数来量化面前文本中含有水印的可能性,当分数超越一个阈值时就以为这段文本中含有水印。
锦标赛采样(图片起首:证据参考文件 [ 2 ] 翻译)
SynthID-Text 提议了一种新的"锦标赛采样"要领,上图是锦标赛采样要领的一个例子。当向模子输入" ... 我最心爱的热带生果是"时,模子缠绵出下一个词汇的散播,其中"芒果"的概率是 0.5,"荔枝"的概率是 0.3,"木瓜"的概率是 0.15,"榴莲"的概率是 0.05。在不加水印的平方生成中,模子会按这个概率直接采样出下一个词汇。
在锦标赛采样中,模子先证据立时数种子生成三个立时的水印函数,然后再从词汇的散播中采样出八个词汇,将这八个词汇两两组合后进行竞赛,在每一轮竞赛中,由一个水印函数决定每一双组合中的胜出者。经过三轮竞赛后,最终的胜出者便是模子的输出戒指:"芒果"。
在锦标赛采样中,词汇是证据水印函数的偏好采样得出的。因此添加水印的文本会在水印函数上有更高的评分。在检测时只需要评估每个词汇在对应的水印函数下的评分,再将评分加和就不错取得这段文本包含水印的可能性。
水印的添加是通过转换采样要领结束的,它会转换模子输出下一个词汇的散播,这看起来不可幸免地会影响生成文本的质料。但是,由于采样要领中使用了立时数种子,尽管在某一立时数种子下词汇的散播会被转换,但在对所有立时数种子进行平均后不错取得和原始散播交流的戒指。SynthID-Text 不错在顺应的成就下幸免影响词汇的散播从而保证文本的质料,也不错以蚀本一部分质料为代价提高水印的检出概率。
丁香五月婷婷基地SynthID-Text 要领在 Google DeepMind 推出的 Gemini 东说念主工智能模子上经过了两千万次用户测试。测试戒指标明 SynthID-Text 在添加水印的同期并不会裁减文本的质料。同期,SynthID-Text 不会产生太多的时候和缠绵支拨,不错被大范畴地应用于分娩膨大之中。
结语
过后检测文本是否由 AI 生成口角常艰巨的。跟着 AI 能力的增强,过后检测会变得越来越艰巨,检测和反检测将会是无终点的时代竞赛。水印要领提供了一种可能的处罚决策,但这需要空话语模子的提供者在生成时就预先加入水印。如若用户使用的模子莫得主动加入水印,就难以在过后进行检测。此外,用户还不错使用开源模子,或者对添加了水印的文本进行二次裁剪来脱逃检测。这些问题都有待进一步处罚。
曩昔,跟着生成式东说念主工智能的普及,如何检测 AI 生成的内容会变得越来越弥留。SynthID-Text 诠释了水印时代在文本生成中大范畴应用的可能性,但水印时代面对的艰巨也证实检测并不仅仅一个时代问题。处罚这个问题还需要各方共同英勇,酿成有关的行业尺度以及法律门径,从而鼓动 AI 走在为东说念主类作事的正轨之上。
参考文件
[ 1 ] Ghosal S S, Chakraborty S, Geiping J, et al. Towards possibilities & impossibilities of ai-generated text detection: A survey [ J ] . arXiv preprint arXiv:2310.15264, 2023.
[ 2 ] Dathathri, S., See, A., Ghaisas, S., Huang, P. S., McAdam, R., Welbl, J., ... & Kohli, P. ( 2024 ) . Scalable watermarking for identifying large language model outputs. Nature, 634 ( 8035 ) , 818-823.
筹划制作
出品丨科普中国
作家丨王琛 中国科学院缠绵时代洽商地点读博士
审核丨于旸 腾讯玄武履行室崇敬东说念主
监制丨中国科普博览
责编丨钟艳平
审校丨徐来 林林
有关推选
1.石头竟然长出了头发?!不外真比拟你思的更可怕……
2."多喝水"简直有效!最新洽商表示:多喝水有助于减肥、治愈肾结石……
3.为什么女性总爱喊疼?真不是矫强,而是……
4.冬天必吃的至人菜!养分好吃还抗癌,搭理我一定要试试
5.为什么我不建议你,凡事都和伴侣"掏心掏肺"?
本文封面图片及文内图片来自版权图库
转载使用可能激励版权纠纷
原创图文转载请后台恢复"转载"
点亮"在看"
沿途涨常识!
人妖 telegram
- 成人情色图片 先行AI商学院,拔擢AI检会师的摇篮2025-01-17
- swag 肛交 三星Galaxy环球新品发布会定档1月23日 AI依然重头戏2025-01-08
- ai 巨乳 青海开展住宅工程质地潜在颓势保障试点2025-01-04
- 成人情色图片 OpenAI直播12天,马斯克融资437亿2024-12-30
- 白鹿 ai换脸 小红书矩阵软件攻略,多账号处分高效,交易变现加快2024-12-26
- 石川澪 白虎 牛市致力于新战队:万亿资金,智谱AI和深圳创投两大黑马引燃市集2024-12-06