最近你们有没有像我一样,又被AI震撼到了?就在上周,OpenAI的最新人工智能大模型GPT4o的发布又一次引爆了全世界。最大的特色是可以像人一样自然地沟通——用富有感情的语音语调聊天,以极大的耐心辅导孩子学习,读取和推理图片视频,甚至能检测情绪。有人说借用《百年孤独》的开头,写下这么一段话:多年以后,当人类最后的火种挡在AI大军面前,准会想起OpenAIGPT4o的那个凌晨。
■OpenA总裁I让两个GPT-4o实时对话,还让它们即兴创作了一首歌曲,非常神奇的是,这首歌曲内容还提到了当时房间的装饰、总裁穿着的特点,仿佛能「看见」人类新生事物的出现除了带来新的便利,也势必伴随着新的挑战,尤其在接受新事物极快的孩子中,衍生出了诸多令人意想不到的「有毒」玩法。
《纽约时报》4月的一篇报道揭露,自从人工智能图像生成软件出现以来,美国已经有多个学区出现AI性骚扰、造黄谣的行为——有部分男生用AI换脸功能,生成带有女同学面部的裸照,并在社交媒体传播分享。
和AI诈骗一样,这种行为也是「深度伪造」的一种,正在美国呈爆发式增长趋势。一个新的潘多拉魔盒正被打开。
用AI制作同学裸照
新泽西州一个位于富裕社区的高中韦斯特菲尔德,几位10 年级女生向校方管理人员报告,称班上的男生使用AI软件制作了她们露骨的色情图片,而且正在互相传播。
学校发表了一份声明,称得知事件后曾立即调查并咨询了警方,但调查方式令所有人震惊。他们「悄悄」地把男孩们叫到一边了解情况,但却「通过对讲机」公布了女孩们的名字。
受害者之一马尼说,「我很震惊,我开始感到有点难过,但我走到外面的走廊里,我看到一群男孩在嘲笑一群女孩,然后我就超级生气了」。她回家告诉了妈妈,并得到了莫大的支持:
「我们必须为自己的权利而战」。
■女孩马尼是学校的击剑明星
与此同时,学校依然没有重视,只是发邮件给家长们,乐观地称「认为照片已经被删除且不会再传播」,而涉事男生只得到了停学一天的处罚。
马尼一家彻底怒了,将这件事曝光了出去,对男生一家提起了诉讼,并亲自跑到华盛顿敦促立法者,将未经同意分享AI制作的人物照片并分享出去定义为犯罪,并允许受害者起诉那些做图片的人。
或许是母女俩的奔走真的起到了作用,新泽西通过了一项规定刑事处罚的法案。
这件事也推动了马尼,她创建了一个网站,并成立了一个慈善机构,旨在帮助AI受害者。「不是每个孩子都会有支持系统来处理这个问题,他们可能看不到隧道尽头的曙光」。
■马尼的学校发给家长的邮件事实上,未成年人利用AI生成不雅图像并传播的事件,并非第一次发生。
早在去年12月,美国佛罗里达州也有两名十几岁的男孩,用AI生成了女同学的裸照并传播,受到了刑事指控,后来被正式抓捕。
在加州的比佛利维斯塔中学,同样有5个男生用AI创建并分享了女同学的裸照,校方发现后没有姑息,主动上报给了警方,给学校所有家长发送了邮件,要求学生立即停止对AI不恰当的使用,任何使用AI生成、传播同学照片的学生都将面临严厉处罚,并开除了这些男生。
与新泽西那所中学形成鲜明对比的是,这所学校的负责人表示,希望开创一个全国先例,即「学校不得允许学生制作和传播同龄人的露骨色情图片」。
「对于学校来说,这是极端的欺凌行为。这些图片对女孩及其家人来说是实实在在的侵犯,我们绝对不会容忍」。
对于美国大多数学校来说,管理者都是第一次听闻能用AI来骚扰、羞辱和欺凌同学,法律也不完善,老师都不知道该怎么应对。
最担心的是,当一群对新事物、对性充满好奇的十几岁青少年,当听闻AI的这种新用法,他们是否都会在私底下偷偷使用并互相传阅?
一个来自《美国医学会儿科杂志》 2018 年的数据,或许可以从侧面给出答案:在 12 至 17 岁年龄段的儿童中,「未经同意转发色情短信的比例为 12.0%,未经同意转发色情短信的比例为 8.4%」。
■早在2021年就有学者在研究AI对未成年人的性霸凌
互联网新暗流
这两年,用AI深度伪造在全世界呈现爆发的趋势。
根据调查显示,2023 年,美国在线深度伪造视频总数为 95820 个,比 2019 年增长550%,色情内容高达98%。还有在英国、澳大利亚和新西兰进行的调查发现,14.1% 的 16 岁至 84 岁受访者有过被深度伪造露骨照片的经历。
女明星都未能幸免。
今年一月份,泰勒·斯威夫特(TylorSwift)被人利用deepfake技术制作的不雅照在社交媒体疯传。一名用户在X(原Twitter)上分享的照片被浏览了4700万次,即便被管理员删除,也依然被其他用户大量转发,以至于霉霉的粉丝涌入X,打起#保护泰勒斯威夫特的标签,要求转发者删除。
研究虚假信息的研究公司Graphika专门去深挖了这些图像的出处,发现是有人用游戏创造出来的,源头可以追溯到一个叫做4chan的匿名社区。而在美国,4chan是一个以分享仇恨言论、阴谋论、种族主义和攻击性内容而闻名的线上论坛,最低注册年龄13岁,用户不乏大量青少年。
因为有些AI图片生成软件会屏蔽、过滤露骨的内容(比如OpenAI的DALL-E),因此有人还会在4chan上专门分享绕过审查的技巧和方法,被大量用户点赞和模仿。
其实,除了用AI制作女性裸照,这类匿名社区还提供了人工智能工具被玩坏的无数种方式。
比如去年人工智能公司ElevenLabs发表了一款工具,可以克隆别人的声音,正常人或许只会拿它克隆自己的声音,而4chan上的用户则克隆了《哈利波特》赫敏的扮演者艾玛·沃森的声音,让她去朗读希特勒的宣言。
后来,虽然Elevenlabs紧急设置了付费才能使用,依然没能阻挡更多名人的声音被人恶意克隆,去发表仇恨言论和虚假政治信息。
还有一次,Facebook母公司Meta向人工智能领域的研究人员发布了大语言模型Llama的开源代码,结果又被传到4chan,被人拿来篡改代码,创建能发表反犹太主义言论的新聊天机器人。
有研究者说,在匿名社区做坏事并号召更多人一起做,会让人迅速融入,与人建立关系。或许这也是为什么,需要大量关注和社交的青少年会铤而走险,用技术完成一次次的匿名攻击。
有人预测,「我们将会看到人工智能生成的虚假图像的海啸。而做出这些内容的人会为疯狂转发和曝光而沾沾自喜,认为自己成功愚弄到了大众」。
深度伪造和背后邪恶丛生的匿名论坛,成为了互联网上的新暗流。
AI与赛博霸凌
在网络上谩骂、羞辱和骚扰,现在有个统一的代称:赛博霸凌(cyberbullying),在青少年之间非常普遍。在美国,59%的青少年表示在网上遭受过欺凌。在 Instagram 上,42%的青少年用户经历过欺凌行为。
根据一名网络安全专家的判断,「人工智能极大地扩大了赛博霸凌的范围、严重性和速度,而且它正在不断自我迭代,可能会加剧网络滥用」。
这样的负面影响,主要体现在网络水军、喷子、谩骂轰炸、带节奏等行为上。
过去没有AI,霸凌者都是自己注册小号,自己花时间写帖子,有相当大的风险被顺着网线找到真人。而如今,通过大语言模型,AI可以分析他人的社交媒体账号、在线活动规律和个人信息,用个人、家庭和私密信息来攻击对方,而且可以发出「夺命连环消息」。
一个例子,就是微软曾在2016年发布过的叫做Tay的聊天机器人,人们与它聊天越多,它学习能力越强,可以鹦鹉学舌一样地复述,像是古早版的ChatGPT。
原本发布者的期望是让人们体验聊天机器人的乐趣,没想到的是,仅仅24小时之后,它变成了一个满级骂人机器人。有些人专门用厌女、种族仇恨的言论训练它,它也将这些脏话输出给别人。
因此只活了一天,Tay就被永久关闭了。
■自己学会种族歧视言论的Tay与此同时,将人工智能作为仇恨武器的行为,一直延续至今,甚至演化出了更强的变体——人肉搜索。
人工智能对信息的爬取能力、学习能力非常强,它们能以超乎人类近百倍的速度搜索,在这个私密信息裸奔的时代,效率极高。有时连身体、心理健康状况、性取向、家人医疗信息等私密信息都能挖出来,如果有人想寄送威胁性的物品,或者营造「被监控」的恐怖氛围,也是轻而易举的一件事。
对于这一代网络原生代孩子来说,很多人线上社交的时间远大于线下,甚至有些人则将「关注」、「点赞」、「取关」和「拉黑」当作友谊开始、升华和结束的标志,吵架更是非常常见的事。
一旦有了人工智能的辅助,就有可能将赛博霸凌的伤害效果拉到最高值,而且受害者无法阻止和识别。还有研究发现,青少年之间的线上矛盾很容易转化为线下暴力。
「在社交媒体上,针尖大的事情就有可能变成滔天恨意」。
当然,有黑暗的地方就有正义。
一个十分值得家长欣慰的消息是,机器学习领域有良知的学者、技术达人和青少年,正在利用AI进行「反赛博霸凌」的尝试。
比如MIT一个叫做Solve的创新解决挑战赛网站中,我看到了一个由十几岁女孩们组成的队伍,正在尝试做一个预防赛博霸凌的AI工具——
利用人工智能检测输入法,提前在有害内容发布前捕捉霸凌言论,可以识别种族主义、性别歧视、骚扰、身体羞辱等形式的语言,同时及时弹出窗口,为欺凌者提供如何表达想法的语言建议。
这些女孩没有只是想想,而是做了仔细的校园调查,联络了德克萨斯大学计算机科学和人工智能教授的反馈,写了论文,在青少年学术会议上展示了自己项目,从自然语言专家那里寻求了建议。
虽然这个工具还没有做出来,但能看到这一代青少年面对新技术带来的问题时,去解决、去创新的勇气。
她们和文章开头对抗深度伪造照片的女孩马尼,都是令我这个成年人都佩服的新生代。让我更相信,哪怕AI注定会在人性之恶中滋生出黑暗,但总有一些人选择以肉身挡在前面。
正如一名机器学习领域内人士所说:「人工智能是一面镜子,不仅反映我们的智力,还反映我们的价值观和恐惧」。
■美剧《西部世界》