人工智能绘画，惊喜伴着争议

2023-03-24 09:28 环球时报

Midjourney生成的图片“一只和汽车赛跑的猫”

Midjourney生成的图片“香港街道上的出租车”

Midjourney生成的图片“中国情侣”

本报记者赵觉珵

一幅由人工智能（AI）生成的“中国情侣”图片近期在国内外社交媒体上被广泛转发，其逼真的视觉效果令不少网友感叹：“AI已经不逊于人类画师了。”这幅作品由AI图片生成工具Midjourney最新推出的V5版本生成，该工具是近期继GPT-4后又一受到关注的AI产品。在接受《环球时报》记者采访时，多名人工智能与互联网业内人士认为，Midjourney V5版本代表了目前生成式AI的前沿水平，其生成的图像在某些领域已经得到商用，通过继续学习和技术迭代，预计其能力可以进一步增强。不过，上述人士也提到，Midjourney以及生成式AI由于通过公开数据进行训练，其生成的作品在版权等问题上存在较大争议。

“中国情侣图片”是如何出圈的

由美国一家工作室开发的Midjourney于去年3月首次亮相，在当年8 月迭代至V3版本并开始引发一定的关注，而今年更新的V5版本让Midjourney及其作品成功“出圈”，代表作是上述的“中国情侣”图片。

在这张图片中，一对年轻中国情侣穿着夹克和牛仔裤坐在楼顶，背景是上世纪90年代的中国城市。由于在光影、人物细节、氛围感等方面的出色刻画，这张图片甚至被一些网友认为是一张真实拍摄的老照片，而非AI生成的图片。

据外媒报道，自上线以来，Midjourney在图像细节上一直在不停进步。Midjourney官方表示，V5版本的图像质量更高、输出更多样化、有更广泛的风格、支持无缝纹理、有更宽的纵横比、有更好的图像提示以及更宽的动态范围等。

此外，该版本还大幅优化了此前无法准确生成人物手部的问题。一名使用过Midjourney的画师告诉《环球时报》记者，在此前版本中，Midjourney对手部刻画有很多问题，例如手指数量错误或形态扭曲，这也是此前分辨图片是否为AI生成的主要判断依据。不过，Midjourney V5版本在这方面有了明显提升，虽然仍能观察到手部不自然的情况。

在V5版本之前，Midjourney已得到一系列应用。去年9月，一幅名为《太空歌剧院》的作品获得了美国科罗拉多州博览会艺术比赛的金奖，这幅作品就是由Midjourney完成的。去年6月，英国杂志《经济学人》曾使用Midjourney设计过一期封面，以呼应“AI新前沿”的封面故事主题。

《环球时报》记者近日也体验了Midjourney，该技术目前主要在通讯软件Discord上以与“Midjourney bot”对话的形式使用。通过输入提示词的方式，记者可以让Midjourney bot生成相应的图片，提示词可以设定很多，还可以要求分辨率、是否写实风格等。通常Midjourney bot会在1分钟左右生成4张图片，用户还可以要求重新生成。

在使用过程中，记者发现Midjourney的另一个问题：用户只能通过提示词来提出要求，但无法对图片生成过程进行控制或修改，图片生成更像是一个“黑盒”。因此，用户需要不断更换或调整提示词，让生成的图片更符合需求。创作出《太空歌剧院》的杰森·艾伦就曾对外媒透露，他总共生成了900多张图片才挑选出满意的作品。

背后是什么技术

业内人士告诉《环球时报》记者，Midjourney是一种大模型生成式AI。2015年，谷歌公司的一名研究员创建了首个用于艺术创作的机器学习应用 DeepDream。此后，AI图像生成开始走进大众视野中。

一家知名跨国企业的AI算法工程师李涛告诉《环球时报》记者，基于扩散模型，Midjourney打造了自己的闭源模型，通过抓取大量公开数据进行训练。与此同时，Midjourney也不断收集用户反馈数据并对模型进行迭代，最终形成目前的成果。

扩散模型属于一种无监督生成模型。计算机视觉处理开源软件库OpenCV负责人马利克在接受外媒采访时曾表示，扩散模型利用从文本数据中获得的知识来理解单词集合在一起的语义，并与真实世界联系起来，这使AI能够在不依赖特定数据集的情况下生成更复杂和多变的图像。马利克认为，扩散模型是生成式AI的重大进步，因为它们不依赖监督学习。通过利用从无监督学习中获得的知识，这些模型可以生成复杂多样的图像，而无须手动标记数据，从而使其更加灵活。

一段时间以来，不少公司均推出了AI图片生成模型或相关产品。近日，微软Bing宣布接入OpenAI的AI绘画模型DALL·E，上线了AI生成功能，Adobe也为旗下的Firefly模型新增了AI绘图产品。

“再无法相信自己的眼睛”

尽管凭借强大的图片生成功能，Midjourney已经获得上千万用户，但它也受到大量的批评与质疑，首当其冲的就是版权问题。

美国《福布斯》杂志网站称，与所有AI图片生成工具一样，Midjourney从互联网上搜集了大量图像进行训练，使其能够创作出看似全新的艺术作品，这引发了人类创造者的不满。目前，已经有不少机构和个人对Midjourney发起起诉，指控该公司涉嫌广泛地侵犯版权。

另据媒体报道，美国版权局近日宣布，Midjourney等生成的AI图像不受版权保护。在说明文件中，美国版权局认为，通过Midjourney等平台自动生成的作品，在整个创作过程中完全由机器人自动完成，并且训练的数据是基于人类创作的作品，因此不受版权法保护。

上海申伦律师事务所律师夏海龙对《环球时报》记者表示，AI生成工具给人类的版权法带来巨大冲击。一方面，相较海量的AI生成作品，即使其中存在侵权情况，权利人也很难及时发现；另一方面，在AIGC（人工智能生成内容）时代，冗长、昂贵的司法程序导致对版权保护也会越来越力不从心。人类的版权法以及著作权保护机构恐怕不得不作出重大调整。

除版权问题外，越来越逼真的AI生成内容也让人担心这些图片、视频可能会被用作非法用途，例如用AI生成的图片进行欺诈。美国前总统特朗普日前宣布，他将于21日被逮捕。随后，大量通过AI生成的“特朗普被捕”图片在社交媒体上传播，误导了一部分网友。印度News18新闻网则提到，近期有网友通过AI生成了一张美国前总统奥巴马与德国前总理默克尔在海边一起吃冰激凌的图片，这让人们更加担心未来会出现怎样的深度造假。该网站援引网友的评论称，“这种技术正变得越来越可怕。技术越来越完善，目前的AI可以创建几乎完美的名人声音或图片，我们可能很快再无法相信自己的耳朵和眼睛。”此外，也有家长向《环球时报》记者表达了AI生成不当图片对儿童影响的担忧。

互联网专家郭涛对《环球时报》记者表示，当前AIGC技术尚处于早期探索阶段，相关法律法规、标准体系和伦理规范等还不健全，存在数据安全风险、著作权侵权风险、深度伪造风险、商业秘密泄露风险、违法信息传播风险等问题。有关部门需要尽快建立健全相关法律法规和标准体系，加强内容审查及内容过滤，推动行业健康可持续发展。▲

责编：黎晓珊

版权作品，未经环球网 huanqiu.com 书面授权，严禁转载，违者将被追究法律责任。

阅读数(665）

不感兴趣

广告软文
重复、旧闻
文章质量差
文字、图片、视频等展示问题
标题夸张、文不对题
与事实不符
低俗色情
欺诈或恶意营销
疑似抄袭
其他问题，我要吐槽

确定

*请填写原因

感谢您的反馈，我们将会减少此类文章的推荐

投诉

人工智能绘画，惊喜伴着争议

不感兴趣

热门图集