多位受访专家表示,AI作画具有出图快、风格丰富的优点,但也存在作品质量参差、缺乏创新能力等问题,相比排斥和隔离,更可取的态度是理性地看待技术进步,用人工智能赋能内容创作。
南方财经全媒体记者记者 吴立洋 见习记者冯恋阁 实习生吴峰 北京、广州报道
(资料图)
编者按
“人工智能从你出生那天就认识你,读过你所有的电子邮件,听过你所有电话录音,知道你最爱的电影……”尤瓦尔·赫拉利在《未来简史》一书中描述了这样一种未来景况:人工智能比人类更了解自己。
步入人工智能时代,人类的生活习惯和生产方式正在被重塑,科幻和现实渗透,惊喜与担忧交加。人与机器的未来是一场亲密的合作还是激烈的战争?机器会将人类的智能拓展到什么样的边界?
南财合规科技研究院推出AI前沿观察系列报道。从技术、政策和治理多角度,剖析人工智能的技术瓶颈与伦理考验,追问未来的可能与限度,以期寻找第四次工业革命浪潮翻涌下人工智能发展的最优路径。
近日,AI作画平台Mid Journey生成的画作“太空歌剧院”战胜人类画手获奖,引发热议。追寻着热点轨迹,AI前沿观察系列报道推出第四篇,我们采访了技术专家专家、律师、从业者,尝试探讨AI作画面临的争议和未来前景。
在科幻电影《银翼杀手2049》中,人类为了控制复制人服务于自己,设置了名为记忆制作人的职业,其工作是为复制人制作虚假的记忆。通过操作手中的仪器,记忆制作人可以随心所欲地将心中想象的场景、物体、人物具象化,形成几可乱真的记忆画面。
现如今,这一令人印象深刻的景象正一步步迈向现实。随着AI作画技术迎来跨越式发展,利用AI进行美术创作的边界被极大地拓展:即使没有受过系统美术训练,用户也可以通过输入词句描述的方式,得到自己期望的绘画作品。
但另一方面,技术和从业者的关系、版权问题等争议亦如迷雾般笼罩着这个新领域。随着技术的日益成熟,AI作画会为美术行业带来福音,还是取代从业者的职业地位?
多位受访专家表示,AI作画具有出图快、风格丰富的优点,但也存在作品质量参差、缺乏创新能力等问题,相比排斥和隔离,更可取的态度是理性地看待技术进步,用人工智能赋能内容创作。
从“机械手臂”到扩散模型
上世纪后半叶,第一代计算机出现后不久,有关AI作画的议题便有了探索。彼时,AI作画的智能化程度仍处于较低水平,仅能在人类预设的程序下进行简单操作。
例如,1970年前后,英国艺术家哈罗德·科恩研发出电脑程序“Arron”,可以控制机械手臂产出黑白画作,再由本人手动填色。经过多年发展,Arron程序智能化程度也并未得到显著提高,该程序逐渐被淘汰,其留存的作品被多个国家的博物馆收藏。
2014前后,深度学习模型“生成式对抗网络”(GAN, Generative Adversarial Networks)的诞生成为AI生成图片发展的关键节点,该模型使原本笨拙的电脑程序变得愈发“智能”。
在原理层面,GAN是由两个相互对抗的生成网络和鉴别网络构成,前者负责生成作品,后者负责鉴别作品系机器生成的“假”作品还是人工制作的“真作品”,当鉴别网络发现图像为“假”时,就会生成一组反馈数据,使得生成网络重新调整图像,循环往复直至鉴别器无法识别。
随着GAN模型大面积被应用于艺术创作领域,AI作画的影响力、盈利能力均得到大幅提升。2018年,巴黎的三位年轻人通过“生成式对抗网络(GAN)”学习逾万张肖像画后,生成了名为《爱德蒙·德·内拉米肖像》的AI作品,最终以432000美元(约合300万人民币)的高价成功拍卖。
“但由传统GAN模型提供的是一种由图像生成图像的技术方案,难以实现从文本到图像的跨模态转化,此外其抽象化效果也不好,因此产生抽象画的能力不足。”香港科技大学(广州)人工智能学域主任熊辉在接受南方财经全媒体记者采访时表示,在实际应用中GAN技术仍存在很多不足,这也为后来扩散模型(Diffusion Model)的兴起埋下了伏笔。
今年2月,一款名为“Disco Diffusion”的开源AI绘画程序爆红,它能根据用户输入的描述性关键词渲染出对应的图像作品;4月,埃隆·马斯克的人工智能研究实验室Open AI发布DALL·E2程序,在输入概念、风格和属性等描述后,可以按照文字需求生成相应图像内容;5月,谷歌发布Imagen与DALL-E-2同台竞技,社交媒体中掀起了用“命题作文”考验不同作画软件,评判谁的作品更出色的打分浪潮。
据熊辉介绍,初期的扩散模型技术还不太成熟,由于在生成画作时需要占用大量的计算资源,因此内生成成本很高,且速度慢,逻辑性差。
针对上述不足,技术工作者引入隐变量(指不可观测的随机变量)构建了新的扩散模型框架,也就是目前的Stable Diffusion Model(稳定扩散模型)。
“相较于过去所有的AI作画技术,基于空间迭代和大型文库运作的Stable Diffusion Model运行速度更快,生成图像逻辑更多样,且操作简单,极大降低了AI作画的技术门槛,因此一经推出就席卷整个行业,成为当前最热门的主流技术路径。” 熊辉说。
砸画师饭碗?
“就目前AI作画的实际表现来看,其最大的优点是可以高效秒出图,作画速度领先职业画手几百倍;但缺点也非常明显,就是秒出图带来的细节缺失,只能远观不可近视。”深圳某位曾参与AI作画产品设计反馈的设计行业从业者在接受记者采访时表达了他对当前AI创作能力的看法。
此外,作画风格丰富也是AI的特点之一,一款AI可以囊括多种主流绘画风格,且可随时修改关键词回退创作获得不同效果;但另一方面,虽然出产画作的风格多变,但基本局限和固化于模型已学习的风格,缺乏自主创新能力,且作品成熟度受限于AI在对应风格下的训练程度,质量层次不齐。
“相比较而言,目前AI作画更适合产出宏大、科幻、游戏等诸如此类场景的概念画,例如根据宇宙飞船穿越星海、天国的教堂、飞龙在天等等类似的关键词进行创作。”该设计行业从业者表示。
事实上,近期最受关注的一幅AI创作的作品,本身确实以上述关键词为创作主题。今年9月,美国科罗拉多州博览会的艺术比赛中,一位署名为杰森·艾伦(Jason Allen)的参赛者凭借其作品《太空歌剧院》获得第一名。
据悉,这幅作品系一名游戏设计师Jason Allen用AI绘画工具Mid journey生成的,该结果也引发了关于AI作画的争论,人们一方面质疑Jason Allen使用AI生成作品参赛的行为是否涉嫌作弊,另一方面也在探讨是否AI将会全面取代美术行业从业者。
值得注意的是,AI的出现并非美术行业面临的首次“生存危机”。1839年,银版摄影法被发明并首次公开时,法国画家保罗·德拉罗什就曾评论道:“从这天起,绘画死了。”而近两百年后的今天,摄影早已成为艺术的一部分,而绘画这条古老的分支则从精准描绘物体的桎梏中解脱,发展出更多价值。
“看待这一问题,需要回到职业美术工作者的工作价值上。” 广州某资深美术从业者告诉记者,美术相关专业的学生就业方向大体可分为艺术和设计两个大类,就艺术方向而言,从业者跻身行业前列需要具备出色的审美、创造力和个性,从而让自己的作品焕发生命力;后者则更看重客户需求的感知能力和审美,因为设计的目的是实现功能与满足需求。
“对美术行业的前景感到悲观似乎为时过早。”该美术行业从业者指出,人工智能的主要优势在于其庞大的数据库,这使其可以展现更多的设计风格。
然而他也认为,人类智能中的创造力和个性,是目前的AI凭借学习和迭代无法产生的:“我认为审美、创造力和个性是美术行业从业者跻身前列的特质,也是人类与AI最本质的区别。”
争议不断的版权
除作品质量还有待提高外,自AI作画诞生起,围绕其进行的版权争议也从未停息。
2018年11月,美国人Stephen Thaler为一副名为“A Recent Entrance to Paradise”登记申请版权,但在作者栏,其所填的名称为“Creativity Machine”(创意机器),并表示这是一幅由AI生成的作品。
但该申请于次年遭到了美国版权局的驳回,理由是根据美国《版权法》规定,法案仅保护“建立在人类创造力基础上的智力劳动成果”。其后,Stephen Thaler又两次申请美国版权局复议该版权登记注册,均被后者以相同的理由拒绝。
同样是在2019年,于伦敦举办的世界知识产权大会上,国际保护知识产权协会(AIPPI)发布了《人工智能生成物的版权问题决议》。协议中表示,人工智能生成物只有在其生成过程中有人类干预、且该生成物符合受保护作品应满足的其他条件情况下,才能获保护。对于生成过程无人类干预的人工智能生成物,不应获得版权保护。
“根据我国现有的法律规定,个人创作的作品才受法律保护,因此人工智能创作的作品并不能享有著作权。” 上海大邦律师事务所高级合伙人游云庭在接受21世纪经济报道记者采访时表示,因为AI开发者对相应软件付出了研发成本,因此对于用户使用相关产品生产的画作可根据用户协议享有相应的权益。
“但需要注意的是,该权益不是《著作权法》意义上的,而是《反不正当竞争法》意义上的,因为当前相关的法律规定尚不明确,因此AI开发者可以适用《反不正当竞争法》第2条做兜底保护。”游云庭说。
此外,近期一个名为“mimic”的AI绘画网站测试版的上线也引起轩然大波。该网站主要功能系生成日系二次元画风的头像,其允许用户上传15至100张图像让AI进行学习,然后输出画风相同的AI画作。
该网站的上线引发日本插画师行业集体声讨,画师们纷纷发布声明,质疑AI学习自身画风后产出作品的著作权归属问题,并表示将禁止任何绘图AI学习其作品。
有趣的是,网友们提出了一系列“反制”措施,例如给mimic“喂”大量的迪士尼或任天堂旗下角色图片,生成带有相关特色的作品。“把这个画师们解决不了的难题交给东西半球最强法务部吧。”网友们如此调侃道。
但也有业内人士对画师的抵制行为持悲观态度。南京某独立画师告诉记者,按照现有司法实践和行业惯例,判定绘画作品著作权侵权一般需要满足“超过合理使用范畴”“接触”和“实质性相似”三个条件 :“如果参照正常的反抄袭维权手段,是否超过合理使用范畴和构成实质性相似尚可沿用同样的判断标准,但证明AI曾经接触过原作者的作品显然会更加困难。”
她进一步指出,除非规定AI开发者必须公开其深度学习的数据库来源,否则很难确定画作是否被其“接触”过。
不过,该独立画师也表示,美术行业创作者积极参与相关讨论,争取自己的权益,也有利于对于新技术更具针对性的法律法规和行业共识的形成。
游云庭表示,现有《著作权法》并未对他人或及其学习公开发表的作品设置禁止性规定,因此只要AI获取相关作品复制件的途径是合法的,并且并未在AI创作的作品中使用学习的作品,其学习和创作就不会涉及对著作权的侵犯;对于未被公开发表的作品,则可按照《反不正当竞争法》进行保护。
“给创作以AI,而不是给AI以创作”
这场AI作画和美术从业者的“人机竞争”,究竟谁能成为最后的赢家?
《太空歌剧院》获奖后,有画师在社交媒体上表示:“人工智能的发展将对画师行业带来巨大的冲击,底层画师可能被AI取代。”
“这种恐慌和困境的出现是必然的。”上述广州某位资深美术行业从业者表示,AI在事实上已开始承担一部分设计工作,例如海报设计中,其可以批量生成相同风格,不同配色和配字的海报,远比人类快速和精准。这位从业者直言,AI对用户需求的精准接收和反馈毫无疑问会使其成为“最完美的乙方”。
但这并不意味着人类美术工作者会被全面取代,谈及AI作画的未来,多位受访专家与从业者指出,相比排斥和隔离,更可取的态度是理性地看待技术进步,用人工智能赋能内容创作。
熊辉指出,人工智能技术的应用既需要技术知识,也需要领域知识。前者指的是对不同技术工具的理解和运用,后者则是美术行业从业者本身的专业知识与经验积累,这是技术难以简单模仿和超越的。
“总的来说,我认为AI应该成为从业者的新画笔。”熊辉认为,就如同不同的人使用画笔一样,创作者在专业领域水平越高,就越容易使用AI创造出好的作品。
事实上,作为一名游戏设计师,使用AI创作《太空歌剧院》的Jason Allen本身也具备不俗的美术功底,有从业者在评价该作品时指出,如果缺乏相应的审美能力和对画作细节的描述、调整能力,即便使用同样的AI工具,他人也很难创作出《太空歌剧院》般优秀的画作。
上述深圳设计行业从业者也表达了相似的观点。“AI正在成为辅助创作的工具。”他解释道,一些对成本、质量要求不高的设计工作,比如家庭装饰画可以交由AI处理;针对同一创意点高速、大量出图的特点也可以帮助设计师产生和丰富灵感。
据了解,实际上当前Disco Diffusion、DALL·E2等AI工具已被不少画师用于辅助自身创作,注入框架草图、打光等原本需要大量手动完成的创作过程可以利用AI便捷实现,画师在成果基础上进行调整修改即可。
“无论是在音乐、美术还是其他任何领域,AI工具的目的都是给专业工作者赋能,帮助从业者更快地将自己的灵感转变为现实。”熊辉说。
出品:南财合规科技研究院
统筹:郭美婷、李润泽子
研究员:郭美婷、李润泽子、冯恋阁
本期作者:吴立洋、冯恋阁、实习生吴峰