作为美国科州政治、贸易、金融和制造业中心的科罗拉多州,每一年都会举办一场大型的艺术博览会。但在今年的比赛中,主办方将数字艺术奖项颁给了一幅由AI绘画的作品《Theatre d’opera  Spatial》,这条消息穿越了大洋彼岸,点燃了人们对AI绘画的关注和担忧。

39岁的游戏设计师Jason Allen在绘画AI软件Midjourney(以下简称mid)中仅依靠关键词就生成了100张图片,并经过很长时间的微调和筛选,他选择了三张最好的图片,将它们打印出来直接寄给了赛事评委,这件获奖作品则是其中一幅。

Jason Allen使用的软件mid是一款人工智能绘画聊天机器人,同时也是一家独立研究实验室,目前以公司的形式运营。

这家公司由科技公司Leap Motion的联合创始人David Holz创立。David Holz曾在北卡罗莱纳大学攻读数学博士学位,并研发出了他之后创办Leap Motion所使用的技术。

毕业后的David Holz在美国航空航天局签担任顾问,不久之后,他还是选择与朋友在2010年共同创立自己的公司Leap Motion,并通过销售可以在手上做动态捕捉的设备来盈利。

经营这家公司十二年后,David Holz希望寻找一个不同的环境而不是一家风投支持的大公司,因此他选择了离开,并创办了Mid。

David Holz可以被称为一名连续创业者。如今的Mid成员只有十个,没有投资人,规模非常小。但David Holz在采访中表示,他并非以财务回报为动机,公司也没有任何销售压力,更不必成为上市公司。他们只是为了在未来十年可以从事更多比较有意义的项目,并且享受乐趣。

正如Mid的官网中所言,这是一个广泛而多元的实验室。同时,David Holz称,他并不认为这是创作艺术的过程,而是拓展人类想象力的过程。

但并非所有人都这么想。这幅画作引发了绘画界的一场风暴,其中关于底层画师的存亡。AI绘画的发展和兴起在满足一些需要绘画作品的商家的同时也势必会造成大批画师的失业,因为自己打开电脑就能手动操作,不需要再花钱雇人绘画。

不过,一些担忧仍无法阻止AI绘画的发展。

Mid的核心成员之一是开发AI绘画程序Disco Diffusiond的艺术家Somnai。Disco Diffusion是一款可以直接运行在谷歌云端电脑的程序,但它的界面对外行人并不友好,因为它由一连串的代码组成。

但有人从中看到了商机。小红书上,有博主发布了与Disco Diffusion有关的入门教程,淘宝上也有售卖关于使用问题的说明书。

今年四月,人工智能团队Open AI发布了DALL·E2代,与以上两种AI绘画程序功能相同的是,同样能够输入文字进行AI绘画创作。与1代相比, DALL·E2具有更高的分辨率和更低的延迟,并且新版本还增添了一些新的功能,比如对原始图像进行编辑。

这些AI绘画企业正面临一个强有力的对手。美国东部时间10月17日,英国开源人工智能公司Stability AI宣布获得1.01亿美元融资,估值10亿美元。

这也意味着Stability AI成为了第一家AI绘画独角兽企业。

Stable Diffusion是Stability AI旗下的绘画平台。根据智源社区发表的文章可知,目前Stability AI团队已有103人,包括1名博士。明年计划资助超过100名博士。公司发言人表示,未来商业模式类似红帽和MongoDB,开源版本免费,通过商业版本来盈利。

实际上,作为开源企业的标杆,红帽的商业模式是为免费的开源代码增加更多价值,使用户愿意付费。用户能够将开源产品的代码修改成为全新的代码,而且可以申请或者取消订阅服务。MongoDB的社区版也是免费开源的,企业版则需要购买更高级的订阅版本。

二者的商业模式都是通过免费开源来吸引用户,再通过社区黏住用户,从而创造更大的价值。按照Stability AI发言人所讲的内容,公司未来很可能也会采取订阅的收费制模式。

有熟悉公司商业计划书的人士说,更长远的计划是成为一个控股公司,支持多个开源项目的商业化。

01

兴起

国外的AI绘画正在兴起,国内也如雨后春笋般出现了多种AI绘画程序。

百度就是其中的一个入局者。8月,百度依托飞浆、文心大模型的技术创新推出了“AI作画”的首款产品——文心一格。在2022世界人工智能大会(WAIC)上,这款产品在上海的大会现场亮相。

百度AI数字人希加加在文心一格中通过文字描述,创作出了包括“水墨弄堂”、“外滩游船”、“印象生煎”等具有上海风貌的作品。百度公司创始人、董事长兼首席执行官李彦宏在开幕式中也分享到,人们看到的AI作画,是过去一年技术进展的代表。

哪怕是绘画零基础的小白,打开文心一格的网页输入一些关键词,选择想要的绘画效果就能得到一副不错的照片。朋湖网记者也在文心一格中尝试输入“中原的田野和草地”,等待几分钟后就得到了一幅如下的绘画。

除了文心一格,盗梦师、TIAMAT等绘画平台的发展势头也很猛烈。其中,由上科大团队孵化的TIAMAT在10月12日完成了数百万美元的天使轮融资。

TIAMAT作为浦东分会场八大元宇宙的超级应用场景之一,也在2022世界人工智能大会上与观众相见。由TIAMAT创作的图片,则是一幅巨大的水龙卷,创作所需时间只在4-8分钟。

2022年喷涌而出的AI绘画,背后离不开关键技术的突破。

Open AI在去年年初推出的CLIP模型是经过大量数据训练后形成的高水平计算机视觉研究,能够使AI实现图文识别和融合。CLIP的数据训练对文字和图像同时进行,并让二者相互调整实现“文字——图像”的匹配。

比如,CLIP可以实现将小孩的图像和“小孩”这个词语匹配到一起。作为一项革命性的突破,Open AI在今年发布的dell-e2就是建立在CLIP的技术之上。

这是从量变到质变的过程。

除此之外,CLIP与Diffusion模型的合作也打开了新大门,AI绘画产品Disco Diffusion就是二者融合的典型案例。同时,Disco Diffusion产品的成功昭示着AI绘画在商业场景落地的开始。

例如获奖画家使用的Midjourney,目前为止注册用户已经超过了300万。对于已经有了大量用户群体的Midjourney而言,其收费模式和上述提到的Stability AI发言人所讲的一样,采用的是订阅制的商业模式。

针对个人用户和企业用户,Midjourney出台了两种不同的订阅套餐方案。个人用户可以享受每月10美元的200张图片(超额另外收费),以及不限量图片的每月30美元,生成的图片可以商用。

针对企业客户出台的套餐则为一年600美元,生成作品可以商用。并且若因Midjourney获利在每月2万美元以下不用支付Midjourney分成,如果因Midjourney获利在每月2万美元以上,则需要支付Midjourney20%的分成,或者商讨出其它分成协议。

与Midjourney不同的是,Open AI推出的Dalle-2则有免费额度,一旦超过这个额度就需要付费了,生成的图片可以商用。

国内的TIAMAT目前还处于内测阶段,全部免费使用;百度推出的文心一格也是免费使用,每天可以生成30次,每次6张,但不能商用。盗梦师可以免费试用几次,需求更多则需要付费,一共有每月99元和299元两个档位。

AI绘画基于大量数据和图片的训练能在短期内实现质的飞跃。这也意味着AI绘画一旦发展成熟,企业完全可以缩减耗费在人工作图上的支出,只需通过AI绘画就能完成。于企业方而言,未来通过AI绘画满足的需求是多种多样的。

AI绘画席卷的不止是书籍、杂志、产品、人物的绘画师,还包括产品包装、海报宣传、企业logo的设计从业者。打开电脑,手动输入几个关键词,就能得到一组可供随意挑选的照片,效率提升的同时还能减少成本。

02

质疑

但随着AI绘画的兴起,网络上出现了许多质疑。

一个微博名叫“乌合麒麟”的网友的讨论两次登顶微博热搜,他认为画画就是谁画得好就学习谁,把AI画作优秀的部分学习过来就可以了。但有人认为AI的主要问题是版权,画手辛苦画的作品被偷走,让AI接稿拿去盈利,同时AI绘画的兴起也可能会取代大量底部的画家,造成大批人失业。

在AI绘画超话中,有不少画家因为AI绘画的发展而焦虑。但与此同时,AI绘画已经产生了经济价值,比如平台联名文创产品,淘宝上已经有人开始打包卖起了AI绘画教程。社交媒体平台上,一位名叫“梵黎世界AI绘画”的博主专门研究人工智能绘画艺术应用,现在已经有不少AI画家同他合作产生收益。

近两年AI绘画喷涌而出,但仍正处于初步发展时期,有不少平台仍在内测。对于一些新型的AI绘画平台而言,通过关键词形成的画并不能尽人意,比如文心一格平台上生成的人像十分扭曲。

但AI有强大的学习能力。如今AI可以通过文字生成绘画,未来也可以生成视频、电影和新闻稿件。据了解,AI视频剪辑技术创业公司Runway已经通过文字指导生产出了视频。

当AI顺着数字媒介的路径向前发展,我们一定会见证这个时代的巨大变革。在不久的将来,人机互动或许会成为最普遍的合作模式。