自聊天(tiān)机器人ChatGPT火爆以(yǐ)来,微软公司(sī)创始人比尔·盖茨已多次(cì)公(gōng)开谈论人工智(zhì)能话题(tí)。在最(zuì)近(jìn)的一次(cì)采访中,他再次(cì)表示:“AI可能会让科技(jì)行(xíng)业迎来(lái)一(yī)次剧(jù)烈的洗牌”。
这个结论是他在当地(dì)时间2月(yuè)20日接受《In Good Company》节目专(zhuān)访(fǎng)时提出(chū)的。
他预期,AI的发展可(kě)能(néng)会威胁到谷歌的市占率(lǜ),因(yīn)为微软在AI方面的行动相当(dāng)迅(xùn)速(sù)。而最终科技(jì)巨(jù)头(tóu)将把AI整(zhěng)合成(chéng)用户的“全能助手”,包揽(lǎn)一切应用,与人(rén)们进(jìn)行沟通并提供建议,可以取代亚马(mǎ)逊、Siri或Outlook等(děng)应用。
大佬口中全能助手的到来可能尚需时日(rì),但由ControlNet引发的(de)又一次AI绘画浪潮,让AIGC在ChatGPT的(de)话题热点包围中杀出(chū)重围。
01
ControlNet颠覆AI绘画新玩法
AIGC向(xiàng)可控靠近
以AI绘画(huà)为代表的AIGC上(shàng)一(yī)次爆火的时候,还是(shì)2022年8月,在美国科罗拉(lā)多州(zhōu)举办的新兴(xīng)数字艺(yì)术(shù)家竞赛中,一(yī)幅(fú)名(míng)为(wèi)《太空歌剧院》的作品(pǐn)获奖。
随后各大厂商(shāng)的(de)AI绘(huì)画软(ruǎn)件被广大网友熟知并体(tǐ)验,Stable Diffusion便是(shì)其(qí)中代表。
用(yòng)户们可以在应(yīng)用中输入一(yī)组(zǔ)关键词(cí)或者一(yī)张照(zhào)片,就能获得一(yī)幅AI创作(zuò)的画作。
作画的关键(jiàn)就是所输(shū)入的文本。同一(yī)组关键词也可以创作出很多张风格不一样(yàng)的画作(zuò),这让创作(zuò)的过(guò)程(chéng)就像开盲盒。
很多用户很喜(xǐ)欢(huān)这种不确定的惊(jīng)喜,他们会将生(shēng)成的美(měi)图当做头(tóu)像。而(ér)另一部分喜欢翻看AI绘画的“翻车(chē)”作品。在(zài)社交媒(méi)体上(shàng),许多用户分享AI“翻车现(xiàn)场”,例如,一(yī)位网友的小(xiǎo)狗照片被AI画成了“肌肉男”,还(hái)有网友的个人(rén)照片被(bèi)AI识别成(chéng)了(le)建筑。
而如(rú)今随着ControlNet的出(chū)现与(yǔ)加(jiā)持,以往AI绘(huì)画(huà)的(de)填写关键词游(yóu)戏可能(néng)要被(bèi)颠(diān)覆了。
ControlNet是一位正(zhèng)在斯坦(tǎn)福读博的中国人张吕敏(mǐn)创作的一种基(jī)于控制(zhì)点(diǎn)的(de)图(tú)像变形算(suàn)法,主要(yào)用于数字(zì)图像处理、计算机视觉和(hé)计算机(jī)图(tú)形(xíng)学等(děng)领(lǐng)域。
其SD插件一(yī)经发布,在短(duǎn)短的(de)两天内便成为了AI绘画领(lǐng)域(yù)最新的热点。
在此之前,大家(jiā)用了很多方法想让AI生成的结果尽可(kě)能(néng)的符合要求,但是(shì)都不(bù)尽如(rú)人(rén)意,它的出现代表着AI生成开始进入真正的可控时(shí)期。
因为ControlNet可以直接提取画面的构(gòu)图,人物(wù)的姿(zī)势和画(huà)面(miàn)的深度信息(xī)等。有了它的帮(bāng)助(zhù),就(jiù)不用频繁(fán)的用提(tí)示词来碰运气,抽盲(máng)盒式的创作了。
通俗的说ControlNet相(xiāng)当于给AI绘画加了(le)“魔法”,不少博(bó)主的作品(pǐn)已经获得了大量的浏览量,“viggo”就(jiù)是其中之一,他用朋(péng)友的照片直接带她们走进动漫世(shì)界(jiè)。
viggo先用(yòng)StableDiffusion图片(piàn)转文字。
再用Text2Prompt插件拓展找到(dào)对(duì)应的关键词(cí);最后用ControlNet插件绑(bǎng)定骨骼开始换关键词(cí)试效果。
通过图片就可以(yǐ)看出来,效果十分惊艳。
更厉害(hài)的是(shì),除了真实的照片,草(cǎo)图(tú)也可以加上(shàng)“魔法”,知乎大(dà)牛“DevPoint”和(hé)“逗砂”介绍到(dào)ControlNet还能实现线稿(gǎo)转全彩图。大神张吕敏其本尊也亲自回应。
不得不说(shuō)当(dāng)下AIGC已经变(biàn)得越(yuè)来越强(qiáng)大(dà),甚至输出的作品都已(yǐ)经能以假乱真(zhēn)了(le)。
02
难(nán)辨虚实,AIGC技术力爆(bào)发
警惕安(ān)全问(wèn)题
近日,“苏州金(jīn)鸡湖有(yǒu)游艇party”的消息火遍(biàn)网络(luò),而经过警(jǐng)方辟谣这所谓的(de)“party”可能是全国第一起(qǐ)AI绘图诈骗。
由于这个活动里面给出的美(měi)女照片(piàn)都是(shì)AI制作的真(zhēn)人照片(piàn)绘图,因为太逼真(zhēn),被(bèi)大家(jiā)当成真(zhēn)事传播了(le)。
不过仔细观察可以发现,活动发起者提供的照(zhào)片(piàn)中(zhōng)有个很大的漏洞可以(yǐ)发现并非(fēi)真人,而是AI绘(huì)图(tú),那便是图片中女性(xìng)的手指部分有的存在异(yì)常。
有行业(yè)人事表(biǎo)示(shì):“现(xiàn)在因(yīn)为手指部分的绘画(huà)算(suàn)法比较复杂(zá),AI还不太(tài)会(huì)画人的手,但(dàn)最新看(kàn)到的(de)图片已(yǐ)经(jīng)有越来越(yuè)完美(měi)的(de)AI模型出(chū)现,以(yǐ)后可能就完全没有漏洞了。”
类似的(de)AI作图诈骗(piàn)在国外也已有发生。据(jù)英国广播公(gōng)司(sī)报道,土耳其地(dì)震期间,有Tiktok用户使用(yòng)AI合成了儿童受灾的假(jiǎ)照片发(fā)布(bù)到(dào)网络,以(yǐ)此诱骗善良(liáng)的(de)人打(dǎ)赏“捐助”从(cóng)而(ér)实施诈骗。
目前随着(zhe)技(jì)术发展(zhǎn),AIGC已经能做(zuò)出真(zhēn)人照片般的绘图效(xiào)果,如果(guǒ)这样(yàng)的图片被用来(lái)诈骗(piàn),将非常可怕。
此外AIGC还引发了很(hěn)多担(dān)忧,一方面(miàn),批判者(zhě)认为AI在“学习(xí)”了大(dà)量前人的作品之后,其创作(zuò)没有任(rèn)何情绪和灵魂,难(nán)以和人类的(de)艺术创作相提(tí)并(bìng)论。
另(lìng)一方(fāng)面(miàn),AIGC背后的(de)版权(quán)、目前都(dōu)并没(méi)有得到(dào)有效的解决,还有AIGC会不(bù)会代替人(rén)类“至高无上”的(de)创意。
马斯(sī)克也强调,人(rén)工智(zhì)能(néng)的(de)安(ān)全问题需(xū)要得到重视,太晚就来不及了。
03
AIGC下一站除了(le)视频,还(hái)有远方
技术都是(shì)有两面性的,潜在的(de)危害并不能(néng)掩盖(gài)其光辉的贡(gòng)献。现在看来,人工智(zhì)能技术将是第四(sì)次工(gōng)业革命的核心驱动(dòng)力量(liàng),将创造新的增长奇迹(jì)。
过去一(yī)年,人工智能在技术(shù)和商业层(céng)面(miàn)都(dōu)有了巨大进展,AI绘画(huà)就(jiù)是(shì)人(rén)工智能技术发生方向性改变的一个代(dài)表。其(qí)下一(yī)站或许就是视频。
此前,Meta和(hé)谷歌先后发布了几条引爆(bào)科技圈(quān)的短视频。这(zhè)些视频引(yǐn)发关注并非内容做得多优秀,反(fǎn)而都非常简单,比如一匹正在喝水的马,一只画画的玩具熊(xióng),或(huò)者一段骑摩托车的第(dì)一(yī)视角(jiǎo)录像,随便一个有手机的(de)人都可(kě)以(yǐ)随(suí)手录下一(yī)段。
但这些短视频的创作方式非常简单,创(chuàng)作者仅仅需(xū)要向AI输入一(yī)段话,甚至只是说一下要求(qiú),AI就可(kě)以(yǐ)根据需(xū)要(yào)生(shēng)成一段视频。
谷(gǔ)歌(gē)发布的(de)两个AI生成视频分别来自于Imagen Video和Phenaki,前(qián)者主要突出(chū)的是高(gāo)清,与Meta的Make-A-Video没有太多的差(chà)别。
在Make-A-Video公布了AI生成的视频后,AI圈(quān)就(jiù)已(yǐ)经玩了一波梗,一(yī)个能够做(zuò)出(chū)更高(gāo)清视(shì)频的(de)AI还不足以(yǐ)在短时间内戳中兴奋点。
Phenaki更加(jiā)令人震(zhèn)惊的地方在于,它可以(yǐ)制作出超过2分(fēn)钟的连(lián)贯的(de)也(yě)有确切内容的视频,这才是真(zhēn)正让人们感到惊喜的地方。因为(wèi)无论AI生成的视频多么(me)高清,也(yě)只能(néng)是为内(nèi)容生产者(zhě)提供一个灵感,一个素材,一(yī)个过场动(dòng)画(huà)。
不过(guò)能够(gòu)制(zhì)作出(chū)有具体剧情内(nèi)容(róng)的视频就意味(wèi)着,一些视频创(chuàng)作由AI代替人(rén)工(gōng)完成已经初步有(yǒu)了(le)可(kě)能。
当下AI的发展速度已(yǐ)经超过(guò)大部分人的(de)想象。内容产(chǎn)业的本质(zhì)是供给创造需求,AIGC作(zuò)为全新(xīn)的内容生产方式,可(kě)以(yǐ)为内容产业带(dài)来更(gèng)新的(de)内容(róng)风(fēng)格、更(gèng)快的生产速度(dù),更(gèng)低的生产成本,这无疑(yí)会(huì)驱动内容产业的大爆发。
除(chú)了AI绘图(tú)、视频(pín),AIGC技术还能应用于音乐(lè)、代码(mǎ)、机器人(rén)动作等多种内容形式的(de)生成。不难发现该项技术(shù)不(bù)仅在游戏等行业能得到有(yǒu)效应用,对于下一代(dài)互(hù)联(lián)网各种元素的构(gòu)建亦有关(guān)键意义。
从商业化(huà)的(de)角度来看,文化娱乐、教育、传媒等(děng)诸多领域,本身就对基于AI的(de)可(kě)视化内容有强烈需求。
因此(cǐ),AI绘(huì)画及视频或不是结果,而只是AI进程中的一块(kuài)重要拼图,有望在技术(shù)更新(xīn)的加持(chí)下实现更(gèng)大的应用价值(zhí)。
AI从理解内容,走向了(le)可以生成(chéng)内容(róng),甚至能够创(chuàng)造出独立价值和(hé)独立(lì)视角的内容(róng)。AIGC的再次出圈,更(gèng)代表着未来的(de)先进生产力(lì)即将到来。
04
紧(jǐn)抓(zhuā)大(dà)模(mó)型与(yǔ)算力,牢固AIGC底座(zuò)
从技术(shù)的发展也可(kě)以看出(chū),在语言大模型、图像大模型(xíng)之后,多模态大模(mó)型已经成为了新(xīn)的趋势。
大模型被誉为当前人(rén)工智能发(fā)展(zhǎn)的智能底座,是(shì)全(quán)球竞争最激烈的研(yán)究(jiū)方向(xiàng)之一,包括谷歌、亚马逊、百度、阿里(lǐ)、腾讯等众多头部企(qǐ)业都在竞(jìng)相发力。
不过训练大模(mó)型的确价格不菲,以(yǐ)国盛证券发布的《ChatGPT需要多(duō)少算(suàn)力(lì)》报告估(gū)算,GPT-3训练一次的成本约为140万美元。而对于(yú)一些(xiē)更大的LLM(大型语言(yán)模型),训(xùn)练成本(běn)则(zé)介(jiè)于200万美元至1200万美(měi)元(yuán)高价之(zhī)间。
以(yǐ)ChatGPT在2023年1月(yuè)的独立访(fǎng)客平均数1300万计算,其对应芯片(piàn)需求为3万多(duō)片英伟达A100 GPU,初始投入成(chéng)本(běn)约为8亿美元,每日(rì)仅电费就在5万美元左(zuǒ)右(yòu)。
此外不论是ChatGPT还是AIGC,都离不(bù)开庞大算力支(zhī)持。在关注各类(lèi)大模型的发展同时,更应该关注算力网络(luò)的建设。
算力(lì)网络(luò)正驱动AI产业发展(zhǎn)进(jìn)入史诗级加速进程(chéng),让AIGC及通用(yòng)AI这(zhè)一人工智能发展的终极目标(biāo)离得更近。
因为(wèi)算力(lì)可以(yǐ)对突破性技术创新提供大力的支(zhī)持。这方面,多(duō)模态大(dà)模型是典型(xíng)。作为面向未来强(qiáng)人(rén)工智(zhì)能、通用人(rén)工智(zhì)能(néng)的重要技(jì)术(shù)创新,多模态大模(mó)型(xíng)已经在(zài)人工(gōng)智能领域(yù)提出了很多年,业界也有(yǒu)不少技术(shù)突破,但是,多(duō)模(mó)态大模型(xíng)进一步往下走,算(suàn)力需求呈几(jǐ)何式上升,一(yī)般的算力基(jī)础设施很快将难(nán)以胜任。
从(cóng)图像、文字、语音(yīn)单独一项的训练,到双模态、三模(mó)态的(de)跃迁,让人工智能可以灵活应对不同模(mó)态的转化、像(xiàng)人与(yǔ)世界交(jiāo)互一样(yàng)自(zì)然,这方(fāng)面(miàn),由算力网络来(lái)驱动将(jiāng)有明显优势(shì)。
此(cǐ)外(wài),还有(yǒu)很(hěn)多需要(yào)爆发式增长的算(suàn)力来(lái)支撑(chēng)的(de)技术创新,将(jiāng)在人工智(zhì)能算力网络支撑(chēng)下快速(sù)推(tuī)进。
AIGC已经(jīng)露出(chū)曙光,期待在(zài)大(dà)模型和(hé)大(dà)算(suàn)力的(de)支(zhī)持下(xià)AIGC能(néng)持(chí)续颠覆内容生产的方式,将(jiāng)创造的(de)边际成本降低,让万(wàn)众受益。
未经允许不得转载:绿茶通用站群 三大改造的内容和意义,简述三大改造的内容
最新评论
非常不错
测试评论
是吗
真的吗
哇,还是漂亮呢,如果这留言板做的再文艺一些就好了
感觉真的不错啊
妹子好漂亮。。。。。。
呵呵,可以好好意淫了