三大改造的内容和意义，简述三大改造的内容-绿茶通用站群

三大改造的内容和意义，简述三大改造的内容 ChatGPT之后又一应用杀疯了，AIGC或进入可控期，将洗牌科技行业？

自聊天(tiān)机器人ChatGPT火爆以(yǐ)来，微软公司(sī)创始人比尔·盖茨已多次(cì)公(gōng)开谈论人工智(zhì)能话题(tí)。在最(zuì)近(jìn)的一次(cì)采访中，他再次(cì)表示：“AI可能会让科技(jì)行(xíng)业迎来(lái)一(yī)次剧(jù)烈的洗牌”。

这个结论是他在当地(dì)时间2月(yuè)20日接受《In Good Company》节目专(zhuān)访(fǎng)时提出(chū)的。

他预期，AI的发展可(kě)能(néng)会威胁到谷歌的市占率(lǜ)，因(yīn)为微软在AI方面的行动相当(dāng)迅(xùn)速(sù)。而最终科技(jì)巨(jù)头(tóu)将把AI整(zhěng)合成(chéng)用户的“全能助手”，包揽(lǎn)一切应用，与人(rén)们进(jìn)行沟通并提供建议，可以取代亚马(mǎ)逊、Siri或Outlook等(děng)应用。

大佬口中全能助手的到来可能尚需时日(rì)，但由ControlNet引发的(de)又一次AI绘画浪潮，让AIGC在ChatGPT的(de)话题热点包围中杀出(chū)重围。

ChatGPT之后又一应用杀疯了，AIGC或进入(rù)可控期，将洗牌(pái)科技行(xíng)业？_黑料(liào)正能(néng)量

ControlNet颠覆AI绘画新玩法

AIGC向(xiàng)可控靠近

以AI绘画(huà)为代表的AIGC上(shàng)一(yī)次爆火的时候，还是(shì)2022年8月，在美国科罗拉(lā)多州(zhōu)举办的新兴(xīng)数字艺(yì)术(shù)家竞赛中，一(yī)幅(fú)名(míng)为(wèi)《太空歌剧院》的作品(pǐn)获奖。

随后各大厂商(shāng)的(de)AI绘(huì)画软(ruǎn)件被广大网友熟知并体(tǐ)验，Stable Diffusion便是(shì)其(qí)中代表。

用(yòng)户们可以在应(yīng)用中输入一(yī)组(zǔ)关键词(cí)或者一(yī)张照(zhào)片，就能获得一(yī)幅AI创作(zuò)的画作。

作画的关键(jiàn)就是所输(shū)入的文本。同一(yī)组关键词也可以创作出很多张风格不一样(yàng)的画作(zuò)，这让创作(zuò)的过(guò)程(chéng)就像开盲盒。

很多用户很喜(xǐ)欢(huān)这种不确定的惊(jīng)喜，他们会将生(shēng)成的美(měi)图当做头(tóu)像。而(ér)另一部分喜欢翻看AI绘画的“翻车(chē)”作品。在(zài)社交媒(méi)体上(shàng)，许多用户分享AI“翻车现(xiàn)场”，例如，一(yī)位网友的小(xiǎo)狗照片被AI画成了“肌肉男”，还(hái)有网友的个人(rén)照片被(bèi)AI识别成(chéng)了(le)建筑。

而如(rú)今随着ControlNet的出(chū)现与(yǔ)加(jiā)持，以往AI绘(huì)画(huà)的(de)填写关键词游(yóu)戏可能(néng)要被(bèi)颠(diān)覆了。

ControlNet是一位正(zhèng)在斯坦(tǎn)福读博的中国人张吕敏(mǐn)创作的一种基(jī)于控制(zhì)点(diǎn)的(de)图(tú)像变形算(suàn)法，主要(yào)用于数字(zì)图像处理、计算机视觉和(hé)计算机(jī)图(tú)形(xíng)学等(děng)领(lǐng)域。

其SD插件一(yī)经发布，在短(duǎn)短的(de)两天内便成为了AI绘画领(lǐng)域(yù)最新的热点。

在此之前，大家(jiā)用了很多方法想让AI生成的结果尽可(kě)能(néng)的符合要求，但是(shì)都不(bù)尽如(rú)人(rén)意，它的出现代表着AI生成开始进入真正的可控时(shí)期。

因为ControlNet可以直接提取画面的构(gòu)图，人物(wù)的姿(zī)势和画(huà)面(miàn)的深度信息(xī)等。有了它的帮(bāng)助(zhù)，就(jiù)不用频繁(fán)的用提(tí)示词来碰运气，抽盲(máng)盒式的创作了。

通俗的说ControlNet相(xiāng)当于给AI绘画加了(le)“魔法”，不少博(bó)主的作品(pǐn)已经获得了大量的浏览量，“viggo”就(jiù)是其中之一，他用朋(péng)友的照片直接带她们走进动漫世(shì)界(jiè)。

viggo先用(yòng)StableDiffusion图片(piàn)转文字。

再用Text2Prompt插件拓展找到(dào)对(duì)应的关键词(cí)；最后用ControlNet插件绑(bǎng)定骨骼开始换关键词(cí)试效果。

通过图片就可以(yǐ)看出来，效果十分惊艳。

更厉害(hài)的是(shì)，除了真实的照片，草(cǎo)图(tú)也可以加上(shàng)“魔法”，知乎大(dà)牛“DevPoint”和(hé)“逗砂”介绍到(dào)ControlNet还能实现线稿(gǎo)转全彩图。大神张吕敏其本尊也亲自回应。

不得不说(shuō)当(dāng)下AIGC已经变(biàn)得越(yuè)来越强(qiáng)大(dà)，甚至输出的作品都已(yǐ)经能以假乱真(zhēn)了(le)。

难(nán)辨虚实，AIGC技术力爆(bào)发

警惕安(ān)全问(wèn)题

近日，“苏州金(jīn)鸡湖有(yǒu)游艇party”的消息火遍(biàn)网络(luò)，而经过警(jǐng)方辟谣这所谓的(de)“party”可能是全国第一起(qǐ)AI绘图诈骗。

由于这个活动里面给出的美(měi)女照片(piàn)都是(shì)AI制作的真(zhēn)人照片(piàn)绘图，因为太逼真(zhēn)，被(bèi)大家(jiā)当成真(zhēn)事传播了(le)。

不过仔细观察可以发现，活动发起者提供的照(zhào)片(piàn)中(zhōng)有个很大的漏洞可以(yǐ)发现并非(fēi)真人，而是AI绘(huì)图(tú)，那便是图片中女性(xìng)的手指部分有的存在异(yì)常。

ChatGPT之后(hòu)又一(yī)应用杀疯了，AIGC或进入可控期，将(jiāng)洗牌科技行业？_黑(hēi)料正能量

有行业(yè)人事表(biǎo)示(shì)：“现(xiàn)在因(yīn)为手指部分的绘画(huà)算(suàn)法比较复杂(zá)，AI还不太(tài)会(huì)画人的手，但(dàn)最新看(kàn)到的(de)图片已(yǐ)经(jīng)有越来越(yuè)完美(měi)的(de)AI模型出(chū)现，以(yǐ)后可能就完全没有漏洞了。”

类似的(de)AI作图诈骗(piàn)在国外也已有发生。据(jù)英国广播公(gōng)司(sī)报道，土耳其地(dì)震期间，有Tiktok用户使用(yòng)AI合成了儿童受灾的假(jiǎ)照片发(fā)布(bù)到(dào)网络，以(yǐ)此诱骗善良(liáng)的(de)人打(dǎ)赏“捐助”从(cóng)而(ér)实施诈骗。

目前随着(zhe)技(jì)术发展(zhǎn)，AIGC已经能做(zuò)出真(zhēn)人照片般的绘图效(xiào)果，如果(guǒ)这样(yàng)的图片被用来(lái)诈骗(piàn)，将非常可怕。

此外AIGC还引发了很(hěn)多担(dān)忧，一方面(miàn)，批判者(zhě)认为AI在“学习(xí)”了大(dà)量前人的作品之后，其创作(zuò)没有任(rèn)何情绪和灵魂，难(nán)以和人类的(de)艺术创作相提(tí)并(bìng)论。

另(lìng)一方(fāng)面(miàn)，AIGC背后的(de)版权(quán)、目前都(dōu)并没(méi)有得到(dào)有效的解决，还有AIGC会不(bù)会代替人(rén)类“至高无上”的(de)创意。

马斯(sī)克也强调，人(rén)工智(zhì)能(néng)的(de)安(ān)全问题需(xū)要得到重视，太晚就来不及了。

AIGC下一站除了(le)视频，还(hái)有远方

技术都是(shì)有两面性的，潜在的(de)危害并不能(néng)掩盖(gài)其光辉的贡(gòng)献。现在看来，人工智(zhì)能技术将是第四(sì)次工(gōng)业革命的核心驱动(dòng)力量(liàng)，将创造新的增长奇迹(jì)。

过去一(yī)年，人工智能在技术(shù)和商业层(céng)面(miàn)都(dōu)有了巨大进展，AI绘画(huà)就(jiù)是(shì)人(rén)工智能技术发生方向性改变的一个代(dài)表。其(qí)下一(yī)站或许就是视频。

此前，Meta和(hé)谷歌先后发布了几条引爆(bào)科技圈(quān)的短视频。这(zhè)些视频引(yǐn)发关注并非内容做得多优秀，反(fǎn)而都非常简单，比如一匹正在喝水的马，一只画画的玩具熊(xióng)，或(huò)者一段骑摩托车的第(dì)一(yī)视角(jiǎo)录像，随便一个有手机的(de)人都可(kě)以(yǐ)随(suí)手录下一(yī)段。

但这些短视频的创作方式非常简单，创(chuàng)作者仅仅需(xū)要向AI输入一(yī)段话，甚至只是说一下要求(qiú)，AI就可(kě)以(yǐ)根据需(xū)要(yào)生(shēng)成一段视频。

谷(gǔ)歌(gē)发布的(de)两个AI生成视频分别来自于Imagen Video和Phenaki，前(qián)者主要突出(chū)的是高(gāo)清，与Meta的Make-A-Video没有太多的差(chà)别。

在Make-A-Video公布了AI生成的视频后，AI圈(quān)就(jiù)已(yǐ)经玩了一波梗，一(yī)个能够做(zuò)出(chū)更高(gāo)清视(shì)频的(de)AI还不足以(yǐ)在短时间内戳中兴奋点。

Phenaki更加(jiā)令人震(zhèn)惊的地方在于，它可以(yǐ)制作出超过2分(fēn)钟的连(lián)贯的(de)也(yě)有确切内容的视频，这才是真(zhēn)正让人们感到惊喜的地方。因为(wèi)无论AI生成的视频多么(me)高清，也(yě)只能(néng)是为内(nèi)容生产者(zhě)提供一个灵感，一个素材，一(yī)个过场动(dòng)画(huà)。

不过(guò)能够(gòu)制(zhì)作出(chū)有具体剧情内(nèi)容(róng)的视频就意味(wèi)着，一些视频创(chuàng)作由AI代替人(rén)工(gōng)完成已经初步有(yǒu)了(le)可(kě)能。

当下AI的发展速度已(yǐ)经超过(guò)大部分人的(de)想象。内容产(chǎn)业的本质(zhì)是供给创造需求，AIGC作(zuò)为全新(xīn)的内容生产方式，可(kě)以(yǐ)为内容产业带(dài)来更(gèng)新的(de)内容(róng)风(fēng)格、更(gèng)快的生产速度(dù)，更(gèng)低的生产成本，这无疑(yí)会(huì)驱动内容产业的大爆发。

除(chú)了AI绘图(tú)、视频(pín)，AIGC技术还能应用于音乐(lè)、代码(mǎ)、机器人(rén)动作等多种内容形式的(de)生成。不难发现该项技术(shù)不(bù)仅在游戏等行业能得到有(yǒu)效应用，对于下一代(dài)互(hù)联(lián)网各种元素的构(gòu)建亦有关(guān)键意义。

从商业化(huà)的(de)角度来看，文化娱乐、教育、传媒等(děng)诸多领域，本身就对基于AI的(de)可(kě)视化内容有强烈需求。

因此(cǐ)，AI绘(huì)画及视频或不是结果，而只是AI进程中的一块(kuài)重要拼图，有望在技术(shù)更新(xīn)的加持(chí)下实现更(gèng)大的应用价值(zhí)。

AI从理解内容，走向了(le)可以生成(chéng)内容(róng)，甚至能够创(chuàng)造出独立价值和(hé)独立(lì)视角的内容(róng)。AIGC的再次出圈，更(gèng)代表着未来的(de)先进生产力(lì)即将到来。

紧(jǐn)抓(zhuā)大(dà)模(mó)型与(yǔ)算力，牢固AIGC底座(zuò)

从技术(shù)的发展也可(kě)以看出(chū)，在语言大模型、图像大模型(xíng)之后，多模态大模(mó)型已经成为了新(xīn)的趋势。

大模型被誉为当前人(rén)工智能发(fā)展(zhǎn)的智能底座，是(shì)全(quán)球竞争最激烈的研(yán)究(jiū)方向(xiàng)之一，包括谷歌、亚马逊、百度、阿里(lǐ)、腾讯等众多头部企(qǐ)业都在竞(jìng)相发力。

不过训练大模(mó)型的确价格不菲，以(yǐ)国盛证券发布的《ChatGPT需要多(duō)少算(suàn)力(lì)》报告估(gū)算，GPT-3训练一次的成本约为140万美元。而对于(yú)一些(xiē)更大的LLM(大型语言(yán)模型)，训(xùn)练成本(běn)则(zé)介(jiè)于200万美元至1200万美(měi)元(yuán)高价之(zhī)间。

以(yǐ)ChatGPT在2023年1月(yuè)的独立访(fǎng)客平均数1300万计算，其对应芯片(piàn)需求为3万多(duō)片英伟达A100 GPU，初始投入成(chéng)本(běn)约为8亿美元，每日(rì)仅电费就在5万美元左(zuǒ)右(yòu)。

此外不论是ChatGPT还是AIGC，都离不(bù)开庞大算力支(zhī)持。在关注各类(lèi)大模型的发展同时，更应该关注算力网络(luò)的建设。

算力(lì)网络(luò)正驱动AI产业发展(zhǎn)进(jìn)入史诗级加速进程(chéng)，让AIGC及通用(yòng)AI这(zhè)一人工智能发展的终极目标(biāo)离得更近。

因为(wèi)算力(lì)可以(yǐ)对突破性技术创新提供大力的支(zhī)持。这方面，多(duō)模态大(dà)模型是典型(xíng)。作为面向未来强(qiáng)人(rén)工智(zhì)能、通用人(rén)工智(zhì)能(néng)的重要技(jì)术(shù)创新，多模态大模(mó)型(xíng)已经在(zài)人工(gōng)智能领域(yù)提出了很多年，业界也有(yǒu)不少技术(shù)突破，但是，多(duō)模(mó)态大模型(xíng)进一步往下走，算(suàn)力需求呈几(jǐ)何式上升，一(yī)般的算力基(jī)础设施很快将难(nán)以胜任。

从(cóng)图像、文字、语音(yīn)单独一项的训练，到双模态、三模(mó)态的(de)跃迁，让人工智能可以灵活应对不同模(mó)态的转化、像(xiàng)人与(yǔ)世界交(jiāo)互一样(yàng)自(zì)然，这方(fāng)面(miàn)，由算力网络来(lái)驱动将(jiāng)有明显优势(shì)。