我们人类属于什么动物，人类属于什么动物门-绿茶通用站群

我们人类属于什么动物，人类属于什么动物门 ChatGPT之后又一应用杀疯了，AIGC或进入可控期，将洗牌科技行业？

自聊天机器人ChatGPT火(huǒ)爆(bào)以来，微软公(gōng)司创始人(rén)比尔·盖茨已多次公开谈论人工智能(néng)话题。在最近的一次采访中，他再(zài)次表(biǎo)示：“AI可(kě)能会让科技行业迎来一(yī)次剧烈的洗(xǐ)牌”。

这(zhè)个(gè)结论(lùn)是他在当地时间2月20日(r我们人类属于什么动物，人类属于什么动物门ì)接受《In Good Company》节目(mù)专访时(shí)提出(chū)的(de)。

他预期，AI的发展可能会威(wēi)胁(xié)到谷歌的(de)市占率，因为微软在AI方面的行动(dòng)相当迅(xùn)速(sù)。而最终科(kē)技(jì)巨头将把AI整合成用户的“全能助(zhù)手(shǒu)”，包揽一切应用，与(yǔ)人们进(jìn)行沟通并提供建议，可以取代亚(yà)马逊(xùn)、Siri或Outlook等应用。

大(dà)佬口中全能(néng)助手的(de)到来可能尚(shàng)需时日，但(dàn)由(yóu)ControlNet引发的(de)又一次(cì)AI绘画浪潮，让AIGC在ChatGPT的话(huà)题热点包围中杀出重围(wéi)。

ChatGPT之(zhī)后(hòu)又一应用杀疯了，AIGC或进(jìn)入可控(kòng)期，将洗牌科技行(xíng)业？_黑料正能(néng)量

ControlNet颠(diān)覆AI绘画新玩(wán)法

AIGC向可控(kòng)靠近

以AI绘画(huà)为代(dài)表的AIGC上一(yī)次爆火(huǒ)的时候，还(hái)是(shì)2022年(nián)8月，在美国科罗拉多州举办(bàn)的新兴数字艺术家(jiā)竞赛(sài)中，一幅名(míng)为《太空歌剧院》的作品获奖。

随后各大厂(chǎng)商的AI绘画软件被广大网友(yǒu)熟知并体验，Stable Diffusion便是(shì)其中代表。

用(yòng)户们可以在应用(yòng)中输入一组(zǔ)关(guān)键词或者一张(zhāng)照片，就能获(huò)得一(yī)幅AI创作的画作。

作画的关键就是所输入的文本。同一组(zǔ)关键词(cí)也可以(yǐ)创作出很(hěn)多张风格不一样的(de)画(huà)作，这(zhè)让创作的(de)过程就像(xiàng)开盲盒。

很(hěn)多用(yòng)户很喜欢这种不确定的惊喜，他们会将生成的美图当(dāng)做头像。而另一部分喜欢翻看(kàn)AI绘(huì)画的“翻车(chē)”作品(pǐn)。在社(shè)交媒体上，许(xǔ)多用(yòng)户分享AI“翻车(chē)现场”，例如，一位(wèi)网(wǎng)友的小狗照(zhào)片被AI画成(chéng)了“肌(jī)肉男”，还有(yǒu)网友(yǒu)的个人照片被AI识(shí)别成了(le)建(jiàn)筑。

而如今随着ControlNet的出(chū)现(xiàn)与加持(chí)，以(yǐ)往AI绘画(huà)的填写关键词游戏可能要被颠覆了。

ControlNet是(shì)一(yī)位正在斯坦(tǎn)福读博的中(zhōng)国人(rén)张吕敏创(chuàng)作(zuò)的(de)一(yī)种基于(yú)控制点的图像变形算法，主要用于(yú)数字图像处理、计算(suàn)机视觉(jué)和(hé)计算机图形学(xué)等领域。

其SD插件一经发布(bù)，在短短的两天内便(biàn)成为(wèi)了AI绘画(huà)领域最(zuì)新的(de)热(rè)点。

在(zài)此之前，大(dà)家用了很多方法想让AI生成的(de)结果(guǒ)尽可能的符合要(yào)求，但是(shì)都不尽如人(rén)意，它的出现代表着AI生成开(kāi)始进(jìn)入(rù)真正的可控时期(qī)。

因为ControlNet可以直接提取画(huà)面的(de)构(gòu)图，人物(wù)的姿势和画面的深度信息等。有了它的帮助，就不用频繁的(de)用提示词来碰(pèng)运(yùn)气，抽盲盒式的创(chuàng)作了。

通俗的(de)说ControlNet相当于(yú)给AI绘画加了“魔法”，不少博主的作品已经获得(dé)了大量(liàng)的(de)浏览量(liàng)，“viggo”就是其中(zhōng)之一，他(tā)用朋友的照(zhào)片直接(jiē)带她们走进动漫(màn)世(shì)界。

viggo先用StableDiffusion图(tú)片转文字(zì)。

再用Text2Prompt插(chā)件拓展(zhǎn)找到对应的(de)关键词；最后用ControlNet插件(jiàn)绑(bǎng)定骨骼开始换关键(jiàn)词试效果。

通过(guò)图片就可以看出(chū)来，效果十分惊艳(yàn)。

更厉害的是，除了(le)真实的照片，草图也可以加上“魔(mó)法”，知乎大牛“DevPoint”和“逗砂”介(jiè)绍到ControlNet还能实(shí)现线稿转全彩图。大(dà)神张吕敏其本尊也亲(qīn)自回应(yīng)。

不得不说(shuō)当下AIGC已经变得越来越强(qiáng)大(dà)，甚至输出的作品都已经能以假(jiǎ)乱真了。

难(nán)辨虚实，AIGC技术力爆发

警惕安全问题

近日，“苏州(zhōu)金鸡湖有游(yóu)艇party”的消息火遍网络，而经过(guò)警方辟谣这所(suǒ)谓的“party”可能是全国第(dì)一起AI绘图诈骗。

由于这(zhè)个活动里面给出的(de)美女照(zhào)片都是(shì)AI制作(zuò)的(de)真人照片绘图，因为(wèi)太逼真，被大家当成真事传播了。

不过仔细观(guān)察可以发现，活动发起者提供的照(zhào)片中有(yǒu)个很大的漏洞可以发现并非真人，而是AI绘图，那便是图片中女(nǚ)性的(de)手(shǒu)指部分有的存在异常(cháng)。

ChatGPT之后又一应用杀疯了(le)，AIGC或进(jìn)入可控期(qī)，将洗牌科技行业？_黑料正能量

有行业(yè)人(rén)事(shì)表示(shì)：“现在因为手指部分的(de)绘画算法比较复杂，AI还(hái)不太会画(huà)人的手，但最新看(kàn)到的图(tú)片已(yǐ)经有越来越完美(měi)的(de)AI模型(xíng)出现，以后可能就完全没有漏洞了。”

类似的AI作图诈骗在国外也已有发生。据英国广播公司报道，土耳其地震期间(jiān)，有Tiktok用户使用AI合成了儿童受灾的(de)假(jiǎ)照片发布到网(wǎng)络，以此诱骗善良的人打赏“捐助”从(cóng)而实(shí)施诈骗。

目前随着技术发(fā)展，AIGC已经能做出真人照片(piàn)般的绘图效果，如果这样(yàng)的图片被用来(lái)诈骗，将非(fēi)常可怕。

此外AIGC还引(yǐn)发了很多担(dān)忧，一方面，批判(pàn)者认为AI在“学习我们人类属于什么动物，人类属于什么动物门”了大量前人(rén)的作(zuò)品之后，其创作没有任(rèn)何(hé)情绪和灵魂，难以和人类(lèi)的艺术创作相提并论(lùn)。

另一方面，AIGC背后的版权、目前都(dōu)并(bìng)没有得到(dào)有效的解决(jué)，还有AIGC会不(bù)会代替人类“至高无上”的创意。

马(mǎ)斯(sī)克也强(qiáng)调，人(rén)工智能的安全问题(tí)需要(yào)得到(dào)重视，太晚就来不及了。

AIGC下(xià)一(yī)站除了视频，还有远方

技术都是有两面性的，潜在(zài)的危害并不能掩盖其光辉的贡献。现在看来，人(rén)工智(zhì)能技术将是第四次工业(yè)革命的核心驱动力量，将创(chuàng)造新的增(zēng)长奇迹。

过去一年，人工智(zhì)能(néng)在技术(shù)和(hé)商业层(céng)面(miàn)都有了巨(jù)大进展，AI绘画就是(shì)人工智能(néng)技术发生方(fāng)向性改变的一个代表。其(qí)下一站或许就是视(shì)频。

此前，Meta和(hé)谷歌先后发(fā)布(bù)了几条引(yǐn)爆科技圈的短视频。这些视频引发关注并非内容做得多优(yōu)秀，反而(ér)都非常简单，比如一(yī)匹正在喝水的马，一只(zhǐ)画画的玩具熊，或(huò)者一段骑(qí)摩托车的第一视角录(lù)像(xiàng)，随便(biàn)一个有(yǒu)手机的人都可以(yǐ)随(suí)手录(lù)下(xià)一(yī)段。

但这些短视频的创作方式(shì)非常简单(dān)，创作者仅仅需要向AI输入一段话，甚至只是说一(yī)下要求，AI就可以根据需要(yào)生成一段视频(pín)。

谷歌(gē)发布的(de)两(liǎng)个AI生(shēng)成视频分别(bié)来自于Imagen Video和Phenaki，前者主要突出的是(shì)高(gāo)清(qīng)，与Meta的(de)Make-A-Video没有太多(duō)的差别。

在Make-A-Video公布了AI生成(chéng)的视频后，AI圈就已经玩(wán)了一波梗，一个能够做出更(gèng)高清视频的AI还不(bù)足以在短时间(jiān)内戳(chuō)中兴奋点。

Phenaki更加令人震惊的地方(fāng)在(zài)于，它可以制作出超过2分钟(zhōng)的连贯的也有确切内(nèi)容的视频，这才是真正让人们(men)感到惊喜(xǐ)的地方。因为(wèi)无论(lùn)AI生成的视频(pín)多么高清，也只能是为(wèi)内容生产者提供(gōng)一(yī)个灵感，一个素材，一个过(guò)场动画(huà)。

不(bù)过能够制(zhì)作出有具(jù)体剧情内容的视频就意(yì)味(wèi)着，一些视频创(chuàng)作由AI代替人工(gōng)完成(chéng)已(yǐ)经初(chū)步(bù)有了可能。

当下AI的发展速度已经超过大部分人的想象。内容(róng)产业的本质是供给创造(zào)需求，AIGC作为全新的内容生产方(fāng)式，可以(yǐ)为内容产(chǎn)业(yè)带来更新的内容风格、更快的生(shēng)产(chǎn)速度，更(gèng)低(dī)的生产成本，这(zhè)无疑会驱动(dòng)内容产业的大爆(bào)发。

除了(le)AI绘(huì)图、视(shì)频，AIGC技术还能应用(yòng)于音乐、代码、机(jī)器(qì)人动作等(děng)多种内(nèi)容(róng)形式(shì)的生成(chéng)。不难(nán)发现该项技术不(bù)仅在游戏等行(xíng)业能得到有效(xiào)应用，对于下一(yī)代互联网各种(zhǒng)元素的构建(jiàn)亦有关键意义。

从商业(yè)化的角度来看，文化娱乐、教育、传(chuán)媒等诸多领域，本(běn)身就对基于AI的可视化内(nèi)容(róng)有强烈需求。

因(yīn)此，AI绘(huì)画及视(shì)频或不是结果，而(ér)只是AI进程中的一(yī)块重(zhòng)要拼图，有望在技术更新的(de)加持(chí)下实现更大的应用价值。

AI从理解内容(róng)，走向了可(kě)以生成内容，甚至能够创造(zào)出独立价值和独立视(shì)角的内容。AIGC的再次(cì)出圈，更(gèng)代表着(zhe)未来(lái)的先进生产力即将到(dào)来。

紧抓大模型与算力，牢固(gù)AIGC底座

从技术的(de)发展也可以看出，在语言大模型、图(tú)像大(dà)模型(xíng)之后，多模(mó)态大(dà)模型已经成(chéng)为了新的(de)趋势。

大(dà)模(mó)型被(bèi)誉为当前人工智能发展的智(zhì)能(néng)底(dǐ)座(zuò)，是(shì)全球竞争最(zuì)激烈的研究(jiū)方向之(zhī)一(yī)，包括(kuò)谷(gǔ)歌(gē)、亚(yà)马(mǎ)逊、百度、阿里、腾讯等众多头(tóu)部企(qǐ)业(yè)都在竞(jìng)相发力。

不过训练大模(mó)型的确(què)价格不(bù)菲，以国盛证(zhèng)券发布的《ChatGPT需要(yào)多少算力》报告估算，GPT-3训(xùn)练一次的(de)成本约为(wèi)140万美元。而对于一些更(gèng)大(dà)的LLM(大型语言模型)，训练成本(běn)则介于200万美元至1200万美(měi)元(yuán)高价之间。

以ChatGPT在2023年1月的(de)独(dú)立(lì)访(fǎng)客平均数1300万计算，其对应芯片需求(qiú)为(wèi)3万多片英伟(wěi)达A100 GPU，初始投入(rù)成本约为(wèi)8亿美(měi)元，每日仅电费就在5万美元左右。

此外不论是ChatGPT还是AIGC，都离不开(kāi)庞大算力支持。在关注各类大(dà)模型的发(fā)展同时(shí)，更(gèng)应该关(guān)注(zhù)算力网(wǎng)络(luò)的建设(shè)。

算力网络正驱动(dòng)AI产业发展进入史(shǐ)诗级加速进程(chéng)，让AIGC及通用(yòng)AI这一人工智能发展的(de)终(zhōng)极目标离(lí)得更近(jìn)。

因(yīn)为算力可以对(duì)突破(pò)性(xìng)技术创(chuàng)新(xīn)提供大力的支(zhī)持(chí)。这方(fāng)面，多模态大(dà)模型是典型。作为面(miàn)向(xiàng)未(wèi)来强人工智能、通用人工(gōng)智能的重要技术创新，多模态大模型已经在人工(gōng)智(zhì)能领域提出(chū)了很(hěn)多(duō)年(nián)，业界也有不少技术突破，但是，多模态(tài)大模(mó)型(xíng)进一(yī)步往下走(zǒu)，算力(lì)需求呈几何式上(shàng)升，一般的(de)算(suàn)力基础设施很快(kuài)将难以胜任。

从图(tú)像、文(wén)字、语音单独一项(xiàng)的训(xùn)练，到双模态、三模态的跃迁，让人(rén)工智能(néng)可以灵活应对不同模态的转化、像人与世(shì)界交互一(yī)样自然，这方(fāng)面，由算(suàn)力网络(luò)来驱(qū)动将有明(míng)显优势(shì)。