绿茶通用站群绿茶通用站群

我们人类属于什么动物,人类属于什么动物门

我们人类属于什么动物,人类属于什么动物门 ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自聊天机器人ChatGPT火(huǒ)爆(bào)以来,微软公(gōng)司创始人(rén)比尔·盖茨已多次公开谈论人工智能(néng)话题。在最近的一次采访中,他再(zài)次表(biǎo)示:“AI可(kě)能会让科技行业迎来一(yī)次剧烈的洗(xǐ)牌”。

这(zhè)个(gè)结论(lùn)是他在当地时间2月20日(r我们人类属于什么动物,人类属于什么动物门ì)接受《In Good Company》节目(mù)专访时(shí)提出(chū)的(de)。

他预期,AI的发展可能会威(wēi)胁(xié)到谷歌的(de)市占率,因为微软在AI方面的行动(dòng)相当迅(xùn)速(sù)。而最终科(kē)技(jì)巨头将把AI整合成用户的“全能助(zhù)手(shǒu)”,包揽一切应用,与(yǔ)人们进(jìn)行沟通并提供建议,可以取代亚(yà)马逊(xùn)、Siri或Outlook等应用。

大(dà)佬口中全能(néng)助手的(de)到来可能尚(shàng)需时日,但(dàn)由(yóu)ControlNet引发的(de)又一次(cì)AI绘画浪潮,让AIGC在ChatGPT的话(huà)题热点包围中杀出重围(wéi)。

ChatGPT之(zhī)后(hòu)又一应用杀疯了,AIGC或进(jìn)入可控(kòng)期,将洗牌科技行(xíng)业?_黑料正能(néng)量

01

ControlNet颠(diān)覆AI绘画新玩(wán)法

AIGC向可控(kòng)靠近

以AI绘画(huà)为代(dài)表的AIGC上一(yī)次爆火(huǒ)的时候,还(hái)是(shì)2022年(nián)8月,在美国科罗拉多州举办(bàn)的新兴数字艺术家(jiā)竞赛(sài)中,一幅名(míng)为《太空歌剧院》的作品获奖。

随后各大厂(chǎng)商的AI绘画软件被广大网友(yǒu)熟知并体验,Stable Diffusion便是(shì)其中代表。

ChatGPT之后又一应(yīng)用杀疯(fēng)了,AIGC或进入可(kě)控期,将洗牌(pái)科技行业(yè)?_黑料正(zhèng)能量

用(yòng)户们可以在应用(yòng)中输入一组(zǔ)关(guān)键词或者一张(zhāng)照片,就能获(huò)得一(yī)幅AI创作的画作。

作画的关键就是所输入的文本。同一组(zǔ)关键词(cí)也可以(yǐ)创作出很(hěn)多张风格不一样的(de)画(huà)作,这(zhè)让创作的(de)过程就像(xiàng)开盲盒。

很(hěn)多用(yòng)户很喜欢这种不确定的惊喜,他们会将生成的美图当(dāng)做头像。而另一部分喜欢翻看(kàn)AI绘(huì)画的“翻车(chē)”作品(pǐn)。在社(shè)交媒体上,许(xǔ)多用(yòng)户分享AI“翻车(chē)现场”,例如,一位(wèi)网(wǎng)友的小狗照(zhào)片被AI画成(chéng)了“肌(jī)肉男”,还有(yǒu)网友(yǒu)的个人照片被AI识(shí)别成了(le)建(jiàn)筑。

而如今随着ControlNet的出(chū)现(xiàn)与加持(chí),以(yǐ)往AI绘画(huà)的填写关键词游戏可能要被颠覆了。

ChatGPT之后又一应用杀(shā)疯了,AIGC或进入可控期,将(jiāng)洗牌科技行业?_黑料正能量(liàng)

ControlNet是(shì)一(yī)位正在斯坦(tǎn)福读博的中(zhōng)国人(rén)张吕敏创(chuàng)作(zuò)的(de)一(yī)种基于(yú)控制点的图像变形算法,主要用于(yú)数字图像处理、计算(suàn)机视觉(jué)和(hé)计算机图形学(xué)等领域。

其SD插件一经发布(bù),在短短的两天内便(biàn)成为(wèi)了AI绘画(huà)领域最(zuì)新的(de)热(rè)点。

在(zài)此之前,大(dà)家用了很多方法想让AI生成的(de)结果(guǒ)尽可能的符合要(yào)求,但是(shì)都不尽如人(rén)意,它的出现代表着AI生成开(kāi)始进(jìn)入(rù)真正的可控时期(qī)。

因为ControlNet可以直接提取画(huà)面的(de)构(gòu)图,人物(wù)的姿势和画面的深度信息等。有了它的帮助,就不用频繁的(de)用提示词来碰(pèng)运(yùn)气,抽盲盒式的创(chuàng)作了。

通俗的(de)说ControlNet相当于(yú)给AI绘画加了“魔法”,不少博主的作品已经获得(dé)了大量(liàng)的(de)浏览量(liàng),“viggo”就是其中(zhōng)之一,他(tā)用朋友的照(zhào)片直接(jiē)带她们走进动漫(màn)世(shì)界。

ChatGPT之后又一应(yīng)用杀疯了,AIGC或进入可控期,将洗(xǐ)牌科技(jì)行业(yè)?_黑料正能(néng)量

viggo先用StableDiffusion图(tú)片转文字(zì)。

再用Text2Prompt插(chā)件拓展(zhǎn)找到对应的(de)关键词;最后用ControlNet插件(jiàn)绑(bǎng)定骨骼开始换关键(jiàn)词试效果。

ChatGPT之后又一应用杀疯了(le),AIGC或进入可控期,将洗牌(pái)科技行业?_黑料(liào)正能(néng)量

通过(guò)图片就可以看出(chū)来,效果十分惊艳(yàn)。

ChatGPT之后又一应(yīng)用(yòng)杀(shā)疯了,AIGC或(huò)进入(rù)可(kě)控期,将洗牌科(kē)技行业(yè)?_黑料(liào)正能量(liàng)

ChatGPT之后又一应用杀疯了,AIGC或(huò)进入可控期,将洗(xǐ)牌科技行业?_黑料(liào)正能量

更厉害的是,除了(le)真实的照片,草图也可以加上“魔(mó)法”,知乎大牛“DevPoint”和“逗砂”介(jiè)绍到ControlNet还能实(shí)现线稿转全彩图。大(dà)神张吕敏其本尊也亲(qīn)自回应(yīng)。

ChatGPT之(zhī)后又(yòu)一应用杀疯了,AIGC或(huò)进入可控期,将洗牌科技行业?_黑料正能量

不得不说(shuō)当下AIGC已经变得越来越强(qiáng)大(dà),甚至输出的作品都已经能以假(jiǎ)乱真了。

02

难(nán)辨虚实,AIGC技术力爆发

警惕安全问题

近日,“苏州(zhōu)金鸡湖有游(yóu)艇party”的消息火遍网络,而经过(guò)警方辟谣这所(suǒ)谓的“party”可能是全国第(dì)一起AI绘图诈骗。

由于这(zhè)个活动里面给出的(de)美女照(zhào)片都是(shì)AI制作(zuò)的(de)真人照片绘图,因为(wèi)太逼真,被大家当成真事传播了

ChatGPT之后(hòu)又(yòu)一应用(yòng)杀疯了,AIGC或进入可控(kòng)期,将洗牌科技行业?_黑料正(zhèng)能(néng)量

不过仔细观(guān)察可以发现,活动发起者提供的照(zhào)片中有(yǒu)个很大的漏洞可以发现并非真人,而是AI绘图,那便是图片中女(nǚ)性的(de)手(shǒu)指部分有的存在异常(cháng)。

ChatGPT之后又一应用杀疯了(le),AIGC或进(jìn)入可控期(qī),将洗牌科技行业?_黑料正能量

有行业(yè)人(rén)事(shì)表示(shì):“现在因为手指部分的(de)绘画算法比较复杂,AI还(hái)不太会画(huà)人的手,但最新看(kàn)到的图(tú)片已(yǐ)经有越来越完美(měi)的(de)AI模型(xíng)出现,以后可能就完全没有漏洞了。

类似的AI作图诈骗在国外也已有发生。据英国广播公司报道,土耳其地震期间(jiān),有Tiktok用户使用AI合成了儿童受灾的(de)假(jiǎ)照片发布到网(wǎng)络,以此诱骗善良的人打赏“捐助”从(cóng)而实(shí)施诈骗。

目前随着技术发(fā)展,AIGC已经能做出真人照片(piàn)般的绘图效果,如果这样(yàng)的图片被用来(lái)诈骗,将非(fēi)常可怕。

此外AIGC还引(yǐn)发了很多担(dān)忧,一方面,批判(pàn)者认为AI在“学习我们人类属于什么动物,人类属于什么动物门”了大量前人(rén)的作(zuò)品之后,其创作没有任(rèn)何(hé)情绪和灵魂,难以和人类(lèi)的艺术创作相提并论(lùn)。

另一方面,AIGC背后的版权、目前都(dōu)并(bìng)没有得到(dào)有效的解决(jué),还有AIGC会不(bù)会代替人类“至高无上”的创意。

马(mǎ)斯(sī)克也强(qiáng)调,人(rén)工智能的安全问题(tí)需要(yào)得到(dào)重视,太晚就来不及了。

03

AIGC下(xià)一(yī)站除了视频,还有远方

技术都是有两面性的,潜在(zài)的危害并不能掩盖其光辉的贡献。现在看来,人(rén)工智(zhì)能技术将是第四次工业(yè)革命的核心驱动力量,将创(chuàng)造新的增(zēng)长奇迹。

过去一年,人工智(zhì)能(néng)在技术(shù)和(hé)商业层(céng)面(miàn)都有了巨(jù)大进展,AI绘画就是(shì)人工智能(néng)技术发生方(fāng)向性改变的一个代表。其(qí)下一站或许就是视(shì)频。

此前,Meta和(hé)谷歌先后发(fā)布(bù)了几条引(yǐn)爆科技圈的短视频。这些视频引发关注并非内容做得多优(yōu)秀,反而(ér)都非常简单,比如一(yī)匹正在喝水的马,一只(zhǐ)画画的玩具熊,或(huò)者一段骑(qí)摩托车的第一视角录(lù)像(xiàng),随便(biàn)一个有(yǒu)手机的人都可以(yǐ)随(suí)手录(lù)下(xià)一(yī)段。

ChatGPT之后又一应(yīng)用杀疯了(le),AIGC或进入可控期,将(jiāng)洗牌科技行业?_黑料正(zhèng)能(néng)量

但这些短视频的创作方式(shì)非常简单(dān),创作者仅仅需要向AI输入一段话,甚至只是说一(yī)下要求,AI就可以根据需要(yào)生成一段视频(pín)。

谷歌(gē)发布的(de)两(liǎng)个AI生(shēng)成视频分别(bié)来自于Imagen Video和Phenaki,前者主要突出的是(shì)高(gāo)清(qīng),与Meta的(de)Make-A-Video没有太多(duō)的差别。

在Make-A-Video公布了AI生成(chéng)的视频后,AI圈就已经玩(wán)了一波梗,一个能够做出更(gèng)高清视频的AI还不(bù)足以在短时间(jiān)内戳(chuō)中兴奋点。

Phenaki更加令人震惊的地方(fāng)在(zài)于,它可以制作出超过2分钟(zhōng)的连贯的也有确切内(nèi)容的视频,这才是真正让人们(men)感到惊喜(xǐ)的地方。因为(wèi)无论(lùn)AI生成的视频(pín)多么高清,也只能是为(wèi)内容生产者提供(gōng)一(yī)个灵感,一个素材,一个过(guò)场动画(huà)。

不(bù)过能够制(zhì)作出有具(jù)体剧情内容的视频就意(yì)味(wèi)着,一些视频创(chuàng)作由AI代替人工(gōng)完成(chéng)已(yǐ)经初(chū)步(bù)有了可能。

当下AI的发展速度已经超过大部分人的想象。内容(róng)产业的本质是供给创造(zào)需求,AIGC作为全新的内容生产方(fāng)式,可以(yǐ)为内容产(chǎn)业(yè)带来更新的内容风格、更快的生(shēng)产(chǎn)速度,更(gèng)低(dī)的生产成本,这(zhè)无疑会驱动(dòng)内容产业的大爆(bào)发。

除了(le)AI绘(huì)图、视(shì)频,AIGC技术还能应用(yòng)于音乐、代码、机(jī)器(qì)人动作等(děng)多种内(nèi)容(róng)形式(shì)的生成(chéng)。不难(nán)发现该项技术不(bù)仅在游戏等行(xíng)业能得到有效(xiào)应用,对于下一(yī)代互联网各种(zhǒng)元素的构建(jiàn)亦有关键意义。

从商业(yè)化的角度来看,文化娱乐、教育、传(chuán)媒等诸多领域,本(běn)身就对基于AI的可视化内(nèi)容(róng)有强烈需求。

因(yīn)此,AI绘(huì)画及视(shì)频或不是结果,而(ér)只是AI进程中的一(yī)块重(zhòng)要拼图,有望在技术更新的(de)加持(chí)下实现更大的应用价值。

AI从理解内容(róng),走向了可(kě)以生成内容,甚至能够创造(zào)出独立价值和独立视(shì)角的内容。AIGC的再次(cì)出圈,更(gèng)代表着(zhe)未来(lái)的先进生产力即将到(dào)来。

ChatGPT之后又一应(yīng)用杀(shā)疯了,AIGC或进入可控期,将洗牌科技(jì)行业?_黑料(liào)正能量

04

紧抓大模型与算力,牢固(gù)AIGC底座

从技术的(de)发展也可以看出,在语言大模型、图(tú)像大(dà)模型(xíng)之后,多模(mó)态大(dà)模型已经成(chéng)为了新的(de)趋势。

大(dà)模(mó)型被(bèi)誉为当前人工智能发展的智(zhì)能(néng)底(dǐ)座(zuò),是(shì)全球竞争最(zuì)激烈的研究(jiū)方向之(zhī)一(yī),包括(kuò)谷(gǔ)歌(gē)、亚(yà)马(mǎ)逊、百度、阿里、腾讯等众多头(tóu)部企(qǐ)业(yè)都在竞(jìng)相发力。

不过训练大模(mó)型的确(què)价格不(bù)菲,以国盛证(zhèng)券发布的《ChatGPT需要(yào)多少算力》报告估算,GPT-3训(xùn)练一次的(de)成本约为(wèi)140万美元。而对于一些更(gèng)大(dà)的LLM(大型语言模型),训练成本(běn)则介于200万美元至1200万美(měi)元(yuán)高价之间。

以ChatGPT在2023年1月的(de)独(dú)立(lì)访(fǎng)客平均数1300万计算,其对应芯片需求(qiú)为(wèi)3万多片英伟(wěi)达A100 GPU,初始投入(rù)成本约为(wèi)8亿美(měi)元,每日仅电费就在5万美元左右。

ChatGPT之后又(yòu)一应用(yòng)杀疯了,AIGC或进入(rù)可控期,将洗牌(pái)科技行(xíng)业(yè)?_黑(hēi)料正能(néng)量

此外不论是ChatGPT还是AIGC,都离不开(kāi)庞大算力支持。在关注各类大(dà)模型的发(fā)展同时(shí),更(gèng)应该关(guān)注(zhù)算力网(wǎng)络(luò)的建设(shè)。

算力网络正驱动(dòng)AI产业发展进入史(shǐ)诗级加速进程(chéng),让AIGC及通用(yòng)AI这一人工智能发展的(de)终(zhōng)极目标离(lí)得更近(jìn)。

因(yīn)为算力可以对(duì)突破(pò)性(xìng)技术创(chuàng)新(xīn)提供大力的支(zhī)持(chí)。这方(fāng)面,多模态大(dà)模型是典型。作为面(miàn)向(xiàng)未(wèi)来强人工智能、通用人工(gōng)智能的重要技术创新,多模态大模型已经在人工(gōng)智(zhì)能领域提出(chū)了很(hěn)多(duō)年(nián),业界也有不少技术突破,但是,多模态(tài)大模(mó)型(xíng)进一(yī)步往下走(zǒu),算力(lì)需求呈几何式上(shàng)升,一般的(de)算(suàn)力基础设施很快(kuài)将难以胜任。

从图(tú)像、文(wén)字、语音单独一项(xiàng)的训(xùn)练,到双模态、三模态的跃迁,让人(rén)工智能(néng)可以灵活应对不同模态的转化、像人与世(shì)界交互一(yī)样自然,这方(fāng)面,由算(suàn)力网络(luò)来驱(qū)动将有明(míng)显优势(shì)。

ChatGPT之后又(yòu)一应(yīng)用杀疯(fēng)了,AIGC或(huò)进入可(kě)控期,将洗牌(pái)科技行业(yè)?_黑(hēi)料正能量

此外,还有(yǒu)很(hěn)多需要爆发式(shì)增(zēng)长的算力来支(zhī)撑的技术创新,将在人工(gōng)智能算力网(wǎng)络支撑下快速推进(jìn)。

AIGC已(yǐ)经露出曙光,期待在大模型(xíng)和大算力(lì)的支持下AIGC能持续颠覆内(nèi)容生产的方式(shì),将创(chuàng)造(zào)的边际成本降(jiàng)低,让万众受益(yì)。

未经允许不得转载:绿茶通用站群 我们人类属于什么动物,人类属于什么动物门

评论

5+2=