绿茶通用站群绿茶通用站群

鸭绒被好还是鹅绒被好,鹅绒被最大的缺点

鸭绒被好还是鹅绒被好,鹅绒被最大的缺点 ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自聊天机(jī)器人ChatGPT火爆(bào)以来,微软公司创始人(rén)比尔·盖(gài)茨已多次(cì)公开谈论(lùn)人工智(zhì)能话题。在最近(jìn)的一次采(cǎi)访中(zhōng),他再次表示:“AI可(kě)能会让科技(jì)行业迎来一次(cì)剧烈的洗牌”。

这(zhè)个结论是他在当地时间2月20日接受《In Good Company》节目专访时提(tí)出的。

他预期,AI的发(fā)展可能会威胁(xié)到谷歌的市(shì)占率,因为微软在AI方面的行动相(xiāng)当(dāng)迅速。而最(zuì)终科技巨头将把AI整合成(chéng)用(yòng)户的“全能助手”,包揽一切应用(yòng),与人们进行沟通并提供建议,可以取代(dài)亚马逊、Siri或Outlook等(děng)应用。

大佬(lǎo)口中全能助手的到来(lái)可(kě)能尚(shàng)需时日,但由ControlNet引发的又(yòu)一(yī)次AI绘(huì)画浪(làng)潮,让AIGC在ChatGPT的话题(tí)热(rè)点包围中杀(shā)出重围。

ChatGPT之后(hòu)又(yòu)一(yī)应(yīng)用(yòng)杀疯(fēng)了,AIGC或进入可控(kòng)期,将洗牌科(kē)技行(xíng)业(yè)?_黑料正能量

01

ControlNet颠覆(fù)AI绘画(huà)新玩法

AIGC向可控靠近

以AI绘画为代表的AIGC上一次爆火的时候,还是2022年8月,在(zài)美国科罗(luó)拉多州举办(bàn)的新兴数字艺(yì)术(shù)家竞赛(sài)中,一(yī)幅名为《太空歌(gē)剧院》的(de)作品(pǐn)获奖。

随后各大(dà)厂商(shāng)的AI绘画软件被广大网(wǎng)友熟知并体验,Stable Diffusion便是其(qí)中代表。

ChatGPT之(zhī)后又(yòu)一应(yīng)用(yòng)杀疯了(le),AIGC或进(jìn)入可控(kòng)期(qī),将洗牌(pái)科(kē)技行业?_黑料正能量

用户们可(kě)以在应(yīng)用中输入一组(zǔ)关(guān)键词或者一张照片,就能获(huò)得一幅AI创作的画作。

作画(huà)的关键就是所输入的文本。同一(yī)组关键(jiàn)词也可以创(chuàng)作出(chū)很多张风格不一样的画作,这让创作的过程就像(xiàng)开盲盒。

很多用户很喜(xǐ)欢这种不确定的惊喜(xǐ),他(tā)们(men)会将生成的美图当做头(tóu)像。而另一部(bù)分(fēn)喜欢翻看AI绘画的(de)“翻车(chē)”作品。在社交媒体上(shàng),许多用(yòng)户分享AI“翻车现场”,例如,一位网(wǎng)友的(de)小(xiǎo)狗照片被AI画成(chéng)了“肌肉男”,还有网(wǎng)友(yǒu)的个人照片被AI识别成了建筑。

而(ér)如今(jīn)随(suí)着ControlNet的出现与加持,以(yǐ)往AI绘画的填写关键词游戏(xì)可(kě)能要被颠覆了。

ChatGPT之后又(yòu)一(yī)应用杀疯了,AIGC或进入可控期,将(jiāng)洗(xǐ)牌科技行业(yè)?_黑料(liào)正能量

ControlNet是一位正(zhèng)在(zài)斯坦福读博的(de)中国(guó)人(rén)张吕敏创作的(de)一(yī)种基于控制点(diǎn)的(de)图像(xiàng)变形算法,主要用于数字图像处(chù)理、计算机(jī)视觉和计算机(jī)图形学等领域(yù)。

其SD插件(jiàn)一经发布(bù),在短(duǎn)短的两天内(nèi)便成为了(le)AI绘画领(lǐng)域最(zuì)新的热点(diǎn)。

在此之前(qián),大家用了很多方法想(xiǎng)让(ràng)AI生成的结果尽可能的符(fú)合要求,但(dàn)是都不尽如人意,它的出现(xiàn)代表着AI生成开始进入真(zhēn)正(zhèng)的可控(kòng)时(shí)期。

因为ControlNet可(kě)以直(zhí)接提取画面的构图,人(rén)物的(de)姿(zī)势和画面的深度信息等。有了它的帮助(zhù),就不用频繁的用提示词(cí)来碰(pèng)运气(qì),抽盲盒式的创(chuàng)作了。

通(tōng)俗(sú)的(de)说(shuō)ControlNet相当于给AI绘画加了“魔(mó)法(fǎ)”,不少博(bó)主(zhǔ)的作品已经获得了大量的(de)浏览量,“viggo”就是其中之一(yī),他用(yòng)朋友的照片(piàn)直(zhí)接带她们走进动漫世界(jiè)。

ChatGPT之后又一应用杀(shā)疯了,AIGC或进入可控期(qī),将洗牌(pái)科技行业?_黑料正能量

viggo先用StableDiffusion图片转文(wén)字。

再用Text2Prompt插件拓展(zhǎn)找到(dào)对应(yīng)的关键词;最后用(yòng)ControlNet插件绑定骨骼开始换关键词试效果(guǒ)。

ChatGPT之后(hòu)又一应(yīng)用杀疯了,AIGC或进入可控(kòng)期,将洗牌科技(jì)行业?_黑料正能量

通过图片就可以看(kàn)出(chū)来(lái),效(xiào)果十分惊(jīng)艳。

ChatGPT之后又一应用杀疯了(le),AIGC或(huò)进入可(kě)控期,将(jiāng)洗(xǐ)牌科技行业?_黑料正能量

ChatGPT之后又一应用杀疯了,AIGC或进(jìn)入可(kě)控期,将洗牌科技行业?_黑料正(zhèng)能量(liàng)

更厉害(hài)的(de)是,除(chú)了真实(shí)的照片,草图也可以加上“魔法(fǎ)”,知(zhī)乎大(dà)牛“DevPoint”和“逗砂”介绍(shào)到ControlNet还能实现(xiàn)线(xiàn)稿转全彩图。大(dà)神张吕敏其本尊也亲自回应。

ChatGPT之后又一应(yīng)用杀(shā)疯了(le),AIGC或进入可控期,将(jiāng)洗牌(pái)科技行业?_黑料正(zhèng)能量

不(bù)得不(bù)说(shuō)当下AIGC已经变得(dé)越(yuè)来(lái)越(yuè)强大,甚至输出(chū)的作品都已经能以假乱真(zhēn)了。

02

难辨(biàn)虚实,AIGC技术力(lì)爆发

警惕安全问题

近日(rì),“苏州金鸡(jī)湖有(yǒu)游艇party”的消息火遍网络(luò),而经(jīng)过警方辟谣(yáo)这(zhè)所谓的“party”可能(néng)是(shì)全国第一起AI绘图诈(zhà)骗。

由于(yú)这个(gè)活动里面(miàn)给出的美女照片(piàn)都是AI制作的真人照片绘图(tú),因(yīn)为太逼真,被大家(jiā)当成(chéng)真事传播了

ChatGPT之(zhī)后又一应用杀(shā)疯了(le),AIGC或进入(rù)可控期,将洗牌科技(jì)行业?_黑料正能量

不(bù)过仔细观(guān)察可(kě)以(yǐ)发现(xiàn),活动发起者提供的照片中(zhōng)有个(gè)很大的漏洞可(kě)以发现(xiàn)并非真(zhēn)人,而是(shì)AI绘图(tú),那便是图(tú)片中(zhōng)女性的手指部(bù)分有的存在异常。

ChatGPT之后又一应用杀疯了(le),AIGC或进入(rù)可控期,将(jiāng)洗牌科技(jì)行业?_黑料正能量

有行业(yè)人事(shì)表示:“现在(zài)因为手指部分(fēn)的(de)绘画算法(fǎ)比(bǐ)较复杂,AI还(hái)不太会画人(rén)的手,但最新看到的图片已经有越来越完美的AI模(mó)型出现,以后可能(néng)就完全没有漏洞了。

类似的AI作图(tú)诈(zhà)骗(piàn)在国外也(yě)已有发生(shēng)。据(jù)英(yīng)国广播公司报道(dào),土(tǔ)耳其地震期间,有Tiktok用户(hù)使用AI合(hé)成(chéng)了儿童受灾的假(jiǎ)照片(piàn)发(fā)布到网络,以此诱骗善(shàn)良的人(rén)打赏(shǎng)“捐(juān)助”从而实施诈骗。

目前(qián)随着技(jì)术发(fā)展(zhǎn),AIGC已(yǐ)经能(néng)做出真人照片般的绘图(tú)效果,如果(guǒ)这(zhè)样的图片被用来诈骗,将非常可(kě)怕。

此外AIGC还引发了很多担忧,一方(fāng)面,批判者认(rèn)为AI在“学习(xí)”了大量前人的(de)作品之(zhī)后,其创作没有任何情绪和灵(líng)魂(hún),难(nán)以和(hé)人类的艺术(shù)创(chuàng)作相提(tí)并论。

另一(yī)方面,AIGC背后的(de)版权、目前都并没有得到(dào)有效的解决(jué),还有AIGC会不会代替人类“至高无(wú)上”的创意。

马斯(sī)克也强调,人(rén)工智能的(de)安全问题需(xū)要得(dé)到重视,太(tài)晚就来不(bù)及(jí)了。

03

AIGC下一站除了视频,还有远方

技术都(dōu)是有两(liǎng)面性(xìng)的,潜在的危(wēi)害并不能掩盖(gài)其光(guāng)辉的(de)贡献。现在看来,人工智能技(jì)术将是第四(sì)次工业革命的核心驱动(dòng)力量(liàng),将创造新的增(zēng)长奇(qí)迹(jì)。

过去(qù)一年,人(rén)工智能在技术和商(shāng)业层面都有(yǒu)了巨大进展,AI绘画(huà)就是人(rén)工智能技术发生(shēng)方向性改变的(de)一(yī)个(gè)代表。其(qí)下一站或许就是视频(pín)。

此前,Meta和谷歌先后发布了(le)几条(tiáo)引爆科技圈的短视频。这些(xiē)视频引发关注(zhù)并非(fēi)内容(róng)做得多优秀(xiù),反而都(dōu)非(fēi)常简单,比如一(yī)匹正(zhèng)在(zài)喝水(shuǐ)的马,一只画画的玩具熊,或者一段骑摩托车(chē)的第一(yī)视角录像,随便一个(gè)有手机的人(rén)都(dōu)可以随手(shǒu)录(lù)下一段。

ChatGPT之后又(yòu)一应用(yòng)杀疯了(le),AIGC或进入(rù)可控期,将洗牌科技行(xíng)业?_黑料正(zhèng)能量

但(dàn)这些短(duǎn)视频的(de)创作方式非常简单,创作者仅仅需要(yào)向AI输入一(yī)段话,甚至只(zhǐ)是说一(yī)下要求(qiú),AI就可(kě)以根(gēn)据需要生(shēng)成一段(duàn)视频。

谷歌发布的(de)两个AI生成视频分别(bié)来自于Imagen Video和Phenaki,前(qián)者主要(yào)突出的是高清,与Meta的(de)Make-A-Video没有太多的差(chà)别。

在(zài)Make-A-Video公布了AI生成的(de)视频(pín)后,AI圈就已经(jīng)玩了(le)一波梗(gěng),一个能够做(zuò)出更高(gāo)清视频的AI还(hái)不足以在(zài)短时(鸭绒被好还是鹅绒被好,鹅绒被最大的缺点shí)间内戳中兴奋点(diǎn)。

Phenaki更加令人震惊的(de)地方在(zài)于,它可以制(zhì)作出超过2分(fēn)钟的连贯的(de)也有确(què)切(qiè)内容的视(shì)频,这才(cái)是真正让人们感到惊(jīng)喜的地方。因为无论AI生成的(de)视频(pín)多么高(gāo)清(qīng),也只能是为内容(róng)生产者提供一个(gè)灵感,一个素材(cái),一个过场动(dòng)画(huà)。

不过能够制(zhì)作出(chū)有具体剧情(qíng)内容的视(shì)频(pín)就意(yì)味着,一些视频创作由AI代(dài)替人(rén)工完(wán)成已(yǐ)经初步有了可能。

当下AI的发展速度已(yǐ)经超过(guò)大部分人的想(xiǎng)象。内容产业的本质(zhì)是供给(gěi)创(chuàng)造需求,AIGC作为(wèi)全新的内(nèi)容生产方式,可以为内容产业(yè)带来更新的内容风格、更快的生产(chǎn)速度,更低的(de)生产成(chéng)本,这无疑会驱动内(nèi)容产业的(de)大爆(bào)发(fā)。

除了AI绘图(tú)、视频,AIGC技术还能应(yīng)用于音乐(lè)、代码、机器人动作等多(duō)种内容形式的(de)生成(chéng)。不难(nán)发现(xiàn)该(gāi)项技术(shù)不(bù)仅在(zài)游(yóu)戏等行(xíng)业能得到有效应(yīng)用(yòng),对(duì)于下一代互联(lián)网各(gè)种元素的构(gòu)建亦有关键意义(yì)。

从商(shāng)业化的角度来看,文(wén)化娱乐、教(jiào)育、传媒等(děng)诸(zhū)多领域(yù),本身就(jiù)对基(jī)于AI的(de)可视(shì)化内(nèi)容有强(qiáng)烈需求。

因(yīn)此,AI绘画及视频或不是结果,而只是AI进(jìn)程中的一块重要拼图(tú),有望在技术(shù)更新的加持下实现更大的应用价(jià)值。

AI从理解内容,走向了可(kě)以生成(chéng)内容(róng),甚至能够创造出独立价值和独立视角的内(nèi)容(róng)。AIGC的再次出(chū)圈,更代表着(zhe)未来的先进生产力(lì)即(jí)将到来(lái)。

ChatGPT之后又一应用杀疯了,AIGC或进入可控(kòng)期,将洗(xǐ)牌科技行业?_黑料正能量

04

紧抓(zhuā)大模型与算力,牢固AIGC底座

从技术(shù)的发展也可以(yǐ)看(kàn)出,在(zài)语言(yán)大模型、图像大(dà)模型之(zhī)后,多模态大模型已经成为了新(xīn)的趋(qū)势。

大(dà)模(mó)型被(bèi)誉为当前人工智能发展的智能底座(zuò),是全球竞争最激(jī)烈的研究方向之一,包括谷歌、亚(yà)马(mǎ)逊、百度、阿里、腾(téng)讯等众多头部企业都(dōu)在(zài)竞相发力(lì)。

不过训练(liàn)大(dà)模型(xíng)的确价格不菲,以国盛证券发(fā)布的(de)《ChatGPT需要多少算力》报告估算,GPT-3训练一次(cì)的成本约为140万(wàn)美元。而(ér)对于一些更大的LLM(大(dà)型语言(yán)模(mó)型(xíng)),训练成本则介于200万美元(yuán)至1200万美(měi)元高价(jià)之(zhī)间。

以(yǐ)ChatGPT在2023年1月(yuè)的独(dú)立(lì)访(fǎng)客平均(jūn)数1300万计(jì)算,其对应芯片需求为(wèi)3万多片英伟达(dá)A100 GPU,初(chū)始(shǐ)投(tóu)入成本约为(wèi)8亿美元,每日(rì)仅电费就(jiù)在5万(wàn)美(měi)元(yuán)左右。

ChatGPT之(zhī)后又一应用杀疯了(le),AIGC或进入(rù)可控期,将(jiāng)洗牌科技行业?_黑料正(zhèng)能量

此外不论(lùn)是ChatGPT还(hái)是(shì)AIGC,都离不开庞大算力支持。在(zài)关注各类(lèi)大模型的发展同时,更应该关注算力网络的建设(shè)。

算力网络正驱(qū)动AI产(chǎn)业发展进入史诗级加速进程,让AIGC及通用(yòng)AI这一人工(gōng)智能发(fā)展(zhǎn)的终极目标(biāo)离(lí)得更近(jìn)。

因为算力可以(yǐ)对突破性(xìng)技术创(chuàng)新提供大力的(de)支(zhī)持。这(zhè)方面,多模态大模型是(shì)典型(xíng)。作为面向未来(lái)强人工智能、通用人(rén)工智能的(de)重要技术创新(xīn),多模态大模型已(yǐ)经在人工(gōng)智(zhì)能领域提出了(le)很多年,业界(jiè)也有不少技术(shù)突破,但(dàn)是,多模(mó)态(tài)大模型进一步往下走,算力需求呈几何式上升,一般的算力基础设施(shī)很快将难以胜任。

从图(tú)像、文字、语音单独一项的训练,到双模态、三模态的跃迁,让人工智(zhì)能可以灵活(huó)应对(duì)不(bù)同模态的转化、像人(rén)与(yǔ)世界(jiè)交(jiāo)互一(yī)样自然,这方(fāng)面,由(yóu)算力网络来驱动将有(yǒu)明显(xiǎn)优(yōu)势。

ChatGPT之后又一(yī)应用杀疯了,AIGC或(huò)进入(rù)可控(kòng)期,将洗牌科技行业?_黑料正能量(liàng)

此外,还(hái)有很多(duō)需要爆发式增长的(de)算(suàn)力来支撑(chēng)的(de)技术创新,将在人工智(zhì)能算力网(wǎng)络支撑(chēng)下快速推进。

AIGC已经露出曙光(guāng),期待在大(dà)模型和大算力的支持下AIGC能持续颠覆内容生(shēng)产的方式,将创造的边际成本降低,让万众(zhòng)受益。

未经允许不得转载:绿茶通用站群 鸭绒被好还是鹅绒被好,鹅绒被最大的缺点

评论

5+2=