编辑:编辑部
一年一度的百度Crat大会又来了,还是一如既往地酷炫、硬核!
当你仰望星空时,你在想些什么?
有执着的发问,就会有不曾想象的回音。
从方寸之间到寰宇之外,创造新宇宙的人,相信永远看不到天花板。
坚定的人,不会因为到达而停下,他们用创造的脚步丈量未知。
百度CREATE大会,为我们展示了人类设计师和AIGC共同创意制作的绘画。
而就像这些绘画所描述的场景,百度,也不曾停下创新的脚步。
在大会开始,李彦宏就提出了一个令人深思的观点:第四次科技革命的标志,就是深度学习算法。与深度学习相关的重大创新,会像汽车、互联网一样,对我们的社会产生重大的影响。
真正的实践中,没有导航地图,只有指南针。而百度,也是摸准大致方向后,基于实践一步步迭代,才跑出了有价值的创新。
在大会上,李彦宏展示了这样一幅画。这幅画是他以「危机和希望」为关键词,在百度AI作画平台一格上生成的。
这幅画,很好地代表了人工智能面临的现状——经历起起落落,但充满希望。
是的,李彦宏依然坚持去年的观点——创造者们将迎来属于人工智能的黄金十年。
AIGC元年,来了
,AIGC全面爆发。
DALL·E2让文本生成图片火爆一整年,随后的StablDiffussion、Midjourny,更是启发了无数人的艺术灵感,甚至让不少画手感到震惊。
而DALL·E2和谷歌发布的Imagn的模型,也吸引了许多AI学者参与研究。
ChatGPT虽然到了年末才压轴出场,但「强化学习」赋予它的魔力,让它在全民狂欢中再次掀起AIGC的风暴。
其实,在年初,百度研究院早已预测到了AIGC在这一年的火爆。
超大规模预训练模型呈现知识增强、跨模态统一建模、多学习方式共同演进的趋势,并逐渐实用化。
例如AIGC(AIgnratdcontnt,人工智能创造内容),借助大模型的跨模态综合技术能力,可以激发创意,提升内容多样性,降低制作成本,将会实现大规模应用。
而且,这已经不是百度研究院第一次做出神预测了。年,它预测的NLP模型在GPT-3上得到应验,而在年,它押中的数字人全面大爆。
而这次,百度对于AIGC领域的趋势,可谓是胸有成竹。
三个天才创作者,一键圆你导演梦
在Crat大会上,百度几乎将AIGC深入应用到了每一个环节。歌曲、场景、演讲脑图的创作,这些环节中,全都有AI的参与。
而李彦宏以「危机和希望」为主题生成的绘画,背后就是文心知识增强跨模态大模型一格,它就是接下来要出场的三位天才创作者的其中一位。
这次Crat大会上,百度技术委员会主席吴华为我们介绍了三位能力超群的天才创作者。
它们分别是天才编剧——文心ERNIE3.0Zus,天才插画师——文心ERNIE-ViLG2.0,剪辑和动画大师——VIMER-TCIR。
有了这三位天才创作者,再配上自己设计的虚拟人演员,你也可以当上导演,拍出自己的影视大作了!
文心ERNIE3.0Zus语言大模型,陪你聊到天荒地老!
作为ERNIE3.0系列模型的最新升级,ERNIE3.0Zus除了对无标注数据和知识图谱的学习之外,还通过持续学习对百余种不同形式的任务数据实现了全面掌握。
在对通用知识和专门知识「双管齐下」后,模型的泛化能力显著提升,不管是多语言理解,还是生成任务,都能轻松搞定,名副其实的「通才」了属于是。
无论是自主创作、自由回答,还是命题对话、情感分析,多个层次化Prompt,ERNIE3.0Zus都能顺利应对。
文心ERNIE-ViLG2.0图像生成大模型,天才画师了解一下?
如果说文心ERNIE3.0Zus是语言大师,ERNIE-ViLG2.0就是作画大师。它能根据一句话或者一段描述文本,生成一幅精美的画作。
中文提示,想要什么画,直接开口说就行,只有你想不到的,没有ta画不出来的,看看这艘青花瓷战舰,像不像一尊精美的艺术品?就是不知道真的打起来,会不会被一炮干碎......
而要达成这个目标,离不开模型本身背后知识增强的扩散模型。
一句话或几句话的提示中,哪些是核心要素,需要在画作中突出展现,哪些是修饰要素,作用就是锦上添花,还不能喧宾夺主,这里边就有学问了。
为了尽可能实现精准作画,在学习过程中,ERNIEViLG2.0引入了语言、视觉等多源知识,引导模型更加