时间:2023-05-30|浏览:193
2022年1月5日,在百度“AIGC智能创作新风尚”媒体沟通会上,百度技术委员会主席吴华介绍了百度AIGC内容生成能力背后的技术原理。2022年10月,百度发布了业界首个知识增强的AI作画大模型ERNIE-ViLG 2.0,它能根据一句话或一段描述文本,生成一系列精美的画作。吴华介绍指出,在AI预训练学习过程中,百度创新性地提出了知识增强的扩散模型,以提高文本生成图像的准确性,实现了精准的细粒度语义控制。
吴华告诉记者,只需要输入一段文字,ERNIE-ViLG就可以快速理解这段文字所表达的含义和场景,然后根据这个理解,在几十秒内就可以生成媲美人类作画水平的图像,同时能够生成数百张风格各异的画作,比如写实、意象、中国风、二次元等等。目前ERNIE-ViLG 2.0已经刷新SOTA效果,性能远远超过了国际上的同类技术。在图文相关性和图像保真度两个维度的人工评估上,ERNIE-ViLG 2.0相对于DALL-E 2和Stable Diffusion同样取得了较大的优势。
AIGC的蓬勃发展不可避免地给设计师带来身份危机,设计师如何跨越传统设计业与AI设计的鸿沟?吴华认为,任何技术的进步都会带来新的想象空间,从每次技术革新的总体来看,AI设计对行业其实是起到了正向促进作用。通过AI和设计师协同工作,AI可以辅助设计师提供更多的灵感,更多的创意,更多的素材,帮助设计师创造更好的作品。此外,AI本身可能也会成为一个新的创作流派。
由于一系列AIGC生产工具的出现,音视频等内容创作者的工作效率得到了大幅提高。AIGC正在让个体创作者成为真正的“独立”制作人。
热点:谷歌百度