伴随人工智能技术的迭代发展,AI文生视频模型出现,可以根据文字描述就能生成视频。《三星堆:未来启示录》《山海奇镜之劈波斩浪》《英雄》等作品将这种AI视频生成技术应用于筹拍、预演、实拍、后期等环节,深刻改变了影视创作的生产模式。不过,业界在积极尝试使用新技术打造数智影视内容、发展数智影视产业的同时,也应深入了解AI视频生成技术可能给影视业发展带来的风险和挑战。
近来,很多创作者反映,在利用AI生成与中国历史现实相关的视频内容时,经常会闹出笑话。例如,他们输入指令,让AI生成一段以中国某大学校园作为场景的视频,视频场景里出现的学生都是外国人的面孔;输入指令让AI生成一条中国街道的视频,视频中街道两边招牌上的文字却不是汉字,而是一些奇怪的符号,如同“天书”一般。如果说AI文生视频模型在生成中国现实题材的视频时出现的错误显而易见、容易识别和纠正,那么它在生成中国历史文化题材的视频时,则更容易出现一些隐秘、不容易识别的错误。比如,让AI生成一段讲述中国古代故事的视频,我们得到的内容里很可能会出现其他国家的古代景观,传统服饰、帽冠、纹样设计等。如果创作者相关的知识储备不足,则很难看出其中的问题。
目前这类AI生成视频经常出现的低级错误,实际上与其生成逻辑及训练数据的局限性密切相关。AI文生视频模型依托计算机深度学习,通过学习数据库中已有的及用户投喂的图像和视频资源,结合用户输入的文字描述,生成新的视频内容。所以,训练模型的质量和多样性直接影响生成内容的准确性和文化适配性。当前大量的AI文生视频模型在国内的训练数据中,反映中国文化特征的视频素材较为匮乏。所以,在生成涉及中国文化的内容时,可能出现失真或错误。例如,当用户输入指令要求AI生成反映古诗《琵琶行》意境的视频时,生成结果可能出现古人手抱吉他而非琵琶的场景。这种错误往往是因为AI缺乏对琵琶形象的深度训练,从而在内容生成时胡乱组合数据库中不相关的素材所致。如果类似错误的视频内容大量涌现,不仅会影响作品的艺术性与文化价值,还可能对观众,尤其是青少年群体造成误导。这反映了AI视频生成技术在文化适配方面的不足,需要行业进一步优化训练数据。
因此,要应对AI视频生成技术生成与中国历史现实相关的视频内容时容易出现失真、错误等问题,需要构建信息准确、考据翔实、能反映中国文化的数据库。其中应包括经过专业机构审核和认证,反映中国历史与现实的图像、视频等资源,用以训练AI文生视频模型,从而确保中国数智影视内容生产的真实性与高品质。
然而,优质的数据库建设并非一蹴而就,而是需要政府部门、相关高校及科研机构、影视生产机构等各界通力合作。首先,政府部门应发挥主导作用,搭建图像、视频资源的确权、传播与推广平台,支持集合中国文化图像、视频资源的数据库建设,鼓励各界共创、共享,探索数智影视内容创作生产的长效模式。其次,相关高校与科研机构需要发挥科研转化能力,深入挖掘中华文化的历史源流、性质特征、美学特色、文化内涵,系统梳理中华文脉及特色景观、城市、建筑、文物、人物等相关要素,为已有图像、视频资源的考据和新资源的开发提供深厚的理论支撑。再次,影视生产机构应在推进反映中国文化的数据库建设过程中,将前沿数字技术与历史资源、文化资源、艺术资源等有机结合,助力中华优秀传统文化IP的创意开发,提高基于中华优秀传统文化IP的数智影视内容品牌的传播力与影响力。
总之,在人工智能时代,中国数智影视产业大有可为,而高质量的反映中国文化的数据库则是数智影视产业的关键“基础设施”。因此,我们应当重视反映中国文化的数据库建设,并将其运用到AI文生视频模型训练中。在此基础上,通过深度融合技术与文化创意,我们可以创作出更多高品质的数智影视内容,形成富有中国特色的数智美学范式,从而助力中国数智影视产业行稳致远。
原文刊于《光明日报》2024年11月27日第15版,作者周雯,系北京师范大学艺术与传媒学院数字媒体系主任、教授。
原文链接:https://epaper.gmw.cn/gmrb/html/2024-11/27/nw.D110000gmrb_20241127_3-15.htm