[观点]周雯：呼唤反映中国文化的数据库-北京师范大学新闻网

伴随人工智能技术的迭代发展，AI文生视频模型出现，可以根据文字描述就能生成视频。《三星堆：未来启示录》《山海奇镜之劈波斩浪》《英雄》等作品将这种AI视频生成技术应用于筹拍、预演、实拍、后期等环节，深刻改变了影视创作的生产模式。不过，业界在积极尝试使用新技术打造数智影视内容、发展数智影视产业的同时，也应深入了解AI视频生成技术可能给影视业发展带来的风险和挑战。

近来，很多创作者反映，在利用AI生成与中国历史现实相关的视频内容时，经常会闹出笑话。例如，他们输入指令，让AI生成一段以中国某大学校园作为场景的视频，视频场景里出现的学生都是外国人的面孔；输入指令让AI生成一条中国街道的视频，视频中街道两边招牌上的文字却不是汉字，而是一些奇怪的符号，如同“天书”一般。如果说AI文生视频模型在生成中国现实题材的视频时出现的错误显而易见、容易识别和纠正，那么它在生成中国历史文化题材的视频时，则更容易出现一些隐秘、不容易识别的错误。比如，让AI生成一段讲述中国古代故事的视频，我们得到的内容里很可能会出现其他国家的古代景观，传统服饰、帽冠、纹样设计等。如果创作者相关的知识储备不足，则很难看出其中的问题。

目前这类AI生成视频经常出现的低级错误，实际上与其生成逻辑及训练数据的局限性密切相关。AI文生视频模型依托计算机深度学习，通过学习数据库中已有的及用户投喂的图像和视频资源，结合用户输入的文字描述，生成新的视频内容。所以，训练模型的质量和多样性直接影响生成内容的准确性和文化适配性。当前大量的AI文生视频模型在国内的训练数据中，反映中国文化特征的视频素材较为匮乏。所以，在生成涉及中国文化的内容时，可能出现失真或错误。例如，当用户输入指令要求AI生成反映古诗《琵琶行》意境的视频时，生成结果可能出现古人手抱吉他而非琵琶的场景。这种错误往往是因为AI缺乏对琵琶形象的深度训练，从而在内容生成时胡乱组合数据库中不相关的素材所致。如果类似错误的视频内容大量涌现，不仅会影响作品的艺术性与文化价值，还可能对观众，尤其是青少年群体造成误导。这反映了AI视频生成技术在文化适配方面的不足，需要行业进一步优化训练数据。

因此，要应对AI视频生成技术生成与中国历史现实相关的视频内容时容易出现失真、错误等问题，需要构建信息准确、考据翔实、能反映中国文化的数据库。其中应包括经过专业机构审核和认证，反映中国历史与现实的图像、视频等资源，用以训练AI文生视频模型，从而确保中国数智影视内容生产的真实性与高品质。

然而，优质的数据库建设并非一蹴而就，而是需要政府部门、相关高校及科研机构、影视生产机构等各界通力合作。首先，政府部门应发挥主导作用，搭建图像、视频资源的确权、传播与推广平台，支持集合中国文化图像、视频资源的数据库建设，鼓励各界共创、共享，探索数智影视内容创作生产的长效模式。其次，相关高校与科研机构需要发挥科研转化能力，深入挖掘中华文化的历史源流、性质特征、美学特色、文化内涵，系统梳理中华文脉及特色景观、城市、建筑、文物、人物等相关要素，为已有图像、视频资源的考据和新资源的开发提供深厚的理论支撑。再次，影视生产机构应在推进反映中国文化的数据库建设过程中，将前沿数字技术与历史资源、文化资源、艺术资源等有机结合，助力中华优秀传统文化IP的创意开发，提高基于中华优秀传统文化IP的数智影视内容品牌的传播力与影响力。

总之，在人工智能时代，中国数智影视产业大有可为，而高质量的反映中国文化的数据库则是数智影视产业的关键“基础设施”。因此，我们应当重视反映中国文化的数据库建设，并将其运用到AI文生视频模型训练中。在此基础上，通过深度融合技术与文化创意，我们可以创作出更多高品质的数智影视内容，形成富有中国特色的数智美学范式，从而助力中国数智影视产业行稳致远。

原文刊于《光明日报》2024年11月27日第15版，作者周雯，系北京师范大学艺术与传媒学院数字媒体系主任、教授。

原文链接：https://epaper.gmw.cn/gmrb/html/2024-11/27/nw.D110000gmrb_20241127_3-15.htm