此页面上的内容需要较新版本的 Adobe Flash Player。

获取 Adobe Flash Player

大数据

郭全中:我国文化大数据体系建设研究
作者:   来源:郭全中   日期:2020-12-30

   随着大数据、人工智能等新技术的快速发展,数据在经济社会发展中起着越来越重要的作用。中共十九届四中全会指出,健全劳动、资本、土地、知识、技术、管理、数据等生产要素由市场评价贡献、按贡献决定报酬的机制。而具体到国家文化大数据体系建设,2020年5月,中央文改办下发《关于做好国家文化大数据体系建设工作的通知》(以下简称《通知》),为国家文化大数据体系建设提供了政策依据、建设路径和主要思路。要真正建设好国家文化大数据体系,更好地发挥文化大数据的效用,就要界定清楚文化大数据的内涵和外延,文化大数据体系的构成以及文化大数据的应用。


 

   一、文化大数据的内涵与文化大数据体系的构成

   厘清文化大数据的内涵与外延以及文化大数据体系的构成是建设国家文化大数据体系的前提和基础。目前,对于文化大数据尚缺乏准确的定义以及对文化大数据体系的构成缺乏清晰的认知,主要原因是局限于“小文化”[1]领域以及没有抓住大数据的本质,而这就需要扩大到大文化范畴和按照大数据的本质特点和规律来讨论问题。

   1.文化大数据的定义与内涵

   目前,文化大数据尚缺乏统一的定义,绝大多数都是通过描述式的归纳法来界定文化大数据。高书生认为文化大数据分为需求侧和供给侧,需求侧的大数据是因文化消费而产生的海量数据,供给侧的大数据来自公共文化机构、高校科研机构、文化生产机构等。[1]这种定义法简单容易理解,但是缺点也很明显:一是没有从大数据的本质和规律来对文化大数据进行界定;二是仍然从“小文化”的视角来界定,而不是采取“大文化”的视角,导致内涵和外延过窄,导致文化大数据的数量和质量都会受到很大影响;三是在供给侧重点强调了PGC内容供给,而没有给予UGC内容足够的重视。而要准确定义文化大数据,就要从大数据的本质特点和规律出发进行定义。

   所谓文化大数据,是指服务于文化相关决策,需要新型数据处理模式才能对其内容进行采集、存储、管理和分析的海量、高增长率和多样化的信息资产。可以从以下四个方面加强对文化大数据的理解:一是在目的方面,是服务于文化相关决策,即满足人民在文化领域日益增长的美好需要;二是在处理模式方面,需要新型处理模式,原有的处理模式已经不能有效处理;三是在本质方面,是信息资产,是新的生产要素,其价值比石油等资源更大;四是在复杂性方面,极为复杂,不仅体现为海量数据,而且还体现文本、音频、视频等格式,更体现既有规则数据也有不规则数据;五是具有大数据的海量性、频率高、实时性、全维度、在线性等特点。

   2.文化大数据体系的构成

   在文化大数据体系的构成研究方面,目前国内的系统化研究很少,且主要集中于文化大数据的构成,而不是文化大数据体系构成。有的研究认为从数据对象的生成方式及其在数据生态系统中所处的位置来看,文化大数据可以被概括为文化原生数据与文化衍生数据两类。其中,文化原生数据又可以进一步细分为文化行为数据、文化内容数据、文化时空数据等类型。高书生从文化生产体系再造的角度,认为供给侧的大数据可以作为生产要素进入文化生产过程,需要格外关注供给侧的大数据,尤其强调从文化遗产中“萃取”的数据,主要包括中国文化遗产标本库、中华民族文化基因库、中华文化素材库三库。

   文化大数据体系是一个极为复杂的体系,涵盖标准、伦理、技术平台、内容、监管政策、参与者、数据共享与协同、落地场景等。一是在标准方面。由于文化大数据构成庞杂、参与主体众多而且互联网巨头在其中起着重要作用,这导致文化大数据的标准极难统一。

   二是在文化大数据伦理方面。文化大数据涉及到精神层面和用户的个人隐私,尤其需要具备正确的伦理观和价值观,当然大数据技术本身并无价值观,而使用大数据技术的企业和员工要具备正确的价值观和伦理观。

   三是在技术平台方面。文化大数据构成复杂、参与者众多,目前不仅互联网巨头搭建起了属于自身的文化大数据技术平台方面,而且其他文化大数据相关企业也搭建起了或大或小的技术平台,尤其是实力强大的互联网巨头搭建起了内容、技术与用户等中台,为数以亿计的用户提供个性化、及时性的文化服务。在技术平台方面,国家层面缺乏真正统一的、涵盖政府相关的文化大数据的技术平台。

   四是在内容方面。文化大数据可以分为既有内容深度挖掘和生产的、文化机构持续生产的、自媒体生产的三类,其中中国文化遗产标本库、中华民族文化基因库、中华文化素材库等是既有内容深度挖掘和生产的重要组成部分,每天都在生产的新闻、娱乐等内容是文化机构持续生产的主要组成部分,而用户每天生产的各种各样的文化相关内容是自媒体生产的核心内容。

   五是在监管政策方面。大数据尤其文化大数据的监管作为新兴事物,处理的都是新问题,需要的技术手段复杂、涉及面广,尤其涉及到数以亿计用户的隐私和数字资产,这就要求在监管政策上采取全新的观念、手段和工具,核心则是观念上要树立起数据思维和数据治理的观念。

   六是在参与者方面。文化大数据的参与主体众多、类型复杂,有政府机构(既是文化大数据治理的监管机构又是某些文化大数据整理的服务外包机构)、互联网巨头(字节跳动、腾讯、阿里巴巴、百度、快手)等,各类文化大数据相关企业、用户、科研机构等。

   七是在数据共享与协同方面。大数据的价值在于多元关联与共享,单一维度数据的价值则相对很小,但目前文化大数据主要由互联网巨头掌握,而且各家互联网巨头的技术标准不一且文化大数据蕴藏着巨大的商业利益,各家企业并不愿意共享各自的数据,也导致文化大数据难以充分发挥应有的价值。

   八是落地场景方面。随着大数据技术快速打破行业和区域限制,大数据的落地场景越来越多、价值越来越大。文化大数据落地场景多、类型复杂,基本上涉及到用户的方方面面的需求,而不仅仅局限于新闻资讯、文化娱乐等与文化相关的需求,在教育、旅游等融合产业中都会有相应的落地场景。

   3.构建国家文化大数据体系意义重大

   国家文化大数据体系建设作为我国的重大战略部署,无论对于我国优秀文化的保存和传承,还是助力我国文化产业的可持续发展,都具有重大的现实意义。

   第一,在文化事业方面能够促进文化事业发展繁荣。一方面国家文化大数据体系建设把我国文化资源全面数据化和标签化,为文化创作提供更多更好的素材;另一方面通过对优秀传统文化的数据化,彻底打破时间和距离制约,实现优秀文化的持久化保存和更好地传承。

   第二,助力文化产业及关联产业可持续发展。在当下的大数据时代,文化大数据已经成为重要的生产要素,既能为我国文化产业的高速发展提供不竭的资源,又能助力文化产业的跨界发展,进一步拓展文化产业的市场和边界。

   二、国家文化大数据体系建设的基本思路与不足

   中央文改办下发的《通知》,明确了国家文化大数据体系建设的主要思路,而系统分析《通知》则可以看出基本上采取的还是小文化的建设思路。

   1.基本任务和思路

   整体来说,《通知》采取了极为务实的做法,以国有文化单位为主要依托并吸引社会力量加入,以供给侧文化大数据为抓手,核心围绕掌控力强的政府文化大数据展开。毫无疑问,这种思路容易推进、见效快,而且能够帮助国有文化单位找到新的业务增长点。具体任务和思路如下。

   第一,明确了国家文化大数据体系建设的八大任务。《通知》明确了中国文化遗产标本库建设、中华民族文化基因库建设、中华文化素材库建设、文化体验园建设、文化体验馆建设、国家文化专网建设、国家文化大数据云平台建设和数字化文化生产线建设等八大任务。

   第二,供给侧、生产端、体系化是三大关键词。从《通知》来看,一是要从供给侧着手。即对中国文化遗产标本库、中华民族文化基因库、中华文化素材库进行深度挖掘和数据化。二是从生产端发力。三是体系化是关键。

   第三,有线电视网络公司和国家文化大数据产业联盟在其中发挥重要作用。一是有线电视网络公司将承担国家文化专网等的建设,将成为最大的受益者。二是国家文化大数据产业联盟的各类企业。

   2.该思路的不足之处

   《通知》中国家文化大数据体系建设的思路很务实,也能够在很短的时间内取得实效,在一定程度上帮助国有文化企业发展新业务,但从整体上说,该思路也存在范围过窄、体系不够健全等不足之处。

   第一,采取的是“小文化”思路。从《通知》可以看出,国家文化大数据覆盖的范围主要是文化和旅游部所管理的文化领域,相比于范围更广的“大文化”领域则覆盖范围相对狭窄,明显采取的是“小文化”的建设思路,虽然短期内能够快速推进,但从长期来看,不利于系统、全面地建设国家文化大数据体系。

   第二,主要集中于供给侧的文化大数据,而对于需求侧的文化大数据则考虑较少。《通知》重点围绕国家掌控的文化大数据资源(政府文化大数据资源),核心是公共文化服务资源,而且建设的重点是供给侧的生产端,而对于需求侧的文化大数据关注很少。

   第三,主要集中于文化机构尤其是国有文化机构生产的内容,而对于数量更为庞大的、更接地气的UGC内容则关注不够。《通知》中强调要充分发挥公共文化机构、高校科研机构和文化生产机构的能力和作用,而对于UGC的内容则基本没有涉及。

   三、建设国家文化大数据体系的对策建议

   国家文化大数据体系建设作为涉及多个部门的国家重大战略性工程,应通过多部委联合发布和实施的方式来提升重视程度,采取“大文化”的建设思路,充分发挥公共文化机构、互联网文化企业以及各类文化企业的协同作用,实现供给端、需求端、监管端等系统化、体系化的建设。

   1.由中宣部牵头、多部委联合发文推进

   目前《通知》由中宣部文改办发布,由于文改办只是中宣部的一个正厅级内设部门,相对来说级别较低,与国家文化大数据体系建设的地位和重要性不匹配。一般来说,对于文化领域的国家重大战略部署都是由多部门联合发文,例如,《关于促进文化和科技深度融合的指导意见》就由科技部等六部门联合发文。因此,作为国家大数据体系建设重要组成部分的国家文化大数据体系建设也应该由多部委联合发文,建议由中宣部牵头,中宣部、发改委、中央网信办、财政部、文化和旅游部、广播电视总局、科技部等部委联合发文推进该重大工程,以切实发挥文化大数据这一新生产要素在经济社会发展中的重要驱动作用。当然,如果由中办、国办两办发文最好。

   2.采取“大文化”建设思路

   所谓的“大文化”思路,是相对于之前的“小文化”思路来说的,完全覆盖了中宣部的监管与治理范围,不仅涵盖了“小文化”的文化与旅游部的监管与治理范围,而且涵盖了网信办、广电总局、新闻出版署等部门的监管与治理范围,真正构建起数量巨大、多元关联、互联互通的国家文化大数据体系。

   “大文化”建设思路,从根本上符合大数据和互联网发展规律,能够有效地打破部门主义和数据孤岛,把散落于于各个部门的文化资源有效整合起来,不仅能更好地发挥互联网和数据资源的几何指数增长效应,又能发挥不同类型文化资源的协同效应,真正助力我国文化事业和文化产业大发展大繁荣。

   3.树立起开放合作的理念

   大数据要真正发挥作用就要实现多元数据的融合和关联,而要实现有效融合和关联,在理念上要打破各自为战的旧观念,树立起开放合作的新理念。

   真正树立开放合作理念,一是要求国家文化大数据体系建设不能由文化部门关起门来搞建设,更不能为了部门利益而不充分利用社会资源,尤其要按照互联网和大数据的发展规律,秉持开放、合作、互助的理念,打通国家文化大数据体系与国家大数据体系的有效连接,彻底实现不同数据体系之间的互联互通,更好地发挥国家文化大数据体系的功能和效用;二是实现国有文化单位和企业与民营文化单位和企业之间的开放合作,发挥全社会之力建设国家文化大数据体系;三是互联网文化巨头之间也要充分开放合作,实现文化数据在更广范围、更多平台之间的关联;四是文化单位和企业与其他类型单位和企业的开放合作,实现文化数据与其他数据的多元关联。

   4.以建设系统化、体系化的国家文化大数据体系为目的

   首先,要构建起由监管治理层、标准与伦理层、技术平台层、内容与传播层、用户层、落地场景等构成的多层次国家文化大数据体系。在监管治理层方面,加强顶层设计,实现多部委之间的协同监管与治理;在标准与伦理层方面,虽然不可能要求各大互联网文化企业采取一样的数据标准,但是可以在政府购买服务的文化大数据采取一样的标准,而且各大互联网文化企业可以在文化大数据标准方面密切合作。至于大数据伦理,应树立起“数据向善”的伦理观;在技术平台层方面,由于各大互联网文化企业有自己的技术平台,且技术平台之间不可能有效对接,应由国家出面建立起国家文化大数据技术和内容平台,一方面负责由国家出资的相关文化大数据,尤其是公共文化服务领域的文化大数据,另一方面负责与各大互联网文化企业的技术和内容平台对接。

   其次,涵盖供给侧、需求侧等所有的文化大数据。除了供给侧的文化大数据之外,还要涵盖需求侧的文化大数据,尤其是需求侧的文化大数据包括了用户文化需求的各类的细化数据,对于生产端的生产出适销对路的文化大数据产品和满足用户的美好生活需要具有关键性价值。当然由于需求侧的文化大数据基本上为大型互联网文化企业所有,在需要使用需求侧数据时,国家文化大数据平台应该采取各种有力措施激励大型互联网文化企业共享相关数据,以更好地发挥国家文化大数据体系的价值。在供给侧方面,除了文化机构生产的文化大数据之外,还应该包括自媒体和用户自生产的文化大数据,而且在5G快速普及和短视频流行的时代下,自媒体和用户自生产的文化大数据更接地气,数量占比也越来越大。

   第三,涵盖所有的参与者。除了国有文化机构、科研院所、相关文化机构之外,重点应把大型互联网文化企业纳入体系,并把大型互联网文化企业平台上的文化大数据生产者一并纳入体系。

   5. 加强文化大数据的共享与关联

   大数据是人工智能的核燃料,文化大数据对于文化的智能化极为关键,尤其是不同维度和来源的多元关联数据作用巨大。国家文化大数据体系建设,一方面在技术平台和标准方面尽可能实现不同平台数据的可转换。虽然不同互联网平台都有自身的数据利益,不可能采取数据平台的完全统一化和互通化,但是可以鼓励不同的互联网平台的大数据在交易时可以实现可转换;另一方面采取各种有效的激励措施促进各大互联网文化企业的文化大数据共享与关联。

   6.促进文化大数据的多场景落地

   第一,搭建国家文化专网助力广电网络的数字化转型。目前国家正在大力推进“新基建”,并采取各种方式融资,文化领域的“新基建”在现阶段就是国家文化大数据体系建设,国家和各级政府的总投资额很大,而作为国有文化产业重要力量的有线电视网络公司应成为国家文化专网建设的承担者。目前中国广电已经拿到了5G牌照,中国广电以及各省有线电视网络公司正在积极推动5G网络建设,5G网络的切片技术可以为行业提供更好、更安全的专网建设,自然中国广电等可以利用5G技术建设好国家文化专网等,更好地做好“宣传文化”与“信息服务”工作。[2]

   第二,大力鼓励大型互联网文化企业参与国家文化大数据体系建设和运营。毫无疑问,大型互联网文化企业在文化大数据方面技术能力强、用户规模大、资金实力强、运营能力突出,既要鼓励大型互联网文化企业全方位参与国家文化大数据体系的建设,又要鼓励大型互联网文化企业充分利用国家文化大数据体系的资源,为用户提供更好的文化产品。

   第三,拓展更多的落地场景。随着大数据技术快速打破行业和区域限制,大数据的落地场景越来越多、价值越来越大。要打造良好的文化大数据生态系统,就要让参与各方都能获益,而这就要在更多的商业场景落地,“以技术为本、以文化为魂、以产业为载体”就是有效的思路,除了文化体验馆、文化体验园之外,文化产业、旅游产业、信息服务业、教育业等都是很好的落地场景和载体。