你的隐私,大数据怎知道******
作者:杨义先、钮心忻(均为北京邮电大学教授)
在网络上,每个人都会或多或少,或主动或被动地泄露某些碎片信息。这些信息被大数据挖掘,就存在隐私泄露的风险,引发信息安全问题。面对汹涌而来的5G时代,大众对自己的隐私保护感到越来越迷茫,甚至有点不知所措。那么,你的隐私,大数据是怎么知道的呢?大家又该如何自我保护呢?
1.“已知、未知”大数据都知道
大数据时代,每个人都有可能成为安徒生童话中那个“穿新衣”的皇帝。在大数据面前,你说过什么话,它知道;你做过什么事,它知道;你有什么爱好,它知道;你生过什么病,它知道;你家住哪里,它知道;你的亲朋好友都有谁,它也知道……总之,你自己知道的,它几乎都知道,或者说它都能够知道,至少可以说,它迟早会知道!
甚至,连你自己都不知道的事情,大数据也可能知道。例如,它能够发现你的许多潜意识习惯:集体照相时你喜欢站哪里呀,跨门槛时喜欢先迈左脚还是右脚呀,你喜欢与什么样的人打交道呀,你的性格特点都有什么呀,哪位朋友与你的观点不相同呀……
再进一步说,今后将要发生的事情,大数据还是有可能知道。例如,根据你“饮食多、运动少”等信息,它就能够推测出,你可能会“三高”。当你与许多人都在独立地购买感冒药时,大数据就知道:流感即将暴发了!其实,大数据已经成功地预测了包括世界杯比赛结果、股票的波动、物价趋势、用户行为、交通情况等。
当然,这里的“你”并非仅仅指“你个人”,包括但不限于,你的家庭,你的单位,你的民族,甚至你的国家等。至于这些你知道的、不知道的或今后才知道的隐私信息,将会把你塑造成什么,是英雄还是狗熊?这却难以预知。
2.数据挖掘就像“垃圾处理”
什么是大数据?形象地说,所谓大数据,就是由许多千奇百怪的数据,杂乱无章地堆积在一起。例如,你在网上说的话、发的微信、收发的电子邮件等,都是大数据的组成部分。在不知道的情况下被采集的众多信息,例如被马路摄像头获取的视频、手机定位系统留下的路线图、驾车的导航信号等被动信息,也都是大数据的组成部分。还有,各种传感器设备自动采集的有关温度、湿度、速度等万物信息,仍然是大数据的组成部分。总之,每个人、每种通信和控制类设备,无论它是软件还是硬件,其实都是大数据之源。
大数据利用了一种名叫“大数据挖掘”的技术,采用诸如神经网络、遗传算法、决策树、粗糙集、覆盖正例排斥反例、统计分析、模糊集等方法挖掘信息。大数据挖掘的过程,可以分为数据收集、数据集成、数据规约、数据清理、数据变换、挖掘分析、模式评估、知识表示等八大步骤。
不过,这些听起来高大上的大数据产业,几乎等同于垃圾处理和废品回收。
这并不是在开玩笑。废品收购和垃圾收集,可算作“数据收集”;将废品和垃圾送往集中处理场所,可算作“数据集成”;将废品和垃圾初步分类,可算作“数据规约”;将废品和垃圾适当清洁和整理,可算作“数据清理”;将破沙发拆成木、铁、布等原料,可算作“数据变换”;认真分析如何将这些原料卖个好价钱,可算作“数据分析”;不断总结经验,选择并固定上下游卖家和买家,可算作“模式评估”;最后,把这些技巧整理成口诀,可算作“知识表示”。
再看原料结构。大数据具有异构特性,就像垃圾一样千奇百怪。如果非要在垃圾和大数据之间找出本质差别的话,那就在于垃圾是有实体的,再利用的次数有限;而大数据是虚拟的,可以反复处理,反复利用。例如,大数据专家能将数据(废品)中挖掘出的旅客出行规律交给航空公司,将某群体的消费习惯卖给百货商店等。总之,大数据专家完全可以“一菜多吃”,反复利用,而且时间越久,价值越大。换句话说,大数据是很值钱的“垃圾”。
3.大数据挖掘永远没有尽头
大数据挖掘,虽然能从正面创造价值,但是也有其负面影响,即存在泄露隐私的风险。隐私是如何被泄露的呢?这其实很简单,我们先来分解一下“人肉搜索”是如何侵犯隐私的吧!
一大群网友,出于某种目的,利用自己的一切资源渠道,尽可能多地收集当事人或物的所有信息;然后,将这些信息按照自己的目的提炼成新信息,反馈到网上与别人分享。这就完成了第一次“人肉迭代”。
接着,大家又在第一次人肉迭代的基础上,互相取经,再接再厉,交叉重复进行信息的收集、加工、整理等工作,于是,便诞生了第二次“人肉迭代”。如此循环往复,经过多次不懈迭代后,当事人或物的画像就跃然纸上了。如果构成“满意画像”的素材确实已经证实,至少主体是事实,“人肉搜索”就成功了。
几乎可以断定,只要参与“人肉搜索”的网友足够多,时间足够长,大家的毅力足够强,那么任何人都可能无处遁形。
其实,所谓的大数据挖掘,在某种意义上说,就是由机器自动完成的特殊“人肉搜索”而已。只不过,这种搜索的目的,不再限于抹黑或颂扬某人,而是有更加广泛的目的,例如,为商品销售者寻找最佳买家、为某类数据寻找规律、为某些事物之间寻找关联等。总之,只要目的明确,那么,大数据挖掘就会有用武之地。
如果将“人肉搜索”与大数据挖掘相比,网友被电脑所替代;网友们收集的信息,被数据库中的海量异构数据所替代;网友寻找各种人物关联的技巧,被相应的智能算法替代;网友们相互借鉴、彼此启发的做法,被各种同步运算所替代。
各次迭代过程仍然照例进行,只不过机器的迭代次数更多,速度更快,每次迭代其实就是机器的一次“学习”过程。网友们的最终“满意画像”,被暂时的挖掘结果所替代。之所以说是暂时,那是因为对大数据挖掘来说,永远没有尽头,结果会越来越精准,智慧程度会越来越高,用户只需根据自己的标准,随时选择满意的结果就行了。
当然,除了相似性外,“人肉搜索”与“大数据挖掘”肯定也有许多重大的区别。例如,机器不会累,它们收集的数据会更多、更快,数据的渠道来源会更广泛。总之,网友的“人肉搜索”,最终将输给机器的“大数据挖掘”。
4.隐私保护与数据挖掘“危”“机”并存
必须承认,就当前的现实情况来说,大数据隐私挖掘的“杀伤力”,已经远远超过了大数据隐私保护的能力;换句话说,在大数据挖掘面前,当前人类有点不知所措。这确实是一种意外。自互联网诞生以后,在过去几十年,人们都不遗余力地将碎片信息永远留在网上。其中的每个碎片虽然都完全无害,可谁也不曾意识到,至少没有刻意去关注,当众多无害碎片融合起来,竟然后患无穷!
不过,大家也没必要过于担心。在人类历史上,类似的被动局面已经出现过不止一次了。从以往的经验来看,隐私保护与数据挖掘之间总是像“走马灯”一样轮换的——人类通过对隐私的“挖掘”,获得空前好处,产生了更多需要保护的“隐私”,于是,不得不再回过头来,认真研究如何保护这些隐私。当隐私积累得越来越多时,“挖掘”它们就会变得越来越有利可图,于是,新一轮的“挖掘”又开始了。历史地来看,人类在自身隐私保护方面,整体处于优势地位,在网络大数据挖掘之前,“隐私泄露”并不是一个突出的问题。
但是,现在人类需要面对一个棘手的问题——对过去遗留在网上的海量碎片信息,如何进行隐私保护呢?单靠技术,显然不行,甚至还会越“保护”,就越“泄露隐私”。
因此,必须多管齐下。例如从法律上,禁止以“人肉搜索”为目的的大数据挖掘行为;从管理角度,发现恶意的大数据搜索行为,对其进行必要的监督和管控。另外,在必要的时候,还需要重塑“隐私”概念,毕竟“隐私”本身就是一个与时间、地点、民族、文化等有关的约定俗成的概念。
对于个人的网络行为而言,在大数据时代,应该如何保护隐私呢?或者说,至少不要把过多包含个人隐私的碎片信息遗留在网上呢?答案只有两个字:匿名!只要做好匿名工作,就能在一定程度上,保护好隐私了。也就是说,在大数据技术出现之前,隐私就是把“私”藏起来,个人身份可公开,而大数据时代,隐私保护则是把“私”公开(实际上是没法不公开),而把个人身份隐藏起来,即匿名。
《光明日报》( 2023年01月12日 16版)
将数字文明融入新闻理论创新******
党的二十大报告强调,创新才能把握时代、引领时代。以“元技术”为基础的数字革命给人类社会传播格局带来巨大变化,数字化深刻影响着新闻业态和人类的新闻经验,对新闻学的发展提出了新的要求。面对新的时代特点和实践要求,如何建构中国自主新闻学知识体系,持续推进中国新闻学理论创新,是我国新闻传播学界面临的重大课题。
重新审视新闻学核心概念
新闻学科的基础应从媒介机构或职业新闻实践转变到整个人类的新闻传播活动,进入人的生活世界。当前,互联网生态下的新闻信息生产与传播是开放的,专业性新闻职业共同体的壁垒逐渐被打破,脆弱的新闻专业体系变得更加无足轻重,传统的内容生产企业对互联网内容平台公司具有依赖性。以往新闻学研究多集中于新闻业的内部运作,而忽视了它的外部联系和影响,研究的对象局限于新闻行业以及管理部门,为从业者和管理者提供实用知识。虽然也有学者开始从社会学和政治学的视角出发,将新闻看作社会的一个子系统,用场域、系统这样的概念来分析新闻,但这类研究并不多。
媒介技术变革不断挑战着传统新闻理论的解释框架,改变了传统的新闻生态结构。英国利兹大学教授安德森(Chris W. Anderson)认为,新闻生态的网络涵盖新闻生产机构、数字技术和新闻行动者等全部要素,且各要素之间的相互关系也是全新而复杂的。他提出“新闻生态”(news ecosystem)这一概念,强调新闻学研究的核心对象须由具体的“新闻机构”转向更为弥散的、网络化的“新闻生态”。李良荣认为,传统新闻媒体面临沦为“内容提供商”的风险,多生产主体、多媒介渠道、融合新闻产品共同重塑了新闻生产和传播生态。也有学者提出,新闻学研究出现了“生态转型”,不能再不假思索地以媒介组织为“容器”来理解新闻,而应该越过各种传统的边界,去探索那些原本不可预知的道路。在这一方面,研究者可借鉴行动者网络理论(ANT),打破新闻实践各个环节之间的界限,探索在数字网络中描述和解释新闻现象的新路径。
新的新闻传播生态呼吁研究者重新审视既有的新闻学概念,创新新闻理论体系。浙江大学文科资深教授黄旦提出,新闻学原来所坚信不疑的一些前提及其概念需要改造,将新闻学转变为一个经验性的学科。法国学者斯特劳斯(Claude Lévi-Strauss)认为,词语是人们自由改造、任意使用的工具,尽管它们清楚地表达了本身的含义。但正如华勒斯坦(Immanuel Wallerstein)所言,“旧理论的很多既狭隘又具误导性的假说依然深刻影响着我们的思维,而实际上本不该如此。这些曾经被认为是思想解放的假说,今天已经成为我们对社会进行有用的分析的核心理性障碍”。因此,建立新闻理论的新范式就必须反思我们的理性束缚。
从早期的传单、小册子到大众传播时代的报刊、通讯社、广播、电视,从互联网时代的网站、微博、微信等社交媒体到人工智能时代的社交机器人,媒介技术不断更迭,新闻活动的面貌与新闻产品的形态也发生了改变。传统新闻理论具有自洽的解释框架与基本范式,但受到新闻生态、业态和媒介技术发展的挑战,无法继续解释、分析和预测“弥散式”的新闻活动。因此,研究者不得不追问,传统新闻理论范式是在哪种媒介实践与媒介生态中形成的,是如何形成的,其用意是什么?这些理论受到哪些冲击,是否需要对其进行根本性的改造,或者只需局部调适?新的新闻传播生态和实践的主要变化是什么,用什么概念体系和理论框架才能更好地对其进行分析,并对新闻学的未来发展作出科学预测?
比如,新闻“真实性”概念内涵的变化。2019年2月,某公众号发布《寒门状元之死》一文,引发公众对该自媒体运用虚假内容的广泛批评。这表明在公众心中,“真实”是新闻信息传播的底线,对虚假消息不能容忍。但也有研究显示,人们往往倾向于扩散虚假消息,在社交媒体上,虚假消息传送到用户的速度要比真实消息更快。中国人民大学新闻学院教授杨保军谈道,新闻真实追求的基本目标不是建构真实、塑造真实、设置真实,而是“反映(性的)真实”“再现(性的)真实”,新闻真实应该回到事实真实这一基本要求上来。中国人民大学新闻学院教授陈力丹说,“新闻真实是可能的,但这种努力需要建立在对新闻真实这种现象的深刻理解之上”。那么,在数字新闻学中,“真实”概念是否还有其存在的空间?一方面,强调“新闻真实”是建立数字新闻学理论体系的重要组成部分,但如何理解数字新闻中的“真实”却并不容易回答。在数字时代,这种“真实”是特定场景下的真实,体现的是人的理解和认识的“真实”,这意味着公众对“新闻真实”的需求也是动态变化的。另一方面,面对社会事实类型的变化,“新闻真实”的内涵也须随之更新。研究者应深刻分析存在与意识的关系和认识论问题,这也就意味着以往的新闻学概念在经验层面受到严重挑战。
再如,如何回答新闻“客观性”与“情感”的问题。舒德森(Michael Schudson)认为,不再简单地信奉事实,转而信奉一整套规章制度,以应对连事实都成问题的世界,这就是“客观性”。其后,客观性就成为新闻领域的“不死之神”,在这一主导范式之下,“情感”被驱离于新闻领域核心准则之外。传统新闻理论认为,新闻业理应重视客观理性,鼓励业界以“冷静而非情感化”的风格进行事实报道。原因在于,若在新闻生产中引入情感因素,会使这种“非理性”内容妨碍新闻的专业性。但情感因素是新闻业的一部分,且虚拟现实、沉浸式等新闻类型在创造同理心、唤起共鸣等方面具有显著作用,这意味着数字平台、社交媒体与新闻业的结合将进一步促使整个新闻业呈现出“情感转向”。此外,技术可供性进一步增加了“情感转向”的速度,并使得“情感”开始以合法的身份“接合”了专业新闻理念。国内部分学者已经关注到了这一理论转向,但研究只是刚刚起步,还需进一步推进和深化。
近几年,在强调新闻专业主义的西方传统媒体中,出现了一种“新闻激进主义”的现象。有学者将“新闻激进主义”视为在非主流媒体、女权传媒、激进报章等中可以找到的新闻报道方式,包括以第一人称叙述且内容有引导性的报道。新闻学者正日趋关注激进报道如何影响主流传媒。也有学者认为,“新闻激进主义”之势非但不会逆转,更将引发范式的转移。那么,数字新闻学该如何回答“客观”与“情感”的关系问题,又将如何处理“事实与观点分离”原则在当下的表现,这些问题值得研究者反思。
立足“数字新闻生态”的问题域
梳理数字新闻实践的形态,反思互联网环境下新闻系统的流动性,关注网络化社会公众参与数字新闻实践以及媒体平台边界模糊等方面的变化。詹姆斯·凯瑞(James W. Carey)在《作为文化的传播》一书中提醒,在媒介问题上的理论空白,使我们在通往具体的研究之路上必然要走许多弯路。梅罗维茨(Joshua Meyrowitz)在《消失的地域:电子媒介对社会行为的影响》一书中也有类似的观点。许多对媒介影响的研究都忽略了对媒介自身的研究,由此带来的结果是,无论研究什么媒介的内容,如电视或者报纸、戏剧、电影、小说等,其方法都是一样的,媒介本身被当作了中性的传送系统。北京师范大学新闻传播学院教授喻国明探讨了未来媒介的进化逻辑,具体分析了从“场景时代”到“元宇宙”再到“心世界”的未来媒介演进逻辑,及其对于人的社会实践自由度的维度突破。
从新媒介、人与媒介关系的视角来理解数字新闻实践,即将媒介看成是人类的境况,从数字人文主义的视角分析媒介和新闻。彼得斯(John Durham Peters)在《奇云:媒介即存有》一书中将媒介实践和媒介制度视为嵌入自然界和人类世界关系之中的事物。武汉大学信息管理学院教授王晓光、南京大学艺术学院副教授陈静认为,新兴数字技术正在加速数字中国的构建进程,以数字媒介和人工智能为基础的新兴文化形态和知识生产体系正日见雏形,数字人文正在积极引领文化时空的数字化转换,并展现出广阔的发展前景。
数字新闻时代,在沟通的“讯息、告知和理解”三个环节中,受众通过不同的媒介进行沟通,实际上充满着诸多不确定性或选择的可能性。有学者认为,无论是期望通过沟通交往形成“共同体”,还是批判现代社会公共领域的萎缩,都不过是“一种怀旧情绪的自然流露”,是用旧的知识来理解新的世界。在政治社会学理论中,现代社会之前的社会被看成是一个由各部分构成的统一整体。相反,在一个急剧分化的社会中,使个人感到难以负担的是其缺乏社会同意的模式,而将各种角色整合为统一的生活。在传统新闻理论范式中,公众寄望于通过对话与协商而走向公共空间。那么,在数字新闻生态系统中,公众参与传播实践的方式发生了哪些变化,值得研究者反思。
从网络化关系出发,聚焦学术研究、业界实践和新闻教育体系改革等方面,建立数字新闻学新生态、新语境。在传统的新闻学研究中,存在着工具性思路——一种基于媒体技术演进的线性思考的研究框架:口头传播、书写传播、印刷传播、电子传播,现在又增加了网络/数字传播,用“媒体融合”或者“全媒体”来建构“新闻学”。这表明当前新闻学研究的学术想象力不足。相反,新闻业界要比新闻学界更具有探索精神。如《纽约时报》在2014年的“创新报告”中提到,要基于新媒体环境的变化,调整编辑部职能,创建受众拓展职位,并着手组建数据分析团队,创建战略分析团队,鼓励跨部门合作,零距离贴近受众,优先聘用数字人才,助力“数字优先”战略。这份报告对于国内媒体了解传统媒体如何更好地融合纸媒的传统业务和数字业务,顺利实现数字化转型,具有一定的参考价值。这些数字方面的创新和人才职位的想象,现有的教学思维和内容并不能完全涵盖,也不能仅靠增加“网络传播”或“新媒体传播”之类的议题来实现新闻理论的创新。高校应从网络化关系出发,彻底打破现有的专业划分,创新高素质应用型人才培养模式,满足数字时代对全媒体人才的需求。此外,对于新闻的内涵与本质,研究者也需要有全新的思考。与之相应,对现有的教学方案、教学方式、课程体系等,也应做出符合中国新闻实践需求的发展。
重塑媒介变迁中人民的主体性
树立新闻学以人民为中心的导向,回答好新闻是“为了谁”“服务谁”的问题。媒介变迁所带来的交往活动和交往结构的改变在不断重塑着人民的主体性,赋予主体新的内涵。研究者须反思新闻学研究应建构一种什么样的新闻环境,需要一种什么样的新闻品质,呼唤一种什么样的公共参与,以及建构一种什么样的公共生活等问题。新闻的人民性是马克思主义新闻观的核心理念。中国人民大学新闻学院教授郑保卫认为,构建中国特色社会主义新闻学,应坚持以马克思主义为指导,坚持以人民为中心的研究导向,坚持体现继承性和民族性、原创性和时代性、系统性和专业性,坚持党的领导。
技术日益成为人们认识世界、感知世界的本质性要素。数据与算法使人们的知识生产方式和生活状态发生了改变,人与技术的关系发生深刻变化。比如,算法运用于新闻传播活动中,涉及人民的主体性存在的意义、算法带来新的传播关系以及对公共传播秩序的影响、工具理性与交往理性的关系等问题。一方面,信息传播技术发生变化,数字传播环境对公共政治生活产生影响。另一方面,新闻传播领域已经出现了结构性的变化,如媒介形态、传播主体等。无论媒介如何改变,其物质性有何不同,信息与物(口语手势、风水火土、文字书写、大众媒介等)都是围绕“人类境况”而展开的。媒介无非是交往网络中的一环,而塑造人类历史的,正是这些信息与物的交换与传播。那么,从媒介视角出发,从人们的交往网络和实践入手,探讨如何构建符合人民群众需要的中国特色新闻学理论,应成为研究者关注的问题。
构建中国特色的新闻学理论
党的二十大报告强调,要提炼展示中华文明的精神标识和文化精髓,加快构建中国话语和中国叙事体系。信息技术拓展了人类生活的空间,也丰富了人类文明的内涵。只有从数字文明的角度出发,努力构建能够体现中国新闻学知识生产自主性、引领全球新闻研究的新闻学理论新体系,才能提升中国新闻学话语的国际影响力。传统新闻学存在多种不同范式(或者说是准范式)。早前有学者总结了“四大报刊”理论,麦奎尔(Denis McQuail)在这一基础上扩展到了“六大理论”范式,但这些理论范式都是基于西方的新闻实践和价值立场总结出来的,因此存在着“概念和术语多有不周严之处”。清华大学新闻与传播学院教授陈昌凤认为中国特色新闻学有学科的基本架构,是一个体系。黄旦谈道,如果说学术体系的建构是一个研究范式问题的话,那么新闻传播学科应该从媒介这个视角介入进去,要重新进行概念化,改变工具论思维。作为媒介来讲,这是一种开放的、重新建立关系的过程。也有学者从学术研究的方法论视角出发,总结出了“规范性”“实证主义”“社会学”和“全球比较”四大范式,并认为“数字新闻学”有可能成为第五大新闻理论范式。虽然这一划分存在标准不统一的问题,但视野更为开阔,具有一定参考价值。
新闻理论创新应站在数字文明转型的角度,即从文明的视角出发,特别是中华文明新形态的角度,分析数字新闻实践在当下存在的价值与意义。这与已有研究主要立足于技术变迁的角度来分析是有差异的。文明是历史沉淀下来的,被绝大多数人认可和接受的发明创造、人文精神以及公序良俗的总和。这些集合至少包括以下要素:语言、文字、工具、道德、信仰、宗教、法律、家族、城邦和国家。中国社会科学院新闻与传播研究所所长胡正荣认为,演化的媒介在人类文明交流互鉴中扮演了重要角色,数字时代的人类命运共同体应以多样、平等、开放和包容为原则,通过构建全媒体传播体系,努力提升联结性、对话性、共享性和智能性,从而实现文明对话与文明互鉴。也有学者认为,数字文明在更优越的模式基础上,将形成新的法则、新的语言、新的公序良俗甚至新的文化和信仰。数据的新力量,就如同农耕之于古代文明、工业革命之于现代文明,将催生一种全新的文明形态。
中国新媒体技术发展处于全球优势地位(如5G、人工智能等领域都居于世界领先水平),社交媒体生态多样,平台丰富,行动者活跃程度高,数字媒体用户广泛参与新闻实践,创造了新的传播方式,如微信公众号、短视频、网络直播等。中国的新闻治理也有很多新探索,如大规模推广“中央厨房”,建立数据监控中心,培养网络评论员队伍,将融媒体中心与社会治理结合等,这些都为研究者建立新的新闻理论范式提供了宝贵的资源和实践经验。应加快中国新闻学话语体系建设,聚焦新闻传播实践中遇到的新问题,推进新闻理论创新,建立能够引领全球新闻学范式革命的理论体系,提升中国新闻学话语的国际影响力,推动中华文化更好地走向世界。
(本文系国家社科基金重大攻关项目“互联网环境下的新闻理论范式创新研究”(21&ZD318)阶段性成果)
(作者 浙江大学公共外交与战略传播研究中心 吴飞)
(文图:赵筱尘 巫邓炎)