来源:人民日报-人民日报。
随着信息技术的快速发展,新的信息分析技术被应用于政治学研究。很多政治学研究者利用大数据的爬行、文本分析等成熟技术获取新的研究资料并进行分析。同时,数十亿单位的大数据有其自身的政治研究价值。可以说,大数据为政治学带来了研究方法的创新,进一步拓展了政治学的研究领域。
基于大数据的网络舆情研究。网上有很多现成的数据,可以用来研究网上的舆论和政府部门的反应。一些政治学研究者经常使用两类在线大数据作为分析材料:一类是政府在线政治平台上的公开消息和相关部门的回复信息,另一类是网民在微博、微信等主流媒体网站和社交媒体平台上的发帖信息。这些数据可以通过数据抓取技术直接获取。第一类数据经过分析处理后,可以反映群众关心的话题分布情况、政府相关部门回应的特点以及问题解决的程度。还可以进一步分析具体群体在什么时间提出什么类型的需求。第二类数据主要用于分析网民对特定事件的看法和态度。微博等社交媒体的数据分析不仅关注特定话题,还将话题分析与情绪、偏好等因素相结合,展现了网络舆论对特定事件态度的演变以及影响网络舆论变化的具体因素。可以说,网络大数据的应用极大地丰富了政治学对网络舆情的研究方法。
分析文本转换后的大数据。网络大数据之后,研究者试图挖掘其他未准备好的、更独特的大数据信息。这样的信息主要有两种,一种是从开放平台获取的大数据文本。这类数据是通过数据爬行技术获得的,但发布这些数据的平台并不为人所知,需要研究人员进行搜索。目前,政治学研究者比较关注并取得研究进展的大数据主要包括:从裁判文书网获取的司法大数据、从NPC代表建议数据库和CPPCC委员建议数据库获取的文本大数据等。随着政府信息公开的增多,这类可供研究的信息资源将越来越丰富。另一类数据只有经过文本转换后才能使用,比如研究历史数据。相当多的历史数据是以图片而不是文本的形式存在的,这就需要通过识别技术将图片信息转化为文本,然后进行大数据分析。这样的数据很难获得,但一旦数据库形成,对政治学研究会有很大的帮助。
大数据为政治学提供了新的研究材料和分析技术,但并没有改变政治学研究的本质。面对层出不穷的新材料、新工具,政治学研究者需要保持清醒的头脑,不要陷入对数据和方法的盲目追求。同时,要结合政治学研究特点,充分发挥大数据技术优势,推动信息技术在政治学研究中的应用取得更多突破。首先是开发更加多样化的大数据类型。目前,政治学的研究和分析大多是以文本形式出现的大数据。文字只是浩瀚信息世界的一种,还有很多图片、音频、视频等信息类型有待开发利用。其中一些类型的大数据已经在商业领域得到应用,研究人员可以考虑以适当的方式将其应用于政治学研究。二是探索更前沿的大数据分析技术。现有的分析技术离不开人工标注,需要政治学研究者提取大数据的一小部分,人工读取并标注这部分数据,然后利用机器学习的方法,让计算机基于人工标注的数据对剩余的大量数据进行分析,并尝试得出相应的结论。由于人工标注的数量不一,分析结果也不均匀。在文本挖掘中,有必要进一步开发更先进的技术。三是实现更复杂的大数据分析目标。现有的大数据分析主要描述数据中体现的政治现象,尚未具备解释政治现象、发现运行规律、做出预测的功能,需要进一步的技术支撑和研究突破。从这个角度来看,大数据的开发利用在政治学研究领域有着更广阔的发展前景。
(作者系中山大学政治与公共事务管理学院教授)
003010(2021年10月25日09版)。
内容来源网络,如有侵权,联系删除,本文地址:https://www.230890.com/zhan/46909.html