064“文本分析”的操作方法

一、“文本分析”作为一种研究方法
“文本分析”是从不同理论视角和学科背景来分析法律、法规和规章以及政府公文的多种文本分析方法的集合。它既包括传统意义上偏于定量的内容分析,也包含对政策文本中官方语言偏于定性的话语分析。
作为一种跨学科的研究方法,政策文本分析的深层内涵在于:对文本的分析,最终要走出文本。走出文本的过程也就是从具体中抽象概括出一般的过程,是对文本的微观分析与文本所处的历史脉络的宏大叙事相结合的过程。同时,“走出文本”也是文本读者运用多种“解读”文本的方法和视角,通过文本与文本生产所处的历史脉络对话,以发掘文本“深层结构”的过程。也可以理解为,透过文本显性话语来考察政策话语运作本质,以此来揭示政策过程中的价值分配和斗争的过程,是文本理论化的过程。[1]
文本分析尤其是对官方文件的分析,在社会科学的研究中具有独特的地位。其中教育政策文本分析是理解教育政策的基本手段,也是促进我国教育政策研究发展的重要途径。
二、“文本分析”对于研究对象的筛选
下面以“改革开放以来高校招生自主权的国家政策”为例,展示文本分析对象的选取,以及操作中需要遵循的筛选原则。
(一)“全面性”筛选
在第一轮选取中,按照年度顺序对政策标题进行判断,标题涉及高校招生自主权政策的,即做保留。如标题有“高等学校招生”、“教育体制改革”、“自主选拔录取”、“招收”等字眼的文献都暂作保留,保证文件的全面不遗漏。
(二)“代表性” 筛选
为了保证所选取的研究对象是关于高校招生自主权政策的代表性文件,对上一轮挑选出的政策文本进行内容查阅,即第二轮的选取。政策内容不属于高校招生自主权政策的文献,即删除。在内容查阅时,主要选取的研究对象群体是本科阶段的高校招生自主权政策,对本科阶段之前的初高中阶段和之后的研究生、承认教育阶段的虽符合招生自主权但不符合本科的政策文件予以删除。除了限定对象群体外,依据政策文本的上下文语境,判断是否属于本科阶段的高校招生自主权政策,如《关于做好2009年现代远程教育试点高校网络高等学历教育招生工作的通知》,内容虽与招生相关,但全文并未涉及高校的招生自主权,故不纳入研究对象的范围。
(三)“权威性”筛选
在第三轮筛选中,主要是通过专门网站和书籍对文本进行核查与补充。教育部“文献”栏有2000-2019年的《教育部公报》,每个年份有1-12号公报,在每一号公报里有专门关于“高等教育”板块,在这一板块查找,此外还有“教育文献”和“政策法规”导航按钮,利用网站的检索功能,对高校招生自主权政策进行检索和检验。为了进一步确保选取对象的权威性和准确性,在中国法律法规数据库,利用概念界定中涉及到的高校招生自主权政策具体名称进行关键词检索,同时借助政策汇编,如何东昌《中华人民共和国重要教育文献》、杨学为《高考文献》、李均《中国高等教育政策史》等文献辅助。
(四)“相关性”筛选
在对政策的多轮筛选中,有些文本虽然不是与高校招生自主权政策直接相关的,但对高校招生自主权政策会产生重要影响的要予以保留,如《中华人民共和国高等教育法》、《中共中央关于教育体制改革的决定》等。
(五)“重点性”筛选
对于部分还有附录的文本要突出重点性原则,只保留实质性的内容,如办法、其他说明和细则进行保留,对于汇总表等无实质意义的附录直接剔除。对于无实质内容的政策文本,在政策数量统计和分析政策制定主体、目标群体时予以保留,在分析内容主题和价值取向时不予考虑。
三、“文本分析”的过程及信效度
搜集好需要研究的文献之后,借助对有关文本资料的分析展开研究,属于文本分析法。一般来说,对文本的分析,编码十分重要,它依据研究问题和框架的需要,将大量杂乱无序、分类模糊的资料通过层层分类,最后整合成条理清晰、分类明确的主题、概念或类型等。可以借助计算机word和excel的辅助编码,运用文本分析对政策文件实施编码操作,对编码后的结果进行计量统计分析,以客观的解释政策变迁。还可以对于部分已编码内容进行关键词的抓取和词频的分析,借助词云分析工具、citespace等,将相关数据导入excel中,绘制图形。比如,在本例中,可以将搜集到的所有政策文件按照时间顺序进行编号与命名。在正式对政策文本编码时,先在word里将文本内容转换成表格里有序号的条款,逐一对每一条款进行查看和分析归类。当然,文本分析是为研究目标服务的,如何针对文本开展分析,并运用分析结果来解释现象和本质,取决于研究者的研究需要。
文本分析必须保证研究的信效度。由于编码结果受编码员主观价值取向的影响较大,不同的编码者对同一份文本编码的结果可能存在较大偏差。所以,文本编码时,多个编码员独立编码的结果一致性越高,文本分析的可信度也越高。比如,在前例中,可以从众多政策文件中随机挑选3个政策文本,在word里将文本内容转换成表格进行梳理。然后邀请2名同专业的同学担任编码员,加上笔者共3人(依次为编码员1、2、3),分别对政策文本进行编码操作。为了保证研究的准确性和科学性,除了编码开始前的“文本编码指导”外,研究采取背靠背、全程零交流方式进行编码,最后运用霍斯提(Holsti)公式计算编码者间的信度(90%以上表示信度较高)。
[1]涂端午.教育政策文本分析及其应用[J].复旦教育论坛,2009,7(05):22-27.
