文章快速检索     高级检索
  科学与社会  2025, Vol. 15 Issue (1): 115-132  
0

引用本文 

朱逸, 阙明坤. 人机合作:探索生成式AI在质性研究中的应用图景[J]. 科学与社会, 2025, 15(1): 115-132.
ZHU Yi, QUE Ming-kun. “Human-Machine”Collaboration: Exploring the application landscape of generative AIinqualitative research[J]. Science and Society, 2025, 15(1): 115-132. DOI: 10.19524/j.cnki.10-1009/g3.2025.01.115.

作者简介

朱逸,上海杉达学院教授,复旦大学网络空间国际治理研究基地特聘研究员。研究方向为社会研究方法、STS研究;
阙明坤,浙江大学国家高端智库教育学院分中心执行主任。研究方向为教育政策

通信作者

阙明坤,邮箱地址:quemingkun@zju.edu.cn

项目资助

国家社科基金一般项目“增权理论视角下互联网‘零工群体’劳动权益保障研究”(23BSH057)。

人机合作:探索生成式AI在质性研究中的应用图景
朱逸1,2, 阙明坤3     
1. 上海杉达学院;
2. 复旦大学网络空间国际治理研究基地;
3. 浙江大学国家高端智库教育学院
摘要: 生成式AI介入质性研究日益增多。学界就人工与机器在质性研究中的实践状况进行了诸多比对研究,发现生成式AI对于质性研究有积极的作用。本文选取中文环境下的家庭教育访谈文本作为文本基础,运用本土生成式AI,比对在质性研究(扎根理论、主题分析)中人工与机器的分析质量。研究采取人工与机器对同一文本进行编码,邀请专家匿名评价与检验两者的分析质量,发现:生成式AI对人类研究者起着十分重要的辅助与支持作用;人工与机器在质性数据的编码上有相近表现,但在扎根理论、主题分析两类不同的质性方法中呈现出差异化的分析质量。研究进一步探究出现这一现象的原因,提出未来“生成式AI+质性研究”需要加强人机合作与协同、多模态数据智能分析、质性研究全流程介入等。
关键词: 生成式AI    人工智能    人机合作    质性研究    分析质量    
中图分类号: TP391.4           文献标识码: A
DOI: 10.19524/j.cnki.10-1009/g3.2025.01.115
一、质性研究领域中的人工智能

2022年11月,美国人工智能研究公司OpenAI发布了一款名为GPT-3.5的聊天机器人,引发了公众对大型语言模型(Large Language Model,LLM)在私人和专业领域应用的广泛讨论。生成式AI(以下简称“Gen AI”)是基于大语言模型的具体应用。近年来,国内诸多Gen AI陆续出现并向公众与社会开放,如Deepseek、Kimi、豆包、文心一言、智谱清言、讯飞星火、通义千文等。这些Gen AI可对文本数据进行快速处理、分析、计算与总结,并生成具有建设性的观点[1]。如此众多的Gen AI,对于推动质性研究及其方法的变革,有巨大的潜力。Gen AI工具所带来的影响重大且深远,犹如当年互联网刚刚崛起时带来的冲击[2]

迄今为止,人工智能经历了两个重要阶段,一是以专家系统为标志的“人类知识层次”的人工智能阶段;二是以大语言模型为最新标志的“信息编码层次”人工智能阶段[3]。第一阶段的“人类知识层次”的人工智能,体现为对现有人类知识的汇总与搜索机制,只是呈现出数据处理速度和搜索的优势,未从根本上触及大数据、深度算法,没有完全释放人工智能不同于人类智能的特性[4]。同时,它也割离了本身作为感受性关系过程的信息根基,无法处理常识问题的感性层次[5]。“人类知识层次”的人工智能极大提升了效率,对于量化研究有着重要的助推作用,为数据的搜集、处理、分析提供了诸多深度挖掘的机会。但是,该阶段的人工智能未能对质性研究提供实质性的帮助,原因在于质性研究需要的是对文本资料的理解与诠释,而非仅仅效率上的提升[6]。对文本资料的理解与诠释涉及到对知识、数据、信息及其相互关系理解的系统性深化。质性研究的前提是对信息的深刻理解与解读能力。由于人类知识层次的人工智能在此方面的缺陷与不足,致使人工智能虽快速发展多年,但始终难以触及质性研究领域。

人工智能的第二阶段是“信息编码层次”的人工智能。该阶段以大语言模型为典型代表,强调以数据为基础,凭借机器学习、自然语言等算法,从作为信息编码的观念体系转向作为信息编码本身的数据,为研究提供全新的信息编码条件,为理解与诠释质性文本资料提供可能[7]。“信息编码层次”的人工智能通过集合人类数字足迹的大数据,推动人类语境发展到了一个更深层次,深及自然语言语境的“人与机器”融合与进化[8]。源于此,近两年Gen AI迅速闯入质性研究领域,开始在质性研究广泛探索,目前已有一定的研究积累与模式基础,并不断变革与延伸。

在质性研究实施过程中,“信息编码层次”的人工智能到底发挥怎样的作用?相比于人类研究者所实施的质性研究,有什么差异?Gen AI在质性研究中有怎样的实践范围与图景?不同学者从观点促进[9]、数据管理[10]、内容总结[11]、提供额外解释[12]等角度,积极支持质性研究[13]。2023年初,有研究对《自然》(Nature)杂志读者进行了一项调查。结果显示,大多数参与者已经将ChatGPT或类似的Gen AI用于各种专业研究之中,包括使用不同的量化方法与质性方法[14]。为顺应Gen AI分析质性数据的需要,专注于质性分析软件的Nvivo、ATLAS.ti、MAXQDA等均接入了ChatGPT。ATLAS.ti的AI方法依赖于自动编码,直接提出了“不要担心无休止的手动编码”和“将您的整体数据分析时间减少多达90%”[15]的口号,而不是用户的数据查询。MAXQDA采用了一种独特的方法来实现AI分析,手动编码完成后,用户可以将GenAI应用于任何文本数据与代码,并获得与该代码对应的精准总结[16]

学界还持续探讨Gen AI工具对质性研究的影响。本文拟借助我国本土Gen AI,比较在质性研究中人与机器的分析质量的差异,挖掘Gen AI在质性数据分析中的优势与劣势,展望“GenAI+质性研究”的未来实践图景与趋向。

二、相关研究的回顾 1. Gen AI应用于质性研究的实证案例

大语言模型借助深度学习的序列模型,包括自然语言处理(NLP)、循环神经网络(RNN)、长短期记忆网络(LSTM)、Transformer模型等,增强了机器对数据资料的深度理解与诠释能力,与质性数据分析的要求高度契合[17],与传统机器学习中各类监督算法的训练逻辑则有很大不同。有关Gen AI在质性研究中的实践,例如类别编码、扎根理论、内容分析、主题分析、现象学等,已形成相关的研究案例[18],包括探索性数据分析、可视化处理、文本编码等[19],覆盖的学科涉及医疗保健、金融研究、营销研究以及教育学、社会学、管理学、文学等[20]

Gen AI在质性研究中的应用,以实证案例、示范案例、实验案例三类为主。Jonas Wachinger借助ChatGPT对一份58分钟访谈转录文件进行文本编码分析,同时招募了几位研究者进行人工编码,比较人工与机器的编码一致性。研究显示,ChatGPT所生成的编码结果与研究人员编码结果有高度相似性,但Gen AI的编码结果仅停留在描述性层面,未能实现对文本数据的深层次阐释[21]。这与之前Morgan、Ray的研究结果相似,即在质性数据分析中,ChatGPT的创造描述性主题表现较好,但解释能力或创造力依然不足[22-23]

De Paoli采用主题分析方法,研究游戏玩家访谈、教学课程访谈两份质性数据,比对人工与Gen AI在主题提炼和描述方面的一致性。研究发现,ChatGPT(GPT3.5-Turbo)能够较好形成初阶的主题概念,这一点与人工编码相似,但是在对初阶主题进行二次聚合与合成时,与人工编码呈现出差异。在传统质性研究中,对于文本的编码往往需要历经多次概念聚合,最终形成核心主题,机器在多轮的概念聚合过程中逐渐表现出编码能力的不足[24]。Gao Jie等人则从协作定性分析出发,针对16份访谈文本设定人工与Gen AI的合作编码(CollabCoder)工作流,将Gen AI集成到关键的定性分析 阶段,评估开放性编码实施、编码迭代、最终编码本建立。结果发现,Gen AI(ChatGPT)虽然可减轻编码过程中的人工负担,生成的编码与总结也较为详细,但会出现与主题不相关的情况,特别是在引导Gen AI进行质性分析的指示语中,如果缺乏细致且明确的要求,其结果难以模仿人工对文本进行细致理解与编码。不同的指示语对质性数据分析的结果会呈现差异,结果输出的稳定性受到指示语的较大影响[25]

Blaž Mesec等则采用扎根理论方法,运用Gen AI进行质性数据分析。研究发现,相较于人工编码,ChatGPT能够总结和平衡对立的想法,但更倾向于使用抽象程度较低的描述性术语来表达想法,且部分编码无法描述文本内容或存在术语使用不当的问题[26]。Tabone W等从质性数据分析的总结与摘要能力,考察人工与机器的一致性系数。最终发现,两者之间的一致性达到了95%[27]。国外有关Gen AI在质性研究中的应用及效果评估已较为丰富,除了以上实证研究案例外,Will Schiavone研究了ChatGPT对于用户评论的分类[28],Xiao Z等基于预先代码本采用ChatGPT编码测试与比较文本[29],Zachary Taylor等运用ChatGPT对访谈文本进行语音转录与编码[30]等。

2. 现有研究的特征及突破

过往实证研究案例呈现出以下特征:第一,人工与机器在质性研究中的分析质量相近,诸多案例表明Gen AI工具在质性分析中,包括总结、编码、观点等方面,体现出与人类研究者相似的能力,但仅限于初阶编码阶段,在深度阐释能力方面依然有所不足。第二,研究多以国外ChatGPT的运用分析为主,未触及国内大语言模型的运用,且以英文文本为分析材料,对中文文本的分析质量评估未被检验与证实。第三,研究仅限于对编码结果的一致性比较,未考虑其在不同质性方法上的运用差异;在各类案例研究中,仅考察了Gen AI对文本的编码能力,较少触及类似扎根理论、主题分析等不同质性研究方法的效果评估,未辨析不同质性方法间的工具运用差异。第四,以国外研究案例为主,来源于美国、英国、加拿大、荷兰、新家坡等国家,但国内研究较为缺乏,未引起广泛探讨。第五,各类研究案例仅考虑人工与机器的差异性,对质量的考虑不足;诸多研究仅考察了人工与机器在编码方面的差异性,但对于编码内容的规范性、合理性、有效性未能触及,限于研究者的个人评定。

鉴于过往研究现状,本项研究重点尝试以下几方面突破:第一,引入国内本土的Gen AI,以检验与考察Gen AI在质性研究中的作用状况,藩篱于仅对国外Gen AI的使用。第二,采用中文文本数据,评估Gen AI在中文语境下对质性研究的分析质量,比较分析国外英文环境下的研究发现。第三,选择质性研究中的扎根理论、主题分析两类方法,辨析Gen AI对不同质性方法间的功能发挥,以完善过往研究中对不同方法间效果比较的不足。第四,跳出局限于人工与机器编码结果一致性的单一维度比较,引入对编码结果在规范性、合理性、有效性方面的质量评价。本项研究旨在通过以上几方面的探索,丰富我国在“Gen AI+质性研究”主题领域的研究,为我国本土Gen AI在质性研究中的介入与运用,提供符合我国实际的实践路径与参考。

三、研究的设计

本项研究以教育研究案例为基础,采用人类研究者与Gen AI共同参与的方式,评估质性研究的分析质量。

1. 研究的整体设计

第一阶段,准备质性数据。搜索与遴选可供分析的访谈文本,聚焦“家庭教育”主题的质性访谈,获取相关的访谈文本,以此作为质性分析基础。第二阶段,分析人工与机器的质性数据。针对于质性数据,实施人工与机器各自的独立编码,分别运用扎根理论、主题分析两类质性方法输出相关结果。第三阶段,评估分析结果的质量。引入质性方法专家对人工与机器的编码结果进行评估,考察人工与机器的编码一致性以及编码结果质量。第四阶段,探讨“Gen AI+质性研究”的应用图景。对参与质量评估的专家召开线上聚焦会议,结合人工与机器的质性分析结果,聚焦 “Gen AI+质性研究”主题的实践领域与范围进行探讨,包括适应领域、操作要点、工具选择等诸多方面,从而勾画清晰未来Gen AI在质性研究中的应用及实践图景。

2. 质性数据的选定

本研究的质性文本数据以“家庭教育”为主题。访谈文本数据来源于3位家长、1位中学生。访谈内容包括子女婚姻、学习、社交、习俗等。4份访谈文本数据作为此项研究的案例数据,用于后续人工与机器的质性数据分析。由于本项研究主要考察人工、机器在编码能力方面的表现,不涉及对文本内容本身的研究,因此样本量仅采用了4份访谈资料,以作为示范性文本数据进行分析。相关访谈资料合计约3万字。

3. GenAI的选择与使用

为检验我国本土Gen AI在质性研究中的作用状况,本次测试选用国内自主研发的Gen AI。当前,以开源方式可供用户直接使用的Gen AI有Deepseek、通义千问、智谱清言、讯飞星火、Kimi、豆包、文心一言等。根据GenAI的通用性、用户评价、可接入性、稳定性等方面的条件,最终选择了Kimi、智谱清言两个Gen AI。Kimi有着较为广泛的使用与适用,在使用界面、输出结果、呈现形式、分析颗粒度等方面均符合研究的要求。智谱清言有着较多的用户推荐和较好的用户评价,且内设“数据分析”专项分析模块,体现出在数据分析方面的专业性。

4. 参与人员的安排与流程

参与此次研究的人员主要分为两类。其一,在质性数据的分析阶段,为了评估人工与大语言模型AI工具的质性分析效果,专门要邀请有丰富质性研究经验的专家参与文本编码与分析。2位高校教师采用“背靠背”的编码方法,参与对4份文本的分析,以此确保整个质性分析过程的独立性。2位教师的职称分别为正教授、副教授,长期专注于教育研究领域,擅长使用质性研究方法,在核心期刊发表多篇质性方法的教育学研究论文,主持了多个采用质性方法的研究课题,对于扎根理论(三类流派)、主题分析方法均有丰富的实践经验。鉴于此,可充分保障教师对于质性编码及相关方法的熟练掌握,以此确保最终编码的质量,可有效用于与机器编码结果间的比较。其二,在分析结果的质量评估阶段,由于质性研究具有较强的主观构建性,为避免参与分析的教师对于分析结果的主观臆断,另外邀请10位参与者对人工与机器的质性分析结果进行评价,包括人工与机器编码的一致性评价,以及对编码结果规范性、合理性、有效性三方面的质量评价。在这10位研究者中有5位高校教师、5位博士研究生。10位参与者均具备较好的质性研究、分析基础,独立开展过质性研究项目,且发表有高质量的质性方法类文章。不同身份的参与者构成,确保了评估的客观性、多元性。整个评价流程设置为:针对于机器编码结果与人工编码结果进行匿名化处理,分别寄送10位参与者进行评分(分值为0—10分),之后对于返回结果进行统计,分别计算人工与机器编码结果各自的平均分,以此作为编码结果的质量评分,比对人工与机器编码的一致性。在完成质量评估之后,针对于评分中的关键发现,再次邀请该10位参与者召开线上聚焦会议,针对“Gen AI+质性研究”主题探讨其可能的实践领域与策略。

四、研究过程 1. 基于扎根理论的实测

在质性研究方法中,扎根理论有较为广泛的运用。扎根理论有三类传统,即经典扎根理论、程序化扎根理论、建构扎根理论[31]。为便于比对测试,本项研究采用较为常见的程序性扎根理论,分为开放性编码、主轴编码、选择性编码三个阶段[32]。此次测试分三个阶段展开,分别比较人工与机器在扎根理论上的表现。

第一阶段,对于访谈文本进行初步阅读与理解。我们拟定所需研究的主题,结合文本数据内容,设定研究主题为“家庭教育的核心要点”,从而开展相关研究。访谈的原始内容如下(部分节选):

问:平时上学期间和父母交流多吗?

答:还是挺多的。

问:小学住校,初中走读?

答:小学走读,初中住校。

问:您觉得现在的小孩子应该去外面闯荡还是在家乡发展?

答:现在的孩子不一定都希望到外面发展,因为现在我们村旅游业发展的很好,他们就觉得,我在外面读书干嘛?我还不如回来划船、跳舞,一晚上可以挣好多钱。现在的孩子好多都有这种心态,读到高中就回来,帮家里经营酒店。或者像我一样,每天划船、跑车(拉客人环湖)。包车三百块一趟,一天可以跑两趟。这样的经济收益可能会让他们更愿意留在家里。但是我们会跟他们讲,旅游业不是长久的,某一天就会断掉。

问:现在的家长会给小孩子讲传说、故事吗?

答:以前,在我小的时候,不听话的时候,妈妈就会讲故事给我听。现在,我儿子长大一些,懂事的时候,如果他不听话,哭啊闹啊的时候,我也会讲故事给他听。

……

第二阶段,人工与机器分别操作三阶段编码。我们划分人工与机器两类观测组别。人工组的2位高校教师依照程序化扎根理论步骤对文本进行分析,在“背靠背”编码后综合两者的分析,以此作为最终分析结果。机器组则借助Gen AI,在Kimi、智谱清言平台上分别上传4份访谈文本,输入分析指示语为:“依照扎根理论方法,探讨‘家庭教育的关键要点’,研究主题为三个阶段开放性编码、轴心编码、选择性编码,请依照这三个步骤,对文本进行分析,最终输出分析结果”。

第三阶段,质性分析结果的质量评估。人工与机器的最终分析结果见表1

表 1 人工与机器的质性分析结果(扎根理论)

从分析结果来看,人工与机器均较好实施了三阶段编码操作,在各阶段均有相关的编码结果输出。10位参与者对一致性、质量状况的评估发现:

(1)编码一致性方面

人工与机器的编码结果并没有显示出国外诸多研究所呈现高一致性特征,人工与机器在各阶段的编码虽有一定的重合,但代码的重合度并不高。主要原因在于:第一,人工编码过程依照于理论构建的概念提炼逻辑,而机器更多运用高频词的计算思维,两者之间存在分析逻辑上的差异;第二,国外Gen AI 的编码,遵循的是对英文单词的分词策略,单词之间较易形成一致性,而对中文本身的分词有着较高的复杂性,对于单词、词组的选定具开放性,较难形成统一的设定,从而造成了国内外研究在此方面有不同的结论。但这类不一致性却能赋予人工编码有益的补充与辅助机会,例如经济收益、亲子关系、政策影响等角度,均是人工编码时所未触及的。Gen AI则给出了额外的提示,值得被进一步思考与纳入。

(2)理论模型构建能力方面

扎根理论很重要的一点在于理论或模型的构建。从编码结果来看,人工所实施的开放性编码、轴心编码,可较好服务于后续的理论或模型搭建。但从机器编码的结果来看,观念间缺乏逻辑关联性,显得较为碎片化,不利于整体理论或模型的最终搭建。由此可见,在逐级编码过程中,人工编码具备较强的纵向、体系化思维,上下文的关联可有所贯通;而机器在逐级编码过程中,更多是“节点”思维,而不易形成贯穿全程、上下文的系统性思考。国外研究中经常会提到机器编码在质性分析中对概念诠释能力的不足。此次研究则是我们更加深入理解概念诠释力不足问题,即机器编码在逐步编码过程中,单阶段的概念诠释能力并不弱,与人工编码有着相近的表现,由于缺乏多阶段贯穿的系统性段编码能力,最终造成在理论、概念、模型上的诠释力不足。

(3)分析偏好方面

本研究拟定了以“家庭教育的关键要点”为主题的扎根理论研究。人类研究者严格秉承了研究主题开展研究,在选择性编码阶段,仅是结合访谈对象的特征,突出了“民族家庭教育”的核心要点。而机器编码方面,Kimi聚焦于“家庭教育的平衡与适应”,智谱清言突出“家庭教育的多维度影响与引导要点”。两者均在研究主题之下展开,但生成式AI的编码结果更显开放性。两者有着不同的分析偏好,即人工偏向于规范且聚焦的分析,而机器则偏向开放且多元的分析,该特征赋予了彼此互为借鉴与补充的机会。

(4)分析质量方面

我们邀请10位质量评估老师对结果进行评分,采用1—10分的分数范围,从规范性、有效性、合理性进行考量。最终人工组得分8.4分,而机器组则为6.2分。人工组在扎根理论的实践质量上有着明显的优势。这是由于在扎根理论操作过程中,需要实施逐级编码并对概念进行收敛与聚焦,Gen AI伴随着编码阶段的深入,逐渐失去优势。

2. 基于主题分析的实测

主题分析方法是质性研究方法中另一常见方法,该方法旨在识别和解释数据中的模式或主题,形成新的见解和理解[33]。主题分析的步骤大致可分为段落选择、关键词提取、整合编码、聚合主题、概念化、概念模型建立六个步骤[34]。基于人工与机器在主题分析中的可介入、可比较性,此次研究重点关注“关键词提取”和“主题形成”这两个核心步骤。

此次测试依然采用人工与机器分组实施,运用Gen AI实施了对文本数据的关键词分析,之后基于关键词进行主题聚合,形成最终的编码结果,相关结果见表2

表 2 人工与机器质性分析结果(主题分析)

我们发现:

(1)编码一致性方面

不同于扎根理论所需具备的较强主观诠释能力,主题分析基于关键词的主题聚合,对于主观性的依赖性有所减弱。在关键词提炼、主题凝聚方面,人工与机器表现出了较高的相似性。对于文本资料中的家庭角色、文化传统、教育理念、个人发展等关键主题,人工与机器均有所提及。虽然在表述上面存在一定的差异,但在主题概念的指向上具有较高的一致性,此发现与国外的研究结果相一致。

(2)分析的效率方面

人工组对于关键词的提炼,受制于研究人员的精力限制。76个关键词的提取花费了约2小时。而Kimi、智谱清言对于关键词仅用了25秒,根据研究者要求的数据量进行了快速提取,具有较大的灵活性,大大提高了对关键词的提取效率。在主题分析中,关键词提取的数量多少,直接决定了最终主题的多样性。伴随关键词的数量增多,机器提炼出更多维的主题概念,有着一定的优势。

(3)分析质量评估方面

研究采取与扎根理论相同的评分流程与标准,10位质量评价参与人最终给予了人工组8.7分的评分,而机器组则为8.5分。虽然人工组依然优于机器组,但分值差距已十分微小,有6位参与人对于机器的分析质量评分高于人工。人工在主题分析方面的优势并不显著。人工与机器在主题分析上的质量表现差距,远远小于扎根理论,体现出Gen AI在主题分析上的较好表现。

五、总结与展望

人工与Gen AI在质性研究中的测试可以看到,Gen AI在质性数据的初级编码阶段(对于数据的初步概念聚合),有着与人工相近的表现,且在时间消耗方面较人工能有较大的提高,表现出了在初编码阶段的能力与优势。但诸多质性数据的编码需要多轮编码,由文本的简单概念聚合,向着更为理论化、抽象化的情境或类属编码推进,需要逐步融入研究者对于文本内容的理论诠释。Gen AI在后期编码阶段则逐步失去其优势,较难胜任此方面的任务要求。在质性数据的编码流程中,可有选择性的运用Gen AI优势,进行初阶概念的集合,以辅助研究者更为高效的实现对原文本的分析。以此同时,即使Gen AI在编码的后期阶段未能表现出优势,但其相关的输出也可为研究者提供思维、视角上的参考,助力研究者更为开放的进行思考与分析。

本项研究选用了扎根理论、主题分析两类质性方法进行实证研究,发现Gen AI对不同研究方法在实践成效上存在差异。专家评分显示主题分析的编码效果明显优于扎根理论,原因在于不同方法背后所需要凭借的编码技能各有不同。主题分析以概念逐级聚合为主,而扎根理论则需在概念聚合的过程中,逐步进行理论化构建,后者较大程度上加大了编码难度,以及对于抽象思维、理论诠释的要求,进而AI在两种方法应用上呈现出差异化表现。质性方法有着灵活性强、类型化多、组合丰富等特征,研究者在选择Gen AI与质性方法的结合时,需重点考量其与质性方法的匹配性。这为未来研究提供了一个值得深化的议题,即探索Gen AI与诸类质性方法的匹配性。

国外的同类研究多依托于ChatGPT,未见运用我国本土Gen AI。ChatGPT本身语料库是以国外英文语料为训练基础,分词过程以英文单次为基础。将Kimi、智谱清言运用于质性分析研究尚属首次,其语料以国内中文语料为基础,整个分词过程强调对中文语境的关注,更契合于我国本土化语境的需要。研究证明,本土Gen AI在数据编码、概念提炼、内容描述中文文本方面有着不错表现,有着与人工相近的编码成效,由此凸显了我国Gen AI的成熟度与先进性,能够为在中文环境下实施AI辅助的质性分析提供有效的工具选择。由此可预见,伴随着我国Gen AI 的不断迭代与完善,其质性研究分析功能进一步提升效率、质量,会对质性研究方法与模式产生不小的影响,相较于国外ChatGPT、Claude等,更适应我国本土化质性研究的需要。

未来,质性研究需要研究者具备诸多关键能力,例如反身性、反思性、诠释、建构等,从目前生成式AI水平来看依然是无法企及的。而在面对大规模质性数据时,时间、精力、人力则是质性研究最大的瓶颈,但这却是Gen AI的优势所在。研究者需对人工智能形成理性的认识与理解,清晰人工智能在具体质性研究方法中的优势所在。人与机器在质性研究中所应思考的并非是“谁替代谁”的问题,而要更多思考人与机器如何在质性研究中进行合作。AI所赋予研究者在质性研究中的优势在于思维开拓、效率提升等方面,而研究者自身的优势则体现于诠释能力、理论构建等方面。人机的合作在于彼此独特优势的互补。随着我国Gen AI技术的发展,与具体质性研究的结合会日益增多,也对研究者提出了新的要求,即以主动、开放的心态,有选择性地接纳AI技术。这既是一类趋势,也是未来研究者在开展研究过程中的一项必要技能。

过往对于质性研究的理解,多拘泥于访谈文本、历史文献、会议资料等,对以文本类质性数据的依赖较高。未来,囊括图片、视频、语音、文字等多模态的数据形式,均可成为质性研究的数据资源。这一点在诸多质性研究中已出现端倪,如运用绘画分析、视频表情、图片切割等,已形成有相关的质性研究成果。不同于传统的人工阅读与分析,Gen AI可实现对多模态数据的深度解析,这为质性研究提供了更多素材、更多维度上的观察与分析可能,有助于深化研究的发现。人工智能所能赋予质性研究的,不仅在于纯质性的单一分析路径,也可以是“质性-量化”或“量化-质性”的混合分析路径。

现有研究仅对于人工与机器在质性数据分析方面进行了评估,但人工智能所能实践的并不局限于此,例如可借助Gen AI 构建虚拟访谈对象,作为虚拟被访者接受访谈。在访谈实施过程中,可预先设置虚拟访谈人,在线与被访者进行访谈,人工智能针对回答进行追问,这将大大降低访谈的实施成本,提高访谈效率与访谈量;在观点、摘要凝练方面,可借助Gen AI形成大致的观点总结,以辅助于研究者进行深入思考与发现。在指标制定中常用的德尔菲法,也可以借助多个Gen AI,模拟专家身份对于相关指标、主题进行评分或给予观点,制定相关指标体系。除此以外,Gen AI对于质性研究的贡献,还体现于数据清洗、文本描述、质性数据可视化等诸多方面。Gen AI对质性研究的介入并非是局部的,而是全流程的整体性革新,可嵌入于质性研究中的数据搜集、数据分析、数据诠释、数据呈现等诸多环节。

参考文献
[1]
Towler L, Bondaronek P, Papakonstantinou T, et al. Applying Mmachine-Learning to Rrapidly Aanalyze Large Qualitative Text Ddatasets to Inform the COVID-19 Pandemic Response: Comparing Human and Machine-Assisted Topic Analysis Techniques. Frontiers in Public Health, 2023, 19(11): 1268223.
[2]
Chubb L A. Me and The Machines: Possibilities and Pitfalls of Using Artificial Intelligence for Qualitative Data Analysis. International Journal of Qqualitative Mmethods, 2023, 22(4): 1-16.
[3]
王天恩. 人工智能通用化及其实现途径. 中国社会科学, 2024(3): 105-124.
[4]
王林辉, 胡晟明, 董直庆. 人工智能技术、任务属性与职业可替代风险: 来自微观层面的经验证据. 管理世界, 2022, 38(7): 60-79.
[5]
顾小清, 郝祥军. 从人工智能重塑的知识观看未来教育. 教育研究, 2022, 43(9): 138-149.
[6]
阮凯. 人工智能知识生产的核心争议与深层局限的哲学反思. 自然辩证法研究, 2024, 40(3): 66-73.
[7]
刘海龙. 生成式人工智能与知识生产. 编辑之友, 2024(3): 5-13.
[8]
储节旺, 杜秀秀. 生成式人工智能赋能科研知识生产研究述评. 大学图书馆学报, 2024, 42(3): 108-117.
[9]
Ray P P. ChatGPT: A Comprehensive Review on Background, Applications, Key Challenges, Bias, Ethics, Limitations and Future Scope. Internet of Things and Cyber-Physical Systems, 2023, 13(3): 121-154.
[10]
Hamilton L, Elliott D, Quick A, et al. Exploring the Use of AI in Qualitative Analysis: A Comparative Study of Guaranteed Income Data. International Journal of Qualitative Methods, 2023, 22(3): 385-386.
[11]
Christou P A. How to Use Artificial Intelligence (AI) As a Resource, Methodological and Analysis Tool in Qualitative Research. Qualitative Report, 2023, 28(7): 213-252.
[12]
Ciechanowski L, Jemielniak D, Gloor P A. TUTORIAL: AI Research Without Coding: The Art of Fighting Without Fighting: Data Science for Qualitative Researchers. Journal of Business Research, 2020, 34(11): 322-330.
[13]
Rahman M M, Terano H J, Rahman M N, et al. ChatGPT and Academic Research: A Review and Recommendations Based on Practical Examples. Journal of Education, Management and Development Studies, 2023, 3(1): 1-12.
[14]
Owens B. How Nature Readers are Using ChatGPT. Nature, 2023, 615(7950): 20. DOI: 10.1038/d41586-023-00500-8.
[15]
ATLAS. ti. Introducing: AI Coding Beta Powered by OpenAI(2024-07-21). https://atlasti.com/ai-coding-powered-by-openai.[2025-03-30].
[16]
Tai R H, Bentley LR. An Examination of the Use of Large Language Models to Aid Analysis of Textual Data. International Journal of Qualitative Methods, 2024, 28(23): 232-269.
[17]
曾军. 人机交互与辅助生成: 人工智能时代的文论问题. 江西社会科学, 2024, 44(5): 129-141,208.
[18]
Peres R, Schreier M, Schweidel D, et al. On ChatGPT and Beyond: How Generative Artificial Intelligence May Affect Research, Teaching, and Practice. International Journal of Research in Marketing, 2023, 40(2): 269-275. DOI: 10.1016/j.ijresmar.2023.03.001.
[19]
Van Dis E A M, Bollen J, Zuidema W, et al. ChatGPT: Five Priorities for Research. Nature, 2023, 614(7947): 224-226. DOI: 10.1038/d41586-023-00288-7.
[20]
Hassani H, Silva E S. The Role of ChatGPT in Data Science: How AI-Assisted Conversational Interfaces are Revolutionizing the Field. Big Data and Cognitive Computing, 2023, 7(2): 62. DOI: 10.3390/bdcc7020062.
[21]
Wachinger J, Bärnighausen K, Schäfer LN. Prompts, Pearls, Imperfections: Comparing ChatGPT and a Human Researcher in Qualitative Data Analysis. Qualitative Health Research., 2024, 34(5): 413-452.
[22]
Van Manen M. What Does ChatGPT Mean for Qualitative Health Research?. Qualitative Health Research, 2023, 33(13): 1135-1139. DOI: 10.1177/10497323231210816.
[23]
Doshi R H, Bajaj S S, Krumholz H M. ChatGPT: Temptations of Progress. The American Journal of Bioethics, 2023, 23(4): 6-8. DOI: 10.1080/15265161.2023.2180110.
[24]
De Paoli S. Performing an Inductive Thematic Analysis of Semi-Structured Interviews with A Large Language Model: An Exploration and Provocation on The Limits of The Approach. Social Science Computer Review, 2023, 41(6): 1645-1712.
[25]
Jie Gao, Kenny Tsu Wei Choo. CoAIcoder: Examining the Effectiveness of AI-assisted Human-to-Human Collaboration in Qualitative Analysis. ACM Transactions on Computer-Human Interaction, 2023, 31(1): 38-72.
[26]
BlažMesec. The Language Model of Artificial Inteligence ChatGPT - A Tool of Qualitative Analysis of Texts. Authorea, 2023, 43(4): 153-198.
[27]
Tabone W, De Winter. Using ChatGPT for Human-Computer Interaction Research: A Primer. Royal Society Open Science, 2023, 10(9): 231053. DOI: 10.1098/rsos.231053.
[28]
Schiavone W. Can ChatGPT Replace UX Researchers? An Empirical Analysis of Comment Classifications(2023-05-23). https://measuringu.com/classification-agreement-between-ux-researchers-and-chatgpt/.[2025-03-27].
[29]
Xiao Z, Yuan X. Supporting Qualitative Analysis with Large Language Models: Combining Codebook with GPT-3 for Deductive Coding. In Companion Proceedings of the 28th International Conference on Intelligent User Interfaces, 2023.
[30]
Taylor, Z. Using Chat GPT to Clean Qualitative Interview Transcriptions: A Usability and Feasibility Analysis. American Journal of Qualitative Research, 2024, 8(2): 153-160. DOI: 10.29333/ajqr/14487.
[31]
贾旭东, 衡量. 扎根理论的“丛林”、过往与进路. 科研管理, 2020, 41(5): 151-163.
[32]
费小冬. 扎根理论研究方法论: 要素、研究程序和评判标准. 公共行政评论, 2008(3): 23-43,197. DOI: 10.3969/j.issn.1674-2486.2008.03.003.
[33]
Elliott V. Thinking About the Codingrocess in Qualitative Data Analysis. Qualitative Report, 2018, 23(11): 423-465.
[34]
Naeem M, Ozuem W, Howell K, et al. A Step-by-step Process of Thematic Analysis to Develop a Conceptual Model in Qualitative Research. International Journal of Qualitative Methods, 2023, 32(22): 1-18.
“Human-Machine”Collaboration: Exploring the application landscape of generative AIinqualitative research
ZHU Yi1,2, QUE Ming-kun3     
1. Management College, Shanghai Sanda University;
2. International Governance Research Center for Cyberspace, Fudan University;
3. College of Education, Zhejiang University
Abstract: With the emergence and proliferation of generative AI, its involvement in qualitative research has increasingly expanded. The academic community has conducted numerous comparative studies on the practical applications of human and machine involvement in qualitative research, demonstrating the positive role of generative AI in qualitative studies. This study aims to conduct a comparative analysis of analytical quality between human and machine in qualitative research (grounded theory and thematic analysis) within the Chinese context, utilizing China’s domestically developed generative AI tools and family education interview texts as the data foundation, thereby enriching domestic research in this thematic area. The research employs parallel human and machine coding of identical texts, with anonymous expert evaluations assessing the analytical quality of both approaches. Findings reveal that generative AI plays a significant supportive role in assisting human researchers, with comparable performance between human and machine in qualitative data coding. However, distinct analytical quality differences emerge between human and machine across the two qualitative methodologies (grounded theory vs. thematic analysis). This study further investigates the underlying reasons for these variations while proposing future directions for "AI + qualitative research," including human-machine collaboration, intelligent analysis of multimodal data, and AI integration throughout the entire qualitative research workflow.
Keywords: generative AI    artificial intelligence (AI)    human-machine collaboration    qualitative research    qualityof analysis    

作者简介:朱逸,上海杉达学院教授,复旦大学网络空间国际治理研究基地特聘研究员。研究方向为社会研究方法、STS研究;
阙明坤,浙江大学国家高端智库教育学院分中心执行主任。研究方向为教育政策。
通信作者:阙明坤,邮箱地址:quemingkun@zju.edu.cn
项目资助:国家社科基金一般项目“增权理论视角下互联网‘零工群体’劳动权益保障研究”(23BSH057)。