中国社交媒体上关于分娩体验的多维度分析：一种结合LDA、情感分析及深度学习的综合方法

时间：2026年4月20日

来源：Frontiers in Public Health

编辑推荐：

## 摘要 **目的**：分娩是人生中的重大事件，具有复杂的生理和心理社会后果。本研究探讨了女性的分娩经历在中国社交媒体叙事中的构建方式，并识别了不同分娩方式中的关键主题和情绪模式。 **方法**：我们对来自微博和REDnote的17,783篇与分娩相关的帖子进行了横截面内容分析

## 摘要
**目的**：分娩是人生中的重大事件，具有复杂的生理和心理社会后果。本研究探讨了女性的分娩经历在中国社交媒体叙事中的构建方式，并识别了不同分娩方式中的关键主题和情绪模式。
**方法**：我们对来自微博和REDnote的17,783篇与分娩相关的帖子进行了横截面内容分析。使用潜在狄利克雷分配（LDA）来提取主题，并对预训练的中文BERT模型进行了微调，以进行三类别的句子级情感分类；模型性能通过准确性、F1分数和AUC-ROC进行评估。
**结果**：LDA识别出六个主要主题，其中“阴道分娩过程和疼痛体验”以及“分娩的情感意义和家庭价值”所占比例最大。负面情绪明显超过正面情绪，尤其是在阴道分娩的叙事中；而剖宫产和产后恢复的帖子则更为中立和信息性。LDA-BERT方法的综合表现良好（AUC-ROC = 0.89），这支持了情感估计的稳健性。
**结论**：中国社交媒体上的分娩叙事呈现出一种主要是负面的但带有“苦乐参半”的情感特征，阴道分娩和剖宫产的体验之间存在显著差异。这些发现强调了需要定制的围产期干预措施，包括个性化的分娩疼痛管理、加强的心理支持以及更细致的在线健康沟通。

### 1 引言
分娩对女性来说是一个重大的生命事件，不仅涉及复杂的生理过程，还伴随着深刻的心理和社会后果（1-3）。近年来，随着移动互联网和社交媒体的在中国迅速普及，越来越多的女性开始在微博和REDnote等平台上分享她们的分娩故事、寻求情感支持并交流医疗信息（4）。研究表明，中国准妈妈们广泛使用社交媒体和与怀孕相关的应用程序来搜索分娩和产后信息，并与同行交流（4），而类似的社会支持寻求模式也在其他国家有记载（5）。这些用户生成的叙事构成了了解女性从自己角度出发对分娩的感知、情绪和需求的宝贵数据来源。传统上关于分娩态度和经历的研究主要依赖于问卷调查、深入访谈和临床观察。系统评价表明，这些研究已经确定了分娩经历的重要预测因素和结果，但常常受到样本大小、及时性和代表性的限制，往往更侧重于医疗结果而非女性对分娩过程的整体感知（2, 6）。同时，社交媒体上高度情绪化或碎片化的叙事可能会放大负面经历，从而加剧对分娩的恐惧，进而影响孕妇的预期和心理健康（4, 6）。因此，系统分析社交媒体上的分娩叙事对于捕捉女性的真实关切和情绪轨迹、纠正潜在的认知偏见以及改善围产期护理至关重要。

#### 2 相关工作
2.1 分娩经历与母婴福祉
分娩对女性的身体和心理福祉有着深远的影响。大量研究表明，分娩的主观体验——而不仅仅是分娩方式等临床指标——强烈预测了产后心理健康结果，包括抑郁症状、焦虑和分娩相关创伤后应激障碍（CB-PTSD）（10）。系统评价显示，3%至4%的女性符合CB-PTSD的诊断标准，而更大比例的女性报告了与分娩相关的创伤性应激反应（11, 12）。研究还强调，创伤性或极度负面的分娩经历可能会导致长期的心理社会后果，包括与婴儿的关系受损、对未来分娩的恐惧以及避免再次怀孕（10, 13）。定性元分析描述了那些将分娩视为创伤的女性常常会经历强烈的恐惧、失控感和侵犯感，这些情绪可能会持续多年，并扰乱她们的身份和人际关系（13, 14）。作为回应，政策和临床指南越来越强调“积极的分娩体验”应该是母婴护理的核心目标，而不仅仅是关注生存和身体安全。例如，世界卫生组织将积极的分娩体验定义为符合或超过女性预先期望的体验，并支持她的自主性、尊严和情感安全（15）。最近的概念分析同样认为，需要从女性对自己所感受到的威胁、侵犯和控制丧失的评估来理解心理分娩创伤，并呼吁开发更细致的工具来捕捉这些主观维度（16, 17）。然而，大多数这类文献依赖于在临床或社区环境中进行的结构化问卷调查或访谈。虽然这些方法至关重要，但它们可能忽视了那些无法获得正式服务或不愿意在面对面交流中透露极度负面经历的女性。这一空缺激发了人们对更自然、大规模数据来源（如在线叙事）的兴趣。

2.2 分娩叙事与在线社交媒体
社交媒体平台已成为女性记录怀孕、分娩和产后恢复、寻求同伴支持以及讨论“完美”母亲角色的重要空间（18）。与传统调查相比，用户生成的内容更加自发，较少受到研究者定义问题的限制，因此成为了解分娩体验、记忆以及随着时间推移如何公开叙述分娩的宝贵窗口。使用论坛和Reddit社区的研究表明，孕妇和新妈妈经常利用在线空间表达对妊娠并发症、分娩疼痛和新生儿健康的担忧，同时交流实用建议和情感支持（19, 20）。对与怀孕相关的子版块的主题建模分析表明，讨论既涉及医疗风险（如先兆子痫、胎儿生长、引产），也涉及日常生活压力源（如身体形象、家庭矛盾、工作与生活平衡）（19, 20）。在中国背景下，新浪微博等社交媒体平台被广泛用于研究关于抑郁和心理健康的公共讨论，揭示了在线环境中如何协商污名、寻求帮助和应对策略（19, 20）。对微博帖子的大规模分析表明，语言和主题模式能够以补充传统流行病学数据的方式捕捉用户的情感状态和感知压力源（21, 22）。然而，专门针对中国社交媒体分娩叙事的实证研究仍然有限。现有研究通常在相对聚合的层面上讨论妊娠和产后心理健康（例如“围产期抑郁”或“母亲压力”），而不是探讨分娩经历的不同维度（如分娩方式、分娩过程中的互动和产后恢复）在女性自身叙事中的主题化和情感评估。此外，缺乏对阴道分娩和剖宫产故事在日常在线对话中的细致比较。

2.3 自然语言处理（NLP）与深度学习在母婴心理健康中的应用
与这些发展并行的是，计算方法越来越多地应用于社交媒体数据，以高效地提取潜在模式。潜在狄利克雷分配（LDA）是一种广泛使用的无监督主题模型，它将每个文档表示为多个主题的混合，将每个主题表示为单词的分布，并已成功应用于在线健康社区和公共卫生相关的社交媒体数据，以揭示患者的关切和疾病相关主题（7, 8）。与此同时，像BERT这样的深度学习模型通过从大规模预训练中学习情境化表示，显著提高了健康相关社交媒体的情感分析性能（8, 9）。然而，现有的健康传播研究很少将LDA主题建模与基于BERT的情感分析结合起来，在统一框架内探讨分娩经历，而且基于中国社交媒体平台的系统证据仍然稀缺（4）。基于此背景，本研究旨在对中国社交媒体上女性的分娩经历进行多维度分析。我们收集并清理了来自微博和REDnote的17,000多篇与分娩相关的帖子，应用LDA识别核心叙事主题，并使用微调的BERT模型进行句子级别的情感分类。模型性能通过准确性、F1分数和AUC-ROC进行评估。通过结合主题结构和情感分布，我们试图揭示女性在分娩过程中的主要关切、情绪模式和潜在需求，为改进临床实践和公共卫生策略提供实证证据。

### 3 方法论
3.1 数据收集与预处理
本研究的四阶段分析工作流程如图1所示。本研究采用回顾性设计，并使用Python（版本3.7）开发了一个网页爬取脚本。收集了2023年10月1日至2025年9月30日期间在中国两个主要社交媒体平台微博和REDnote上发布的与分娩相关的帖子。为了尽可能全面地捕捉用户生成的分娩经历叙事，构建了一组围绕分娩方式和体验分享表达的关键词组合（例如“阴道分娩日记”、“剖宫产日记”、“分娩故事”、“分娩体验分享”）。在预定义的时间窗口内匹配这些关键词的帖子被检索并存储。
在预处理阶段，使用正则表达式移除了表情符号、URL、标点符号和其他非中文字符，从而减少了文本噪声。然后使用Jieba分词器对剩余文本进行分割。为了提高产科内容的分词准确性，添加了一个特定领域的医学词典，包括“硬膜外麻醉”、“引产”和“催产素”等术语。分割后，应用了一个定制的停用词列表（例如功能词如“的”、“了”、“在”），并只保留长度大于一字符的有意义的令牌以供后续分析。

3.2 高频词分析
预处理之后，计算了所有有效令牌的词频统计，以获得语料库中最显著概念的宏观视图。使用Python的collections库，统计并按降序排列词频。然后检查前100个高频词，以确定分娩讨论的核心语义焦点，并为后续的LDA建模提供初步支持。关于分娩的主题词云如图2所示。为了方便不读中文的读者理解，词云中的高频词在表1中列出，同时附有它们的英文翻译和频率。

3.3 使用LDA的主题建模
3.3.1 方法选择的理由
选择潜在狄利克雷分配（LDA）作为主题建模技术。LDA是一种无监督的概率生成模型，可以自动从大量文本中识别潜在的主题结构，无需预定义标签，非常适合用于社交媒体数据的探索性研究。与传统的词频或聚类方法相比，LDA揭示了文档-主题和主题-词的双重概率分布，这更好地反映了文本叙述的混合语义特性。3.3.2 模型训练和优化为了确定适当的主题数量，我们估计了从1到20个不同主题数量的模型，并使用困惑度和主题一致性分数进行比较。困惑度反映了将文档分配给主题的不确定性（较低的值表示更好的泛化能力），而主题一致性则衡量了同一主题内高概率词汇之间的语义一致性（较高的值表示更好的可解释性）。如图3所示，当主题数量设置为六个时，困惑度曲线出现了拐点（困惑度=-8.37），同时一致性分数达到了最大值（一致性=0.63），这表明六个主题的解决方案在模型复杂性和可解释性之间达到了最佳平衡。在模型训练过程中，迭代次数设置为50次，随机种子固定为100，以确保收敛性和可重复性。图3用于确定最佳主题数量的困惑度和主题一致性分数。对于选定的六个主题模型，我们检查了每个主题下的最高权重关键词，并对其含义进行了基于临床信息的解释。在此基础上，我们为这六个主题分配了描述性标签和定义。主题标签及其代表性术语（附有相应的权重）总结在表2中。主题可视化是使用Python库pyLDAvis实现的，该库生成了一个交互式HTML报告，显示了主题间的距离和术语相关性；此可视化的静态截图见图4。表2主题标签代表性关键词及其权重主题1 阴道分娩过程和体验（占比28.76%）0.025*“医生”+0.019*“子宫收缩”+0.018*“无痛”+0.014*“阴道分娩”+0.012*“用力”+0.011*“分娩”+0.010*“小时”+0.009*“助产士”+0.009*“感觉”+0.009*“撕裂”主题2 分娩的情感价值和家庭意义（占比27.2%）0.032*“孩子”+0.027*“母亲”+0.013*“真的”+0.012*“婴儿”+0.010*“体验”+0.009*“阴道分娩”+0.007*“丈夫”+0.006*“疼痛/痛苦”+0.005*“女人”+0.005*“生活”主题3 孕期日记和母婴经验分享（占比20.36%）0.051*“阴道分娩”+0.026*“分娩”+0.020*“孩子”+0.014*“婴儿”+0.012*“剖宫产”+0.012*“劳动”+0.012*“母亲”+0.011*“怀孕”+0.010*“怀孕期”+0.010*“分享”主题4 产后恢复（占比8.44%）0.021*“产后”+0.015*“剖宫产”+0.015*“阴道分娩”+0.015*“恢复”+0.010*“疤痕”+0.008*“护理/照顾”+0.007*“伤口”+0.006*“身体”+0.006*“状况”+0.006*“子宫”主题5 剖宫产手术体验（占比10.85%）0.020*“感觉”+0.019*“剖宫产”+0.013*“医生”+0.013*“腹部”+0.012*“真的”+0.008*“手术”+0.007*“麻醉”+0.006*“伤口”+0.005*“害怕”+0.005*“非常棒/非常值得”+0.002*“舒适”主题6 高风险妊娠和产科急诊护理（占比4.40%）0.015*“胎盘”+0.013*“医院”+0.012*“医生”+0.007*“剖宫产”+0.006*“羊水”+0.005*“分娩”+0.004*“检查”+0.003*“胎儿位置”+0.003*“脐带”+0.003*LDA主题模型识别的六个主题。图4使用pyLDAvis显示的主题间距离图和术语相关性。3.4 基于BERT模型的情感分析3.4.1 BERT模型的理由对于细粒度的情感分析，采用了基于BERT（双向编码器表示来自Transformer）的深度学习模型。传统的基于词典的方法在处理中文社交媒体文本中的复杂语言现象（例如否定、讽刺）时遇到困难，而BERT通过其双向Transformer架构捕获了上下文语义。此外，它的“预训练+微调”范式表现出较高的样本效率，并且在中文情感分类任务中显著优于传统的机器学习（例如SVM）和基于RNN的模型（例如Bi-LSTM）。3.4.2 手动注释过程和质量控制为了训练BERT情感分类模型，随机选择了2,000篇帖子进行手动注释。注释团队由两名具有社会学背景的研究生组成，他们接受了NLP注释任务的系统培训。他们使用50篇样本帖子的指南来定义三种情感标签：正面、中立和负面。在正式注释阶段，两名研究人员独立进行编码。定期进行交叉检查，任何差异由第三位具有产科背景的资深研究人员解决。注释者之间的同意度很高，Cohen’s Kappa系数为0.85（95% CI：0.82–0.88），表明注释的可靠性非常好。3.4.3 样本量合理性和模型性能2,000个训练样本的大小是稳健的，因为先前的研究表明，微调BERT只需要100到500个标记文本就能在特定领域的分类任务中取得良好性能。在微调过程中，预训练的bert-base-chinese模型使用AdamW进行优化，学习率为2e-5，权重衰减为0.01。最大序列长度设置为128，批量大小为16，模型基于验证损失采用提前停止策略训练了5个周期。在15,783篇帖子的测试集上，微调后的BERT模型达到了0.785的准确率（95% CI：0.76–0.80）和0.890的AUC-ROC。为了验证其有效性，构建了一个Bi-LSTM模型作为基线，其性能较低（准确率：0.742；AUC-ROC：0.852）。这些结果证实了BERT模型可以可靠地识别中文社交媒体文本中的情感。3.5 伦理考虑本研究使用的所有数据均来自公开可访问的社交媒体平台。在分析之前，移除了用户可识别信息，语料库已完全去标识化。研究方案已得到浙江大学医学院伦理委员会的审查和批准（批准号IRB-20250386-R），并且根据匿名数据的二次分析规定免除了知情同意的要求。4 结果4.1 语料库的描述性统计使用基于Python的爬虫，我们从Weibo和REDnote检索了与分娩相关的帖子。去除重复项、广告、机构帖子和没有实质性叙述内容的条目后，保留了17,000多篇有效帖子，每个平台贡献了大约一半的语料库。大多数帖子是由亲身经历过分娩的女性撰写的，她们分享了分娩过程、分娩方式或产后恢复的情况。帖子的平均长度约为几百个字符，有些帖子是多部分的“日记”，涵盖了从怀孕末期到早期育儿的整个过程。高频词统计显示，与分娩方式（“阴道分娩”、“剖宫产”）、分娩过程和身体感觉（“收缩”、“疼痛”、“硬膜外麻醉”）以及医疗和家庭支持（“医生”、“助产士”、“护士”、“婴儿”、“丈夫”）相关的术语出现最频繁，这些提供了语料库核心关注点的初步指示。4.2 分娩叙述的主题结构为了揭示潜在的主题结构，我们对预处理过的语料库应用了潜在狄利克雷分配（LDA）。估计了不同主题数量（1-20）的模型，并使用困惑度和一致性分数进行比较。六个主题的模型获得了最低的困惑度和最高的一致性，因此被选为最佳规格。对每个主题下高概率关键词的临床解释得出了以下主题和比例：主题1：阴道分娩过程和体验（约28-29%）——描述子宫收缩、分娩阶段、疼痛强度、硬膜外镇痛以及与医生和助产士的互动；主题2：分娩的情感价值和家庭意义（约27%）——对生育孩子的价值的反思、家庭关系的变化、感激和爱，以及成为母亲的意义；主题3：孕期日记和母婴经验分享（约20%）——从怀孕到分娩以及早期育儿的系列叙述，通常标记为“日记”，旨在分享；主题4：产后恢复（约8-9%）——关于产后出血、伤口护理、哺乳困难、身体虚弱和康复的担忧；主题5：剖宫产手术体验（约10-11%）——麻醉过程、术中感觉、术后疼痛、伤口愈合以及对手术的复杂感受；主题6：高风险妊娠和产科紧急护理（约4-5%）——关注胎盘问题、胎儿位置异常、紧急手术和密切监测。总体而言，“阴道分娩过程和体验”和“分娩的情感价值和家庭意义”共同占了语料库的一半以上，表明了对分娩的肉体考验和成为母亲的象征性转变的双重关注。4.3 主题间的情感分布使用基于BERT的深度学习模型，并经过手动注释的数据微调，将每篇帖子分类为正面、中性或负面（风险相关）情感。在语料库层面，负面帖子的数量明显多于正面帖子，而中性帖子几乎占所有条目的一半，反映了充满情感的叙述和相对描述性的信息内容的混合。如表3所示，不同主题间的情感分布差异很大。在主题1“阴道分娩过程和体验”中，负面帖子占比较高，主要表达了对剧烈收缩疼痛的恐惧、崩溃和无助感，以及对过程的极度身体疲惫和不确定性。同样，在主题2“分娩的情感价值和家庭意义”中也包含了相对较高的负面情绪比例，但同时显示出所有主题中最高的正面内容比例，反映了分娩叙述中的典型“苦乐参半”模式，其中痛苦和意义常常共存。表3主题名称总数量总百分比情感类别数量百分比主题1 阴道分娩过程和体验5,11528.76%负面2,23443.68%中性2,13341.70%正面74814.62%主题2 分娩的情感价值和家庭意义4,83727.20%负面200641.47%中性181637.54%正面1,01520.98%主题3 孕期日记和母婴经验分享3,62020.36%负面92525.56%中性179849.67%正面89724.78%主题4 产后恢复1,5008.44%负面38025.33%中性1,03569.00%正面855.67%主题5 剖宫产手术体验1,92910.85%负面29915.50%中性1,34569.73%正面28514.78%主题6 高风险妊娠和产科紧急护理7824.40%负面27435.04%中性41753.32%正面9111.64%分娩叙述中按主题的情感分布。相比之下，在主题4“产后恢复”和主题5“剖宫产手术体验”中，中性情绪占主导地位，许多帖子描述了伤口护理、行动不便和哺乳困难等事实性内容。主题3“孕期日记和母婴经验分享”呈现出相对平衡的情感结构，既包括对怀孕和分娩风险的焦虑和育儿压力，也包括对新生命到来的喜悦和满足。4.4 情感分类模型的性能基于BERT的深度学习模型在保留的测试集上进行了评估。该模型取得了较高的总体准确率和F1分数，并且在区分负面帖子和非负面帖子方面表现良好。ROC曲线下的宏观平均面积（AUC-ROC）约为0.89，表明在不同决策阈值下具有很强的区分能力。这些结果表明，所提出的深度学习模型可以可靠地识别中文社交媒体文本中的分娩相关情感，为基于情感分布的后续分析提供了坚实的技术基础。5 讨论5.1 在线分娩叙述的“苦乐参半”模式以及阴道分娩和剖宫产之间的差异结合LDA和BERT的结果显示，在线分娩叙述中存在明显的“苦乐参半”模式。一方面，在语料库层面，负面情绪比正面情绪更为普遍，尤其是在描述阴道分娩过程的帖子中。这与分娩期间常见的剧烈疼痛、身体疲惫和失控感相一致。女性经常描述自己“处于崩溃的边缘”、“因疼痛而尖叫”或“感到完全失控”，突显了心理负担和分娩经历的潜在风险。另一方面，“分娩的情感价值和家庭意义”这一主题表明，痛苦甚至创伤性的经历往往被重新解释为对孩子和家庭的有意义牺牲。许多女性描述即使面对一切困难，她们仍然会选择生下这个孩子，或者她们如何见证婴儿的第一声啼哭和伴侣的泪水将这段经历转化为自豪感和家庭纽带的加强。这表明，意义构建和叙述重构可以在一定程度上缓解分娩的负面影响，并促进心理适应。剖宫产的叙述在语气上有所不同。表面上看，剖宫产的帖子显得更加中立，情感强度较低，许多女性强调可控性和可预测性（例如，“无需忍受长时间的收缩”）。然而，仔细观察会发现隐藏的紧张情绪：一些人表达了对“选择更容易的方式”的内疚或矛盾心理，担心长期健康影响，或者对未曾经历阴道分娩感到后悔。因此，虽然剖宫产可以减少急性不确定性，但它引入了其他需要在分娩教育和咨询中解决的心理社会矛盾。5.2 社交媒体在信息和支持中的作用“孕期日记和母婴经验分享”等主题的强烈存在强调了社交媒体在为孕妇提供信息和情感支持方面的核心作用。许多帖子的目的明确是“留下记录”或“帮助以后的母亲”，提供实用的建议（例如，疼痛管理策略、医院需要携带的物品、哺乳姿势），并分享从并发症或意外事件中“学到的教训”。这种点对点的信息流动补充了正式的医疗指导，特别是在医院教育不完善或时间有限的情况下。在情感层面，评论区和转发互动往往充当非正式的支持社区。女性从有过类似经历的陌生人那里获得同情、鼓励和认可。诸如“你太勇敢了”、“我当时也是一样”或“感谢你让我不那么害怕”之类的表达说明了社交媒体如何缓解孤独感和正常化分娩期间的强烈感受。对于准备分娩的女性来说，阅读他人的经历可以通过替代性暴露来减少焦虑，尽管在某些情况下，极端负面或耸人听闻的故事也可能加剧恐惧和风险感知。同时，研究结果也暗示了社交媒体作为支持空间的矛盾性。算法对极端情感内容的放大可能会扭曲人们对典型分娩经历的认知，用户生成的建议有时会与基于证据的医疗建议相冲突。这意味着医疗专业人员不能简单地忽视社交媒体，而是需要理解并在可能的情况下参与这些在线叙事，以纠正错误信息、回应常见问题，并建立更为建设性的沟通渠道。5.3 对临床实践和公共卫生的影响这些发现为优化孕产妇健康服务提供了数据驱动的、可操作的指导，特别是从跨文化的角度来看。本研究中发现的“苦乐参半”的模式与其他非中国文化背景有相似之处。例如，对澳大利亚和瑞典女性的研究表明，对新母亲身份的喜悦常常与对分娩的强烈疼痛记忆并存，这表明在意义构建方面存在跨文化的共性（29, 30）。然而，剖宫产手术的情绪分布与西方的发现有所不同。虽然瑞典的研究通常将术后体验描述为以疼痛为主，并与“未能自然分娩”的感觉相关联（30），但中国的叙事则呈现出更为平衡的情绪谱。在中国背景下，剖宫产手术有时被重新解读为一种积极且可控的“明智选择”（31）。这种差异反映了不同社会文化对于身体自主权和医疗干预的态度差异，在设计有针对性的公共卫生策略时必须考虑到这些因素。首先，针对阴道分娩过程中强烈负面情绪的干预措施应侧重于结构化的疼痛管理和人性化护理。关于宫缩疼痛的强烈叙述以及对硬膜外麻醉“无效等待时间”的感受，突显了扩大分娩镇痛可及性的紧迫需求（32）。医院应优化麻醉资源以减少等待时间。此外，报告中的无助感和尊严丧失感强调了持续情感支持（如助产士陪伴）的必要性，以帮助女性重新获得控制感（33）。其次，剖宫产手术的独特文化框架要求采取细致的干预措施。虽然一些年轻母亲认为剖宫产是一种“明智的选择”，因为它具有可预测性（31），但她们的叙事往往忽略了长期健康风险。公共卫生政策应在尊重女性自主权的同时，确保提供关于剖宫产短期利益和长期后果的全面教育。此外，还需要改进标准化的术后疼痛管理方案。第三，从数字健康的角度来看，卫生当局可以利用社交媒体的积极潜力，通过建立官方账户来分享基于证据的建设性分娩故事。这有助于平衡线上“恐吓性叙事”的过度传播。本研究开发的分析框架也可以作为实时监控工具，用于识别孕产妇的心理危机和未满足的健康需求。6 结论与未来工作本研究通过结合LDA主题建模和基于BERT的情绪分析，对中国女性在社交媒体上的分娩经历进行了多维度分析。利用来自微博和REDnote的超过17,000条与分娩相关的帖子，我们确定了六个主要主题，这些主题共同描绘了丰富的分娩叙事景观，涵盖了高风险妊娠和分娩过程、术后恢复、家庭意义以及日常母婴日记等方面。情绪分析显示了一种明显的“苦乐参半”模式，虽然负面情绪总体上更为普遍，尤其是在阴道分娩的叙事中，但仍与爱的感觉、感激和生命意义的积极情绪交织在一起。阴道分娩和剖宫产的叙事表现出不同的情感特征和心理社会紧张，突显了差异化临床沟通和支持的必要性。在方法论上，该研究展示了结合LDA和基于深度学习的情感分析来挖掘中文大规模用户生成健康叙事的可行性和价值。该集成框架不仅捕捉了分娩故事的主题结构，还量化了不同主题之间的情绪模式，从而为产科人文学研究和健康传播研究提供了可扩展的工具。然而，也必须承认一些局限性，这些局限性指出了未来研究的方向。首先，数据仅来自微博和REDnote，这些平台主要使用者是居住在城市地区的年轻、受过较高教育且具有数字素养的女性（34, 35），因此样本可能过度代表了这一人群，而低估了农村地区女性、受教育程度较低的女性或数字边缘化群体的分娩经历。其次，本研究依赖于观察性社交媒体文本，这些文本反映了女性在公共数字空间中的自我呈现，而不是直接的临床测量结果。这些叙事受到平台规范和受众期望的影响（36），因此在将叙事模式与实际心理或临床结果（如PTSD或PPD的临床诊断）联系起来时必须谨慎。第三，基于关键词的搜索策略可能天然偏向于那些愿意并能够详细表达自己经历的用户（例如写日记的人），可能会遗漏那些以不同方式表达感受的人。最后，缺乏临床背景信息（如生育次数、特定的产科并发症）限制了研究结果的深入临床解读。未来的研究应考虑采用纵向研究和混合方法，或将社交媒体数据与电子健康记录相结合，以揭示应对过程的动态特性，并更全面地理解分娩经历。

引领行业 | 聚焦麦特绘谱代谢组学整体解决方案>>

揭秘单细胞测序-深入了解这项正在改变我们开展科学研究的技术>>

对同一细胞中的转录组和表观基因组进行同时分析（使用细胞核分离试剂盒简化样本制备工作流程）>>

「大小鼠繁育与健康管理」指导海报，点击即可免费领取电子版或实体海报>>

热点排行

生物通微信公众号

在线客服

微信

新浪微博

我要投稿

返回顶部