基于层次分析的长短记忆网络(AHP-LSTM)的食品安全网络舆情预警模型

引用本文

江志英, 李宇洋, 李佳桐, 贺彦林, 朱群雄. 基于层次分析的长短记忆网络(AHP-LSTM)的食品安全网络舆情预警模型[J]. 北京化工大学学报(自然科学版), 2021, 48(6): 98-107. DOI: 10.13543/j.bhxbzr.2021.06.013.

JIANG ZhiYing, LI YuYang, LI JiaTong, HE YanLin, ZHU QunXiong. An early-warning model based on an analytic hierarchy process-long short-term memory network (ahp-lstm) for food safety network public opinion[J]. Journal of Beijing University of Chemical Technology (Natural Science), 2021, 48(6): 98-107. DOI: 10.13543/j.bhxbzr.2021.06.013.

基金项目

国家自然科学基金（61973024）

第一作者

江志英, 男, 1987年生, 博士.

通信联系人

朱群雄, E-mail: zhuqx@mail.buct.edu.cn

文章历史

收稿日期：2021-02-10

Contents

Abstract

Full text

Figures/Tables

PDF

基于层次分析的长短记忆网络(AHP-LSTM)的食品安全网络舆情预警模型

江志英 ^1,2, 李宇洋 ¹, 李佳桐 ^1,2, 贺彦林 ^1,2, 朱群雄 ^1,2

1. 北京化工大学信息科学与技术学院, 北京 100029;
2. 北京化工大学智能过程系统工程教育部研究中心, 北京 100029

收稿日期：2021-02-10

基金项目：国家自然科学基金（61973024）

第一作者：江志英, 男, 1987年生, 博士

通信联系人：朱群雄, E-mail: zhuqx@mail.buct.edu.cn

摘要：随着互联网技术的迅猛发展，网络已成为社会舆情的重要阵地，而网络舆情是食品风险预警的一个方向。传统舆情预警模型在指标体系的基础上结合反向传播神经网络（back propagation neural network，BP）等神经网络模型进行分析，存在运行不稳定、预测精度不高等问题。为了解决这些问题，采用具有较高预测精度的长短记忆（long short-term memory，LSTM）网络算法，在网络事件指标体系的基础上引入层次分析法（analytic hierarchy process，AHP）并融合食品安全事件指标数据，将融合结果作为LSTM的期望输出，以建立更为稳定、精度更高的风险预警模型AHP-LSTM。实验结果表明，与传统模型相比，AHP-LSTM对于事件指标数据具有较强的处理能力和较高的预警精度。因此构建基于AHP-LSTM的食品安全事件预警方法，可为相关部门有效防范和管理食品安全网络事件提供一定的理论依据和数据支撑。

关键词：食品安全神经网络舆情预警长短记忆网络(LSTM)

An early-warning model based on an analytic hierarchy process-long short-term memory network (AHP-LSTM) for food safety network public opinion

JIANG ZhiYing^1,2 , LI YuYang¹ , LI JiaTong^1,2 , HE YanLin^1,2 , ZHU QunXiong^1,2

1. College of Information Science and Technology, Beijing University of Chemical Technology, Beijing 100029, China;
2. Engineering Research Center of Intelligent Process Systems Engineering, Ministry of Education, Beijing University of Chemical Technology, Beijing 100029, China

Abstract: With the rapid development of internet technology, networks have become an important source of social public opinion, and network public opinion has become a key tool for early warning of food risks. Traditional public opinion early warning models are based on the index system structure, combined with a neural network model such as back propagation neural network (BP) for analysis, but suffer from problems of unstable operation and low prediction accuracy. A novel model based on a long short-term memory (LSTM) network algorithm is proposed in this paper in an attempt to address these problems. The food safety event index data is first fused by an analytic hierarchy process (AHP) algorithm based on the network event index system. The fusion result is then used as the expected output of LSTM in order to establish a more stable and more accurate risk early warning model (AHP-LSTM). Experiments showed that AHP-LSTM has better processing ability and higher early warning accuracy for event index data than the traditional model. In this paper, we use the event index system, combined with AHP and LSTM to study the early warning method of food safety events. Our work provides a theoretical basis and data to assist relevant departments in effectively preventing and mananing food safety network incidents.

Key words: food safety neural network public opinion warning long short-term memory (LSTM) network

引言

互联网的发展和计算机的广泛普及使得网络深入到人们的日常生活中，人们已经习惯于在网络中发表各自的观点，因此网络舆情成为反映社会问题的一个重要渠道。食品安全一直是社会普遍关注的一个问题，尤其是近几年“染色馒头”、“过期肉”、“毒豆芽”等事件的发生，引起了公众的高度关注。部分食品安全事件是在网络上曝光后才引起重视并最后得以解决，由此可见网络舆情对于食品安全问题的治理尤为重要。网络信息的高速发展为各个领域的研究带来新的机遇。近年来，已经有学者开始关注网络媒体和社交网络在预警领域的应用^[1]。互联网使得研究人员能够收集数据并分析个人和团体如何在网络平台上进行交流，包括通过新闻网站和社交媒体网站上的评论区进行交流的数据^[2]。由于社交媒体数据具有规模大、参与者多、传播快、数据内容丰富等特点，对社交媒体数据中信息传播的分析与建模成为研究的难点^[3]。

目前，国内外对于网络事件舆情分析的研究主要分为两类：(1)基于事件影响要素的舆情预警；(2)基于情感分析的舆情预警^[4]。第一类以舆情事件要素为研究对象，通过建立指标体系、融合舆情预警模型，对网络事件进行预警研究。例如，文献[5]以网络舆情事件的百度指数、头条指数等作为舆情热点指标，建立指标体系对舆情进行预警分析。第二类则以事件相关的网络言论为研究对象，分析言论的情感倾向值，从而实现舆情预警。例如，文献[6]结合舆情情感特征，利用情感分析方法实现了网络事件的舆情研判。文献[7]针对食品安全领域的事件要素以及相关新闻文本情感倾向建立了事件舆情指标体系，并结合神经网络模型进行预警分析，其核心主要包括指标体系的建立与预警模型的研究两方面内容。文献[8]指出，媒体报道的数量、消费者的关注程度、信息的争议程度以及所涉及的信息渠道等可能导致事件风险放大，因此这些事件要素成为舆情指标体系的重要指标依据。

在与食品安全相关的风险预警模型研究领域，通过神经网络建模的研究方式较为普遍。如文献[9]使用基于反向传播神经网络(back propagation neural network, BP)的食品安全预警模型对肉类食品的安全风险进行预测，可为食品安全风险预警提供技术支撑。但BP神经网络模型的初始权值为随机分配，导致运行结果不稳定、预测精度不高^[10]。文献[11]结合主成分分析法(principal component analysis, PCA)和径向基函数网络算法(radial basis function network, RBF)建立农残含量预测模型，可有效预测农作物中农药残留含量的情况。但传统RBF算法收敛慢，且计算复杂度会随着网络层次和节点数的增多而迅速增加^[12]。文献[13]建立了贝叶斯网络模型，对高校的食品安全状况进行风险预测，便于提前发现风险威胁，为高校食品安全的风险预警提供帮助。但贝叶斯网络依赖于概率计算，属性组合的计算复杂程度会增加，使得预测难度加大，所需时间也更长^[14]。文献[15]运用支持向量机(support vector machine, SVM)和互联网技术构建了易腐食品的安全预警云体系，尝试对冷鲜鸡肉保鲜期进行预警，并通过实验验证了该模型的有效性和准确性。但SVM算法适用于少量的线性可分的数据训练，不适于大规模非线性网络文本领域的舆情预警分析^[16]。与此同时，随着数据类型和复杂度的增加，模型的建立变得更加困难，传统模型已经无法满足其要求^[17]。Hochreiter等^[18]首次提出长短期记忆(long short-term memory, LSTM)网络，即通过维持一个记忆单元来确定哪些不重要的特征应该被遗忘，哪些重要的特征应该在学习过程中被记住，显示了学习长期依赖性的优越性能。LSTM网络作为最先进的递归神经网络之一，收敛快、预测精度高，在人工笔迹生成、语言预测、语音识别等领域的学习任务中取得了显著的效果^[19-20]。基于改进LSTM构建的双向长短时记忆循环神经网络(bi-directional long short-term memory, BiLSTM)以及注意力机制的双向长短期记忆网络(attention based bi-directional long short-term memory, attention based BiLSTM)等模型均可建立较准确的预测模型^[21-22]，但相对于LSTM网络，这些网络的结构较为复杂。

本文在媒体报道的数量、消费者的关注程度及网络舆情要素基础上，融合情感分析建立舆情指标体系，以LSTM神经网络为核心构建食品安全网络事件预警模型。考虑到网络事件预警缺乏期望输出，引入层次分析法(analytic hierarchy process, AHP)算法对指标数据进行融合计算，并以此作为LSTM神经网络的期望输出；利用LSTM神经网络从指标数据中学习并挖掘出事件指标数据之间的依赖关系，对食品安全事件进行预警分析，为食品安全监督和管理提供数据支撑。

1 基于层次结构的食品安全网络舆情指标体系 1.1 指标体系模型

建立合适的食品安全网络舆情指标体系是能够有效实现食品安全风险预测和预警的前提。针对舆情预警指标体系已经有许多研究成果，已有文献中提出了关于舆情指标选取的一些基本原则^{[4, 23]}，归纳起来有以下几点：1)指标应具有代表性，选取尽可能准确、对舆情确有影响的因素；2)指标应尽可能量化，客观地反映出舆情的状态，对于无法量化的指标应该进行定性分析；3)指标应该尽可能全面，以便能够全面地对舆情的趋势进行研判。

从上述基本原则可以看出，对于舆情指标体系的建立，首先需要有科学的依据，能够客观反映出舆情的状态及发展趋势；另外还应该是可操作的，比如需要能够进行定量或定性分析，过于抽象的指标是没有意义的；再则对于舆情风险的研判不能片面，这就要求指标选取时需要尽可能的全面。从结构上来看，网络舆情具有多面性，同时舆情结构的每一层面都包含许多具体的舆情要素。因此，从整体上来看，网络舆情的特征体系是一个多层次的结构，并且构建的网络舆情指标体系需真实、实时地反映舆情动态。

综上所述，结合网络舆情特征，为全面反映出舆情的状态及趋势，需要构建一个多层次、多角度的指标体系结构。文献[23]通过分层次处理，根据不同的层次选择不同的方向，再从多个方向进行指标体系的构建，依托此结构模型设计的指标体系能够很好地反映出舆情的多面性。此结构模型对本文工作提供了很大的参考价值。

1.2 指标体系构建

通过对食品安全网络的特征进行分析，在网络舆情指标体系模型的基础上，利用网络爬虫从互联网中抓取与食品安全相关的舆情数据，构建三层食品安全事件预警指标体系，具体流程如下：首先利用文本聚类技术获取事件的基本信息；再从普通网络用户的角度出发，就针对发生的食品安全事件所发表的意见言论进行文本挖掘；最后结合情感分析方法进行情感倾向判定，实现食品安全网络舆情指标体系相关指标值的采集。数据源方面，以聚类算法中聚类形成的新闻报道簇作为事件基础信息，网络言论则是通过抓取微博相关博文、评论和转发等信息构成，最终形成基于微博和新闻的网络舆情预警指标体系，其中微博相关6个指标、新闻相关4个指标。具体的指标体系结构如图 1所示。针对图 1的网络舆情体系，分别对各指标进行详细说明如下：

图 1 基于层次结构的食品安全事件预警指标体系 Fig.1 The food safety event warning index system based on network data

1) 新闻数事件相关的新闻报道数量，该数值与事件关注度正相关；

2) 网站数发表或转载事件相关新闻报道的网站数量，该数值与事件关注度正相关；

3) 微博数事件相关的微博数量，该数值与事件关注度正相关；

4) 微博点赞数所有与事件相关微博的点赞总数，该数值与事件关注度正相关；

5) 微博转发数所有与事件相关微博的转发总数，该数值与事件关注度正相关；

6) 微博评论数所有与事件相关微博的评论总数，该数值与事件关注度正相关；

7) 新闻正面数事件相关的新闻中，情感分析值为正值的数量，该数值与事件情感倾向正相关；

8) 新闻负面数事件相关的新闻中，情感分析值为负值的数量，该数值与事件情感倾向负相关；

9) 微博正面数事件相关的微博中，情感分析值为正值的数量，该数值与事件情感倾向正相关；

10) 微博负面数事件相关的微博中，情感分析值为负值的数量，该数值与事件情感倾向负相关。

2 基于层次分析的长短记忆网络(AHP-LSTM)的食品安全舆情预警模型

传统的神经网络模型由于数据类型的持续增多和数据复杂性的增加，面临着建模困难、预测精度不达标等诸多问题。文献[18]提出的基于深度学习的长短期记忆网络，具有收敛快、预测精度高等特点，是目前最先进的递归神经网络之一。因此，本文基于层次结构的食品安全网络舆情指标体系，结合LSTM构建食品安全网络事件预警模型。对于神经网络而言，为了取得较好的训练效果，需要有科学有效的训练数据，包括输入数据与期望输出数据。在本文的场景下，模型的输入数据可根据舆情指标体系获取，但缺乏标准的期望输出数据。为了解决这一问题，引入文献[24]中提出的基于关联函数差分驱动的层次分析算法，用于对指标体系数据进行融合计算，并将融合计算结果作为对应输入数据的期望输出，用来构建完整的预警模型。

2.1 基于关联函数差分驱动的层次分析算法

层次分析法是一种将复杂问题划分为多个层次结构的、多目标的方法，该方法可将定性与定量相结合。AHP方法的3个阶段包括: a)识别因素和建立层次优先排序模型；b)建立问卷调查和收集数据；c)寻找每个风险因素的权重。传统的层次分析法在评价过程中有很多的不足，如当指标过多(超过9个)或数据量过大时，对指标重要程度的判断将及其复杂和困难且计算精度也会因此受到影响。此外传统的层次分析法多用专家决策法，具有很强的主观臆断性，容易给结构的准确度带来偏差^[12]。为了解决上述问题，采用文献[24]中提出的基于关联函数差分驱动的AHP算法，其基本原理如下。

1) 构造下侧关联函数

$ k_{i j}(x)= \begin{cases}0, & x \notin\left[x_{j}(1), x_{j}(4)\right] \\ \frac{x_{i j}-x_{j}(1)}{x_{j}(2)-x_{j}(1)}, & x \in\left[x_{j}(1), x_{j}(2)\right] \\ 1, & x \in\left[x_{j}(2), x_{j}(3)\right] \\ \frac{x_{j}(4)-x_{i j}}{x_{j}(4)-x_{j}(2)}, & x \in\left[x_{j}(3), x_{j}(4)\right]\end{cases} $

(1)

式中，i=1, 2, …, n; j=1, 2, …, m，其中n为样本数，m为指标数。

2) 计算信息矩阵

$ \boldsymbol{K}_{n \times m}=\left[\begin{array}{cccc} k_{11} & k_{12} & \cdots & k_{1 m} \\ k_{21} & k_{22} & \cdots & k_{2 m} \\ \vdots & \vdots & \ddots & \vdots \\ k_{n 1} & k_{n 2} & \cdots & k_{n m} \end{array}\right] $

(2)

3) 中心归一化

$ k_{i j}^{\prime}=\left(k_{i j}-\bar{k}_{j}\right) / S_{j}, \quad i=1,2, \cdots, n ; j=1,2, \cdots, m $

(3)

式中，

$ \bar{k}_{j}=\frac{1}{n} \sum\limits_{i=1}^{n} k_{i j} $

(4)

$ S_{j}=\sqrt{\frac{1}{n}} \sum\limits_{i=1}^{n}\left(k_{i j}-\bar{k}_{j}\right), \quad j=1,2, \cdots, m $

(5)

4) 获得正矩阵R_n×m^j

$ \boldsymbol{R}_{n \times m}^{j}=\left[\begin{array}{cccc} \boldsymbol{r}_{11} & \boldsymbol{r}_{12} & \cdots & \boldsymbol{r}_{1 m} \\ \boldsymbol{r}_{21} & \boldsymbol{r}_{22} & \cdots & \boldsymbol{r}_{2 m} \\ \vdots & \vdots & \ddots & \vdots \\ \boldsymbol{r}_{n 1} & \boldsymbol{r}_{n 2} & \cdots & \boldsymbol{r}_{n m} \end{array}\right] $

(6)

5) 由R_n×m^j计算正交矩阵

$ \boldsymbol{C} \boldsymbol{O} \boldsymbol{R}=\boldsymbol{R} \boldsymbol{R}^{\mathrm{T}}=\left[\begin{array}{cccc} o_{11} & o_{12} & \cdots & o_{1 m} \\ o_{21} & o_{22} & \cdots & o_{2 m} \\ \vdots & \vdots & \ddots & \vdots \\ o_{n 1} & o_{n 2} & \cdots & o_{n m} \end{array}\right] $

(7)

6) 计算对称矩阵COR的特征向量

$ \boldsymbol{W}=\left(w_{1}, w_{2}, \cdots, w_{n}\right)^{\mathrm{T}} $

(8)

本文采用方根法计算各指标的熵值权重w_i，计算公式如式(9)所示。

$ w_{i}=o_{i} / o, \quad i=1,2, \cdots, n $

(9)

式中，${o_i} = {\left( {\prod\limits_{j = 1}^n {{o_{ij}}} } \right)^{\frac{1}{n}}}$, i=1, 2, …, n; $o = \sum\limits_{i = 1}^n {{o_i}} $。

7) 结合权重W获取融合输入数据

$ \boldsymbol{X}^{\mathrm{T}} \boldsymbol{W}=\left[\begin{array}{cccc} x_{11} & x_{12} & \cdots & x_{1 m} \\ x_{21} & x_{22} & \cdots & x_{2 m} \\ \vdots & \vdots & \ddots & \vdots \\ x_{n 1} & x_{n 2} & \cdots & x_{n m} \end{array}\right]^{\mathrm{T}}\left[\begin{array}{c} w_{1} \\ w_{2} \\ \vdots \\ w_{n} \end{array}\right] $

(10)

2.2 长短期记忆网络

长短期记忆网络是一种时间循环神经网络^[25]，是循环神经网络(recurrent neural network, RNN)的改进。LSTM可以学习长期依赖关系，有效解决梯度消失和梯度爆炸的问题，在较长的序列中相比于传统的循环神经网络有更好的表现，且适用于非线性模型的预测。与所有的RNN相同，LSTM神经网络有着一种重复神经网络模块的链式形式；不同的是在LSTM中这个重复模块具有4层神经网络层的结构，并以一种特殊的方式进行交互。LSTM结构图如图 2所示，其中A代表LSTM单元。经典的LSTM存储块包含存储单元状态、遗忘门、输入门和输出门4个部分。

图 2 LSTM结构图 Fig.2 Structure of the LSTM

LSTM通过输入门、遗忘门和输出门来实现信息的保护和控制，其主要流程如下。

1) 通过遗忘门决定从细胞状态中需要丢弃的信息，如式(11)所示。

$ f_{t}=\sigma\left(\boldsymbol{W}_{\mathrm{f}}\left[h_{t-1}, \boldsymbol{x}_{t}\right]+b_{\mathrm{f}}\right) $

(11)

式中，σ为sigmoid函数，W_f为遗忘门的权重矩阵，b_f为遗忘门的偏置项。遗忘门会读取前一个细胞的输出h_t－1和当前细胞的输入x_t的信息，从而输出一个介于[0, 1]之间的向量来表示细胞状态C_t－1中的信息保留或丢弃多少。

2) 在输入门中确定允许多少新的信息加入到细胞状态中。首先在“input gate layer”的sigmoid层决定信息的更新与否，其次在tanh层生成一个向量，作为更新内容，最后把以上两部分结合起来对细胞状态进行更新。

$ i_{t}=\sigma\left(\boldsymbol{W}_{\mathrm{i}}\left[h_{t-1}, \boldsymbol{x}_{t}\right]+b_{\mathrm{i}}\right) $

(12)

$ \widetilde{\boldsymbol{C}}_{t}=\tanh \left(\boldsymbol{W}_{\mathrm{C}}\left[h_{t-1}, \boldsymbol{x}_{t}\right]+b_{\mathrm{C}}\right) $

(13)

式中，W_*是输入门的权重矩阵，b_*是输入门的偏置项。

3) 更新旧细胞状态时间，丢弃决定丢弃的信息，更新新状态。

$ \boldsymbol{C}_{t}=f_{t} \boldsymbol{C}_{t-1}+i_{t} \widetilde{\boldsymbol{C}}_{t} $

(14)

4) 在输出门中确定最终要输出的内容。将细胞状态经tanh处理得到[-1, 1]区间内的一个值，并将其与sigmoid门的输出相乘，即为最终输出部分。

$ o_{t}=\sigma\left(\boldsymbol{W}_{\mathrm{o}}\left[h_{t-1}, \boldsymbol{x}_{t}\right]+b_{\mathrm{o}}\right) $

(15)

$ h_{t}=o_{t} \tanh \left(\boldsymbol{C}_{t}\right) $

(16)

LSTM通过门控状态来控制传输状态，适用于需要长期记忆的任务。

2.3 预警模型的建立 2.3.1 框架设计

基于层次结构的食品安全网络舆情指标体系，采用改进的AHP结合LSTM建立AHP-LSTM食品安全预警模型，对食品安全事件进行网络舆情预警分析。预警模型框架如图 3所示。

图 3 基于AHP-LSTM的食品安全网络舆情预警模型框架 Fig.3 Framework of the AHP-LSTM food safety network public opinion warning model

本文所提AHP-LSTM模型建模过程如下。

1) 使用AHP算法对训练数据集Samples进行分析，得到数据特征分量并组成新的样本集合Samples’。

2) 构建LSTM网络。将训练集作为LSTM网络的输入，将步骤1)中的Samples’作为LSTM网络的期望输出。

3) 训练模型。设置LSTM相关参数，执行网络训练过程。

4) 将测试数据作为LSTM的输入，根据预期输出构建网络舆情预警模型，进行食品安全事件预警。

2.3.2 模型训练

选取109个食品安全相关事件数据作为训练样本，对预警模型进行训练(数据预处理过程见3.1.1节)。首先确定模型参数，对于隐含层节点数和学习效率的调参采用控制变量的方法，先确定非关键参数，重复训练的次数足够多(本文为1 000次)，设置学习效率η，并以一定的速度对其进行衰减，将结果归一化处理至[0, 1.0]范围。为了避免随机初始化效果不理想，需要进行多次训练，选择初始化效果最好的，最终确定最优参数^[26-27]。部分调参结果如表 1所示，p为神经网络的节点数。

下载CSV 表 1 部分调参结果 Table 1 Results of some parameter adjustments

3 结果与讨论 3.1 基于AHP-LSTM的食品安全网络舆情预警实验 3.1.1 数据获取与预处理

通过网络爬虫从互联网中抓取与食品安全相关的网络文本，利用文本聚类技术提取食品安全相关事件，并依据指标体系计算事件指标值。对于指标数据中的情感分析，本文通过开源工具SnowNLP实现。SnowNLP是一个用Python语言编写的类库，主要用于处理中文文本，可实现分词、词性标注、情感分析、汉字转拼音、繁体转简体、关键词提取以及文本摘要等功能。在SnowNLP中，情感分类的基本模型是贝叶斯模型, 对于有c₁和c₂两个分类的问题来说，其特征为w₁, w₂, …, w_n，特征之间相互独立，情感倾向P的计算过程如式(17)所示。

$ P\left(c_{1} / w_{1}, w_{2}, \cdots, w_{n}\right)=\frac{P\left(w_{1}, w_{2}, \cdots, w_{n} / c_{1}\right) P\left(c_{1}\right)}{P\left(w_{1}, w_{2}, \cdots, w_{n}\right)} $

(17)

式中，P(w₁, w₂, …, w_n)=P(w₁, w₂, …, w_n/c₁)·P(c₁)+ P(w₁, w₂, …, w_n/c₂)P(c₂)。

情感倾向取值范围为[0, 1]，越接近1表明情感越积极/正面，反之则越消极/负面。

从获取的食品安全事件数据中选择10起典型的食品安全事件，对构建的食品安全舆情预警模型处理过程及结果进行展示。选取事件如表 2所示。使用改进的AHP算法将事件相关指标数据进行数据融合，指标数据及融合结果如表 3所示。

下载CSV 表 2 典型食品安全事件 Table 2 Typical food safety incidents statistics

表 3 指标体系数据及AHP融合结果 Table 3 Index system data and AHP fusion results

编号	新闻数	新闻正面数	新闻负面数	网站数	微博数	点赞数	评论数	转发数	微博正面数	微博负面数	AHP融合值
1	2 281	1 321	641	974	719	2 281	1 035	2 653	437	215	0.97
2	4 108	1 644	2 137	3 942	252	1 357	1 358	2 056	112	81	0.84
3	1 394	530	763	1 231	429	1 141	394	447	127	288	0.82
4	608	487	106	587	588	7 748	1 177	1 950	372	180	0.27
5	167	36	129	134	42	130	67	182	8	33	0.99
6	407	28	363	121	48	23	207	250	11	36	0.75
7	136	40	91	92	104	146	198	132	58	34	0.93
8	138	39	86	124	22	1 509	395	205	11	11	0.28
9	133	41	80	109	100	85	189	126	52	44	0.87
10	128	10	115	82	32	2	15	16	12	20	0.73

下载CSV 表 3 指标体系数据及AHP融合结果 Table 3 Index system data and AHP fusion results

3.1.2 预警等级划分

根据《国家突发公共事件总体应急预案》，有文献将食品安全事件舆情预警等级分为I~Ⅳ 4个等级^[28]。I级代表特别严重，II级为严重，III级是较严重，Ⅳ级为一般严重。同时为了方便理解，将[0, 1]平均划分为4个区间，区间从低到高依次对应不同的预警级别状态^[29]。预警等级划分如表 4所示。

下载CSV 表 4 预警等级划分 Table 4 Sample data for the event early warning index system

3.2 结果分析

本文选取56个数据组成样本测试集对AHP-LSTM、传统AHP、AHP-BP、AHP-RBF这几个不同的模型进行验证，测试结果的预警正确率如表 5所示。其中，AHP-LSTM模型的预警正确率达到71.4%，在所有模型中表现最佳。

下载CSV 表 5 AHP-LSTM模型和传统模型预警正确率对比 Table 5 Warning accuracy comparison of AHP-LSTM and traditional AHP models

图 4展示了4种模型的预测结果曲线，可以看出LSTM模型的预测结果与期望值曲线基本一致，而其他模型均有相对较大误差。例如BP网络在样例事件17、20、26、27等处有明显与期望值不符的预测结果，而RBF神经网络在样例事件19和事件25处的预警结果与实际期望值不符。整体而言，本文提出的AHP-LSTM模型的稳定性和有效性均相对较高。

图 4 LSTM预警模型与传统预警模型的结果对比 Fig.4 Comparison of experimental results for various early warning models

在模型训练方面，AHP-LSTM模型能在200次以内达到训练要求，并且误差较小，训练平均相对误差为0.503%。而AHP-BP模型需要500次达到训练要求、平均相对误差为1.27%，AHP-RBF模型需要300次达到训练要求、平均相对误差为1.61%。图 5展示了AHP-LSTM模型训练次数与loss值(即损失函数，代表模型输出与真实结果之间的距离)的对应关系，可以看出随着训练次数的增多loss值不断减小，即误差减小。

图 5 模型训练次数与loss的关系 Fig.5 Relationship between model training times and loss

由以上结果可知，与传统模型相比，AHP-LSTM神经网络在食品安全事件预警方面具有更好的预警效果。

3.3 案例讨论

针对实验中部分案例事件预警结果进行分析，对应事件编号及相应预警结果如表 6所示。

下载CSV 表 6 部分案例预警结果 Table 6 Early warning results for selected cases

7号事件—禁用农药豇豆媒体披露，查出海南产豇豆含有禁用农药，在武汉、广州、深圳、杭州等地先后查出毒豇豆，发现含有高毒农药水胺硫磷。该事件中，AHP-LSTM预测准确、偏差较小。对应AHP-BP预警等级比实际等级高了一级，传统AHP实预警等级则相对低了一级，而AHP-RBF实际输出为0.85，预警等级高了两级，偏差较大。

18号事件—甲醇白酒台湾宜兰发生疑似私劣酒中毒事件，因食用假米酒而引起甲醇中毒，中毒死亡人数达8人。AHP-LSTM输出值与期望输出最为接近，预警等级一致。对应AHP-BP与传统AHP预警等级相对实际预警等级均高了一级，同时，AHP-RBF实际输出为0.80，预警等级高了两级，偏差较大。

21号事件—真功夫“排骨门”真功夫排骨中发现胶线、胶粒、脓包、石头，并有异味。AHP-LSTM输出值与期望输出最为接近，预警等级一致。对应AHP-BP和传统AHP模型预警等级比实际预警等级低了一级，而AHP-RBF再次出现较大偏差，预警等级低了两级。

55号事件—饮料砷超标海口部分批发市场、商场、农贸市场、超市等销售农夫果园、水溶C等饮料的总砷超标。在该事件中，AHP预测结果最为准确，而AHP-LSTM偏差较大。经分析，该事件中，相关微博、新闻数据较少，且时间周期较短，不利于网络训练。

从上述具体案例可以看出，相比于传统AHP模型，神经网络模型能够从一定程度上提高预警的准确性，但预警的有效性与模型的选择有很大关系，例如，AHP-BP、AHP-LSTM在多数情况下均能取得不错的预警结果，但AHP-RBF则多次出现较大的预警偏差。

4 结束语

提出了基于层次分析的长短记忆神经网络食品安全网络舆情预警模型AHP-LSTM。通过特征信息的提取，建立食品安全网络事件指标体系结构，将事件指标数据作为LSTM神经网络的输入，使用AHP将指标数据进行数据融合，从而得到风险级别并作为LSTM神经网络的期望输出。训练后的预警模型结果可以用于食品安全事件的风险预警。将该模型与传统模型的准确率进行对比发现，改进后的模型的准确性明显高于传统的预警模型，能更有效地预测食品安全事件的发展趋势，证明了所提模型的科学性与可靠性。本文模型可较为准确地预测食品安全事件趋势，为相关部门提供一定的理论依据与数据支撑，从而更好地采取应对措施。在将来的研究中，我们将运用BiLSTM、attention based BiLSTM等改进的深度学习方法改善本文所提方法的不足，从而更好地适应食品安全事件的预警分析，提高预警分析能力。

参考文献

[1]	FELLENOR J, BARNETT J, POTTER C, et al. The social amplification of risk on Twitter: the case of ash dieback disease in the United Kingdom[J]. Journal of Risk Research, 2018, 21(10): 1163-1183. DOI:10.1080/13669877.2017.1281339
[2]	HANSEN D L, SHNEIDERMAN B, SMITH M A, et al. Analyzing social media networks with NodeXL[M]. 2nd ed. Amsterdam: Elsevier Inc., 2020: 11-29.
[3]	IMRAN M, CASTILLO C, DIAZ F, et al. Processing social media messages in mass emergency: survey summary [C]//Companion of the The Web Conference. Lyon, 2018: 507-511.
[4]	杨柳, 罗文倩, 邓春林, 等. 基于灰色关联分析的舆情分级与预警模型研究[J]. 情报科学, 2020, 38(8): 28-34. YANG L, LUO W Q, DENG C L, et al. Classification and early warning model of public opinion based on grey correlation analysis[J]. Information Science, 2020, 38(8): 28-34. (in Chinese)
[5]	王宁, 赵胜洋, 单晓红. 基于灰色系统理论的网络舆情预测与分级方法研究[J]. 情报理论与实践, 2019, 42(2): 120-126. WANG N, ZHAO S Y, SHAN X H. Method of network public opinion prediction and grading based on grey system theory[J]. Information Studies: Theory & Application, 2019, 42(2): 120-126. (in Chinese)
[6]	王英, 龚花萍. 基于情感维度的大数据网络舆情情感倾向性分析研究—以"南昌大学自主保洁"微博舆情事件为例[J]. 情报科学, 2017, 35(4): 37-42. WANG Y, GONG H P. Analysis of sentiment tendency of big data online public opinion based on the sentiment dimension—Taking " the Independent Cleaning of Nanchang University" Weibo public opinion event as an example[J]. Information Science, 2017, 35(4): 37-42. (in Chinese)
[7]	LI S Z, XU Y, HE Y L, et al. Research on public opinion warning based on analytic hierarchy process integrated back propagation neural network [C]//2017 Chinese Automation Congress (CAC). Jinan, 2017: 2440-2445.
[8]	REUTER C, KAUFHOLD M A, SCHMID S, et al. The impact of risk cultures: citizens' perception of social media use in emergencies across Europe[J]. Technological Forecasting & Social Change, 2019, 148: 119724.
[9]	李笑曼, 臧明伍, 赵洪静, 等. 基于监督抽检数据的肉类食品安全风险分析及预测[J]. 肉类研究, 2019, 33(1): 42-49. LI X M, ZANG M W, ZHAO H J, et al. Analysis and prediction of meat product safety based on supervision and sampling data[J]. Meat Research, 2019, 33(1): 42-49. (in Chinese)
[10]	董曼, 李洁, 尹佳, 等. 基于贝叶斯网络的酱卤肉制品安全预警研究[J]. 食品安全质量检测学报, 2021, 12(1): 27-33. DONG M, LI J, YIN J, et al. Research on safety early warning of sauced meat products based on Bayesian network[J]. Journal of Food Safety and Quality, 2021, 12(1): 27-33. (in Chinese)
[11]	李文, 李民赞, 孙明. 基于PCA和神经网络的农残含量预测模型研究[J]. 测控技术, 2018, 37(12): 34-37. LI W, LI M Z, SUN M. Study on prediction model of pesticide residue content based on PCA and artificial neural network[J]. Measurement & Control Technology, 2018, 37(12): 34-37. (in Chinese)
[12]	GENG Z Q, ZHAO S S, TAO G C, et al. Early warning modeling and analysis based on analytic hierarchy process integrated extreme learning machine (AHP-ELM): application to food safety[J]. Food Control, 2017, 78: 33-42. DOI:10.1016/j.foodcont.2017.02.045
[13]	谢小良, 谢冰琪, 左锦霞. 基于贝叶斯网络的高校食堂食品安全预警研究[J]. 现代预防医学, 2020, 47(18): 3304-3308. XIE X L, XIE B Q, ZUO J X. Research on early warning of food safety in college canteen based on Bayesian network[J]. Modern Preventive Medicine, 2020, 47(18): 3304-3308. (in Chinese)
[14]	卢大安. 大数据挖掘在食品安全风险预警领域的应用[J]. 食品安全导刊, 2019(36): 79. LU D A. The application of big data mining in food safety alert field[J]. China Food Safety Magazine, 2019(36): 79. (in Chinese)
[15]	蔡照鹏, 徐林. 易腐食品安全预警云体系构建研究[J]. 河南城建学院学报, 2018, 27(6): 64-70. CAI Z P, XU L. Early warning method of fresh chicken preservation period based on SVM[J]. Journal of Henan University of Urban Construction, 2018, 27(6): 64-70. (in Chinese)
[16]	汪颢懿, 卞玉芳, 张瑞芳, 等. 基于极限学习机的肉制品质量风险预测研究[J]. 计算机仿真, 2019, 36(10): 413-418. WANG H Y, BIAN Y F, ZHANG R F, et al. Prediction of meat product quality risk based on extreme learning machine[J]. Computer Simulation, 2019, 36(10): 413-418. (in Chinese) DOI:10.3969/j.issn.1006-9348.2019.10.086
[17]	CUI S Y, LI C, CHEN Z, et al. Research on risk prediction of dyslipidemia in steel workers based on recurrent neural network and LSTM neural network[J]. IEEE Access, 2020, 8: 34153-34161. DOI:10.1109/ACCESS.2020.2974887
[18]	HOCHREITER S, SCHMIDHUBER J. Long short-term memory[J]. Neural Computation, 1997, 9(8): 1735-1780. DOI:10.1162/neco.1997.9.8.1735
[19]	SUTSKEVER I, VINYALS O, LE Q V. Sequence to sequence learning with neural networks[C]//28th Conference on Neural Information Processing Systems(NIPS). Montreal, 2014.
[20]	SCHMIDHUBER J. Deep learning in neural networks: an overview[J]. Neural Networks, 2015, 61: 85-117.
[21]	吴汉瑜, 严江, 黄少滨, 等. 用于文本分类的CNN_BiLSTM_Attention混合模型[J]. 计算机科学, 2020, 47(S2): 33-37, 44. WU H Y, YAN J, HUANG S B, et al. CNN_BiLSTM_Attention hybrid model for text classification[J]. Computer Science, 2020, 47(S2): 33-37, 44. (in Chinese)
[22]	LI S Z, XIE G, REN J C, et al. Urban PM_{2. 5} concentration prediction via attention-based CNN-LSTM[J]. Applied Sciences, 2020, 10(6): 1953. DOI:10.3390/app10061953
[23]	黄微, 徐烨, 刘熠, 等. 多媒体网络舆情衰退期形成的评估指标体系构建研究[J]. 情报理论与实践, 2020, 43(1): 76-81. HUANG W, XU Y, LIU Y, et al. Research on the construction of evaluation index system for the formation of decline period of multimedia network public opinion[J]. Information Studies: Theory & Application, 2020, 43(1): 76-81. (in Chinese)
[24]	HAN Y M, GENG Z Q, LIU Q Y. Energy efficiency evaluation based on data envelopment analysis integrated analytic hierarchy process in ethylene production[J]. Chinese Journal of Chemical Engineering, 2014, 22(11): 1279-1284.
[25]	SARKAR M, BRUYN A D. LSTM response models for direct marketing analytics: replacing feature engineering with deep learning[J]. Journal of Interactive Marketing, 2021, 53: 80-95. DOI:10.1016/j.intmar.2020.07.002
[26]	TRAN Q K, SONG S K. Computer vision in precipitation nowcasting: applying image quality assessment metrics for training deep neural networks[J]. Atmosphere, 2019, 10(5): 244. DOI:10.3390/atmos10050244
[27]	LUO C Y, LI X T, YE Y M. PFST-LSTM: a spatiotemporal LSTM model with pseudoflow prediction for precipitation nowcasting[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2021, 14: 843-857. DOI:10.1109/JSTARS.2020.3040648
[28]	孙玲芳, 周加波, 林伟健, 等. 基于BP神经网络和遗传算法的网络舆情危机预警研究[J]. 情报杂志, 2014, 33(11): 18-24. SUN L F, ZHOU J B, LIN W J, et al. On network public opinion crisis early warning based on the BP neural network and genetic algorithm[J]. Journal of Intelligence, 2014, 33(11): 18-24. (in Chinese) DOI:10.3969/j.issn.1002-1965.2014.11.004
[29]	肖琳琳. 农产品加工业安全预警研究[D]. 北京: 北京交通大学, 2014. XIAO L L. The research for security early warning on agricultural product processing industry [D]. Beijing: Beijing Jiaotong University, 2014. (in Chinese)