基于BP神经网络对城市空气污染数据真实性的判别
摘要:目的针对城市空气污染数据的真实性,收集并处理京津冀、长三角和珠三角地区的空气质量数 据,判别数据的真实性,并给出提高空气污染数据真实性的建议。方法使用因子分析、多元统计等方法构建 BP神经网络和多元线性回归模型,利用MATLAB、SPSS和excel等软件,分析空气质量数据的波动性,得到 各个城市空气污染物数据的真实性结果。结果天津、沧州、上海、东莞等城市的空气污染数据较为真实,而 保定、邢台、镇江、扬州、舟山,珠海等城市空气污染数据的不真实性严重。结论应当注重基层环境统计工 作,加强基层和媒体对统计数据的关注,完善软件技术设施。
关键词:空气质量;BP神经网络;MATLAB
空气质量始终是政府、环境保护部门和人民关注的热点问题。近期频繁爆发的雾霾危机也使得人们日 益关注有关监测部门发布的空气质量指标情况。去年“两会”代表和委员纷纷指责中国部分城市伪造空气 监测数据,治霾政策的制定受到来自利益相关者的阻力[1]。2016年的两会上,全国政协常委、环境保护 部副部长吴晓青表示,很高兴在今年的“十三五”规划草案中看到增加了环境质量的考核指标。自中国提 出空气质量数据监测以后,部分地方政府频繁曝出监测数据在改善,而环境质量却在持续恶化的新闻。地 方政府大气监测数据真实性的问题逐渐受到人们的关注。
1相关文献回顾
张锡颖等[2]从空气质量与气候的关系角度研究了这个问题。首先搜集京津冀、长三角、珠三角各个地区的气候和空气质量数据,然后对各个影响因素进行归一化处理,最后得出判别中国地方政府上报监测数 据真实性的方法,并且得出数据真实性的不同类型。王妮妮[3]以空气污染类型为切入点,首先搜集上海市 国控子站的日监测数据,其次对上海市空气质量进行综合评价,然后利用虹桥机场气象监测站数据对上海 市的气象情况进行综合评价,最后得出上海市空气质量状况良好,并且得出了以单点位、单因子为主,多 点位、单因子为辅的空气质量异常数据联合筛选体系。
2数据的获取及假设
数据来源于中国气象局网站[4],为了便于解决问题,提出以下假设:(1)城市空气质量数据的真实性 具有连续性,即这个时间段数据真实,则下个时间段数据也真实;(2)多元线性回归中随机误差项ε是一 个平均值或期望值为零的随机变量;(3)解释变量的所有观测值,随机误差项的方差都是相同的;(4)忽 略除了空气污染物含量外其他影响AQI的因素;(5)不考虑极端天气对空气污染物含量的影响。
3关于BP神经网络
3.1研究思路
以京津冀、长三角和珠三角地区代表城市不同时间的PM10、CO、NO2、SO2的4个指标作为输入数 据,PM2.5作为输出数据构建BP神经网络模型;接着将该地区其他城市的PM10、CO、NO2、SO24个指 标输入到前面构建的BP神经网络模型中,得到这些城市PM2.5的预测数值,通过这些预测PM2.5的数值 与代表城市PM2.5真实数据比较,最后筛选出该地区空气质量数据比较真实的城市。
3.2研究方法
BP神经网络是一种多层前反馈神经网络,一般存在等于或者大于三层神经元。BP神经网络主要包括 输入层、中间层和输出层三部分,上、下层之间是全链接,而同一层的相互之间没有链接。标准的BP神 经网络算法核心是“负梯度下降原理”,即BP神经网络的误差总是沿着误差降落最迅速的目标进行调整。 建立空气质量污染指标数据的BP神经网络模型(图1)。
4城市空气污染数据的真实性判别
4.1研究思路
用SPSS进行因子分析,利用污染物之间的相关性减少污染物变量的个数,进行降维处理,然后建立 多元线性回归模型,对各个城市的犃犙犐指数进行预测,最后进行误差分析及拟合优度检验,比较确定空 气质量数据的真实性。
4.2研究方法
因子分析是指研究从变量群中提取公共因子的统计技术,可以在许多变量中找出隐藏的、具有代表性 的因子,还可以用来检验变量间关系的假设。因子分析是一种十分实用的降低变量维数的方法。因子分析 的主要步骤有:①确认待分析的原始变量是否适合作因子分析;②构造因子变量;③利用旋转方法使因子 变量具有可解释性;④计算每个样本的因子变量得分。 因子分析模型中,假定每个原始变量由两部分组成:共同因子和唯一因子。共同因子是各个原始变量 所共有的因子,解释变量之间的相关关系。唯一因子是每个原始变量所特有的因子,表示该变量不能被共 同因子解释的部分。原始变量与因子分析时抽出的共同因子的相关关系用因子负荷表示。
5建议
根据城市空气污染数据的真实性判别分析结果,针对空气污染数据真实性问题,提出以下建议。
1)重视基层环境统计工作,强化人员配置,提高统计人员的思想意识,把统计工作放在首要位置, 认真对待,耐心负责,同时设置专职统计的各项岗位,挑选业务能力强、掌握统计学相关知识的专业人才 担任统计相关工作,加强对统计人员专业知识和职业道德的教育,努力提高基层统计人员的综合素质和能 力。
2)加强基层和媒体对统计数据的监测,随着社会的发展和人民群众监督意识的加强,公众参与统计 工作的诉求也越来越强,对加大环境信息公开的范围和力度都有所上升。政府通过鼓励各大门户网站或者 地方媒体对各级政府公布的统计数据进行监督检验,来提高统计数据的真实性。要加强基层环保监测能 力,使统计数据能够反映真实的情况,建立统计各部门的沟通机制,有序高效的将统计数据分配给各部 门,每个部门互相监督,避免“越位”现象发生。 3)完善软件技术设施,定期培训和检测,要进一步完善软件建设,加强统计人员统计软件技术的培 训和学习教育,并定期对软件的正确性进行检测和维修,使统计人员工作效率得以提高,统计的真实性得 以加强。
参考文献:
[1]百度百科.空气污染数据判别[EB/OL].[20161002].
[2]张锡颖,曲红伟.城市空气污染数据的真实性判别及分析研究[J].科技经济导刊,2016(11):123124.
[3]王妮妮.上海市空气质量监测数据的规律研究及在数据审核中的应用[D].上海:东华大学,2010.
[4]司守奎,孙玺菁.数学建模算法与应用[M].北京:国防工业出版社,2015.
作者陈璐璐1,陈富媛2,杨鹏辉2,黄艳红2,陈梦倩2
《基于BP神经网络对城市空气污染数据真实性的判别》
- 职称论文刊发主体资格的
- 政法论文浅析工会法主体
- 化学在初中教学中的情感
- 中学教育论文思想政治方
- 法治论文投稿法治型市场
- 杂志社论文发表浅析推动
- 新疆教育报投稿浅析学生
- 分男女招生录取的合宪性
最新优质论文
- 新闻专业有哪些职称
- 论文发表三步曲
- 职称评定需要发表什么样
- 浙江师范大学学报编辑部
- 如何提供职称论文的知网
- 职称晋级论文检索才认可
- 教师类职称论文一般多少
- 医学领域cscd期刊怎么查找
论文发表问题热点
- 电力系统职称核心期刊怎
- 毕业及职称论文发表需要
- 发表职称论文如何鉴别期
- 《教育探索》核心级教育
- 博士生毕业论文答辩技巧
- 工程管理专业论文摘要准
- 硕士从助工晋升中级职称
- 简述机械工程师基础考试