基于RBF神经网络用烤烟化学指标预测平衡含水率

作者:吴雪芹 王建民  字数:3704

摘 要:为了解烤烟烟叶各项化学指标与其平衡含水率间的关系,检测了76种国内外烤烟烟叶样品的吸湿、解湿平衡含水率、总糖、还原糖、总氮、烟碱、氯、钾、pH,基于RBF神经网络技术,对烟丝的吸湿和解湿含水率进行了预测分析。预测结果表明,吸湿含水率的R值为0.91,均方差为0.21;解湿含水率的R值为0.94,均方差为0.21。

关键字:化学指标;平衡含水率;RBF神经网络

烟草平衡含水率是烟草的重要物理参数之一,与烟草及其制品的加工、贮藏以及卷烟的抽吸品质间密切相关。烟草的平衡含水率由其组织结构和化学成分共同决定,且许多化学成分都会不同程度地影响其平衡含水率。本文基于RBF神经网络技术,利用烟草行业中常用的化学指标来达到预测烟草平衡含水率,从而为卷烟企业在使用烟草平衡含水率方面提供一个间接的参考。

1 RBF神经网络及其模型

神经网络作为一种通用函数逼近器,可以以任意精度近似任意非线性函数和动态系统,是高度非线性对象建模的有力工具。它对系统的先验信息要求很少,并且它具有良好的泛化能力,用它作为预测器来预测对象输出的未来值的精度很高,在非线性系统辨识、建模、控制、信号处理等领域有着重要的应用。

2 Clementine简介

Clementine是SPSS公司推出的企业级数据挖掘产品,它提供了包括神经网络、决策树、聚类分析、关联分析、因子分析、回归分析等在内的丰富的数据挖掘模型,它通过节点的连接来完成整个数据挖掘过程,提供机器学习和许多相关统计模型,使数据挖掘的结果更具有可靠性与精确性。本文选用SPSS公司的Clementine来进行RBF网络模型的实现,Clemetine中的工具箱使RBF网络的建立、训练以及预测都变得非常简单,而且训练过程及效果非常直观,使神经网络应用于实际具有更大的可行性。

3 实验部分

3.1材料与方法

3.1.1实验材料

共76种实验用烤烟烟丝,其中国内选用云南、河南、湖南、福建、湖北、贵州、四川、辽宁等10多个地区、不同部位、不同等级烤烟烟丝61种,国外选用美国、津巴布韦、巴西烤烟烟丝15种。

3.1.2 仪器与设备

Φ700mm浓硫酸干燥器 (重庆金龙玻璃制品有限公司);AL294型电子天平(感量0.0001g,梅特勒—托利多仪器有限公司);DHG-9145A型电热鼓风干燥箱(上海一恒科技有限公司);FSJ-114型植物样本粉碎机(农牧渔业部河南扶沟科学仪器厂);AA3连续流动分析仪(德国BRAN-LUEBBE公司);S-3C型精密酸度计(上海大普仪器有限公司)。

3.1.3 试验方法

3.1.3.1 平衡含水率的测定

称取样品约5g置入铝盒内,经烘箱法,在温度为40±2℃下烘4h,冷却至室温后精确称量样品及铝盒质量,在标准温湿度条件下(温度22±1℃、相对湿度60±2%)进行平衡含水率测定 [11]。由ISO恒温恒湿室控制环境温、湿度,相对湿度60%的浓硫酸干燥器控制试验湿度。每间隔一定时间称量样品质量,至两次称量值相差不超过0.002g,视为达到平衡状态,烘箱法[12]测量吸湿平衡含水率。测量解湿含水率时需样品在高湿度条件下平衡3d,然后再放置于标准条件下用相同方法进行测量。

3.1.3.2 化学成分的测定

采用AA3连续流动分析仪检测样品的总糖、还原糖、烟碱、氯、钾、总氮。采用加拿大健康委员会推荐的浸提法[13]测定pH值。

3.1.3.3 数据分析方法

采用DPS7.05对试验数据进行归一化处理,采用Clemetine11.1对试验数据进行RBF神经网络预测分析。

4 结果与分析

4.1 RBF神经网络预测

4.1.1 RBF神经网络模型的建立及参数的设定

为消除数据中各分量之间可能由于单位不同而产生的影响,首先对76种烟丝化学指标进行归一化处理,以使得各种对应于化学成分的向量都为无量纲的单位的向量。本试验用于神经网络建立预测模型的数据61种,验证模型的数据15种,验证模型基本包括国内外大多数地区的不同部位等级的烟丝样品。该模型建立的难点就是需要用相同的试验样本同时预测吸湿和解湿两组数据,这给试验模型的精度提出很高的要求,如果仅进行一组数据的预测,往往模型预测精度很高,而要同时满足两组数据的预测要求,需要对模型中的参数反复进行调试,以达到预测要求。

经过反复调试,该RBF神经网络最终确定如下参数:模型预防过度训练为75%,停止条件为默认值,模型选择为使用最佳网络,二进制集合编码,专家模式中均采用默认值,即RBF聚类为20,持续次数为30,权值动量Alpha为0.9,RBF重叠为1.0,自动计算学习速率Eta。试验所建立的模型如图1所示。

4.1.2 数据分析

通过所建立的RBF神经网络预测模型可以看出,吸湿预测模型估计的准确性为84.663,按输入的相对重要性来分,从大到小的顺序为:pH值、总糖、还原糖、钾、烟碱、氯、总氮;解湿预测模型估计的准确性为84.434,按输入的相对重要性来分,从大到小的顺序为:pH值、钾、氯、还原糖、总糖、烟碱、总氮。通过所建立的预测模型,对验证模型中的数据进行预测,,预测结果和实测值见表1。模型优化时主要考察的是预测值与标准值相关的相关系数系数(R)和均方差(RMSEP),当模型的相关系数(R)最大,均方差(RMSEP)最小时,RBF神经网络所建立的模型预测值与分析样品的实际测量值相关性最好,所建模型为最佳。

其中:Differi为第i个样品的化学标准值与预测值之差,yi是第i个样品的化学标准值,ym是所有样品的化学标准值的平均值, N为预测验证集样品数。

5 结论

基于RBF神经网络技术,利用76种国内外烟丝的化学指标,对烟丝的吸湿和解湿含水率进行了预测,预测结果表明,吸湿含水率的R值为0.91,均方差为0.21;解湿含水率的R值为0.94,均方差为0.21。

参考文献

[1] Takayoshi. Measurement of migration rate of water in cured tobacco material [J]. Food Sci Technol Res, 2003, 9 (3): 245-249.

[2] Sakamoto K, Takase K, Nakanishi Y. Effects of adsorbed water on compressive properties of tobacco cut-filler aggregate [J]. Nippon Nogeikagaku Kaishi , 1998, 72: 637-644.

[3] 阎克玉,李兴波,赵学亮,等.河南烤烟理化指标间的相关性研究[J]. 郑州轻工业学院学报(自然科学版),2000(3) :20-24.

[4] 徐安传,王超,胡巍耀,等.红大烟叶保润性与其重要致香物质间相互关系的研究初探[J].云南烟草,2006(6):17-22.

[5] 邓小华,周冀衡,陈新联,等.烟叶质量评价指标间的相关性研究[J].中国烟草学报,2008(2) :1-8.

[6] S Rcymld Chu,Rahmat Shourcshi, Manocl Tcnorio. Ncural networks for system identificxtion[J].Control Systems Magazinc,IEEE,1990,10(3):31-35

[7] J Barry Gomm, Ding Li Yu. Sclccting radial basis funotion network centers with recursive orthogonal least squares training[J].IEEE Trans, Neural Nctworks,2000,11(12):306-314.

[8] 陈文伟,黄金才.数据仓库与数据挖掘[M].北京:人民邮电出版社.2004-2

[9] 郑新奇,刘晓丽.基于Clementine 决策树的空间数据挖掘方法探讨——以平阴县安城乡为例[C]//中国测绘学会九届二次全体理事会议暨2006年学术年会论文集.2006:560-566.

[10] 邓尚民,韩靖.Clementine在电子商务环境中的数据挖掘应用[J].现代图书情报技术,2007,(10):62-65.

[11] 何保江,刘强,赵明月,等. 烟草保润性能测试方法[J].烟草科技,2009 (2) :25-28.

[12] YC/T 31-1996 烟草及烟草制品 试样的制备和水分测定 烘箱法[S].

[13] Health Canada. Tobacco Control Programme.T-310 Determination of whole tobacco pH [S]. 1999.

相关文档:
创新型展示设计教学模式探索与实践
浅析高校图书馆微信公众平台
女性管理者队伍的现状及其改善途径分析
探讨农业机械化的可持续发展
高清与标清数字电视的兼容系统研究
关于农村金融机构服务“三农三牧”中存在的问
数学课堂学习的几个问题
浅谈风险导向内部审计
完善国有企业公司治理结构的思路探讨
廊坊市高职院校涉外人才培养模式研究
高中生物教学的兴趣培养
互联网金融下的小微企业融资模式研究
浅析我国的行政补偿制度
浅谈小学语文教学中古诗的教学方法
高职院校商务英语教学现状及应对策略