vlambda博客
学习文章列表

[论文荐读]重组牛肉图像识别模型的比较研究


肉类研究》2020年34卷7期刊载了 渤海大学食品科学与工程学院、生鲜农产品贮藏加工及安全控制技术国家地方联合工程研究中心、哈尔滨商业大学职业技术教育学院、江苏省肉类生产与加工质量安全控制协同创新中心 王博、杨洪遥、陆逢贵、陈子东、曹振霞、刘登勇 的论文《 重组牛肉图像识别模型的比较研究 》。该论文由 辽宁省“兴辽英才计划”项目(XLYC1807100) 资助。

在我国重组肉种类较多,如重组牛排、培根等,产量也极大。目前,国内市场上存在重组肉及其制品生产标准不够完善、相关监管部门的管理力度欠缺等问题,常见的感官评价技术虽然可以快速识别重组牛肉,但受到样品相似度及感官评定员生理状态等因素的影响,可能会存在主观性较强、重复性低等问题,从而影响检测结果的准确性。机器视觉技术只需利用图像传感器获取物体的图像,再将图像转换成数字信息,并利用计算机模拟人的判别准则去识别图像,从而作出优于人眼的客观评定,具有识别速度快、准确率高及无损检测等特点,被越来越多地应用到食品科学研究中。

[论文荐读]重组牛肉图像识别模型的比较研究

渤海大学食品科学与工程学院、生鲜农产品贮藏加工及安全控制技术国家地方联合工程研究中心、哈尔滨商业大学职业技术教育学院、江苏省肉类生产与加工质量安全控制协同创新中心的王博、杨洪遥、陆逢贵、陈子东、曹振霞、刘登勇构建基于卷积神经网络的3 种深度残差网络(deep residual network,ResNet)模型(ResNet-50、ResNet-101、ResNet-152),以纹理特征作为模型的识别标签,并以准确率为主要评价指标,辅以测试所需时间对比,将3 种ResNet模型(ResNet-50/101/152)与视觉几何群网络(visual geometry group network,VGG)16、SVM、LeNet-5卷积神经网络3 种模型识别进行对比分析,对重组牛肉进行客观、准确、快速识别,提供一种快速识别重组牛肉的方法。

图像采集和基于多层次的卷积神经网络图像识别模型构建

样品图像均在设计的图像采集装置下采集,图1为图像采集装置的结构示意图。本研究所涉及的数据分析工作均在Python 3.5(64bit)平台上完成,主要使用开源的第三方Python扩展模块配合计算和绘图,其中“Pylab”模块用于绘制二维、三维图像,“Numpy”和“Matplotlib”模块用于数据统计,“Keras”、“TensorFlow”和“OpenCV”模块用于机器学习和最优化计算。

[论文荐读]重组牛肉图像识别模型的比较研究
图1 图像采集装置示意图
[论文荐读]重组牛肉图像识别模型的比较研究
图2 基于ResNet的牛肉图像检索和分类方法

图像采集结果

共采集到样品照片1 542 张,在此基础上,最终得到6 168 张样品图像,按约8∶2随机分配训练集和测试集,其中4 936 张作为训练集,用于构建和优化实验模型,剩余1 232 张作为测试集,用于测试模型的准确性。为美化出图效果,样品图像输出调整为圆形。

图像预处理结果

样品图像经过随机对比度、亮度、旋转和缩放调整等方法预处理后,结果如图3所示。在不改变样品图像本身属性的前提下,随机对比度与随机亮度调整使得样品图像亮度呈现出较大差异,有利于获得大量图像细节信息;经过随机旋转和随机缩放处理后,改变了图像的原有位置、方向和量级,从而生成新的图像,进而增加了样本数量,有利于提升测试结果的准确率。

[论文荐读]重组牛肉图像识别模型的比较研究
图3 图像预处理结果

训练集识别结果评估及分析

损失函数(Loss值)是评估模型准确率最主要的因素,追求较低Loss值是保证模型准确率的重要方式。以ResNet-50模型为例,训练过程中模型均基于1.3.6节所设定的参数。在初始状态下,迭代次数为0,Loss值为4.810,准确率为54%;当迭代次数为4 000时,Loss值降低为0.095,准确率为100%;当迭代次数提高为5 000时,Loss值降低为0.064,准确率为100%。因此,当迭代次数大于4 000时,对训练准确率影响较小,不需要继续迭代,因此将迭代次数定为4 000。

测试集识别结果评估及分析

将3 种不同深度的ResNet模型与SVM、LeNet-5、VGG-16模型的准确率进行比较,模型呈现的数据为重组牛肉与非重组牛肉分类的平均准确率和测试所需时间。单独对比准确率发现,LeNet-5模型<SVM模型<VGG-16模型<ResNet-50模型<ResNet-101模型<ResNet-152模型;单独对比测试时间发现,ResNet-152模型>VGG-16模型>ResNet-101模型>SVM模型>ResNet-50模型>LeNet-5模型;综合对比准确率和测试时间发现,ResNet模型准确率明显优于其他3 种模型。在ResNet模型中,深度越深,规模就越大,识别准确率也就越高,但是所需时间也相对较长。本研究中ResNet-50模型的测试时间最短,仅需0.45 s,识别准确率较高,因此选取ResNet-50模型作为识别重组牛肉的主要模型。

结  论

本研究将卷积神经网络引入到重组牛肉的图像识别领域中,提出一种基于ResNet模型的识别方法,并将此方法应用到图像识别任务中,结果表明:1)以纹理作为识别重组牛肉的标签,当迭代次数达到4 000时,Loss值降低为0.095,训练集准确率达到100%,3 种不同深度的ResNet(50/101/152)模型测试集的准确率分别达到90.2%、90.5%和91.9%,且继续增加迭代次数对准确率的影响较小,在此条件下,ResNet模型可以实现对重组牛肉与非重组牛肉的准确识别;2)3 种不同深度的ResNet模型在识别准确率方面均优于SVM、VGG-16和LeNet-5模型,但在运算速度上优势不太明显,3 种不同深度的ResNet模型(ResNet-50/101/152)测试时间分别为0.45、1.49、2.80 s,说明ResNet模型可以实现对重组牛肉与非重组牛肉的快速识别。

将基于卷积神经网络的3 种不同深度的ResNet模型应用到重组牛肉与非重组牛肉的图像识别领域,并与SVM、VGG-16和LeNet-5 3 种模型的识别效果进行对比分析,证明ResNet模型可以实现对重组牛肉与非重组牛肉的快速、准确识别,其中ResNet-50模型识别准确率达到较高水平,所需时间最短,可用于快速识别重组牛肉,为今后开发智能识别重组牛肉设备提供了参考。



引文格式:

王博, 杨洪遥, 陆逢贵, 等. 重组牛肉图像识别模型的比较研究[J]. 肉类研究, 2020, 34(7): 13-17. DOI:10.7506/rlyj1001-8123-20200521-133.http://www.rlyj.net.cn
WANG Bo, YANG Hongyao, LU Fenggui, et al.Comparative study on image recognition models for restructured beef[J]. Meat Research, 2020, 34(7): 13-17. DOI:10.7506/rlyj1001-8123-20200521-133.http://www.rlyj.net.cn


[论文荐读]重组牛肉图像识别模型的比较研究

为进一步促进动物源食品科学的发展,带动产业的技术创新,更好的保障人类身体健康和提高生活品质,北京食品科学研究院和中国食品杂志社在成功召开“2019年动物源食品科学与人类健康国际研讨会(宁波)”的基础上,将与青海大学农牧学院2020年10月22-23日西宁共同举办“2020年动物源食品科学与人类健康国际研讨会”。研讨会将就肉、水产、禽蛋、制品等动物源食品科学基础研究、现代化加工技术,贮藏、保鲜及运输,质量安全与检测技术,营养及风味成分分析,副产物综合利用,法律、法规及发展政策等方面的重大理论研究展开深入探讨,交流和借鉴国外经验,为广大食品科研工作者和生产者提供新的思路,指明发展方向。

在此,我们诚挚的邀请您出席本次国际研讨会,共聚人脉、共享资源、共谋发展!

由于受疫情影响,部分高校、科研单位及食品企业等人员参会受到限制,故此次会议还专门为广大师生和科研工作者设置了线上会议视频通道。现场参会和线上参会报名请扫描下二维码:

[论文荐读]重组牛肉图像识别模型的比较研究               [论文荐读]重组牛肉图像识别模型的比较研究
现场会议报名                    线上会议报名