共6.5页 1+2+0.5+0.5+0.5+0.5+1 查论文 https://zhuanlan.zhihu.com/p/57134744
一、课题的意义
机器学习作为一门交叉学科,涵盖了许多理论知识以及复杂算法知识,如概率论知识、统计学知识、拓扑学等,是研究怎样使用计算机模拟或实现人类学习活动的科学。深度学习是“机器学习中使用深度神经网络的子领域”,今天的“深度神经网络”,简单来说就是指具有很多隐层的神经网络。较为先进的图像识别技术就是通过构建神经网络训练模型来实现的,在今天图像识别技术已经成为了创新驱动发展的核心驱动力之一,是深度学习领域十分热门的研究领域,其应用十分广泛,在社会、经济、管理、科学、生活等方面处处呼唤汲取图像识别的养分,因此将图像识别与日常生活最常见的买菜场景相结合有重要意义。
为了深入学习领悟习近平新时代中国特色社会主义思想的深刻内涵和伟大历史成就,推动“乡村振兴”战略,聚焦推进农村经济建设、政治建设、文化 建设、社会建设、生态文明建设和党的建设。小组成员以“科技引领生活”的理念,应用学科知识构筑“基于图像识别的果蔬农产品市场价格查询系统”。乡村作为4、5级市场来说,群众文化程度偏低,并且科技使用程度大幅度落后于现代化城市,在瓜果蔬菜的销售时,会有收购人员进行恶意压价的情况出现;在购买时,也是根据每个商贩或者超市要价多少就给多少。人们大多数并不了解真正的市场价格,从而导致可能卖的便宜买的贵的情况出现。因此,本项目的开发可以极大程度的避免该情况的出现,既满足了人民作为耕地者的利益,又满足了作为购买者的利益,经济进行良性循环,从而带动了乡村经济的发展。因此本课题提出利用图像识别技术提升农贸市场服务质量。
二、国内外发展状况
2006年,神经网络之父 Geoffrey Hinton 提出了深层网络训练中梯度消失问题的解决方案:无监督预训练对权值进行初始化辅以有监督训练微调,至此开启了深度学习在学术界和工业界的浪潮。2011年,ReLU激活函数的提出,有效的抑制了早期BP算法存在的的梯度消失问题。2012年开始,深度学习正式进入爆发期,在ImageNet图像识别比赛中,Hinton课题组利用构建的CNN网络AlexNet一举夺魁。后来2013、2014、2015、2016年,通过ImageNet图像识别比赛,DL的网络结构,训练方法,以及GPU硬件的不断进步,深度学习得到了飞速发展。
计算机视觉是深度学习领域最热门的研究领域之一,由于深度学习在视觉中的流行,使得其在应用上百花齐放。2012-2016年,AlexNet,VGGNet,GoogLeNet,ResNet卷积神经网络模型的提出极大的丰富了计算机视觉领域。2017-2018年深度学习框架的开发发展到了成熟期,诞生了PyTorch 和 TensorFlow 等框架。近年来,各大企业学校分分成立计算机视觉研究实验室,如国内的百度公司,其产品十分丰富且识别率高。
在当前的市场氛围下,菜市场作为传统零售行业,智能化程度偏低,效率高低几乎取决于从业人员的经验。国内外企业在这个传统行业中难以牟取利益,因此此类便民智能的产品少之又少。同时由于“多多买菜”“美团”等企业的创建的新型社区团购模式正在挤占传统菜市场的市场份额,传统菜市场亟待转型。本课题拟实现一项便民的智能程序用以改造传统农贸市场。
三、本课题的研究内容
1. 图像识别实现
了解所需的数理知识,统计学基础、大数据计算所需的基础算法、深度学习的数学机理、学习方法论、机器学习的自动化、知识推理与数据学习的融合等。
学习搭建卷积神经网络模型,利用CNN模型训练,能够有效的将大数据量的图片降维成小数据量,能够有效的保留图片特征,符合图片处理的原则。实现对图像的预处理、特征提取和分类方法。
目前计划使用TensorFlow机器学习框架,加载蔬菜水果图片数据集,处理后让模型进行学习训练,最终得以预测分类测试集图片。
2. 农产品价格获取
①爬虫获取批发市场价格
爬虫一般分为数据采集,处理,储存三个部分。计划使用urllib库、requests库等或Scrapy框架对数据进行爬取和解析。
从网站提取蔬菜水果价格之后,将其保存到数据库中。
设置定期爬取相应内容,并对数据库内数据进行保留及替换。
②商家端可上传输入价格
创建专用数据库,并提供接口。
3. 前后端实现
采用C/S架构,利用数据库服务器端,客户端通过数据库连接访问服务器端的数据。为支持前后端分离,采用MVC或MVVM框架(关注Model的变化),实现降低耦合度。动态加载页面相关控制器文件。
本系统功能为图像识别果蔬农产品种类、获取当地市场果蔬农产品价格并相互对应。
四、研究方法和研究手段
本项目所需的开发环境:
- 硬件环境:可以支持训练的CPU,GPU
- 操作系统:Windows10 64位操作系统
- 网络架构:完全支持TCP/IP协议
- 开发工具:PyCharm等
- 开发语言:Python、JavaScript等
- 数据库: MongoDB
研究方法
研究手段
五、研究步骤
六、本题目研究的具体进度安排
| 时间 | 任务 |
|---|---|
| 2021.12.4~2022.1.8 | 研究题目内容,规划大致完成步骤 |
| 2022.1.9~2022.2.25 | 阅读相关文献,研究相关算法,掌握相关语言 |
| 2022.2.25~2022.3.10 | 开题 |
| 2022.3.11~2022.4.12 | 大致完成界面系统的设计、实现算法、准备论文的撰写 |
| 2022.4.13~2022.4.16 | 中期检查 |
| 2022.4.17~2022.5.25 | 修改及完善所设计图像处理系统、完成论文初稿 |
| 2022.5.26~2022.5.30 | 毕业论文修改及完善 |
| 2022.6.1~2022.6.13 | 准备答辩 |
七、参考文献
[1] Li B , Qi P , Liu B , et al. Trustworthy AI: From Principles to Practices[J]. 2021.
[2] Jaderberg M , Czarnecki W M , Osindero S , et al. Decoupled Neural Interfaces using Synthetic Gradients[J]. 2016.
[3] He K , Zhang X , Ren S , et al. Deep Residual Learning for Image Recognition[J]. IEEE, 2016.
[4] Szegedy C , Liu W , Jia Y , et al. Going Deeper with Convolutions[J]. IEEE Computer Society, 2014.
[5] Simonyan K , Zisserman A . Very Deep Convolutional Networks for Large-Scale Image Recognition[J]. Computer Science, 2014.
[6] Chetlur S , Woolley C , Vandermersch P , et al. cuDNN: Efficient Primitives for Deep Learning[J]. Computer ence, 2014.
[7] Krizhevsky, Alex, Ilya Sutskever, and Geoffrey E. Hinton. “Imagenet classification with deep convolutional neural networks.” Advances in neural information processing systems. 2012. [pdf] (AlexNet, Deep Learning Breakthrough)
[8] Ioffe, S., Szegedy, C.: Batch normalization: Accelerating deep network training by reducing internal covariate shift. In: ICML (2015)
[9] Howard A G , Zhu M , Chen B , et al. MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications[J]. 2017.
[10] Jennings N R , Wooldridge M J . Foundations of Machine Learning[M]. MIT Press, 2012.
[11] Ian Goodfellow, Yoshua Bengio, and Aaron Courville: “Deep learning” The MIT Press, 2016, 800 pp, ISBN: 0262035618
[12] LeCun, Yann, Yoshua Bengio, and Geoffrey Hinton. “Deep learning.” Nature 521.7553 (2015): 436-444. [pdf]
[13] 周志华. 机器学习. 北京: 清华大学出版社, 2016.
[14] 徐宗本. 人工智能的10个重大数理基础问题. 中国科学: 信息科学, 2021, 51: 1967–1978.
[15] 周志华. 关于深度学习的一点思考. 机器学习及其应用 2019, 2021.
[16] Rostyslav Demush. A Brief History of Computer Vision (and Convolutional Neural Networks), 2019.
[17] 王生进. 计算机视觉发展之路. 人工智能, 2017.
[18] Rastegari M , Ordonez V , Redmon J , et al. XNOR-Net: ImageNet Classification Using Binary Convolutional Neural Networks[J]. European Conference on Computer Vision, 2016.
XXX同学对其所选课题“基于深度学习的果蔬识别价格查询系统”与课题组成员和老师进了充分讨论,参考了许多书籍和参考文献,对于这一课题有了初步的认识。本课题是学生所学专业知识的延续,符合学生专业发展方向,对于提高学生的基本知识和技能有很大帮助。开题报告所制定的研究策略和研究计划基本合理,课题难度适中,学生能够在预定时间内完成该课题的设计。
