实习期间-第一周总结(2020.11.7-2020.11.8)
1. 论文
看了师弟分享的论文,主题都差不多,基于无人机影像对植被的研究,刚好填补一下遥感那块的“知识迷雾💀”,但缺少深度学习这块的论文。希望之后能够有深度学习相关的论文分享。
2. PyTorch
这是我第三周在实习期间的学习,可能是因为实习所接触的开发知识,我竟然有点恍然大悟的感觉。既然PyTorch是深度学习的框架,那么它就有框架的优势:将复杂的底层逻辑封装成一个个通用接口、组合成一个个类,再包装成模块/包,提供使用者调用。也让我明白我应该多花点时间在如何去做这个项目(需要什么规格的数据、采用什么算法、如何进行调优)
项目研究进展(实习期间).xmind
导图内包括Numpy的基础、PyTorch的基础入门以及学习是遇到的机器学习/深度学习的知识点。
3. 项目想法
现在对项目的想法是,赶紧找到项目的切入点。数据还是先拿三坑村的无人机数据,算法这块得下星期想清楚。然后师弟师妹在看论文的同时,抓紧时间入门PyTorch,然后补一补机器学习/深度学习的知识(因为你们可能还有高数和线代的基础,反正我是忘得七七八八了)。后续想到方案了再和你们说。
实习期间-第二周总结(2020.11.15)
1. 论文
这周没有看论文,可能是师弟师妹比较忙吧,所以没有论文分享。
2. Matplotlib
本周单休,只有一天时间能够研究项目,但是还是回归到了学习基础的状态,学了部分Matplotlib,下周每天下班之后再搞一搞。
3. 期望
希望大家能够多沟通沟通,然后打算近期开个会
实习期间-第三周总结(2020.11.21-2020.11.22)
1. 论文
将嘉文师妹上周找到的论文看完了,不长,也很好理解,也很切合我想要的论文类型。这周末卢戬师弟找到的论文推文也很棒,质量很高,但是需要时间去看以及做总结(看了差不多半篇期刊论文,全是英文,看得有点吃力),接下来的几周得好好看看琢磨琢磨
2. Matplotlib
这周将 Matplotlib 入门,在总结做导图的时候,发现自己做的有问题,重新将上周得到图整理了一次,Matplotlib模块中,做常用的matplotlib.pyplot提供一个类似Matlab的绘图框架,里面包含众多相关的函数(同时也是各种绘制轴图的接口),使用户能够绘制轴图变得简单。因此,NumPy+Matplotlib的组合能够将计算的大量数据展示出来,为深度学习“黑盒”中的数据更方便的展示。所以在学习深度学习框架前,可以先入门NumPy和Matplotlib(前提也是需要Python基础),IDE推荐PyCharm。
3. 小结
这周能看到师弟师妹有交流,挺好的,继续保持。在不耽误学习正事的前提下,去开展项目内容,不过也不要太放纵自己,保持每天都有学习,都会有收获!大家对项目有什么想法以及建议的都可以在群里说。
实习期间-第四周总结(2020.11.29)
1. 研究进展
周六熊博来广州做实习考察了,借此机会和老师交流了一下学习项目进度,目前我们停滞在“打标签”这块,老师也提供了一些建议,结合自己的想法,通过网友的知识分享,现在我们能够将图片进行切割(有重叠度的切割),并且可以通过labelImag软件进行打标签,但是目前的问题是:未确定算法/模型(不同的模型需要不同的图片输入尺寸),因此还没有开展打标签的工作,尽可能下一周将算法确定,然后搭建模型,并制作标签。
2. 论文
emmmmm这周论文没看,下周末抽一天时间来看
实习期间-第五周总结(2020.12.6)
研究近况
模型决定使用熊博之前做“围龙屋”所采用的模型——YOLO v3,但是我尝试跟一个实战去做,但是没这么简单,因为会有官方人员对模型进行更新/修改,因此实战的内容实操并不是很顺利,现在想让师弟师妹开始准备打标签,先把该有的标签和标签和图片数据弄好(相关内容在之后两三天会布置下去),争取下周开始进行训练,看看精度如何
实习期间-第六周总结(2020.12.13)
研究近况
YOLO v3是当前的研究模型,底层原理还没看懂,但是先学会用,如何去训练,如何去检测,今天用了源码自带的VOC数据集,进行检测,5013张照片,检测时间花了572.199秒(折合大概9分30秒左右),使用了GPU:GeForce GTX 1050检测,然后准备尝试去做训练,使用COCO数据集,训练集18G,测试集6G,下载了一个下午,打算明天上班的时候摸鱼探索一下(因为最近没啥事做);同时等待师弟师妹打出来的标签,先把模型的训练过程跑通,然后拿到标签直接开始训练识别柚树的模型
实习期间-第七周总结(2020.12.19)
研究近况
终于有一点成果出来了,虽然精度不高,但是也能知道我们的模型还有很好的成长空间,花了差不多一天的时间撰写训练日志,用于记录之后的训练,顺便提高一下自己写文档的能力。后续会根据此次训练做出相应的处理,继续积极请教老师。
注意:
- xml文件不能存在中文,否则会出现’gbk’解析错误
- 在最新的参数中,.data文件需要是字典类型,并且’names’不需要提供路径,而是直接通过数组的形式传递
- ‘页面文件太小,无法完成操作’ 需要将
dataloader.num-workers设置为0
实习期间-第八周总结(2020.12.27)
研究近况
找熊博聊了一下研究进度,熊博愿意帮我们用更大的模型(YOLOv3)去训练数据,不出意外精度应该能更提高一点,但还是没办法解决数据少的问题,因此熊博也说过段时间是去再飞一次无人机,有机会的话师弟师妹可以去帮帮忙。飞回来的数据就得考师弟师妹去实地考察了,然后再打标签,之后我们再对所有数据一起做数据增强,这样精度会高很多。
现在的想法是了解YOLO的发展史,进而从YOLOv3换至YOLOv4再到最新的YOLOv5,目前就从论文开始。这周在啃YOLO的论文,相关的点我也大概理解之后记录在训练日志中。
