大家好,我叫陈坤泽,2015年毕业于厦门理工学院数学与应用数学(统计方向)专业。
- 大学期间用C++打过ACM,拿过区域赛铜奖;
- 毕业后半年在中国铁塔做Excel/VBA数据自动化处理;
- 也回校、在中科院用C++/Matlab做过一年半的模式识别研究工作;
- 之后在快乐学习教育培训公司当编校主管,从2017年8月开始学习使用python语言,做LaTeX教材的相关自动化数据处理;
- 2020年7月又回到母校,现在在实验室从事深度学习,文字检测方面的相关工作。
我学习东西比较喜欢找专业的资料,或看一套视频先系统化学习一遍;遇到问题也喜欢钻研,总会想着最方便、简洁的解决方案是什么,而不是停留在表面,把眼前的问题解决就不管了;会思考问题的本质,怎么把这一类的问题一口气解决掉,也是这样不断地积累自己的代码工具库,有了后来的pyxllib公共库,封装了很多文本处理、文件操作等常用功能。
有了这些经验、代码积累,就想着整理分享出来,让更多的人受益,少走弯路。特别是做科研等方向的一些同学,往往缺乏系统化的编程学习、工程化协作开发的项目经验。所以本系列教程会重点讲代码开发中的命名规范、简洁性、接口封装、代码复用率、调试效率等等一般人容易忽视的知识点,以及我的pyxllib库有哪些现成的功能工具可以用。因为文章教程首先是面向我们厦门理工学院模式识别实验室的同学,所以主题是围绕深度学习需要具备的一些基本素养,各种软件工具使用,而不是纯讲python。
本系列不是基础教程,读者不要奢望零基础的学了我的教程就能掌握python了。基础方面还是希望读者自己多下功夫,自学廖雪峰的python教程等资料。本系列文章预设了大部分读者都有了python的基本语法知识,会自己安装PyCharm等IDE,写过至少几百行代码,也有了命令行环境变量等基本的计算机知识。真的零基础来听也不是不行,但有些内容可能听着会比较吃力,而且没有相关开发经验,也难领悟到要点,好比跟盲人介绍什么是彩色。
我的python水平也称不上专家,其实多看看各种优秀的开源项目代码,例如就深度学习很流行的PyTorch框架,还有目标检测框架detectron2等等,就会知道自己在工程化上还有很多可以学习的地方。前面分享的个人经历,不是炫耀(又没多传奇,就是个普通的打工人,炫耀个寂寞~~),恰恰是先说清楚我个人阅历的局限性,千万不要把我当“专家”来学习,可以参考我的思考、经验,但优劣、适用场景,大家要根据自己的实际开发经验、需求判断,有自己的辨别能力,欢迎各位拍砖批评,把我当成“砖家”看待就行。我后续会分享自己写的pyxllib工具库,很多功能设计也存在瑕疵,还有不少改进空间。
我学习效率也不咋滴,占用了不少时间来做这个事,感谢老师和各位同事对我这项工作的理解与支持。也感谢所有的同学们,我也从你们那了解到很多资料,学习到很多技巧,否则靠我个人有限的视野认知是很难把文档做到目前这个程度的。最后感谢投入了时间精力学习我资料的所有读者,反馈各处描述不清晰、不完整的地方,激励着我只有真正透彻理解了知识点,才能清晰地跟大家分享解释。
由于本人水平有限,主要都是平时自己学习中,不断摸索琢磨出的一些想法经验,必然会有不足和更好的解决方法,以及不同的角度见解。欢迎大家向我指出,我也很高兴收到大家的意见和建议,不胜感激。
陈坤泽
厦门理工学院
877362867@qq.com
2021年7月27日更新
