一、学习内容:OCR赛事实践——Task01_学习实践Baseline
二、个人记录:
-
实践路径: (1)CPU环境配置(CPU版的paddlepaddle 中缺少需要的包,最终放弃); (2) GPU环境运行(根据群里小伙伴们的建议,设置batch_size_per_card=1 num_worker=0 ,并删除test_list大部分图片,只留下3张,但显存不够,失败); (3) AI Studio运行(也是群里小伙伴们提供的建议,最终运行成功)。 -
Debug总结: (1)cudnn和cuda版本要匹配。其中,cuda10.2有比官方推荐的更匹配的cudnn版本,参考自:https://zhouchen.blog.csdn.net/article/details/107716721; (2)paddlepaddle有支持CPU的版本,但缺少了此次学习需要的模块。paddlepaddle-gpu 的版本也要和cuda匹配。其中,AI Studio是随机分配CUDA环境的,所以安装前先通过nividia-smi 查看CUDA版本; (3)本地环境下,在安装python-Levenshtein 时,需要先安装Microsoft c++ 14.0(或更高版本),再通过whl安装对应python版本的包。 -
个人体会: (1) 这是第一次参加Datawhale的组队学习活动,也是第一次接触OCR赛事、第一次了解paddle框架、第一次配置cuda环境,很开心; (2)群里的小伙伴们会很耐心地分享学习进程、遇到的问题和解决思路,大家真的太友好了~ (3)群里有小伙伴问paddle框架值不值得深入学,毕竟有可以白嫖的算力;我是第一次了解到paddle这个框架,所以也就基于这个问题去知乎了一下。当然是多方观点了。AI Studio这个平台对我这种菜鸡来说挺友好,尤其是我这种硬件不到位的菜鸡,要主动地去多试水。 -
不足: 目前只是跑通了baseline模型,在开始Task02之前,要认真研究代码。
|