-
Notifications
You must be signed in to change notification settings - Fork 2.9k
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
[PaddlePaddle Hackathon] Task 67 #4297
Conversation
…ork for single gt box)
Hi, |
ci问题我这边会协助,目前看报错和你提交的代码无关 |
好的 |
在coco2017上验证 |
你好, 因为我本机的GPU是1660 super,完全训练时间太长,所以在AI Studio上面训练。不过昨天下午查看时,backbone为resnet34时,完全训练(12个epoch)在AI Studio仍需要6天,就尝试了10k iter,batch size 4 评估结果 ohem 10k iter 昨晚到今早查看时,完全训练估计时间变成了不到3天(可能是使用人数变少),就再次训练1 epoch,这次设置了random seed(之前那次没有设置)。目前还在训练中,训练完成后才能生成公开版本的AI Studio项目 您那边方便的话,是否可以完整训练一次?(AI Studio每天最多只能训练16个小时,超过时间后就会断掉,无法连续完整训练) |
这是AI Studio的项目链接: fork版本1,并按照notebook执行即可 因为在AIStudio从github下载代码过慢,这里是从gitee下载的(和github版本一致) 训练一个epoch后的评估结果 ohem 1epoch(29316 iter), bs4 |
可以发邮件到我们的官网邮箱[email protected],说明是这个 PR 的开发者,然后我们会提供充足的算力卡兑换码哈 |
好的 谢谢 |
使用OHEM后,完整训练的结果是这样的 Average Precision (AP) @[ IoU=0.50:0.95 | area= all | maxDets=100 ] = 0.377 和原resnet34-faster-rcnn配置文件的区别只有batch size为4,另外在代码里设置的random seed为1 |
用的第一个,不是resnet-vd版本。有没有可能是因为batch size调大了,但是lr没有调整的原因?因为当时觉得batch size 1训练的太慢了,就把batch size调高了一些 |
也就是说 ohem 这个策略没用? mmdet的结果有跑过嘛 |
mmdet的结果没有跑过,我跑下试试。 open-mmlab/mmdetection#5596 这个issue提到了他在训练faster rcnn用OHEM时,map下降的问题。 |
好的 |
Automatically closed by Paddle-bot. |
PR types
New features
PR changes
APIs
Describe
Hi,
This PR adds OHEM according to Task #4224
Setting BBoxHead.bbox_assigner to OHEMBBoxAssigner in configuration file will enable OHEM.
test case file is located at ppdet/modeling/tests/test_ohem_bbox_assigner.py
Thanks,