博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Ai challenger 2017 image caption小结
阅读量:5740 次
发布时间:2019-06-18

本文共 946 字,大约阅读时间需要 3 分钟。

参加了今年的ai challenger image caption比赛,最终很幸运的获得了第二名。这里小结一下。

 

  1. Pytorch 越来越火了。。 前五名有三个pytorch 两个tensorflow 关于哪个learning frame work 更适合图像nlp相关的应用 我觉得用户用脚投票使用程度说明一切。tensorflow有强大的slim图像库支持,比如nasnet是slim最先支持的毕竟google原版。。。,但是在很多比赛灵活性上对比pytorch还有欠缺 比如强化学习feed dict较慢,比如多模型ensemble实现per step的投票 beam search比较麻烦,甚至一个in graph的beam seach相比pytorch也麻烦很多,希望后面eagar模式能改变这些。
  2. 最佳的caption利器当属微软的

    Bottom-Up and Top-Down Attention for Image Captioning and Visual Question Answering

       

    来自 <>

    前五名除了我都使用这个思路, 因此我的单模型效果(show attention and tell)是相对最差的。。

  3. 强化学习非常重要

    其它选手都通过强化学习大大提升了客观分数,但是仅仅优化类似cider这样的指标的强化学习可能会使得句子通顺度弱于优化cross entropy可能是这个原因我的主观流畅性打分最高..

  4. 调参和一些细节是至关重要的
    1. 比如lstm hidden size 大部分选手可能使用512 而有的选手使用2048 提升明显
  5. 我使用light gbm 进行gbdt rerankcider提升了10个点 这里为 lightgbm call 194w样本,52维特征,5交叉验证regression 只需要3分钟, lamdamart 排序只需要5分钟。
  6. 这里开源了本次比赛我使用的代码,欢迎contribute,特别是对强化学习的修改及改进,很遗憾尽管我也实现了scst但是没有达到理想效果几个指标只有meteor提升,其余指标下降。

   

   

转载于:https://www.cnblogs.com/rocketfan/p/8093584.html

你可能感兴趣的文章
Git提交本地库代码到远程服务器的操作
查看>>
让你快速上手的Glide4.x教程
查看>>
浮动和清除(闭合)浮动
查看>>
LR录制脚本时IE打不开的原因
查看>>
微博自动化测试
查看>>
Sublime Text 2.0.2,Build 2221注册码
查看>>
js scroll事件
查看>>
最长递增子序列 动态规划
查看>>
原生CSS设置网站主题色—CSS变量赋值
查看>>
webpack 4.0 中 clean-webpack-plugin 的使用
查看>>
WPF
查看>>
中文词频统计
查看>>
POJ 2236 Wireless Network (并查集)
查看>>
python分类
查看>>
GitBlit (1)-- 在linux 安装 GitBlit 并运行
查看>>
Windows与Linux之间的文件自动同步
查看>>
程序是如何执行的(一)a=a+1
查看>>
go : 结构
查看>>
18 已知下面的字符串是通过RANDOM随机数变量md5sum|cut-c 1-8截取后的结果
查看>>
BZOJ - 3578: GTY的人类基因组计划2
查看>>