TextTopicNet:CMU开源无标注高精度自监督模型
相关推荐
-
DeepCluster:用于表示视觉特征的无监督学习聚类算法
在这篇文章中,我们要简单介绍Facebook 的"Deep Clustering for Unsupervised Learning of Visual Features". De ...
-
南京大学提出CPD:通过视频-文本对匹配的视频预训练模型
作者:南京大学教授.博士生导师 王利民 本文介绍南京大学计算机系媒体计算组于2020年初公开到arxiv上的一篇文章: CPD (Learning Spatiotemporal Features vi ...
-
首篇「多模态摘要」综述论文
仅做学术分享,如有侵权,联系删除 转载于 :专知 [导读]多模态是文档内容的本质特征之一.来自印度理工等学者发布了首篇多模态摘要综述论文. 摘要 科技的新时代让人们可以方便地在各种平台上分享自己的观点 ...
-
赛尔笔记 | 多模态预训练模型简述
作者:哈工大SCIR 吴洋.胡晓毓 1.介绍 让机器能以人类智能相似的方式作出反应一直是人工智能研究人员的目标.为了让机器能听会说.能看会认.能理解会思考, 研究者提出一系列相关任务,如人脸识别.语音 ...
-
端到端多模态理解的MDETR调制检测
重磅干货,第一时间送达 小黑导读 论文是学术研究的精华和未来发展的明灯.小黑决心每天为大家带来经典或者最新论文的解读和分享,旨在帮助各位读者快速了解论文内容.个人能力有限,理解难免出现偏差,建议对文章 ...
-
ICCV2021|性能优于何恺明团队MoCo v2,DetCo:为目标检测定制任务的对比学习
作者丨小马 编辑丨极市平台 极市导读 作者专为目标检测任务"量身定制"了对比学习框架DetCo,在PASCAL VOC数据集上,DetCo在100个epoch时的性能就与MoCo ...
-
DetCo:用于目标检测的无监督对比学习
重磅干货,第一时间送达 小白导读 论文是学术研究的精华和未来发展的明灯.小白决心每天为大家带来经典或者最新论文的解读和分享,旨在帮助各位读者快速了解论文内容.个人能力有限,理解难免出现偏差,建议对文章 ...
-
OpenAI新宠CLIP有可视化了,CMU小哥开源新玩法,轻松搞定多类型图文联合检索
作者丨王浩帆 编辑丨极市平台 极市导读 本文作者基于CLIP进行多类型图文联合检索,并实现了CLIP注意力机制的可视化,便于对CLIP检索结果进行分析,附有项目地址. >>加入极市CV技术 ...
-
无需检测器提取特征!LeCun团队提出MDETR:实现真正的端到端多模态推理|ICCV 2021 Oral
作者丨小马 编辑丨极市平台 极市导读 本文提出了MDETR,一种端到端调制检测器,能够根据原始文本query直接来检测图像中的目标,基于Transformer的结构,通过在模型的早期阶段融合这两种模态 ...
-
深度学习在医学影像中的研究进展及发展趋势
王丽会1,2, 秦永彬1,2 1 贵州省智能医学影像分析与精准诊断重点实验室,贵州 贵阳 550025 2 贵州大学计算机科学与技术学院,贵州 贵阳 550025 摘要:医学影像是临床诊断的重要辅助工 ...
-
地表最强VLP模型!谷歌大脑和CMU提出极简弱监督模型
深度学习技术前沿 130篇原创内容 公众号 来源:arxiv 编辑:Priscilla 好困&新智元 [导读]谷歌大脑与CMU华人团队提出全新图像+文本预训练模型SimVLM,在最简单的模型结 ...