OpenAI新宠CLIP有可视化了,CMU小哥开源新玩法,轻松搞定多类型图文联合检索
相关推荐
-
这个GAN没见过猪,却能把狗变成猪
丰色 发自 凹非寺 量子位 报道 | 公众号 QbitAI 不用成千上万张目标图片训练,就能让GAN生成你想要的图片,有可能吗? 还真有可能! 来自特拉维夫大学和英伟达的研究人员成功地盲训出领域自适应 ...
-
人工智能“干掉”程序员后,又对艺术家下手了
人工智能领域缺钱,但这两个月来,他们不缺「好消息」. Google 母公司 Alphabet 旗下的 DeepMind,先推出了蛋白质结构预测 AI--AlphaFold 2,为困扰了生化学界 50 ...
-
给你看个宝贝:GitHub 最野的开源模型库!
前阵子抖音爆火的应用蚂蚁呀嘿都笑过吧?这技术让一向严肃认真的giao哥都多了几分俏皮,这么秀的代码,必须狗一波.于是本狗啊不本人有了一个温暖(欠揍)的想法:想弄一个自家爹妈爷爷奶奶一起摇摆的鬼畜视频. ...
-
一张“纸条”就能骗过AI,OpenAI最先进的视觉模型就这?
到底是苹果还是 iPod?AI傻傻分不清楚. " 作者 | 贝爽 今年年初,OpenAI推出了最新一款AI视觉模型CLIP. 相信不少人对它还有些印象,经过庞大的数据集训练,CLIP在图文识 ...
-
GPT
编辑:贾伟 梦佳 继GPT-3的颠覆之后,即将出道的 GPT-4 会走向何方?这一问题牵动着很多人的心. 在不久前,OpenAI的联合创始人.首席科学家IIya Sutskever 曾在吴恩达编辑的 ...
-
WenLan-10亿参数!别只玩GPT,来看看人大&中科院联手打造第一个大规模多模态中文预训练模型BriVL
▊ 写在前面 近年来,多模态预训练模型在视觉和语言之间架起了桥梁.然而,大多数研究都是通过假设文本和图像对之间存在很强的语义关联来对图像-文本对之间的跨模态交互进行显式建模.由于这种强假设在现实场景中 ...
-
首次发现!AI脑回路演化向人类更进一步,OpenAI最新研究引热议,有学者评价:太吓人了
两个月前轰动网络的AI设计大师CLIP,刚刚被OpenAI"扒开"了脑子. 没想到,这个性能强大的AI竟和人类思维方式如此相像. 打个比方,无论你听到"炸鸡"二 ...
-
[首藏作品](5696)把文本变成画作,AI对艺术“下手”了
把文本变成画作,AI对艺术"下手"了图为人工智能系统 DALL·E根据文本"穿着芭蕾舞裙遛狗的小萝卜"绘制的图像图片来源:OpenAI官网自然语言处理与视觉处理 ...
-
组合式创新?CLIP+VQGAN
ace 新旧交替之际,不同时代的审美.这个现象真有趣~~ 知识库 最近有大量使用CLIP+VQGAN的数字艺术作品出现,这两项组合技术不知大家都玩过没? OpenAI的CLIP 用于连接文本与图像 具 ...
-
吴恩达新年公开推荐这个设计师,上千人点赞
2021年一开始,OpenAI在GPT-3方向上的又一重要突破,让吴恩达等大佬激动了. 之前给GPT-3一段话,就能写出一段小说. 现在它成功跨界--可以按照文字描述.生成对应图片! 简直就是&quo ...
-
无法访问GPT-3?强大的克隆版GPT-J带着60亿参数来了
编辑|核子可乐.钰莹 去年 9 月,微软宣布与 OpenAI 达成独家授权协议,称该公司将使用 GPT-3 来"创建新的解决方案,利用先进自然语言生成的惊人能力".这一安排不会阻止 ...
-
OpenAI CLIP模型袖珍版,24MB实现文本图像匹配,iPhone上可运行
机器之心报道 机器之心编辑部 OpenAI 的 CLIP 模型在匹配图像与文本类别方面非常强大,但原始 CLIP 模型是在 4 亿多个图像 - 文本对上训练的,耗费了相当大的算力.来自 PicColl ...
-
GPT Plus Money!B O O M
连接图像和文本,更多的多模态文章可以看博主整理过的系列(跨界出圈 | 谈谈BERT跨模态预训练),本篇文章主要整理一下OpenAI发表的2篇文章.其中CLIP 能够完成图像与文本类别的匹配,DALL· ...
-
像人类一样认识世界,AI需要哪些底层思维?
作者 | 琰琰 近几年,多模态已经成为自然语言处理(NLP)领域的热点研究方向之一.得益于深度学习的兴起,大数据+大模型的双轮模式推动人工智能实现了跨越式发展.但大量实验证明,仅依靠"炼大模 ...
-
打破次元壁,融合自然语言与视觉 | MixLab 人工智能
#DALL·E 和 CLIP#.#OpenAI# DALL·E 和 CLIP DALL·E 可以基于文本直接生成图像: CLIP 则能够完成图像与文本类别的匹配. OpenAI 联合创始人.首席科学家 ...
-
iPhone上也能运行OpenAI了!
视觉/图像重磅干货,第一时间送达 新机器视觉 最前沿的机器视觉与计算机视觉技术 206篇原创内容 公众号 仅作学术分享,不代表本公众号立场,侵权联系删除 转载于:新智元 Transformer的模型动 ...
-
零样本风格迁移:多模态CLIP文本驱动图像生成
重磅干货,第一时间送达 来源:GitHub ,新智元 [导读]零样本的风格迁移听说过没有?英伟达一个实习生小哥集文本CLIP和图像生成StyleGAN于一身,只需要输入几个单词就可以完成你想要的风格迁 ...
-
引燃AI社区,不用跨界也能从文本生成图像,OpenAI新模型打破自然语言与视觉次元壁
艺术创作的事,以后人类只要动手打几个字,其他的交给 AI 就行了. 自然语言与视觉的次元壁正在被打破.这不,OpenAI 最近连发大招,提出两个连接文本与图像的神经网络:DALL·E 和 CLIP.D ...