像人类一样认识世界,AI需要哪些底层思维?
相关推荐
-
一张“纸条”就能骗过AI,OpenAI最先进的视觉模型就这?
到底是苹果还是 iPod?AI傻傻分不清楚. " 作者 | 贝爽 今年年初,OpenAI推出了最新一款AI视觉模型CLIP. 相信不少人对它还有些印象,经过庞大的数据集训练,CLIP在图文识 ...
-
TextTopicNet:CMU开源无标注高精度自监督模型
自监督模型是继GAN之后Yann LeCun看好的世界模型. 本文来自于Carnegie Mellon University和Universitat Autonoma de Barcelona研究团队 ...
-
百度智能搜索到底有多智能?
u1s1是什么意思?干饭人又是个啥? 当在北戴河阿那亚的剧场里被突然问到类似稀奇古怪的问题,一时发懵的我只想当场掏出手机,给对方来个"百度一下". 说起来,搜索这项"旧技 ...
-
文本生成图像的新SOTA:Google的XMC-GAN
来源:新智元 [导读]从图像到生成文本.从文本生成图像,多模态模型的探索一直未停止.最近Google又出从文本到图像的新模型,75%的人类都说超过了传统的SOTA模型,直呼脑子里有画面了! 文本到图像 ...
-
iPhone上也能运行OpenAI了!
视觉/图像重磅干货,第一时间送达 新机器视觉 最前沿的机器视觉与计算机视觉技术 206篇原创内容 公众号 仅作学术分享,不代表本公众号立场,侵权联系删除 转载于:新智元 Transformer的模型动 ...
-
[首藏作品](5696)把文本变成画作,AI对艺术“下手”了
把文本变成画作,AI对艺术"下手"了图为人工智能系统 DALL·E根据文本"穿着芭蕾舞裙遛狗的小萝卜"绘制的图像图片来源:OpenAI官网自然语言处理与视觉处理 ...
-
系统综述|图像描述问题发展趋势及应用
图像描述问题发展趋势及应用 马倩霞李频捷宋靖雁张涛 (清华大学) 摘 要 图像描述解决了在给定图像后自动得到相应的描述性文本的难题,是结合计算机视觉.自然语言处理和机器学习的一个交叉领域,也是一个极具 ...
-
图灵奖得主:AI要获得常识,自监督学习是钥匙
[新智元导读]Facebook AI发布了一篇Yann LeCun和研究科学家Ishan Misra合写的文章:<自监督学习:智能的暗物质>,文章把「常识」描述为人工智能的「暗物质」,还介 ...
-
人工智能“干掉”程序员后,又对艺术家下手了
人工智能领域缺钱,但这两个月来,他们不缺「好消息」. Google 母公司 Alphabet 旗下的 DeepMind,先推出了蛋白质结构预测 AI--AlphaFold 2,为困扰了生化学界 50 ...
-
Noema | 制造常识
文 | 雅各布·布朗宁 译 | 田天增(山西大学) 校 | 赵 斌 缺乏"常识",是既有人工智能常常被攻击的软肋.为突破这一障碍,过去几十年来,人工智能研究者尝试借助逻辑表征或图 ...
-
[首藏作品](6648)图片、文字、语音都能理解 这个AI平台是“全能”选手
图片.文字.语音都能理解 这个AI平台是"全能"选手◎本报记者 陆成宽"小初,请以天宫为主题作首诗吧?""天宫生殿开成,万花垂露照初.稠云不掩国志,飞 ...
-
专访中国人民大学卢志武教授:AI的新突破,或从“文澜”开始
让AI通过"图灵测试",或许不再遥远. 作者 | 来自镁客星球的毛毛 I propose to consider the question, 'Can machines think ...
-
多模态学习,带来AI全新应用场景?
新的AI技术发展趋势有哪些?多模态学习技术一定是其中之一. 最近,刚刚宣布"自立门户"的微软AI明星产品小冰改名为"红棉小冰".殊不知2014年诞生的这一个AI ...
-
大模型时代的AI之变与开发之根
自2018年谷歌发布Bert以来,预训练大模型以强大的算法效果,席卷了NLP为代表的各大AI榜单与测试数据集.随着产学研各界的深入研究,大模型在AI产学研各界的地位得到不断加强.到2021年,我们可以 ...
-
Vokenization:一种比GPT-3更有常识的视觉语言模型
学习人工智能,最好的办法就是先考上大学,学好计算机和数学,其次就是生个孩子. 这可不是一个段子.有了孩子之后,你会能更好理解人工智能到底是如何发生的. 看着一个牙牙学语的小婴儿开始对这个世界发生好奇, ...
-
零样本风格迁移:多模态CLIP文本驱动图像生成
重磅干货,第一时间送达 来源:GitHub ,新智元 [导读]零样本的风格迁移听说过没有?英伟达一个实习生小哥集文本CLIP和图像生成StyleGAN于一身,只需要输入几个单词就可以完成你想要的风格迁 ...