人工智能 · 机器感知
近年来,随着深度学习算法的发展,人工智能在识别和感知领域有了长足的进步,机器似乎有了五感,能看能听能说话还能动!那么,本期圆桌我们一起来关注人工智能领域的新发展,看看计算机视觉、语音识别和机器人领域都发生了什么有趣的进展吧!
1965842 次浏览 17927 人关注
  • 450
    从general的角度上来说,前面的高票回答都答得很好了。我想从我的角度细化来讲一下这个问题。不是泛泛而谈,而是考虑一些具体的实施方案。除去一些零散的点,research方面我个人目前重点关注以下几条线:1. 针对特定问题的Unsupervised Learning: GAN自从…显示全部
    2017-04-06
  • 254
    抽空来简答一下这个问题,恰好也是我们比较关注的一个方向。简单来说,视频检测是比单张图片检测多了Temporal Context(时间上下文)的信息。不同方法想利用这些Context来解决的问题并不相同。一类方法是关注如何使用这部分信息来加速Video Detection。因为…显示全部
    2017-04-06
  • 108
    无屏化语音助手会在越来越多没有屏幕的设备上出现,或者说语音助手会朝着纯语音(VUI)的交互方式发展。首先解释一下纯语音交互。纯语音交互指的是我们给语音助手表达命令、确认、打断、纠错等等信息交换的过程完全通过语音来进行,没有点击、滑动等交互。…显示全部
    2017-04-05
  • 17
    大量同意 @颜沁睿 的观点,特别是: 定位是机器人学时至今日最大的难题(我认为没有之一) 控制的前提是对状态的准确估计,对于移动机器人来说就是定位,控制的精度无法超过定位精度,可见其重要性。主要原因在于,没有任何一种传感器能够保证全天候,高精…显示全部
    2017-04-06
  • 49
    楼上 @ 周博磊 回答的很好。我再补充几点。机器人的SLAM问题最重要的就是求解相机的6自由度姿态Pose(3自由度的位移 t,3自由度的旋转 R),以及确定图像中点的3D位置。目前单目视觉SLAM的主流方法分为两派:1. Feature based Method,例如ORB-SLAM [1-2] 2. 显示全部
    2017-04-02
  • 106
    风格转移算法(Style Transfer)最早源自15年匹兹堡的论文[1508.06576] A Neural Algorithm of Artistic Style。原始版本只是把VGG当作特征提取器,后续的训练只是一个简单的方程优化,不是一个典型的深度学习文章,反倒是一些feedforward的后续算法 (例如L…显示全部
    2017-04-06
  • 54
    看了很多答案,还是忍不住答一发,人脸识别具体技术很多种,逻辑上有关键两步:人脸的注册和人脸的识别。注册就是说告诉计算机你是谁,你长这个样子,识别就是说我长这个样子,你说我是谁。 双胞胎的识别也分成两种情况:双胞胎两个人都注册了和双胞胎其中…显示全部
    2017-04-03
  • 191
    GAN最近的发展挺快的,可以去看ICLR 2017 Conference Track,可以参考最近的博文:GAN论文整理 ICLR 2017 | GAN Missing Modes 和 GAN 这几天NIPS2016,Goodfellow做了GAN《(NIPS 2016 tutorial)Generative Adversarial Networks (GANs)》…显示全部
    2016-12-03
  • 20
    诚如楼上各位所言,语音技术是个特别大的概念,当中最为大家熟知的是语音识别技术,单就这个来说,目前的发展方向,或者说最需要解决的问题的是噪音和口音的问题。因为对应到具体的使用场景中,大街上、汽车里、商场、甚至是家里,总是会有噪音的问题。我们…显示全部
    2017-04-05
  • 65
    在语音识别领域,这个可以理解为嘈杂环境下的降噪处理,和类似人脑的强大的模糊匹配的能力。目前降噪处理已经有很多比较成熟的方案,但是主要针对的还是语谱图比较稳定的噪声环境,例如高速行驶的车辆内的噪声就是比较容易研究和消除的。另外由于录音距离的…显示全部
    2017-04-05
  • 1412
    谢邀。针对这个问题,我们邀请了微软亚洲研究院机器学习组的主管研究员秦涛博士与大家分享他的观点。微软亚洲研究院机器学习组包含机器学习的各个主要方向,在理论、算法、应用等不同层面推动机器学习领域的学术前沿。该组目前的研究重点为深度学习、增强学…显示全部
    2017-03-10
  • 124
    终于来了个自己研究方向的题目~PS:路径规划(Path Planning)与运动规划(Motion Planning)在数学上是同一个问题,所以我在文中就直接混用了。 首先,我们要先明确路径规划/运动规划的定义:简单地说,就是给定环境、机器人模型,指定规划目标(如无碰撞…显示全部
    2017-04-04
  • 303
    资历不深,入坑一年的我仅从个人角度谈谈理解,希望能抛砖引玉。GAN对于人工智能的意义,可以从它名字的三部分说起:Generative Adversarial Networks。为了方便讲述,也缅怀过去两周在某论坛上水掉的时间,我先从Networks讲起。Networks:(深度)神经网络显示全部
    2017-04-05
  • 136
    不请自答。要找比较新颖有趣的传感器,我能想到的大致有两个思路:一是把目光投向那些牛校或者大公司的研究部门。毕竟商业化比较成熟的常见传感器(比如加速计和陀螺仪),估计也算不上新颖了,而那些研究院里的课题基本都是超前市场5-10年的技术;二是关注行…显示全部
    2017-04-05
  • 941
    我可能比较适合回答这个问题。比如下面是我的办公室实拍,装了各种传感器来检测周边环境。我也花了很多个小时逛传感器市场,知道不少相对冷门的传感器。言归正传,我觉得比较有意思的传感器有:微波雷达:就是警察用来测速的X波段雷达。利用多普勒效应测速…显示全部
    2017-04-05
  • 132
    NLP由于特征较为高层,因此现有算法处理起来比较容易,发展比较成熟,像文档分类等任务,简单的特征可以达到非常高的准确率。但是在享受完基于统计的浅层语义果实以后,下一步的深层语义理解则困难重重。像机器翻译,对话系统等依赖深层语义理解的任务,目…显示全部
    2017-02-05
  • 473
    谢邀 @郭同jetHACK @甘小楚。其实很早就想理一理这两者的关系。 先说我的观点:计算机视觉将越来越融合自然语言处理。 因为我自己是计算机视觉研究背景,所以下面主要讨论一下自然语言处理在计算机视觉中的几个应用。 首先,自然语言给计算机视觉的图片数据…显示全部
    2017-02-05
  • 129
    我很同意博磊的看法,计算机视觉在人工智能和深度学习的大背景下方兴未艾。如果我们站在人工智能的big picture上看,在迈向强AI的路上,vision还有太多的东西可以去开拓了。 举个例子:博磊特别提到的Robotics (or Simulation)+Vision,我见到北美几个组热…显示全部
    2016-10-23
  • 1342
    谢邀, 其实这个问题也是我近段时间一直在思考的问题. 昨天刚在组里做了个ECCV'16 Recap, 整理一下思路, 来尝试抛砖引玉. 我的观点是:计算机视觉在人工智能和深度学习的大背景下方兴未艾. 这里进入瓶颈期的,可能是一些计算机视觉的经典问题,如物体识别…显示全部
    2016-10-22