AI在无人机、视频、机器人等领域的最新应用及前沿思考-格隆汇

今天的我们将会分享大疆科技、爱奇艺、宇树科技、和缓医疗、渡鸦等优秀企业对于AI在机器人、无人机、医疗、视频等领域的最新应用以及前沿思考。

作者：天风证券王晨

极客公园创新大会创立于2011年1月，是由极客公园发起的年度科技文化节，已连续举办7届。2018极客公园创新大会上，维基百科联合创始人Jimmy Wales、百度创始人李彦宏、搜狗CEO王小川、锤子科技创始人罗永浩、猎豹移动CEO傅盛、大疆创新总裁罗镇华、得到APP创始人罗振宇、小米科技联合创始人黎万强等多位重量级嘉宾莅临，分享他们在人工智能时代的思考和布局。

从2018年1月22日（周一）起将连续6天推送极客公园IF 2018大会全程纪要，敬请期待。

今天的推送中将会分享大疆科技、爱奇艺、宇树科技、和缓医疗、渡鸦等优秀企业对于AI在机器人、无人机、医疗、视频等领域的最新应用以及前沿思考。

一. 机器人间的「知识共享」带来的是威胁还是机会？

加州大学伯克利分校工业工程和运筹学系教授 Ken Goldberg

本次演讲将会分为三部分，过去、现在和如何准备未来？

第一部分，过去。在1953年，我们把一个机器人放在花园中将其开源令其他对机器人感兴趣的团队一起通过机器臂照护花园，最后超过10万人帮忙一起照顾这个项目。

第二部分，现在。

1）云技术问题。比如2018年人人都在谈论自动驾驶，无论是过去机器臂项目还是自动驾驶都需要借助云技术。目前经过多年的发展，科技界在云技术的连接上有了长足的进步，因此令我产生了将机器人之间的交流搬到云技术的想法。因为对于机器人来说，无论是从视觉上还是抓取上都需要用到大量的计算能力减少现实带来的不确定性。对于机器人的视角来说，现实生活的的干扰项过多，带来很多不确定性。需要通过云技术建立可靠稳定的模型，排除现实中的干扰。

2）低成本问题。全世界，即使是较为落后的非洲有很多人都对机器人感兴趣，我们创立了机器人项目，致力于降低机器人建造成本，造出10美元左右成本的机器人。

3）抓手问题。机器人抓手能够应用于电商企业，他们有成千上万的商品需要挑拣，对于机器人来说在多种物品之间进行挑拣是一个很大的挑战。

首先是，计算机视觉。这需要大量算力，建立三维模型。并通过算法计算出让机器人能够抓取的位置。这仅仅通过我们很难做到，我们集合谷歌云合作。

精度，我们通过不断的重复收集数据，并且不断挑战有难度的物品。这背后的算法利用深度学习网络。

目前云技术面临的挑战就是安全性和私密性。人们已经长时间焦虑人工智能会替代人类，但是今天每百个工人中机器人的渗透率不足1%。未来是一个“Multiplicity”的社会，人们和机器人和谐共处。每个人都将发挥自己的长处，人工智能仅仅只是一个可以讨论的对象，可供学习的对象。比如，谷歌找到的作家合作方案也是机器代理计算，但需要人工输入才能够进行。

人工智能未来会是一个很大的助力。人们的学习方式与机器有所差别，且上场领域天生就有差别，这回事一个很好的互补方式。未来不再是重“顺从”，而是一个强调“创造力”的时代，花更多的时间在于只有人才能够做到的东西，只有人类独有的东西，比如好奇心、创造力、深度思考人力等。

二. 个关于四条腿机器人的故事

宇树科技创始人王兴兴

纵观过去几年，机器人逐渐深入我们的生活，并且趋势在继续，尽管目前还不是爆发式的增长。

为什么四足机器人都采用液压动力？

在过去的一年中，开发了Laikago机器人，他可以向上爬坡，重量只有22千克。目前已经对外预售，如果进程顺利可以对外发货。他可以拉一些货物，也有其他运动功能，比如倒退，左移等。

四足机器人的结构参数：

1. 每条腿有三个电机（关节），整条腿有12个电机，保证运动性能。

2. 每条腿的长度，小腿长度，关节间距等参数。腿越长的机器人运动性能越好。

哪些点限制了组是机器人真正的推广？

1. 机械结构：结构复杂且成本较高，关节机器人对于关节密度的输出要求较高，工艺较为复杂

2. 动力系统：

3. 软件开发程度不够，且开源性较差

未来硬件成本不是问题，对于大部分硬件的精度要求不高，因此可以很好的规模化；

对于软件需要时间和等待，因此事未来需要发力且是有机会的点。

去年，没有有团队完成组是机器人AI的运动控制学习，在传统领域AI在运动的集成控制有很多应用。机器人在摔成任何姿态之后，可以随时站起来，或者在运动过程中某条腿出现问题，如果程序自动出现修复方案，在出现问题后依然能够运动，就是一个很好的应用。四足机器人运动只靠部分电机，因此这是可行的，但需要灵活的算法支撑。

三. 被忽视的工业力量

大疆创新总裁罗镇华

对于科技主义的概念，对于我来说就是一群忠实科技的人集合一起可以改变未来社会发展的潮流趋势。大疆在2006年于深圳创立，我们的创始人把大疆的初衷设定为科技乌托邦，与极客公园的设想不谋而合。我在此基础上补充两点，尊重奋斗，回归常识。

中国今天科技的崛起背后是无数科技人趟过的坑。过去十年，互联网的发展在聚光灯下已经得到了肯定，但是工业历来那个没有得到重视。我们相信工业力量在未来的十年中成为主导者，改变科技发展的潮流。

大疆就是中国工业发展的缩影。大疆创新在2006年由当时还在读研的汪涛先生创立。经过11年多的努力，我们公司已经是员工人数超过12000人，在全球7个国家建立11个办公室，销售网络110国家，2017年销售额达到180亿，同比增长80%。未来发展人民消费能力提升，对于影视、户外、泛文娱有越来越多的需求，继续增长。

大疆从航模起家，几年后开始尝试无人机，同时发展出不同的影像系统。做航模的体量与做无人机的需求有所不同，在安全性、稳定性、小体量等都是巨大的挑战。大疆的方式是先开发技术，然后技术有所突破后，按照消费者需求设计产品。技术为先使得大疆占领技术高点之后，横向拓展发现市场非常广大。

大疆宣传视频与以往有所不同，之前都是大山大河，今天场景截然不同。大疆无人机颜色形状都有所不同，从消费级向工业级拓展。

中国工业创新有两个特点：简单到困难，单纯到复杂。最近发现越来越多的科技巨头开始回归制造。

大疆面临的挑战：

1. 小型化：这两年的产品除了走向更智能化以外，体积也在缩小。可是在行业级应用，希望能偶把行业应用（除了农业植保）做到小型化，这样便于操作和较低成本。可是，这种要求对于我们有很大的挑战。它需要更大的冗余，不仅是性能还有安全性、稳定性。比如央视的直播，飞跃怒江拍摄桥栏搭建过程，因为纤绳不重，2公里不远。但是在强风强磁的环境用消费级很难做到。工业级和消费级的路由器需要有相当大的冗余，需要更高的安全性和更强的复原能力；

2. 集群化管理：大疆工业级发现第三方商业机构提供服务，由原来的两方合作，变成三方或者四方的合作。需要一个一站式管理平台，管理不同行业多个无人机的统一化管理；大疆为了进入行业级市场，大疆推出司空系统，提供简单高效的数据平台，将飞手、分析师和决策者打通，让被服务对象真正受益；

3. 开发者生态：第三方服务提供商，开放了大疆的SDK，超过10万的开发者参与，开发3000个应用，下载超过100万次。无人机提供服务方比如农用植保第三方服务团队必须存在，未来利用无人机提供服务的人成为非常关键的要素。

未来的团队除了白干院子世界，还要有改变比特世界的能力。未来的科技主义者能够加入以交叉学科为轴心的公司，科技者能够找到更大的舞台。大疆就是一个跨学科的平台，多种技术深度突破，进行集成产生产品。今年大疆跨入行业领域，需要更多不同背景的人才加入大疆。

大疆员工平均年龄不到27岁；不重视员工学历；只在于真知灼见，希望能够发现问题而且经过观察找到问题的本质，用积极的态度解决问题。

四. 跨越医疗边界，让每个人都得到健康关怀

和缓医疗创始人&CEO 李宇

医疗不是人们的追求，健康才是。中国平均寿命区域中间，效率较低。

中国和美国医疗费用相差十倍，但并不代表中国医疗行业有那么大的机会。因为美国医疗都是商业保险，没有任何社会保险。中国社保制度的本质就是低成本高效率治疗，医疗产业本身不会有那么多的支出。

中国医疗产业不会那么爆发，是因为中国想要得到较低的支出得到较好的结果，提高效率。美国之所以占比那么高，因为50%医疗服务都花在5%的重症上，中国也有与之相同的趋势，60-80%的医疗费用花在死亡之前一个月。

医疗的思路最早是全部切掉，但发现其他地方也能涨；之后说良性留着恶性切，只能使用与部分癌症。这说明科技在医疗领域不是万能的。预期 40%的疾病与心理状态有关，做一个乐观积极得人一定更好。

我们在预防上多投入1元，救恩能够构建少急救100元。

每天微生物群都在博弈得到宏观上的稳态，因此平时看不出来。

对于健康的人来讲，生存率抛物线的趋势不可逆转，但心理年龄是可以控制的。人生最大的悲哀就是把生理和心理都过成了抛物线。

自我效能感，是一个心理学上的概念，需要自己对社会别人有价值，不然就意志消沉自甘堕落。人到中年发现中年危机。需要知道怎么办“Know-How”。

健康问题需要找医生，中国缺医生和患者之间的信任，有钱也买不到可靠。因此我们（和缓医疗）开始从互联网分级诊疗开始增加信任感。目前已经南扩全国主流三级甲医院主任级专家。建立了移动虚拟医院，提高了效率。在全科医生层面推出24小时服务，不用等待随时看病。

针对信任问题，按照美国家庭医生标准培训，自建医生团队。全职医生的收入仅仅取决于看诊收入，与后续药品收入取消挂钩。同时，主动选择公司层面取消提成式的采购方案。会员的信任才是我们公司最大的资产。

五. 换一种方式理解「机器人」

渡鸦创始人 & CEO 吕骋

简单定义一下什么事Raven R？

无法定义，每个人感觉都有差别。是全球第一款全自动六轴机械臂情感机器人机器人。

在设计和脸上 Raven R和H看起来比较相似，有何区别？

R是可以进行拆卸，也可以装在智能音箱中有较多应用场景；H具有鲜艳颜色、设计感和标杆式交互方式。Raven H已经开始发货了。

很少看到类似的数码产品，设计也是你们主打的特点，我知道有你们的原型图也带到现场，能不能与我们分享？

渡鸦的团队很少，只有10人，且很少与人合作。这次与瑞典的Teen Engineer团队合作，金冠团队合作不容易，但是合作效果比预想的要好。我们用了特殊的打印机，Raven R的设计上从草图到成品基本没有改变。而Raven H先设计脸。渡鸦的设计以直觉为准，希望人看到没有插电的模型，希望上手把玩，设计之后我们会在元器件有突破，想办法塞进去。我的职业生涯中没有碰到过草图与产成品一样的设计，RavenR是第一个。

什么样的合作方式？

用iPad格子设计，希望把机器做出温度感，想到Pixel的经典作品，在iPad上进行快速设计。从简单的2-3轴改到6轴。19*19的点阵屏成本比高清屏高，但是会有科技感。

怎么定义情感？

做了很多思考。谈到机器人会想到形态。这个事很表面的，需要考虑到心中的定位。如果定位仅仅只是工具，比如手机助手的定位是一个工具不会产生感情。有那种人形的机器人想从形象上突破，但是如果定位不改变那么产生感情也会很难。并不一定是技术上有突破才会有感觉，而是心理的定位要有所差别。我之前做了一个实验，当我的团队看到动作反馈的时候会突然把他拔掉，发现技术团队每个人都有不适感，表明做到了一定的情感沟通。哪怕反馈没有满足。

我们认为Sophie完成不了工具上的应用，情感化不是简单的模拟某个人。现在有一个印象还是机器人是一种终极形态吗？

终极形态还不存在。但正是因为不存在所以是最好的时代，可以大胆探索。而且即使是在未来，也不应该是一个形态。我们先入为主讨论的不是功能，不是技术，而是讨论人工智能要填补的定位，这才接近最终形态。现在，传统的数码产品有对工具的定位。我对Sony、Nintendo等公司在蟾皮感情haul方面做得非常好。如果由某个产品能够打破电子产品工具化的定位，才接近最终形态。

希望消费者能够拿着Raven R做什么呢？

对于人工智能产品，不应该能够有这种定位。应该是一种功能与情感的boundary，或者叫做羁绊。仅仅把功能完成好不能产生羁绊，还需要情感的映射，这与产品的形象无关。Raven R不是为了完成什么，而是一个吸引人的形态。我们在产品上留了很温馨的点，比如R的底座可以塞进人和汽车的杯架里，艺术家的专辑都已放到脸上变成一个唱机，还有带补光的化妆镜，电风扇等等配件。因此R不是满足什么工能，而是激发人们的想法。

名称有什么意义？

A8：之所以没有起名字，是因为不想让它进入命名的灾难。想要学习保时捷，那么多年就是911.我们希望消费者起名字，第二希望没有性格一个原始的型号。我们把带有意义字母去掉，进行取名。

什么时候会感受到他？

今年7月份发布开发者版本，年底开放消费者版本。开发者版本会开放所有的源码。

六. AI 时代下，如何重新理解视频？

爱奇艺CTO 汤兴

目前正处于视频的风口，爱奇艺2017年8月在线时长76.8亿小时，相当于88万年。

回归视频历史，视频具有100多年的发展历程，逐步向AI时代靠拢。AI时代下的视频会是什么样的形式？

不可否认的是AI深度的改变了视频传播的方式，撬动了整个生态，包括制作、分发、变现等。

AI在爱奇艺的多个领域有深入的应用。

1. 创作阶段：以前采购成本达到40-50%，现在成本可能更高。该怎样去选择演员，内容变得更加重要；可以通过AI对于电影和电视剧的票房或者流量进行智能预测，比如《急诊医生》的预测和最终表现的差异只有3%。

2. 生产阶段：加入视频指纹，防止盗版，结合区块链的引入，AI时代将会越来越智能化；过去的宣发很难追踪数据，但是爱奇艺泡泡宣发平台可以达到精准的导流。

3. 视频标注：让视频可以被标注、检索。除了题目、演员等初级信息之外，可以对镜头进行分析，对于场景、对白等进行智能标注；未来跟眼睛一样我们对于镜头、图像进行搜索，找到相应的人物和物体。通过建立3维立体模型，提高干扰项目的精准度。

4. 分发阶段：可以根据用户的不同需求提供不同的码流，不同的视频；爱奇艺有全网最大的搜索库。用户的推荐来自编辑的推荐，智能推荐和朋友推荐。每天30%的播放量6已多次来自于智能推荐。

5. 变现阶段：用户不讨厌广告，而是讨厌与自己无关的广告。因此在AI可以把镜头内容与广告结合，减少用户抵触；比如在吃饭的场景，插入可口可乐广告。对于吃饭的对白，插入相对应的广告。

6. 客服阶段：减少人工客服工作量与提高接通率。

AI令视频创作的门槛降低。目前在互联网上高质量视频仍然很少，如何筛选优质的视频有很大难度。我们知道有同人小说的概念，有更多后续的发现。通过对动画的重新编辑加入新的音轨产生新的艺术形式。经过100多年的发展，沉淀在媒介系统中的视频有非常大的规模，如果能够被重新利用能够更好地进行创作那么就能够产生更多优质内容。AI让人人都能够成为导演的时代来临，把场景标签化，智能场景融合，智能加入动作合成视频。让消费者进行逆向的操作，对镜头重新标注，重新识别，建立镜头间的联系，并重新组合，当用户想要创建镜头可以有效利用。比如去一次埃菲尔铁塔拍摄成本较高，但是如果利用以往的镜头，那么就可以更多精力放在创作上。大量利用旧视频继续创作，可以减少创作门槛。手机仅仅减少了拍摄的门槛，但是镜头创作的门槛没有继续，加入区块链技术对尽头进行版权保护对于后续的版权保护和广告收入等进行追踪。

未来AI将会是

1）无所不知，对于视觉、语音都能够进行理解，今天可能只知道有吴亦凡，明天还能够告诉我们他在唱freestyle，粉丝在疯狂打call，让机器理解不止是像素还需要有对情景的理解；

2）交互上无所不能，VR和AR的发展事实上能够让我们在千里之外出现，戴上眼镜之后和世界各地的人一起开会。在不远的未来，极客大会的未来只需要在自己家里进行演讲，但在台上可以看到三维影像；

3）无所不在，AI降低创作的门槛。目前视频的创作还依赖专业的studio的情况变成全民制作自媒体的时代，吸引更多的用户参与。并且通过区块链可追踪，点赞可以跨越平台。未来甚至会衍生出万物互联的视频雾。

AI的后天

视频的终极形态是平行世界。出现在一个完全虚拟的世界中，当参与未来AI的发展可以创造出虚拟的世界。今天VR技术可以让用户随着登山队看沿途美景，在未来一定可以通过视频娱乐去体验体验不到的人生。

娱乐的发展是否会有失控的风险？

在高度智能的时代娱乐内容泛滥的时候如何让人重新思考？随着时代的发展负面情绪也会袭来，但是人类一定能够找到新的产业。人类希望把重复性的工作交给机器去做，AI时代人和机器需要更好的交互。视频的发展是一直探索的未来，未来娱乐和人更好地结合，娱乐会有更大的变化。

AI在无人机、视频、机器人等领域的最新应用及前沿思考

相关阅读

评论