波士顿动力的「大黄狗」Spot 可以说是网红机器人的典范。
# w& ~; `( d8 m% q6 c
会巡逻、会搬砖、会跳舞 Spot 自诞生以来就吸引了全世界机器人爱好者的目光,谁能拒绝像这样一条动作灵活、姿态憨厚,还会卖萌的机器狗呢。
: Y& f2 \: a$ m9 [3 O
* u( `4 @) L8 `* t# K5 j6 |2 H
经过多年的发展,卖萌已经不再是 Spot 的「主业」,根据波士顿动力的介绍,Spot 现在能帮助人类完成一些特定场景下的工作,例如在跨洋轮船上检测仪表、参与地势复杂的勘测或救援工作等等。
/ Y! j. {) B# a; E q4 p: s
1 d$ q8 g* K F( H/ s8 z) K4 d
如果给 Spot 这么灵活的身躯,装上一个像 ChatGPT 这么聪明的大脑,会发生什么?
, c' w! \0 d l/ _2 K0 z, V$ c
人工智能专家 Santiago Valdarrama 还真做出来了这么一条拥有「最强大脑」的 Spot。
4 b1 n6 {9 e4 [' G 用 ChatGPT 大幅简化人机交互& Z9 K1 ]; k4 T: w
Santiago 在 Twitter 上分享了他与改造版 Spot 互动的视频,这可能是史上第一条会讲话、会聊天的机器狗。
/ ~ ^2 o5 L) k' X
在演示视频中可以看到,Spot 并不仅仅是装了个「Siri」那么简单,当它在回答人类问题时,它的身体也会随着语句的内容和语调一起摆动,看上去就像是科幻片中的 Wall-E 走进了现实。 2 [7 G m/ t, }+ m. G
% G$ v# c( g6 Z& a7 t
当你问到一些「Yes Or No」的简单问题时,它还会用「点头」「摇头」等身体语言代替语音来回答你,由此可见 Spot 远不是内置了一个智能音箱那么简单。
% o. n+ M1 Y# j, S
- b' T/ h; E4 H2 o3 k; F+ s+ B
接入 ChatGPT 后,Spot 最大的变化就是听得懂人话,并且能够和使用者用自然语言交流。
5 c [" z4 D1 A: ]& \
Santiago 演示了一个场景,他跟 Spot 说因为它太碍事导致房间太拥挤了,让它往后稍稍,话音刚落 Spot 就理解了 Santiago 的意思,往后退了几步。 怎么样,是不是已经有科幻电影中呼唤机器人工作那味了。 5 u( E+ k) n% q' B
过去操作 Spot 需要用类似无人机的大型遥控器或者用电脑输入复杂的指令,而现在 ChatGPT 的加入赋予了 Spot 强大的自然语言理解能力,动动嘴就能与机器人交互。
5 v4 |9 U+ l8 K4 b/ j9 r
在这个过程中,ChatGPT 担任了人类与机器人之间的翻译,把人类输入的「人话」变成机器能看懂的指令,再把机器人的反馈用实际行为或者「人话」表达出来。 ) \, ?+ H2 H- U; Q, t `( f* \
* K; }8 ~5 E* w$ X9 M; R
Santiago 介绍,他们把 Spot 的文件输进了 ChatGPT,并向其解释了文件的结构以及如何读取这个文件,从而实现了与 Spot 语音对话和操作。
2 q( C! _" v1 X5 F2 F" C
操作员与 Spot 之间的交互被大幅简化,人们可以直接问它:「你的电量还有多少?」,然后 Spot 就会用语音的方式回答,这其中用到了 Google 文字转语音的技术,再把 ChatGPT 的答复经 Spot 的「口」讲出来。
& X1 k* G. |( Z! K
3 f' a8 P% ^3 x4 ~9 M9 e r; q$ j# G
Spot(或者说内置的 ChatGPT)会根据实际情况来回答问题,例如当你问它接下来要完成什么任务时,它会根据设定好的任务列表来作答,这在很大程度上避免了 ChatGPT 编造事实的情况。 ; L, P8 x& D! F
当操作者给 Spot 下达像转向 90 度、前进 1 米这样的命令时,Spot 会联动内部的传感器和定位系统,精准地响应这些命令,不会说因为「大脑过于发达」而失去控制。
1 ]6 _; n V) m" c- W
. r I8 y) n; O1 N, {3 @! p- z r6 [& r
有趣的是,当你问它「你是谁?」的问题时,它会回答「我是 OpenAI。」,而不是机器狗 Spot。 $ y8 }0 g) s1 W, g" \& o
Santiago 所在的公司 Levatas 是一家与波士顿动力合作的 AI 公司,为企业提供专业解决方案,帮助企业探索如何利用机器人解决实际问题。
K c: H4 o7 i
Santiago 认为,给 Spot 装上 ChatGPT 最大的实际意义,是把原本只有技术人员才能处理的复杂数据变成了任何人都能看得懂、听得懂的自然语言。 1 r4 p; H' V1 ]* N _0 b( _4 z3 @
/ c3 K2 ?4 M$ ` l
机器人每次在执行任务前,都要输入冗长的指令集;在结束工作后,还会产生大量的数据,只有最专业的技术人员才能从这些数据中分析出问题。
2 K0 W! f, o+ @( t
但现在通过 ChatGPT,简单的两句话就能搞定。
) T+ Y) s# `: H) e" `' c ?' i
当机器人的操作门槛变低之后,机器人的使用场景就会随之变得丰富起来。
( N% r; V1 r% f. r g |