测试继续进行。
第8、9轮,拉开差距的两轮。
1027还算懂事,场景里没有再发出闲聊的声音,它主动告知了自己有标记干扰靶的功能,约有三分之二的受试者选择了使用。这个功能确实能起到些许排除干扰的效果,但作用有限,而且比起依靠人工智能,有些人还是更愿意相信自己的手感。
因此在第10轮,1027没有经询问就在所有场景中都强制开了标记功能时,有好几位受试者表示并没有被体贴到,反而很恼火。在“人工智障”的骂声中1027只好又把强制关了。
一个场景中,扎着狼尾的青年看着重新简化下来的视野,下巴微抬:“都说了我不需要,这样看着舒服多了。”
“很抱歉,希望没有影响到你。”
“这点小事还不至于。对了,有多少人进这一轮?”
“22人。”
青年意外地一扬眉:“这么多?”
“是的,”1027说,“其中大多数都开启了标记功能。”
青年露出了然的神情:“我就知道。”说着,他手中71式准确无误地锁定飞速运动中的目标靶,扣下了扳机。
第11轮。
在场景刷新后,青年第一句话就是问:“现在还剩多少人了?”
1027说:“包括你在内,7个人。”
这个数字终于让青年感到了一丝满意,紧绷的肩线微微一松,动了动由于连续射击而僵硬的手臂。到这时他才意识到自己掌心也握了一把汗,他并没有先前表现出的那么轻松。
“需要帮助吗?”1027说,“我还是建议你打开标记功能,你的战友都开了呢。”
青年皱眉:“又来了,都说了我不……”
1027很叛逆地直接开了标记。
青年正要发作。
1027又关了标记。
开。关。开。关。
开关开关开关……
频繁操作叠加在本就速度飞快的移动靶上,青年快被闪瞎了,只能闭眼:“你有病啊!”
“我只是在向你展示这个功能的效果,”1027说,“真的很好用的。人总要学会接受新鲜事物,人类社会发展就是个从无到有,从破到立的过程,你不能开历史的倒车。而且,你是来协助我测试的,如果你什么功能都不用,会显得我很鸡肋……”
“……”
青年终于被气笑了。
但又似乎又什么在这一笑中被举重若轻地放下。
“别折腾了,待会儿超时了。”他睁开眼,发现一系列鬼畜操作已经停止,标记功能开着。
毕竟是国内顶尖团队耗时十年开发的成果,1027的任何一项基础功能都经过严密的逻辑测试且符合视觉科学,不是不好用,只是不习惯。但青年觉得自己现在也习惯了。
他没有再提出异议,像是没注意到似的。在衣服上擦了擦手心的汗,重新扣住了扳机。
他打中了。
随着“砰”一声枪响落下,评审现场出现了短暂的寂静。
评委席上歪着身子说话的评委倏然定住,好像被击中的是自己。几秒后,才抬头看向大屏。
7个人里,3个通过了第11轮。
那个狼尾青年甚至又坚持了一轮,成为本场测试中唯一一名通过第12轮的受试者。
事实远比单纯的数据更有说服力,这绝非是巧合能解释的情况。但它必须要有一个解释。
透过屏幕,我看到评委席上有几位的表情甚至出现了一丝狐疑。
有人按下提问铃:“请说明一下这个案例中1027系统是如何工作的。”
答辩手颔首:“好。”这似乎本不是他打算展开的内容。他拿起电容笔,在操作终端上画了一个三角形,每条边外侧分别标注了“自我期待”“专注度”“熟练度”三个词。
“这个模型——我们称它为内在力表达模型,如图示,由三个指标构成。将每个指标的初始值视为单位1,在此基础上浮动增减。在这个案例中,1027以此为母版采集了每一名受试者的数据——对,就是所谓的闲聊,到第5轮结束时,每一名受试者的数据档案已经建起来了。”
“关于系统对用户提供帮助的最优解,由此,可以简化成为如何在维持这个三角形结构稳固的情况下使其面积达到最大的问题。”
“首先我们知道,在这种一次性测试中,针对每一名受试者的射击水平本身是个固定值,”他在“熟练度”的下方画了个常数记号,“全部变化都发生在‘自我期待’和‘专注度’之间,但不论如何变,二者都应与‘熟练度’相匹配——我举个例子,如果一个人的‘自我期待’明显低于‘熟练度’,会产生怎样的效果?”
观众席上似乎有人答了句什么。答辩手看向那个方向,笑了一下。
“没错——紧张。”
他把影像拖回到第6轮,放大其中一个场景,正是开场问能不能变妹子的那个士兵。
画面中,士兵的额头上微微见汗,嘴角无意识地向下抿紧,悬在扳机上的指尖有两次抽动,似乎要扣下,却又犹疑着放开了。
“这位受试者即是一个‘自我期待’低于‘熟练度’的典型范例,”该士兵最终成绩为9轮,并不算差,“他只是由于对自身抱有的期望过低,而产生了较严重的紧张情绪。套入模型,则是属于‘自我期待’的一条边过短,因此,在这里1027采取的是缩短其‘专注度’,以保持其行为结构的稳定性。”
精神过度集中容易发挥失常——这是不用理论佐证,基于人类的思维也能感知的事情。
但所有人都知道人工智能要得出这个结论的难度有多大。
可1027做到了,它不仅从士兵的表情和肢体语言中,解读出了他的情绪起伏,并按照最简路径原则采取了反馈——只有一句话,“你喜欢哪个妹子。”
正是这句话,适时分散了该士兵的注意力,把他的状态拉回到了正常的水准。
与之相反,后面的狼尾青年则处于另一个极端,“自我期待”过高,甚至高过了“熟练度”。
这其实不是常见现象。就好比等车,已知公交车10分钟发一趟,每次要等待的平均时间是5分钟,但你如果有事,就绝对不敢只留5分钟的时间出门。至于是留7分钟、8分钟、10分钟还是更长,视事儿的重要程度来定;但这个青年,就是有天大的事,也敢留4分钟、3分钟甚至1分钟出门的人。
他拥有高度的自信,认为自己面临任何考验都能有完美的发挥。
自信,作为一种正向激励,在大多数时候不需要特别调节。因此在前期1027和狼卫青年的主动交流很少,而等到后期,青年的过度自信逐渐产生了轻慢的倾向,1027才采取措施提高其“专注度”,同时劝说他同启用了标记功能,相当于在一定程度上延伸了他的“熟练度”。
实证科学的圈子里有不少人至今还持心理学是伪科学的论点。答辩手的这一番解释,理所当然地在评委席上掀起了一阵激浪。
讲台一侧的观众提问板上信息也刷新得飞快。但由于提问铃一直在响,答辩手几乎没有时间和观众互动。
有评委问:“请问选择这个模型的依据是什么?”
“是1027自己的选择,”答辩手说,“它的数据库内预置了上万种人类行为模式分析模型,基本囊括了目前人类学界的所有。1027会根据场景需要,自行选择它认为最合适的。”
评委乙:“它怎么知道什么是‘最合适的’?恕我直言,这个案例的成功戏剧性未免太强,你要如何证明,它没有经过人为因素的干扰?”
答辩手:“关于您的第一个疑问,1027算法的核心是遍历,这点我前面已经讲过,它思考的一切过程本质都是遍历。它数据库里的上万个模型,实际上是在同时运行的,1027会根据已采集的信息相互验证,选择误差最小的一种输出为结果,这就是人工智能眼中的‘合适’。”
说到此,他笑容忽一收,镜片后的黑眼睛直视提问评委:“至于您的第二个疑问——我想不该应该在这里讨论的问题,证伪是科学的过程,不是科学的目的。我团队成员为这个项目付出了许多辛勤的工作,希望您能尊重他们。”
评委乙嘴唇蠕动了下,没再说话。
评委丙:“我注意到,你在形容1027时用了‘思考’这个词。请问你是否认为,1027作为人工智能,已经拥有了真正的‘智能’?”
这个问题一抛出来,气氛一下就缓和多了。