Agent人工智能在虚拟现实环境中的应用

公式 3-3
p(xt, yt)是愉快度。愉快全面代表价信息,当感情价和情绪价都是最大值时,Agent最愉快,反之则最勉强。
A(xt, zt)是激活度。激活度总是处在困倦,及心理敏感度和生理兴奋度最大值之间。总是取负值的厌烦程度起降低激活度的作用。
d(t)是支配度。支配的存在是为了区分影响外界状况和事件的感觉,如厌烦和生气,或被外界环境控制的感觉,如恐惧和悲伤。
根据以上的计算结果,将情感归入相应的类,如图3-9。一个形容词代表一种PAD类别,人工设定相应的PDA值。

图3-9
每一类对应一个激活阈值Φ和一个饱和阈值Δ,如图3-10。当点在且仅在一个类的Φ内,类被激活,激活程度由公式3-4计算。当点在且仅在一个类的Δ,类完全激活,W = 1。如果以上条件都不满足,Agent进入特殊的混乱(Confused)状态。

图3-10
公式3-4
3.3.2 集成和应用 Integration and Application
最终,将情感系统集成到现有的Max中,设定相应的输入输出,图3-11。Max的认知构架通过两种途径提供给情感系统情感价信息:
(1) Interpretation和Dialog Manager,审察过程;
(2) Perception,对正面或负面刺激的直接反应。
而情感系统反馈给认知构架三方面数据:
(1) 情绪价和厌烦程度;
(2) PAD三元组;
(3) 被激活的情感类型及其强度,或者混乱(Confused)。
前两项数据用于Behavior Generation,第三项用于Dialog Manager。

图3-11 将情感系统集成到现有的Max

图3-13是Max生气并走出画面的例子
3.4小结
会话Agent对实时性的要求比较高,在交互、展示、教育上有广范的应用,但是由于硬件的限制,Agent的外形一般计较粗糙。
另一方面,会话Agent的语言、行为、情感都是由开发者根据实际环境预先设定,缺少自学习的能力,不能一般地在各种情况中切换。
还有,语言识别模块是会话Agent比较薄弱的一块,这个模块如果不能很好的适应环境,会使Agent答非所问,完全背离设计的目的。
所以,将来会话Agent的发展应该至少有三个方向:
(1) 更逼真的视觉效果,包括精细的肌肉变化、眼神的变化、毛发的飘动等,也许可以用骨架来控制肌肉变化;
(2) 学习能力的增强,对新语句的融会和理解,这需要语言学和人工智能其它领域的支持;
(3) 语言识别模块更强大,声音的采集处理,能够应付各种各样的意外因素。
四、行为Agent Behavioral Agent
行为Agent与会话Agent有所不同。行为Agent研究的是Agent在虚拟环境中根据环境的状态,调整行为,规划运动,完成目的,主要用于控制动物在虚拟环境中的运动。
徐晓媛[26]和James[27]分别就动物和人的运动模拟所做的博士工作,深入细致的探索了理论模型和实践方法。[28]提出垂直的多级抽象层次结构AHA (Asynchronous, Hierarchical Agents),模拟人类多层次的迭代思考过程。[29]将增强学习法(Reinforcement Learning)用于自发虚拟Agent(Autonomous Virtual Agent)的运动控制,采用Q-Learning和TD-Learning两种算法。[30]的离散调度机制决定运动随时间的变化,而由一个多通道构架完成动作的执行和渲染。
MIT Media Lab C4[31]的理念基于大脑被分成很多系统,并在一块黑板上交流。主要模块有:感应系统和感知系统,动作系统,导航和运动系统,短期记忆和心理黑板(Mental Blackboard)。C4的工作集中在训练一只家庭宠物上,4.1详细介绍。
4.2介绍Wen[32]等提出的将Agent的行为可视化的方法,。
4.1 C4





