是向两腿机器人过渡的必要桥梁。比赛在两支各有3个机器人的球队之间展开,机器人的外形是一条四腿狗,能完成比赛所需的各种动作。
类人组(Humanoid League):由类人的两腿机器人进行,分为规定动作部分和自由发挥两部分,规定动作部分包括单腿站立一分钟、点球大战、踢球等。
仿真比赛采用分布式控制方式,相当于每个队员有自己的大脑, 因而是一个独立的“主体”。 其技术特点是:
(1)动态实时系统:Soccerserver一个周期是200ms(3D),服务器每个周期都会向球员发送感觉信息和通讯信息,在这一个周期中球员必须向服务器发送一个动作指令更新一次场上信息。
(2)分布式合作与协调:11个独立的智能体程序合作组成一只球队。 (3)带噪声的、非全信息的环境模型:球员智能体的动作和感知信息都被Soccerserver加入了噪声干扰,使得动作存在偏差,感知信息也存在误差。
(4)非符号化的环境信息。
(5)受限的通讯带宽:球员智能体在每个周期内只能发送几条最大长度为512字节的通讯信息。
Robocup的最终目标是:“到21世纪中期之前,一支完全由人型机器人足球运动员组成的足球队在世界足联规定的比赛规则下战胜人类世界杯冠军”。
1.2 选题背景与意义
2004年在葡萄牙里斯本举行的第八届Robocup机器人足球世界杯赛中增加了Robocup仿真组3D的比赛,Robocup3D和Robocup2D足球仿真比赛目的相同,新的比赛加入了第三维使得比赛更接近人类比赛环境,Robocup3D仿真比赛将逐渐取代Robocup2D仿真比赛。在这次比赛中报名参加3D仿真比赛的队伍共有64支队,最终有17支队伍通过了预选,其中很多队伍是Robocup仿真比赛的世界一流强队,比如前世界冠军葡萄牙FC Portugal队,连续四届世界亚军德国Brainstormers队,清华大学队以及德国AT-Humboldt等老牌劲旅。我国只有科大蓝鹰队和清华大学队参赛,分别获得第5名和第9名。随后进行的2005德国公开赛和美国公开赛均有Robocup3D的比赛。2005机器人足球世界杯赛将于2005年7月在日本大阪举行。中国机器人足球从2001年开始全国性的竞赛活动,2005中国机器人足球大赛将于今年七月底在江苏常州举行。
建造机器人进行足球比赛是很有挑战性的工作,激发了大家极大的研究兴趣。到1998年4月,共有22个国家1000多名研究人员在进行此方面的研究工作。我国目前有20多所高校和科研单位开展机器人足球研究,主要包括清华大学、中国科技大学、国防科大、东南大学、上海交通大学、同济大学、厦门大学、北京理工大学、南京邮电大学等。东南大学仿真组(2D)代表队将于今年7月出
征在日本大阪举办的Robocup2005 OSAKA机器人足球赛。国内的比赛也将在今年七月底举行,东南大学仿真组2D和仿真组3D将同时参赛。
1.3 研究现状
Robocup仿真组2D的研究在国际国内都日趋成熟,其仿真器版本已达10.10;智能体结构、个人技术动作、球队的战略战术、对手建模等方面都有了一些成熟的方法。
1.3.1 智能体(agent)结构[2] ( 节下子标题:宋体、加粗、小四号,行间距与正文一致为20磅,增加段前和段后分别为0.5行)
智能体结构可以分为慎思结构(Deliberative 智能体)、反应结构(Reactive 智能体)和混合结构。前两种结构有其各自的缺点:纯粹的反应式系统很难设计直接目标的行为;大多数基于推理机制的慎思系统不易处理实时信息而且缺少反应能力。作为一种主要的混合结构模型,层结构能在实际中有效克服前述两种结构的缺点。层是结构化功能与控制的有效手段,同时可以使设计的系统具有多种期望的属性,如reactive能力、deliberative能力、合作和自适应能力等。层结构的主要思想是按照智能体的功能将其结构分成2个或更多的混合组织的层,层之间可以互相交互。关于层结构的详细描述请参阅文献[3]。(此处文献序号不用上标) 1.3.2 个人技术动作
在球员的个人技术动作方面现在主要采用的方法有经验式、数学解析、机器学习等。经验式方法简单,易于编成实现,但是它的误差较大。数学解析方法效率高,解比较精确而且可以求出全部的解,但是很难对动作建模。现在各个球队采用最多的就是机器学习算法,这种方法有较大的通用性,简单,且鲁棒性好。在球员的个人技术动作方面,历年的很多强队都公布了他们在这方面的代码,到目前为止这类问题的研究已经比较成熟,很多队伍都已经具备了很好的个人技术。
1.3.3 球队的战略战术
Robocup 是一个充满合作与对抗的多智能体环境,球队的整体策略是一个典型的分布式多智能体问题。
由于服务器发给球员送过来的信息是有噪声的,因此建立一个精确的世界模型是球员做出正确决策的基础,这里介绍两种球和球员位置速度的预测模型[7]。
一种是基于BP 学习算法的预测模型,通过对球员和Coach 获得的位置、速度信息进行采样,因为Coach 获得的信息是无噪音的,可以将它作为导师信号,
而将球员获得的前几个周期的位置、速度信息作为神经网络的输入,对BP网络进行训练。在比赛过程中运用训练好的BP 神经网络对球和球员的位置和速度进行预测可以取得了较好的效果。
………………………………………………………………………………………………………..
(公式从第五个汉字处用公式编辑器编写,要按照章进行编号,格式为章号-式号)
W??s?z?z?0?? (1-1)
………………………系统幅值随频率变化曲线如图1.1所示。………………………
(所有文章中出现的图形和曲线都必须在文中引用,并且按照此方式进行标注说明。)
图1.1 系统幅值Mp随频率ω的变化曲线(宋体,字号为五号,段前0行,段后0.5
行)
(所有文章中出现的图形和曲线都按照此方式进行标注说明。图号要按照章
进行编号,格式为章号.图号)
在开发智能体的同时,各个大学也开发了不少辅助工具,如阵型调整工具,比赛统计分析工具,离线教练等等。这些工具的开发为智能体的开发调试提供了强有力的支持。
1.4 本文的结构
本文以_________的研发工程项目作为应用背景,对____________技术进行了研究。全文共分为七章,各章的主要内容如下:
第一章扼要地介绍了_____________________________________________的概念、特点与相关研究背景;
第二章研究了__________________________________;
第三章对__________________________________________________进行了研究,给出了_______________________________________的控制方案,并讨论了__________________________的设计方法;
第四章________;………………………
第六章总结了全文的研究工作,给出了存在的问题和进一步研究的方向。
(正文中公式必须使用公式编辑器书写,正文,宋体小四号,行距20磅;英文及数字须使用Times New Roman字体)
第六章 结 论
6.1论文总结(包括:毕业设计(论文)主要工作与结论、存在的问题或者可以改善提高的地方)
Robocup仿真程序研究是人工智能领域的一个统一平台,世界范围内的学校和研究机构正在开展着广泛而深入的研究,本论文旨在为以后参与进来的研究者提供一个基础,同时要构建一个队伍参加今年七月底在常州举行的2005中国机器人足球大赛。经过近6个月的工作,本论文已成功构建了一支队伍,同时保存了完整记录文档。相关工作总结如下。
6.1.1 主要工作及结论
1.熟悉Linux操作系统及其基本操作,掌握Linux下C++和Matlab的程序设计方法以及相关工具。了解UvA底层代码的特点和工作方式以及各个变量和函数的功能。
2.通过Server和SPADES手册了解Robocup3D程序的通信手段。合作翻译了SPADES手册和相关英文资料。了解2D和3D的区别和相同之处。
3.对server中物理模型的参数进行测试,得出准确可靠的模型计算公式。 4.采用面向对象的思想,分层次、分模块构建智能体的总体框架。 5.构建智能体的结构完整world model,并深入研究了对场上移动物体的定位问题,并对不同方法实际测试作比较。
6.1.2 存在的问题
1.目前智能体的编译是基于3Dserver,需要使用SPADES提供的智能体库构建一个智能体与SPADES通讯的接口,从而使智能体独立于服务器。
2.个人技术还不完善,加速到某一点的精确计算,踢球的精度的控制等都仍需进一步完善。
3.服务器和SPADES等相关平台还不完善,还在进一步完善中,如果他们尤其是server提供的模型稍有变化,就需要在智能体的模型和相关动作中得到实现。
6.2 感想或者收获(仅供参考)
对本人来说这是一个全新的领域,参加这个项目拓宽了本人的知识面,拓展