基于MPC的驾驶员转向控制行为建模与仿真
2021-11-27
来源:意榕旅游网
第3l卷第3期 文章编号:1006—9348(2014)03—0198—06 计算机仿真 2014年3月 基于MPC的驾驶员转向控制行为建模与仿真 吉岩 ,郭洪艳 。,曲婷 ,陈虹 (1.吉林大学汽车仿真与控制国家重点实验室,吉林长春130025;2.吉林大学控制科学与工程系,吉林长春130025) 摘要:为了描述驾驶员的转向行为,研究了驾驶员转向过程中的预瞄及滚动优化行为,由于难以用简单的数学表达式反映汽 车转向过程中驾驶员的行为,提出选用搜索算法及模型预测控制方法(Model Predictive Control,MPC)进行具体建模。最后, 结合车辆动力学软件veDYNA对所建立的驾驶员转向行为模型进行验证。仿真结果表明.驾驶员转向控制行为模型对人类 驾驶员的仿真相似程度较高,符合人类驾驶员的驾驶特点,说明改进模型预测控制理论为研究驾驶员模型提供了有效途径。 关键词:驾驶员;转向控制行为模型;模型预测控制;搜索算法;仿真 中图分类号:TP391.9 文献标识码:B Modeling and Simulation of Driver Steering Behavior Based on Model Predictive Control JI Yan ,GUO Hong—yan ,QU Ting ,CHEN Hong ’ (1.State Key Laboratory of Automobile Simulation and Control,Jilin University,Changehun Jilin 130025,China; 2.Department of Control Science and Engineering,Jilin University,Changchun Jilin 130025,China) ABSTRACT:To imitate the behavior of a driver steering,the abilities of preview,cognition,prediction and optimi- zation were researched.Because the driver’S behavior is complex in the process of vehicle steering,it is difficult to be expressed with a simple mathematica1.Selecting the search algorithm and Model Predictive Control,the driver steering behavior was modeled.At last,combined with vehicle dynamics software veDYNA,the simulation was con— ducted with the real vehicle data.Compared with the results of the human driver,the driver steering behavior model has a high similarity,and can meet the human driver's driving characteristics.Therefore,the model predictive control theory can provide an effective way for driver model study. KEYWORDS:Driver;Steering behavior model;Model predictive control(MPC);Search lagorithm;Simulation 1 引言 据统计.我国每年因交通事故死亡的人数超过10万人。 员模型l2],但该模型没有考虑驾驶员的预瞄行为,仅仅依靠 汽车的运动状态引起的与预期路径之间的横向偏差进行补 其中大部分的交通事故都源自于复杂的人一车一路闭环系统. 并且驾驶员是最主要的因素。随着计算机仿真技术的发展, 可以采用虚拟的驾驶员及车辆模型对人一车一路系统进行分 偿校正,这并不符合驾驶员的特点。之后。日本学者Kondo 提出了预瞄跟随模型[3],预瞄跟随模型发展的初期阶段,驾 驶员的行为都是通过传递函数中的正向校正和反馈估计来 模拟 4].由于传递函数的参数只能根据设计者的经验来给 出,因此这类驾驶员模型的准确性有待提高。随着研究的不 断深入以及控制理论的发展.模糊控制[5][ 、神经网络控 析和评价,这不仅提高了系统的安全性,同时也有效地节约 了实车试验成本。因此,一个能够反映真实驾驶员行为特性 的驾驶员模型对于人一车一路闭环系统的分析与评价是至关 重要的 。 制 1『引等智能控制方法被应用于驾驶员模型的研究,模糊控 制模型与神经网络控制虽然一定程度上能表示人的思维与 驾驶行为,但由于两种方法都需要充分利用驾驶员的经验, 需要大量的试验数据,因此成本较高。 应用上述方法建立的驾驶员转向行为模型已经取得了 一为了模拟驾驶员的驾驶行为.国内外许多学者已经做了 不同的研究。早期阶段,McRuer等人发展了补偿跟随驾驶 基金项目:教育部”长江学者和创新团队发展计划”资助(IRTIO17); 973课题(2012CB821202)863项目(2012AAl10701);吉林 大学汽车仿真与控制国家重点实验室开放基金项目。 收稿日期:2013—07一O1修回日期:2013—07—16 ・--——定的成果,但仍有不足之处,而且,实际的驾驶员是复杂的 变动态系统.上述方法在某些情况下并不能很好的反映驾驶 员行为的动态特性,无法达到满意的动态效果。1980年,美 198..-—— 角 之间的关系如由式(1)所示。 Fyj 2cF (1) Fy.,=2C月 式(1)中,c c 分别为前后轮胎的侧偏刚度,同时,式 (2)给出了轮胎侧偏角与汽车速度、横摆角速度以及前轮转 角的关系。 ,:6一。rctan( ) (2) ,:。 t ( ) 另外,设Pos 为车辆在大地坐标系下的侧向位移,根据 车辆坐标系与大地坐标系的转换关系可得: Posr= rcos + sin (3) 为了简化该模型,作如下的近似: 。rcta ( ) 。 t ( ) cos 1 sm cos8 1 结合(1)一(4)式,根据∞= ,选择 :[Pos ] 作为系统的状态变量,转向盘转角 作为系统的控制输入, 转向盘转角与汽车前轮转角的关系为 =A8,其中A为转 向盘转角到车轮转角的转向系角传动比。选择汽车在大地 坐标系下的侧向位移Y=Pos 作为系统的输出,可将车辆模 型写成如式(5)的状态空间形式。 =Ax十 u , L) Y=Cx 其中, O 1 0 0二 ± 0 m口 ntv = 。 二 ± : 。 如 、 (6) 0 0 l 0 B=[。 警01 C=[1 0 0 01 将状态空问表达式(6)离散化可得: (k+1)=Gx(k)+ (k) … Y ( )=Cx( ) 在这里,G=e ,日=I eAtBdt。 3.2预瞄行为建模 为了模拟驾驶员的预瞄行为,这里采用搜索算法模拟图 1中驾驶员对路径的预瞄行为以获取期望路径信息。假设驾 驶员期望跟随的道路信息是已知的,采用如表1所示的离散 数表形式记录车辆行驶路径信息。表1中的序号代表路径 ...——200...—— 的方向,n为道路终点,每一对 、y坐标代表大地坐标系下一 个路径点的横坐标、纵坐标,这些点按方向连起来可以描述 一条完整的路径。图3中,期望路径被描述为表1的形式,在 大地坐标系XOY下,假设汽车纵向速度 不变, 为道路的 起点,汽车的当前位置用坐标表示为( ,yn),驾驶员在汽车 当前位置所看到的前方路径信息称为预瞄信息。 表1 期望信息表 (七) 图3 获取预瞄信息的示意图 期望路径信息的获取大致分为三步:首先,计算车辆当 前在大地坐标系下的横坐标;其次,在表1中寻找车辆位置, 并将此位置存为下一次搜索的起点,以减少下一次搜索的时 间;最后,根据第二步获得的车辆位置,在驾驶员的视觉范围 内依次寻找路径点,采用多点预瞄以反映驾驶员向前预瞄一 段距离的特点,其具体流程如3.4节中图4所示。基于以上 的搜索算法,驾驶员可以获得期望路径信息r(k),以此模拟 驾驶员的预瞄行为。 3.3 预测、优化行为建模 根据第2节的分析可知,模型预测控制的原理与驾驶员 预测优化行为是一致的,因此本文选择模型预测控制的方法 模拟驾驶员的预测和优化能力。根据模型预测控制的基本 思想,于当前k时刻预测[k,k+ ]时域内的动态行为,本文 中选择预测时域为 ,控制时域为Ⅳ ,满足N ≤ ,N 时刻 以后,控制输入不变:u(k+Ⅳ 一1)=u(k+Ⅳ )…=u(%+ 一1),定义k时刻的预测输出方程为(8)式: y (k+l I k) yⅣ(k+1 I k)全 y (k+2 I k) (8) (k+ l k) 同时,定义k时刻的优化控制输入序列U(k)为: (k) 31,(k+1) 素 (k),即决策出的转向盘转角传递给神经肌肉系统。下 一时刻,控制时域向前推进一步,上述预测优化过程重复进 u( )=[1 0…0】U(k) (16) U(k)全 (9) 行,即可对车辆的转向进行闭环控制。 3.4 神经肌肉系统模型 u(k+N 一1) 根据模型预测控制的基本原则和相关理论,可推导出k 驾驶员的神经肌肉系统的限制主要来自驾驶员的肌肉 时刻 步被控输出的预测方程如下: l,Ⅳ(k+1 I k)=Sxx(k)+.s U(k) (10) p 其中, S =[CG CG2…CG ] CH 0 0 CGH CH 0 S = N p。。。H CG 一 H CC5— H cG H :0 在这里, (k+1 I )反映了驾驶员对车辆未来输出的 预测。同时,根据3.2节驾驶员预瞄到的期望路径信息 r(k),定义如下的参考输入序列: r(k+1) r(k+2) (12) r(k+ ) 对于转向行为,驾驶员的期望是:在转向盘动作不要太 大的前提下,使车辆实际输出的侧向位移跟踪上预瞄得到的 理想侧向位移,实现车辆侧向行驶轨迹的控制。为了反映驾 驶员的期望,这里选择二次型性能指标J(y (j}),U(k),N , )为目标函数: J=l lr (y (k+1 I k)一R(k+1))l l+ll F U(k)Il (13) 将驾驶员的期望描述为(14)式的优化问题,即使目标 函数J(y。(J}),U(k),N , )值最小: min川)J(Y (k),U(k),N , ) (14) 式(13)中,J。=l l r ( (k+1 I k)一R(k+1)I I 反 映了实际侧向位移与理想侧向位移的偏差,J2=ll FuU(k) Il 反映了驾驶员对转向盘的操纵, 和f 分别是输出序列 和控制信号序列的权重因子。 能够反映驾驶员对于路径 跟踪精度的要求, 越大,车辆侧向位移的偏差越接近零,即 路径跟踪的精度越高。 则反映驾驶员对控制动作的要求, rⅡ越大,驾驶员的控制动作越小, 越小,控制动作则越大。 显然,给定权重因子 和L同时最小化.,。和 是矛盾的,因 此调节过程中需要对二者折衷考虑。求解(14)式的优化问 题,可得系统的控制输入序列: U( )=(|s Tl TI1 S +r Tr )I1S Tl TryE (k+1 I k) (15) 其中E ( +1 l k)=R(k+1)一.s (k),根据模型预测 控制的机理,如式(16),将得到的控制序列U(k)的第一个元 反应滞后。驾驶员的肌肉反应滞后描述的是驾驶员对信息 的感知延时,这种滞后通常是一种纯滞后,可用传递函数来 表示,因此本文选用(17)式的传递函数,其中,t 为纯滞后时 间常数,代表人的肌肉反应时间,其参数选择可依据文献 [11]。 D(s)=e-tds (17) 综上所述,设计驾驶员转向控制行为模型的流程如图4 所示。 图4 驾驶员转向行为模型的流程图 预测行为建模 优化行为建模 其中 与车辆坐标系下的纵向速度、侧向速度以及横摆 角的关系为 = cos ̄b一 sin ̄9,T为采样时间,f 为驾驶员 的预瞄时间,xo(k一1)和xo(k)分别为上一时刻和当前时刻 车辆在大地坐标系下的纵向位移, 代表路径表中第s点的 横坐标, 代表路径表中第s点的纵坐标,r(i)为获取的路径 信息。 4 仿真与分析 为了验证所建立的驾驶员转向控制行为模型对人类驾 驶员的模拟程度,依据图1及图4,将实车试验获取的道路信 息输入所建立的驾驶员转向控制行为模型对车辆进行控制 (包括国际标准的双移线试验和国际标准的蛇形穿杆试验), 并针对人类驾驶员与驾驶员模型的行为以及二者所引起的 车辆状态进行对比分析。 4.1 仿真动力学模型 由于实车试验中人类驾驶员操纵的是红旗HQ430轿车, 一201一 因此为了保证二者的一致性.本文采用了实验室已搭建的以 表2仿真参数 车辆动力学软件veDYNA为框架的HQ430轿车仿真模型,经 过验证该模型符合要求,可以用于仿真研究。由于这部分不 是本文的重点,因此建模过程不详细描述。 4.2仿真结果 根据进行的实车试验:驾驶员为驾驶经验丰富的老司 一 目D,雠嘲瘟番 机,试验场地为清洁、干燥、平直的沥青路面,双移线试验纵 向车速稳定在64km/h后进入试验区段.蛇形穿杆试验纵向 车速稳定在50km/h后进入试验区段。因此,本文选择的路 面摩擦系数为0.8,双移线工况所设置的车速为64km/h,选 择参数 = 、f。=0.4,20,蛇形穿杆工况所设置的车速为 50km/h,选择参数 =,20、f =0.5,20。其余的驾驶员转向 一 控制行为模型参数及 30车辆参数如表2所示。 ~一黜 较 ( (b) __ 曼 剖 _一。 __ £ ≥ _ | _ _— 200 x坐标/m 车辆行驶轨迹对比曲线 (d) 驾驶贾模型 一宴际驾驶员 | 。 喜 /\\ fl 蝌 、 一 艘 f L 7 J 驰 蜒 8 to 12 14 16 1 8 。 … 1 ’… … ’ l ’…l 时何 时闻/s (c)转向盘输出对比曲线 (d】车辆横摆角逮度对比曲线 图5双移线试验的对比曲线 将双移线道路信息输人本文建立的驾驶员转向控制行 针对实车试验的这一位真实驾驶员进行建模,而是模拟一类 为模型,对HQ430仿真车辆进行控制,得到如图5所示的对 驾驶员。所以驾驶员模型优化输出的转向盘并没有与实际人 比结果。其中实线表示实车试验测得的数据。虚线表示本文 类驾驶员的输出完全重合。但转向盘趋势、幅值及时间历程 仿真得到的数据,图5(a)为仿真设定车速与实车试验的对 相差不大,满足实际双移线试验的要求。图5(d)反映了驾 比曲线,图5(b)为车辆的行驶轨迹对比曲线,图5(c)为驾驶 驶员操纵引起的车辆状态,HQ430仿真车辆输出的横摆角速 员模型优化输出转向盘与实际驾驶员输出转向盘的对比曲 度符合实际HQ430轿车输出的横摆角速度。因此,这一组 线,图5(d)为驾驶员模型操纵车辆输出的横摆角速度与实 数据可以说明驾驶员模型的有效性:驾驶员转向控制行为模 际HQ430轿车输出横摆角速度的对比曲线。从图5可以看 型对车辆的操纵与实际驾驶员对车辆操纵的行为是一致的。 出,当车辆速度达到64kⅡL/h后,驾驶员进行双移线操作,从 将蛇形穿杆道路信息输入本文所建立的驾驶员转向控 对比结果上看。车辆的行驶轨迹的跟踪精度较高,与实车轨 制行为模型。对HQ430仿真车辆进行控制,得到如图6所示 迹的侧向偏差非常小,符合实际情况。由于本文并没有完全 的对比结果.图形表示同图5。从图6可以看出,当车辆速度 ...——202...—— 达到50km/h后,驾驶员进行蛇形穿杆操作,图6(b)中车辆 和双移线试验相似,符合蛇形穿杆试验的要求。这一组数据 行驶轨迹的对比结果表明.仿真车辆的行驶轨迹与实车轨迹 进一步说明了驾驶员模型对真实驾驶员有很好的模拟效果, 之间的侧向偏差较小。图6(c)中的转向盘对比曲线说明: 综合两种不同工况下的仿真结果可以说明应用MPC方法研 驾驶员在进行连续转向操纵时,输出转向盘的趋势、幅值及 究驾驶员模型的有效性。 时间历程同样符合真实驾驶员的输出。图6(d)的对比结果 、髓髑棚匾辞 一一____… … 一 一 ~《 …E 鐾 爵 f~一 …一…计 勿。 ~一…一 X坐标/m (丑】毂向速度对比曲线 (bJ驾驶轨迹对比曲线 (d) q--H实。际43车。辆 ̄ 一…一 ~… 一一 一—一一。 一一r…: …一 熬 lO 12 t4 16 l8 20 22 24 26 28 时同 时间 (c)转向盘对比曲线 (d1双移线对比曲线 图6蛇形试验的对比曲线 5 结语 [5]I Kageyama,H B Pacejka.On a new driver model with fuzzy con— 本文从MPC方法与驾驶员转向行为的一致性角度出 tml[J].Vehicle System Dynamics,1992,20(sup1):314-324. 发,采用搜索算法描述驾驶员的预瞄行为建模,应用MPC方 [6] 高振海,管欣,郭孔辉.驾驶员确定汽车预期轨迹的模糊决策 法基于线性二自由度车辆模型对驾驶员的预测及优化能力 模型[J].吉林工业大学自然科学学报,2000,30(1):7-10. 建模,最后利用实车数据结合车辆动力学软件veDYNA进行 [7] C C MacAdma,G E Johnson.Application of elementary neural networks and preview sensors for representing driver steering con— 仿真,通过与人类驾驶员行为的对比分析,可以说明第2节 trol behaviour[J].Vehicle System Dynamics,1996,25(1):3— 中对驾驶员行为的描述是合理的,各部分模型能较准确的模 30. 拟驾驶员的行为特点。同时说明,模型预测控制的方法为驾 [8]K H Guo,F Pan,Y Cheng,H Ding.Driver model based on the 驶员模型的研究提供了一条有效途径。 preview optimal artiifcila neural network[C].AVEC Proceedings, 2002:677-682. 参考文献: [9]C C MacAdam.An optimal preview control ofr linear systems[J]. [1] 黄海斌,蒋文娟.预瞄驾驶员模型中车辆操控问题的分析及仿 Journal of Dynamic Systems,ASME,1980,102(3):188-190。 真[J].计算机仿真,2012。29(7):358—362. [1O] x Na,D J Cole.Linear quadratic game and non-cooper ̄ive pre— [2]D T McRuer,E S Krende1.The human operator aS a servo system dictive methods for potentila application to modelling driver— element[J].Journal ofthe Franklin Institute,1959,267(5):381 AFS interactive steeirng control[J].Vehicle System Dynamics, -403. 2012(ahead—of-print):1—34. [3] M Kondo,eta1.Theory of Manual Vehicle Contro1.Ergonomics [1 1] A Y Ungoren and H Peng.An adaptive lateral preview driver [J].1969,12(4):599—633. model[J].Vehicle System Dynamics,2005,43(4):245—259. [4] 郭孔辉.驾驶员一汽车闭环系统操纵运动的预瞄最优曲率模型 (下转第331页) [J].汽车工程,1984,6(3):1—15. ...——203- -—— 表1 网络控制不同算法延迟率对比 参考文献: [i]孙丽英,葛超,朱艺.RBF神经网络在函数逼近领域内的研究 [J].计算机与数字元工程,2007,(8):47—48. [2]K Dautenhahn.Book renew:Swarm intelligence[J].Genetic Pro- gramming and Evolvable Machines,2002,3(1):93—97. [3] Liu Wei,Wang Ke—inn.A hybrid particle¥Wal3Tl optimization al- gorithm for predicting the chaotic time series[C].2006 IEEE In— ternational Conference on Mechatonircs and Automation,Luoyang, 2006:2454—2458. [4]谢宗安,张滔.进化神经网络在倒立摆控制中的应用[J].计 算机仿真,2006,23(5):297—299,306—307. [5] 顾洪军,张佐,吴秋峰.网络控制系统的实时特性分析及数据 传输技术[J].计算机工程与应用,2001,37(6):38—43. [6] 崔桂梅,等.网络控制系统的保性能控制[J].北京科技大学 学报,2006,28(6):595-599. [7]L F L in,Ja Moyne,D Tilbury.Network design consideration for 根据上表能够得知,利用传统算法进行网络控制,假设 网络控制的拥塞程度较高,网络控制信号传输状态不理想, 将造成网络时延性较强。而利用本文算法进行网络控制,则 可以降低这种时延性,从而有效提高随机长时延网络控制的 稳定性。 ‘distirbuted control systems[J].IEEE Trnsaaction on Control Sys- tems Technology,2002,10(2):297-307. [8] 黄肖玲,柴天佑.粒子群优化算法在大型选矿企业原料采购计 划中的应用[J].自动化学报,2009,(5):632-636. [9]X.FLi,Y C Mao,Y Liang.A Survey on Topology Control in Wireless Sensor Networks[C].in 2008 lOth International Confer- 5结束语 为了解决传统的状态维度矩阵算法在随机长时延网络 控制方面的缺陷,提出了一种基于控制信号补偿规则模型的 随机长时延网络控制方法。根据随机长时延网络的运行相 ence on Control Automation Robotics&Vision:Icarv 2008,Vols 1 —4,2008:251—255. [1O]J S ardosh,P R an.A survey:Topology control for wireless sensor networks ̄C].In Icscn 2008:Proceedings of the Interna— tional Conference on Signal Processing Communications and Net- working,2008:422—427. 关参数.进行随机长时延网络的控制。根据网络时延情况, 建立控制信号补偿规则模型。实验结果表明,利用本文算法 进行随机长时延网络控制,极大的提高随机长时延网络控制 的稳定性,从而对控制对象进行准确的网络控制,满足实际 生产的需求。 [作者简介] 曹德胜(1971一),男(汉族),安徽霍山县人,硕士研 究生,副教授,主要研究方向:计算机软件与理论; 贾海龙(1982一),男(汉族),陕西宝鸡人,讲师,硕 士,研究方向:图像识别,信息与通信工程。 f上接第203页) [12] G Prokop.Modeling human vehicle driving by model predictive online optimization[J].Vehicle System Dynamics,2001,35 (1):19—53. [13] C Charles,C C MacAdam.Understanding nda modelling the hu— man driver[J].Vehicle System Dynamics,2003,40(1-3):101 134. [14] S D Keen,D J Cole.Application of time—variant predictive con- tolr to modelling driver steering skill[J].Vehicle System Dynam— ics,2011,49(4):527-559. _ [研吉郭要计究研洪: 方究岩艳向方(为1向9驾8为0驶一车)员辆:女模主作(型动汉者:安 族简全),介控吉制]林 人、车,辆讲硕状师士态,研博参究士数生,主估, 曲 婷(1982一):女(汉族),吉林人,博士研究生,主要研究方向为 模型预测控制、驾驶员模型; 陈虹(1963一):女(汉族),浙江人,教授,博士研究生导师,主要研 [15]席裕庚.预测控制[M].北京:国防工业出版社,1993. [16]邹涛,丁宝苍,张端.模型预测控制工程应用导论[M].北 京:化学工业出版社.2010. 究领域为预测控制、鲁棒控制、非线性控制和汽车控制。 一331—