科学网最优节制与最优解说

2019-11-10 新亚网 新亚网整理
浏览

科学网最优控制与最优讲解

《最优节制:数学理论与智能要领》张杰,王奔腾.北京:清华大学出书社,2017.

媒介:最优节制与最优解说

    三十多年前,最优节制曾是我由力学转入节制后的首选偏向。记得第一个课题就是桥梁和高层修建的主动减振节制,属漫衍参数系统问题;第二个长短线性问题的次优节制,试图操作最小二乘要领和勒让德非凡函数举办递归求解Hamilton-Jacobi-BellmanHJB)方程。惋惜因其他研究任务最后都没一连下去,成为心中至今的遗憾。喜欢最优节制的一个主要原因是大学和硕士期间沉迷于变分法、力学和物理中各类百般的变分道理、泛函阐明及其在希尔伯特空间的几许暗示方法。我一直但愿能操作泛函从代数几许空间的角度去表明最优节制,并进而在流形上近似求解各类非线性最优节制问题。

       赴美留学之后,研究偏向立即转入以人工智能为基本和以智能呆板人系统为工具的智能节制。1986年,上导师George N. Saridis传授的“自组织系统之随机节制”(StochasticControl of Self-Organizing Systems)课时,一度曾有时机转头从事最优节制的研究,但由于对付如何操作熵(entropy)暗示与导师有严重的分歧,一番争吵之后,最后“少”果而终,仅留下一篇集会会议论文和一篇杂志论文。有幸的是,这让我有时机独立地提出了早期自适应动态筹划(adaptive dynamic programmingADP,最初称为approximate dynamic programming)的思想。更可喜的是,本日,以刘德荣传授和魏庆来研究员为代表的巨大系统打点与节制国度重点尝试室团队在此规模硕果累累,已成为国际上研究ADP的先锋与重镇。

       其实,至今我仍认为熵暗示大概是统一各类最优节制要领,出格是将自适应和预测节制统一起来的可行途径,甚至更遍及的平行节制也可以纳入熵暗示的框架之中。出格是跟从副导师Robert F. McNaughton传授上完自念头、形式语言和理论计较机课程之后,更感想节制熵与信息熵、计较巨大性之间有着深刻的内涵关联,再加上进修节制和呆板进修(其时称为“进修呆板”,learning machines)要领,或者可以或许创出一条从最优节制的数学理论到最优节制的智能要领之新路。这三十余年来未熄的“梦”想,就是驱动创作本书的原始念头。

    虽然,本书的写作尚有一个十分显然的现实念头。近十年来,周围愿以节制理论和节制工程专业为第一选择的学生相对大大淘汰,学生们都但愿转入其它以算法为主更时兴收效更快的专业。相对而言,节制支付大,回报却不见得大。然而,节制是“硬”科技,更是智能技能中的“硬”智能。没有过硬的节制,很多想法和算法无法落地。并且,最优节制是节制之中的“硬”课程,是“硬”中之硬。正如国度与社会的成长不能只成长“虚拟”经济,必需有强硬的“实体”经济支撑,技能的康健成长,必然也不行忽略节制技能,必需有高质量的人才不绝插手节制技能的研究与开拓之中才可一连。因此,一部与时代技能和应用要求合拍的最优节制教程,是吸引更多优秀学生从事节制专业的重要一步,这就是本书写作的现实念头。

        因此,2015年秋,(新亚网整理,更多精彩请浏览:inewya.com),我承诺包袱起中国科学院大学(以下简称“国科大”)计较机与节制学院的“最优节制”研究生解说任务,并操持写一本新的最优节制课本。最初有二个打算,一是按“以进修者为中心的教诲”(learner-centered educationLCE,个中老师和学生都是进修者)之思想解说,并凭据解说“三地步”方法布置解说内容和进度;二是变“编年体”式的教科书为“纪传体”的课本,就像《史记》开创中国史书的撰写新方法,但愿“最优节制”这门课的讲义只管活跃有趣,与时代相宜。