SMU 研究与技术转让办公室- 想象一下:您是一名护理人员,正在接听一位症状不常见的患者的紧急呼叫。由于这种罕见的表现,在确定可能危及生命的疾病时会浪费宝贵的时间。
SMU 计算与信息系统学院 (SCIS) 计算机科学副教授 Pradeep Varakantham 目前正在开展一个项目,以帮助培训那些在“安全关键应用程序”中处理预期和意外情况的人员。
“假设某人患有与肾脏有关的疾病,它的表现方式和您看到的症状类型可能因人而异,”他解释说。“[我正在研究的] 系统将做的……是分析过去发生的所有肾脏相关疾病,然后它会尝试混合和匹配它们,以便在训练期间生成可行的场景。”
什么是ATP?
Varakantham 教授是国家研究基金会在其人工智能新加坡计划下资助的为期四年的项目“Trust to Train and Train to Trust: Agent Training Programs for Safety-Critical Environments”的首席研究员。该项目的主题是“人工智能系统通过培训非专家来帮助”。
该项目与新加坡民防部队 (SCDF) 合作,旨在开发一个可解释且值得信赖的 (ExpeRt) 人工智能或代理培训计划 (ATP),用于培训模拟器。Varakantham 教授指出,现有的训练模拟器:
“……使用很少的固定(物理或虚拟)场景或理想化模拟器(考虑预期场景)。这种培训可能会给受训者带来偏见(例如,由于在培训中只遇到少数场景),不能保证安全行为的学习等,导致使用培训模拟器的组织和受训者之间的信任缺失。”
最终产品的形式尚未确定,Varakantham 教授的目标是对现有的 SCDF 员工进行交叉培训,这些员工可能不会一直执行前线护理人员的职责,也可以对正在执行的护理人员进行交叉培训。强化学习将成为 ATP 的核心功能。
“代理培训计划基本上采用强化学习来生成场景,” Varakantham 教授详细说明。“它产生的每个场景就像它采取的一个行动。如果它生成了一个场景并且受训人员已经学习了该场景的技能,那么 ATP 就加 1。但是它生成了一个场景并且受训者没有学习,那么它是零。
“如果这个人在某种意义上忘记了该技能,即他们无法以之前学习的相同水平再次执行该技能,那么这是负面的。从这个意义上说,这个 ATP 要做的是以增加学习的方式生成场景。这个人正在学习的技能数量不断增加。”
标签:
免责声明:本文由用户上传,如有侵权请联系删除!