首頁 » 人工智能学习对他们有利的谈判顺序

人工智能学习对他们有利的谈判顺序

最后,我很高兴看到红十字国际委员会引用了 EJIL:Talk!的达波·阿坎德 (Dapo Akande) 的观点来支持其新立场。达波在 2012 年持相同立场时认为,“主权和国家自治理由被用来证明对非国际武装冲突进行更有限的监管是合理的,但当国家在其领土之外采取行动时,这些理由并不适用。”看到如此一流的学术研究影响红十字国际委员会的法律立场,令人鼓舞。,只有一个 RAN 会保持活跃,而不是两个、三个、四个或任意多个,具体取决于参与合作的运营商数量。该理论在纸面上很有前景,但在付诸实践之前,它必须满足公平性和激励贡献方面的某些条件。简而言之:运营商愿意参与吗?“为了回答这个问题,我们制定了一些规则并启动了合作试验,”Orange 网络研究工程师 Xavier Marjou 解释道。“通过根据不同的规则集试验人工智能,可以确保拟议的合作系统可靠、公平并对各方有利。”

模拟谈判我们模拟了承运商之间的谈判

 

并尝试让每个人都参与进来,轮流完成他们的“轮班”。 “我们实例化了代表每个承 目标电话号码或电话营销数据 运商利益的软件代理,承运商在试验过程中学会了相互谈判。这是一种基于强化的学习模型:代理参与并对环境采取行动,作为回报,环境会反馈此行动的结果以及相关的奖励,无论是正面的还是负面的。通过执行一系列操作,代理最终会找到对他们最有利的组合。在我们的用例中,代理/承运商提出轮班,作为回报,他们会获得与节省的千瓦时量成比例的奖励。随着时间的推移,代理会意识到某些谈 10 个浪费你时间和金钱的 SMM 误区 判顺序比其他顺序更合适,并且可以产生利润,因此他们被鼓励继续参与。”

因此鼓励他们继续参与和合作

 

该应用属于合作人工智能的范畴,这是一个相对尚未开发的领域,因为需要强大的计算能力才能理解多智能体交换中的所有组合假设。

鼓励合作的最佳规则
模拟了多轮谈判,产生了各种结果。某些规则有利于合作和轮班的良好交替。其他一些更有偏见的规则可能会导致代 印度手机号码 商/承运人利用漏洞损害其他参与者的利益。所研究的系统显示了各种可能的情况,并证明了道德合作是可能的,基于四个评估指标:效率(节省的千瓦时量)、安全性(衡量当其他代理商不合作时代理商的风险)、参与激励(通过展示好处来鼓励合作)和公平性(每个玩家节省相同的千瓦时量)。通过对承运人之间的互动进行建模,可以定义最佳谈判参数并将交换限制在严格必要的范围内,以便在“现实生活中”实现最佳复制。

返回頂端