AI模型预部署的可靠性评估

admin • 2025年07月16日 15:56 • 百科栏目 • 阅读 5

基础模型是大量的深度学习模型，这些模型已经在大量通用的、未标记的数据上进行了预训练。它们可以应用于各种任务，比如生成图像或回答客户问题。但是，作...

基础模型是大量的深度学习模型，这些模型已经在大量通用的、未标记的数据上进行了预训练。它们可以应用于各种任务，比如生成图像或回答客户问题。

但是，作为ChatGPT和DALL-E等强大人工智能工具的支柱，这些模型可能会提供不正确或误导性的信息。在安全关键的情况下，比如行人接近自动驾驶汽车，这些错误可能会造成严重后果。

为了防止此类错误，麻省理工学院和麻省理工学院- ibm沃森人工智能实验室的研究人员开发了一种技术，可以在将基础模型部署到特定任务之前评估其可靠性。

他们通过训练一组彼此略有不同的基础模型来做到这一点。然后，他们使用他们的算法来评估每个模型对相同测试数据点学习的表示的一致性。如果表示是一致的，就意味着模型是可靠的。

当他们将他们的技术与最先进的基线方法进行比较时，它在捕获各种分类任务的基础模型的可靠性方面表现得更好。

有人可以使用这种技术来决定一个模型是否应该应用于特定的环境，而不需要在现实世界的数据集上进行测试。当数据集可能由于隐私问题而无法访问时，例如在医疗保健环境中，这可能特别有用。此外，该技术可用于基于可靠性分数对模型进行排序，使用户能够为其任务选择最佳模型。

“所有模型都可能出错，但知道自己什么时候出错的模型更有用。对于这些基础模型来说，量化不确定性或可靠性的问题变得更加困难，因为它们的抽象表示难以比较。我们的方法可以让你量化表示模型对于任何给定输入数据的可靠性，”资深作者Navid Azizan说，他是麻省理工学院机械工程系和数据、系统和社会研究所(IDSS)的Esther和Harold E. Edgerton助理教授，也是信息和决策系统实验室(LIDS)的成员。

他与第一作者Young-Jin Park (LIDS研究生)一起撰写了一篇关于这项工作的论文;麻省理工学院- ibm沃森人工智能实验室的研究科学家王浩;以及Netflix的高级研究科学家谢尔文·阿德希尔。该论文将在人工智能不确定性会议上发表。

统计共识

传统的机器学习模型被训练来执行特定的任务。这些模型通常根据输入做出具体的预测。例如，模型可能会告诉你某张图片中是猫还是狗。在这种情况下，评估可靠性可能只是查看最终预测，看看模型是否正确。

但基金会的模式是不同的。该模型使用一般数据进行预训练，其创建者并不知道该模型将应用于的所有下游任务。用户在训练完成后就可以让它适应自己的特定任务。

与传统的机器学习模型不同，基础模型不会给出像“猫”或“狗”标签这样的具体输出。相反，它们基于输入数据点生成抽象表示。

为了评估基础模型的可靠性，研究人员使用了一种集成方法，通过训练几个模型，这些模型具有许多相同的特性，但彼此之间略有不同。

“我们的想法就像计算共识。如果所有这些基础模型对我们数据集中的任何数据都给出了一致的表示，那么我们可以说这个模型是可靠的，”Park说。

但他们遇到了一个问题:他们如何比较抽象的表示?

他补充说:“这些模型只是输出一个矢量，由一些数字组成，所以我们不能轻易地比较它们。”

他们用一种叫做邻域一致性的想法解决了这个问题。

对于他们的方法，研究人员准备了一组可靠的参考点来测试模型的集合。然后，对于每个模型，他们调查位于该模型表示的测试点附近的参考点。

通过观察相邻点的一致性，他们可以估计模型的可靠性。

对齐表示

基础模型在所谓的表示空间中映射数据点。我们可以把这个空间看成一个球体。每个模型都将相似的数据点映射到其球体的同一部分，因此猫的图像放在一个地方，狗的图像放在另一个地方。

但是每个模型会在自己的领域内绘制不同的动物地图，所以当猫可能被分组在一个球体的南极附近时，另一个模型可以在北半球的某个地方绘制猫的地图。

研究人员使用像锚一样的邻近点来对齐这些球体，这样它们就可以使表征具有可比性。如果一个数据点的邻居在多个表示中是一致的，那么应该对该点的模型输出的可靠性有信心。

当他们在大范围的分类任务中测试这种方法时，他们发现它比基线更加一致。另外，它不会因为挑战测试点而导致其他方法失败。

此外，他们的方法可用于评估任何输入数据的可靠性，因此人们可以评估模型对特定类型的个体(例如具有某些特征的患者)的效果如何。

王说:“即使所有型号的整体性能都是平均水平，从个人的角度来看，你也会更喜欢最适合自己的型号。”

然而，一个限制来自于它们必须训练一个大型基础模型的集合，这在计算上是昂贵的。在未来，他们计划找到更有效的方法来建立多个模型，也许是通过使用单个模型的小扰动。

这项工作部分由麻省理工学院- ibm沃森人工智能实验室、MathWorks和亚马逊资助。

本文来自作者[admin]投稿，不代表qlhej号立场，如若转载，请注明出处：https://qlhej.cn/wiki/202507-1427.html

5 4

本文作者

admin签约作者

4284 文章

1 粉丝

我是qlhej号的签约作者[admin],本篇文章《AI模型预部署的可靠性评估》主要讲述了:基础模型是大量的深度学习模型，这些模型已经在大量通用的、未标记的数据上进行了预训练。它们可以应用于各种任务，比如生成图像或回答客户问题。但是，作...

常识科普

分享实测攻略“网易棋牌是否可以用挂”详细分享开挂步骤

网易棋牌是否可以用挂是一款可以让一直输的玩家，快速成为一个“必胜”的ai辅助神器，有需要的用户可以加我微下载使用。手机打牌可以一键让你轻松成为“必赢”。其操作方式十分简单，打开这个应用便可以自定义手机打牌系统规律，只需要输入自己想要的开挂功能，一键便可以生成出

admin
2025年08月02日
0
常识科普

澳大利亚学生中有三分之一的读写和计算能力未达标

堪培拉，8月14日(IANS):国家标准化测试发现，三分之一的澳大利亚学生没有达到基本的读写和计算能力的要求。据新华社报道，周三，联邦政府公布了2024年国家评估项目——识字和算术测试的结果，显示三分之一的学生未能达到阅读和数学的基本标准。来自940

admin
2025年08月02日
0
综合

推荐必备“手机上打麻将输了钱能要得回来”分享装挂详细步

手机上打麻将输了钱能要得回来是一款可以让一直输的玩家，快速成为一个“必胜”的ai辅助神器，有需要的用户可以加我微下载使用。手机打牌可以一键让你轻松成为“必赢”。其操作方式十分简单，打开这个应用便可以自定义手机打牌系统规律，只需要输入自己想要的开挂功能，一键便可

admin
2025年08月02日
0
综合

你书架上尘封的复古游戏或许能卖到300英镑

当我看到一些复古电子游戏在2024年的售价时，我总是很恼火，尤其是当我曾经拥有一款有问题的游戏时。我最近后悔的游戏是Dreamcast射击游戏《CannonSpike》，这是我在欧洲发行的最后一款SEGA主机游戏。（至少在最近独立开发者开始重新访问Dreamcast

admin
2025年08月02日
0
百科栏目

玩家热议“麻将机程序控牌器怎么识别的”确实是有挂

麻将机程序控牌器怎么识别的是一款可以让一直输的玩家，快速成为一个“必胜”的ai辅助神器，有需要的用户可以加我微下载使用。手机打牌可以一键让你轻松成为“必赢”。其操作方式十分简单，打开这个应用便可以自定义手机打牌系统规律，只需要输入自己想要的开挂功能，一键便可以

admin
2025年08月02日
0
常识科普

泽连斯基称乌克兰军队已有效遏制俄罗斯在东线的进攻

　　(路透社)-乌克兰总统泽连斯基周四表示，乌克兰军队已经降低了俄罗斯军队在顿涅茨克地区发动袭击的可能性。泽连斯基在与指挥官们商讨后发表了夜间视频讲话，他表示，军方正在尽最大努力“增强我们战斗旅的复原力”。“此时，乌克兰国防军已经设法削弱了占领者在顿涅茨克地区的进攻潜力，”他说。

admin
2025年08月02日
0
科技世界

实测教程“打牌辅助器下载免费”的确有挂

打牌辅助器下载免费是一款可以让一直输的玩家，快速成为一个“必胜”的ai辅助神器，有需要的用户可以加我微下载使用。手机打牌可以一键让你轻松成为“必赢”。其操作方式十分简单，打开这个应用便可以自定义手机打牌系统规律，只需要输入自己想要的开挂功能，一键便可以生成出手

admin
2025年08月02日
0
百科栏目

以色列空袭贝鲁特致12人遇难，边境冲突升级

黎巴嫩公共卫生部说，以色列对黎巴嫩首都贝鲁特南郊发动空袭，造成至少12人死亡，66人受伤。伊朗国家通讯社(NNA)报道称，周五发生在贾莫斯街一栋建筑上的袭击造成5名儿童伤亡。该机构说，一架F-35喷气式飞机对居民区进行了两次袭击。

admin
2025年08月02日
0
常识科普

今日热议“手机打麻将开挂是什么意思”确实真的有挂

手机打麻将开挂是什么意思是一款可以让一直输的玩家，快速成为一个“必胜”的ai辅助神器，有需要的用户可以加我微下载使用。手机打牌可以一键让你轻松成为“必赢”。其操作方式十分简单，打开这个应用便可以自定义手机打牌系统规律，只需要输入自己想要的开挂功能，一键便可以生

admin
2025年08月02日
0
作者专栏

华尔街遭遇自4月以来最差一周，尽管就业报告暗示9月加息

　　周五收盘时，追踪美国500强公司股票的标准普尔500指数当日下跌2%，本周下跌2.1%。这是自4月中旬周跌幅3%以来的最大跌幅。以科技股为主的纳斯达克综合指数(NasdaqCompositeIndex)收盘下跌2.5%，本周收盘下跌3.4%。该指数包括亚马逊(Amazon)、苹果

admin
2025年08月02日
0

发表回复

本站作者后才能评论

评论列表（4条）

admin 2025年07月16日

我是qlhej号的签约作者“admin”！

回复
admin 2025年07月16日

希望本篇文章《AI模型预部署的可靠性评估》能对你有所帮助！

回复
admin 2025年07月16日

本站[qlhej号]内容主要涵盖：国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育

回复
admin 2025年07月16日

本文概览：基础模型是大量的深度学习模型，这些模型已经在大量通用的、未标记的数据上进行了预训练。它们可以应用于各种任务，比如生成图像或回答客户问题。但是，作...

回复

AI模型预部署的可靠性评估

本文作者

文章推荐

发表回复

评论列表（4条）

联系我们