2024年1月,ISO与IEC联合发布《系统和软件工程-系统和软件质量要求和评估 (SQuaRE) -人工智能 (AI) 系统质量评估指南》(ISO/IEC TS 25058:2024)。
人工智能(AI)系统的评估具有挑战性。因此,低质量的人工智能系统可能会对关键操作和决策的自动化产生相当大的影响。
技术规范旨在指导人工智能开发人员对其人工智能系统进行质量评估,但并未说明准确的测量值和阈值,因为这些值和阈值因每个系统的性质而异。相反,技术规范为人工智能系统质量的相关方面提供了全面的指导,以便成功进行质量评估。
只要每个特性和子特性都能通过测试策略进行验证,测试就属于本指南的范围,但测试方法和测量的细节在其他地方也有涉及,例如 ISO/IEC/IEEE 29119 系列。