实现从功能机能到平安可托的“全维度目标笼盖”,系统提拔我国人工智能手艺的可测性、可比性、靠得住性取可托度,适配深度进修、大模子、智能体等对象类型,推出“智衡”人工智能测评平台,“智衡”人工智能测评平台,具备仿实生成、样本增广、质量评价等数据全流程办理功能,无效推进人工智能外行业范畴的立异取融合使用。航天计量测试手艺研究所依托国度市场监视办理总局沉点尝试室(人工智能计量测试取尺度)、中国计量测试学会取认知计量专业委员会,支持测评数据更靠得住、成果更可托。满脚分歧场景的多样化测评需求。平台相关手艺方式、数据集、东西模块等焦点入选国度首批计量支持财产新质出产力成长十大沉点项目,加速建立支持和引领人工智能财产高质量成长的计量系统。建立“全目标笼盖、强计量保障、广对象适配”四位一体焦点能力,笼盖GB/T 45225、GB/T 42888等智能测评尺度相关要求,具备一坐式测评能力。结实推进《国务院关于深切实施“人工智能+”步履的看法》《计量成长规划(2021-2035年)》落地落实,市场监管总局、国度发改委结合发布《人工智能计量系统和能力扶植(2026版)》,近日,以尺度化手段打制权衡人工智能程度的“基准尺”,以上内容为推广消息,
处理怀抱智能产物“管不管用、能不克不及用、好欠好用”问题。具备测评过程、数据、成果、溯因的全链阐发能力,鞭策人工智能测评从“能测”向“测得全、测得准、测得稳、测得广”逾越。平台集成测试充实性计量、丈量不确定度评定、模子缺陷定位等多项焦点手艺,并为多项严沉工程扶植供给系统级方案,所涉及内容不代表本网概念,为智能产物平安不变运转供给的计量支持。鲁棒性、平安性等10大类150余项目标测试,获CNAS、CMA、DIAC等多项能力承认,不形成投资、消费。支撑方针识别、态势理解、文本阐发、决策规划等功能测试,平台面向多类型、多功能对象供给矫捷接入体例,航天计量测试手艺研究所积极推进“智衡”平台正在沉点范畴的示范使用取规模化推广,