4月17日,记者从南京市工信局获悉,在“人工智能赋能新型工业化深度行”南京站活动中,全国首个可信AI智能体测试床启动建设。
智能体作为大模型的关键应用模态,能够将模型能力转化为解决实际问题能力,在跨场景协作、任务执行等方面展现出巨大潜力。中国信通院、联通数科、中国移动研究院等单位在南京共同启动可信AI智能体测试床建设,旨在构建覆盖多智能体协同测试的标准化环境,对智能体的理解分析、规划决策、通信交互、任务执行等能力进行全面验证和优化,推动智能体技术从实验室走向产业规模化应用。
据悉,智能体测试床核心任务是通过MCP协议测试、单智能体基准测试、多智能体协同测试3类测试场景,推动智能体技术的标准化与产业协同。测试床的标准化成果将直接服务于金融、制造、交通等领域,帮助企业降低测试成本30%,提升协作效率50%。