期末考试结束了带孩子来WAIC看看“最会做题的大模型”

王克丹科技资讯2024-07-06 18:55:488800

期末考试结束，“神兽”放暑假了，带孩子去哪逛？来2024世界人工智能大会看看“更会做题的大模型”吧。带着孩子去感受中国科技力量，尤其是在大模型技术发展中，看到中国也有可以和世界PK的技术，对于从小培养孩子的科技创新能力和技术自信是非常有益的。

“能根据10岁儿童的口吻，写一篇不超过500字且以上海为主题的童话故事吗？”在上海世博展览馆科大讯飞的展台，6月27日全新升级发布的讯飞星火V4.0成为大家围观的焦点。面对观众提出来了各种文字问题，包括音视频、图片解读类的多模态问题，讯飞星火V4.0都对答如流，给出逻辑清晰且正确的回答。

期末考试结束了带孩子来WAIC看看“最会做题的大模型” 第1张

现场，你可以带孩子一起体验在讯飞星火APP/DESK“个人空间”里上传工作、学习、生活、健康等各类资料，形成个人专属知识库，通过AI人设功能，让大模型生成更具个性化风格的内容，真正做到成为每个人在生活和工作中“用得上”的大模型。

2024世界人工智能大会前夕，基于全国首个国产万卡算力集群“飞星一号”，讯飞星火大模型V4.0七大核心能力全面升级，全面对标GPT-4 Turbo。6月27日举行的发布会上，科大讯飞根据《通用认知智能大模型评测体系》构建测试集，结果显示讯飞星火V4.0在文本生成、语言理解、知识问答、逻辑推理、数学能力等维度全面超越GPT-4 Turbo，代码与多模态能力也大幅提升。而在国际组织的12项测试集对比中，讯飞星火V4.0也实现了8项超越，其中理解与推理能力在四大机构测试中取得“全胜”战绩。

讯飞星火全面对标GPT-4 Turbo，可不是泛泛而谈，都是经过“实战”检验过的。

今年中高考真题实测中，一些专业机构纷纷下场，使用市面上常见的大模型产品如通义千问、字节豆包、讯飞星火、文心一言、腾讯元宝、月之暗面Kimi等作为“考生”，围绕“大模型高考测试”得出了一系列结果。综合来看，国产大模型在中国高考的表现不落下风，有着教育行业背景的讯飞星火大模型在一众大模型中表现抢眼，语数外各科“成绩”均排名第一，被评为“更会做题的大模型”。

期末考试结束了带孩子来WAIC看看“最会做题的大模型” 第2张
（新京报测评结果，星火大模型表现最好）