大语言模型意识水平测评报告显示：DeepSeek-R1语义一致性表现较好

来源：科技日报2025-08-04 15:35

百度英国BBC与《每日邮报》消息，阿塔在2003年被发现，原先收藏阿塔的西班牙收藏家始终相信阿塔就是个外星人。

　　近日，记者从世界人工意识协会国际人工智能DIKWP测评标准委员会获悉，由该协会主导、全球10余个国家与地区的90多家机构和企业参与的《全球首个大语言模型意识水平“识商”白盒DIKWP测评2025报告（100题版）》（以下简称《报告》）日前出炉。

　　《报告》的核心亮点在于全球首创的意识水平测评体系。《报告》基于DIKWP模型，从数据、信息、知识、智慧、意图等方面，构建全链路评估体系。测试题全面覆盖大语言模型的感知与信息处理、知识构建与推理、智慧应用与问题解决、意图识别与调整四大模块，对主流大语言模型的意识水平进行系统化、量化深度剖析。

　　《报告》对当前主流的大语言模型进行了全面测评，包括DeepSeek-V3、ChatGPT-o1、通义千问-2.5、ChatGPT-4o、Kimi、文心大模型-3.5和Llama-3.1等。测评结果显示，不同模型在不同模块的表现各有千秋。

　　例如，感知与信息处理部分主要考察模型在处理原始数据、提取信息和保持语义一致性方面的表现。ChatGPT-4o和ChatGPT-o1在数据转换和格式处理方面表现出色，体现出稳定性。ChatGPT-o3-mini、ChatGPT-o3-mini-high、通义千问-2.5、Kimi和Grok在信息提取方面表现优异，特别是在数据到信息转化路径上的表现尤为突出。DeepSeek-R1、ChatGPT-4o、Kimi和ChatGLM-4 Plus在保持语义一致性方面表现较好。

　　知识构建与推理部分的测评考察模型将信息整合为知识的能力，以及逻辑推理能力。结果显示，通义千问-2.5、ChatGLM-4 Plus和ChatGPT-4o表现突出。

　　意图识别与调整部分的测评重点考察模型对用户意图的理解能力，以及根据意图调整输出的能力。结果显示，豆包和Gemini-2.0 Flash Thinking Experimental表现较好，能够准确理解用户的问题并提供相关回答。（记者王祝华）

[ 责编：王一涵 ]

阅读剩余全文（）

您此时的心情

新闻表情排行日/周

开心

0
难过

0
点赞

0
飘过

0

视觉焦点

包银高铁包惠段启动联调联试
舞蹈诗剧《只此青绿》惊艳亮相好莱坞

最热文章

推荐阅读

杜鹃花海茶飘香

2025-08-04，安徽省芜湖市无为市昆山镇三公山茶叶种植基地，千亩高山野生杜鹃在翠绿的茶园之间绚丽绽放，美轮美奂，美不胜收

2025-08-04 15:13

慕田峪长城山花烂漫

2025-08-04，北京怀柔慕田峪长城内外山花盛开，美丽的春花把古长城打扮的多姿多娇，犹如春天里一幅壮美的风景画

2025-08-04 15:44

引江济淮菜巢线复航

2025-08-04，船舶航行在安徽省合肥市庐江县境内的引江济淮航道上，标志着菜子湖湿地候鸟越冬季禁航结束，菜（子湖）巢（湖）线恢复通航

2025-08-04 15:40

太湖之滨春景如画

2025-08-04，江苏苏州吴中区光福镇，太湖之滨，桃花、樱花、油菜花等竞相绽放，生态优美，春景如画

2025-08-04 15:31

用镜头记录城市更新青岛首届“百家媒体看改变”活动圆满闭幕

2025-08-04 10:14

“昭君杯”首届全国老年合唱大赛在京启动

"昭君杯"首届全国老年合唱大赛在北京国家大剧院正式启动

2025-08-04 16:10

金沙江特大桥抢抓施工

2025-08-04，云南省昭通市绥江县，新市金沙江特大桥施工现场，工人正加紧施工。

2025-08-04 15:41

梅花绽放报春来

2025-08-04，重庆市巫山县曲尺乡月明村一大片梅花竞相开放、灿若红霞，游客和市民前来游玩打卡，尽享春日的快乐和惬意

2025-08-04 14:52

非遗进景区助推文旅融合

2025-08-04，福建省福清市石竹山风景区，一场非遗英歌舞、建瓯挑幡等非遗表演正在进行，让游客感受中华优秀传统文化魅力，丰富景区文化内涵和游览品质

2025-08-04 15:55

湿地公园生态美

2025-08-04，江西省赣州市章贡区城市中央公园内，游船与湖水、植被、高楼相互映衬，呈现出一幅冬日多彩美丽生态画卷

2025-08-04 15:30

盐湖绽放“硝花”景观

2025-08-04，受低温天气影响，山西省运城盐湖出现冬季独特的“硝花”景观，水面上的硝花形态各异晶莹剔透，美不胜收。

2025-08-04 15:56

《龟兹》：从千年壁画穿越而来的灵魂之舞

一位“行者”行走在广袤的沙漠中，遮掩着绝世的面庞，一面“古镜”掩埋于厚重的沙下，刻满了时间的裂痕。

2025-08-04 17:25

雪后森林裹银装

2025-08-04，重庆市酉阳土家族苗族自治县桃花源国家森林公园白雪皑皑，雪景如画

2025-08-04 15:24

关爱卡寒假公益行助力云南各族青少年儿童梦想起航

2025-08-04 14:42

集大原旅游专列首发

2025-08-04，在山西太原南站开往呼和浩特东站的D4022次列车前，游客自拍合影。

2025-08-04 16:01

生态田园

2025-08-04，广西梧州岑溪市岑城镇木榔村，生态田园中阡陌纵横线条分明，冬韵如画。

2025-08-04 16:48

冬日景美

2025-08-04，贵州省黔西市绿化白族彝族乡大海子村，青山环绕树木葱茏，构成一幅美丽的生态画卷。

2025-08-04 16:40

色彩斑斓映姑苏

2025-08-04，古城苏州街头，成片的银杏、红枫等树木色彩斑斓满目缤纷，成为一道迷人的风景。

2025-08-04 15:48

“美丽经济”助力乡村振兴

2025-08-04，初冬时节，山东省青岛市即墨区灵山街道花卉种植基地的大棚里一片繁忙，种植户忙着管护花卉。

2025-08-04 15:48

河南南阳：冬日景美如画

2025-08-04，初冬时节，河南省南阳卧龙岗文化园内，树木换上"新装"，宛如一幅五彩斑斓的画卷，吸引不少市民、游客前往赏景。

2025-08-04 18:34

加载更多

跛脚是什么意思	暗代表什么生肖	脑出血有什么后遗症	特斯拉是什么电池	沙拉是什么
ie是什么	处大象是什么意思	二十四节气分别是什么	苹果和生姜煮水喝有什么功效	ferragamo是什么牌子
多囊卵巢综合症有什么症状	口腔溃疡吃什么中成药	变态反应科是看什么病的	婴儿什么时候吃辅食	刘邦为什么杀韩信
吃什么能降胆固醇	艾滋病是什么病	老人适合喝什么茶	xxoo是什么	诺如病毒吃什么药好得快一点

热疹用什么药helloaicloud.com	气短是什么症状hcv9jop6ns4r.cn	火加同念什么bysq.com	鼻干眼干口干属于什么症状wuhaiwuya.com	老年人屁多是什么原因hcv8jop5ns5r.cn
高血糖不能吃什么weuuu.com	生殖器疱疹擦什么药hcv8jop6ns4r.cn	多动症挂什么科xinmaowt.com	马眼是什么hcv8jop3ns5r.cn	腱鞘囊肿看什么科hcv9jop2ns4r.cn
空腹洗澡有什么危害hcv9jop8ns1r.cn	甲基苯丙胺是什么hcv8jop8ns1r.cn	女性外痔擦什么药膏好hcv8jop1ns8r.cn	大便带血丝是什么原因hcv9jop7ns2r.cn	类风湿为什么反复发烧hcv7jop6ns4r.cn
生日礼物送什么好hcv9jop8ns1r.cn	上热下寒吃什么中成药hcv9jop3ns9r.cn	金舆是什么意思hcv9jop6ns6r.cn	扁桃体发炎咳嗽吃什么药效果好hcv9jop8ns3r.cn	6月5日是什么日hcv8jop3ns4r.cn

华为p10闪存门怎么回事华为p10闪存门事件介绍

大语言模型意识水平测评报告显示：DeepSeek-R1语义一致性表现较好

相关阅读

您此时的心情

视觉焦点

最热文章

独家策划

华为p10闪存门怎么回事 华为p10闪存门事件介绍

大语言模型意识水平测评报告显示：DeepSeek-R1语义一致性表现较好

相关阅读

您此时的心情

视觉焦点

最热文章

独家策划

华为p10闪存门怎么回事华为p10闪存门事件介绍