news 2026/5/8 16:17:55

L2-1 Compass评测书生大模型实践

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
L2-1 Compass评测书生大模型实践

C-Eval数据集的评测

  • 运行时遇到如下报错:
returnnext(self.gen)File"/root/.conda/envs/opencompass10/lib/python3.10/site-packages/modelscope/msdatasets/utils/hf_datasets_util.py", line1492,inload_dataset_with_ctx dataset_res=DatasetsWrapperHF.load_dataset(*args, **kwargs)File"/root/.conda/envs/opencompass10/lib/python3.10/site-packages/modelscope/msdatasets/utils/hf_datasets_util.py", line1008,inload_dataset builder_instance=DatasetsWrapperHF.load_dataset_builder(File"/root/.conda/envs/opencompass10/lib/python3.10/site-packages/modelscope/msdatasets/utils/hf_datasets_util.py", line1142,inload_dataset_builder dataset_module=DatasetsWrapperHF.dataset_module_factory(File"/root/.conda/envs/opencompass10/lib/python3.10/site-packages/modelscope/msdatasets/utils/hf_datasets_util.py", line1447,indataset_module_factory raise e1 from None File"/root/.conda/envs/opencompass10/lib/python3.10/site-packages/modelscope/msdatasets/utils/hf_datasets_util.py", line1401,indataset_module_factory).get_module()File"/root/.conda/envs/opencompass10/lib/python3.10/site-packages/modelscope/msdatasets/utils/hf_datasets_util.py", line914,inget_module_with_script raise ValueError(ValueError: Loading opencompass/ceval-exam requires you to execute the dataset scriptinthat repo on yourlocalmachine. Make sure you havereadthe code there to avoid malicious use,thensetthe optiontrust_remote_code=True to remove this error.

判断是参数的问题,通过修改若干如下位置的代码:

把trust_remote_code = trust_remote_code 改成如下=True,完成运行

运行结果

自建数据集测评

运行结果

多模态数据集测评


版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/7 18:42:37

Bandit游戏通关记录

https://overthewire.org/wargames/bandit/bandit6.html Bandit Level 0 → Level 1 cat readmeBandit Level 1 → Level 2 ## 法一 cat ./- ## 法二 cat < - ## 法三 cat /home/bandit1/-Bandit Level 2 → Level 3 cat "spaces in this filename" cat space…

作者头像 李华
网站建设 2026/5/2 18:07:51

如何以非管理员权限运行 regedit

如何以非管理员权限运行 regedit 已完成思考&#xff0c;参考 24 篇资料 以非管理员权限运行 regedit 的完整方案&#xff08;彻底消除 UAC 提示&#xff09; 核心结论&#xff1a;regedit 默认标记为highestAvailable执行级别&#xff08;获取当前用户最高权限&#xff09;…

作者头像 李华
网站建设 2026/5/5 20:31:44

基于图像处理的智能血细胞检测算法研究

目录前言选题背景意义数据集构建数据获取数据格式与类别数据标注数据处理功能模块介绍算法理论YOLOv8目标检测算法注意力机制多尺度特征融合技术相关代码介绍模型定义代码数据加载与预处理代码模型训练与评估代码重难点和创新点相关文献最后前言 &#x1f4c5;大四是整个大学期…

作者头像 李华
网站建设 2026/5/4 17:23:12

JBoltAI AI应用中台:重塑企业智能化的统一基座与范式

在企业智能化转型进程中&#xff0c;“系统碎片化、数据孤岛、开发门槛高、能力难复用”等痛点&#xff0c;导致多数企业陷入“AI技术看得见、落地用不上”的困境。JBoltAI基于Java生态构建的AI应用中台&#xff0c;并非简单的工具集合&#xff0c;而是通过“统一基座标准化范式…

作者头像 李华