news 2026/6/22 15:41:41

MingLi-Bench开源:160道算命大赛真题评测AI命理水平

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
MingLi-Bench开源:160道算命大赛真题评测AI命理水平

AI 到底会不会算命?MingLi-Bench 用一种很硬核的方式回答这个问题——把全球算命师大赛 2022 到 2025 年的真题整理成 160 道选择题,覆盖事业、健康、婚姻、子女、财运、学业、官非、灾劫十二大类人生事件,全都是真实赛题不是闭门造车编的。

设计上把排盘和推理解耦:通过 iztro 库预先算好八字和紫微命盘,模型直接拿到命盘信息去推流年事件,避免”排盘排错了后面全白给”。当然也可以关掉这个测模型自己排盘准不准。选项顺序能打乱防止模型只选某个固定位置。

支持 GPT-4o、Claude、Gemini、DeepSeek-R1、豆包等主流模型,走 OpenRouter 一个 key 覆盖大部分。评分标准简单粗暴:跟标准答案完全一致才算对,没有”部分得分”的模糊空间。跑完在 logs 目录吐三类文件:详细 JSON、摘要 TXT、每道题的模型原始回复——翻回去看 AI 到底胡说了啥特别有意思。

项目下载:https://pan.quark.cn/s/918ecb5f022c

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/14 6:37:03

MuleSoft企业级AI编排:安全可控的LLM集成实践

1. 项目概述:当企业级集成平台遇上大语言模型,不是叠加,而是重定义工作流“AI Orchestration in Action: How MuleSoft and LLMs Fuel the Future of Enterprise AI”——这个标题里藏着一个正在发生的、静默却剧烈的范式转移。它说的不是“用…

作者头像 李华
网站建设 2026/6/14 6:36:41

[量化]《浮点数比较的艺术:从内存布局到极致性能优化》

# 浮点数比较的艺术:从内存布局到极致性能优化> 你是否遇到过 0.1 0.2 ! 0.3 的困惑?本文从 IEEE 754 浮点数内存表示出发,深入分析浮点数比较的精度陷阱,并给出在不同场景下的高性能比较技巧——包括位运算、无分支代码、SIM…

作者头像 李华
网站建设 2026/6/13 21:44:19

用动态规划解决小店库存决策:97行Python实现自行车订货优化

1. 项目概述:用不到100行Python代码,把“每天该进多少辆自行车”变成一个可计算、可复现、可验证的数学决策问题你不是在经营一家抽象的“零售企业”,你是在管理一家真实的社区自行车店。每天下午6点,你站在货架前,看着…

作者头像 李华
网站建设 2026/6/13 17:37:59

如何用Citra模拟器在PC上完美运行任天堂3DS游戏:终极完整教程

如何用Citra模拟器在PC上完美运行任天堂3DS游戏:终极完整教程 【免费下载链接】citra A Nintendo 3DS Emulator 项目地址: https://gitcode.com/gh_mirrors/cit/citra 想要在电脑上重温《精灵宝可梦》、《火焰纹章》或《动物之森》等经典3DS游戏吗&#xff1…

作者头像 李华