news 2026/7/3 13:50:18

GLM-5.2 对中文金融文本的理解能力突出

张小明

前端开发工程师

1.2k 24

对DeepSeek-V4在金融文本上的处理能力进行全方位评测，使用 CFLUE 测试集对各模型能力进行评测，CFLUE是一个开源的测评基准，由阿里云与苏州大学联合构建，其中金融应用评估数据集包括125道应用类样题目，囊括文本分类、机器翻译、关系抽取、阅读理解与文本生成五类典型任务。具体细分项目如下：

得分方式的计算上，知识评估以准确率（ACC）与F1得分为主；应用评估中，对于有正确答案的分类与抽取问题，主要采用ACC与F1得分计算；对于文本生成、阅读理解类题目，主要采用Bert、Rouge等方法计算模型回答与标准答案之间的相似度。其中Bert模型从模型回答的语义相似度计算得分，Rouge则从两者重复的文段比例角度计算。翻译类题目采用BLEU方法，类似于计算词汇的重复比例。

来源：国金证券

网站建设 2026/7/3 13:47:01

Gemini Advanced订阅制解析：大模型服务进入能力付费时代

1. 这不是“涨价”，而是大模型服务进入成熟期的必然分水岭Gemini Pro API正式开启订阅制，基础版定价19.99美元/月，附赠两个月免费试用——这个消息在开发者群和AI产品团队内部传开时，我正调试一个用Gemini做多轮会议纪要摘要的自动…

李华

网站建设 2026/7/3 13:43:13

Elastic 现在在 OpenAI 速率限制使用量达到 80% 时就发出告警，在你的应用被被限流之前

作者：来自 Elastic Daniela Tzvetkova Elastic 中的 OpenAI 速率限制监控会在每个项目和模型之间映射 “余量（headroom）”。将已配置的 RPM、TPM 和 IPM 限制与实际使用情况进行对比，并在 throttling（限流）…

李华

网站建设 2026/7/3 13:42:02

Desktop Postflop：免费开源德州扑克GTO求解器完全指南

Desktop Postflop：免费开源德州扑克GTO求解器完全指南【免费下载链接】desktop-postflop [Development suspended] Advanced open-source Texas Holdem GTO solver with optimized performance 项目地址: https://gitcode.com/gh_mirrors/de/desktop-postflop …