This commit is contained in:
mei 2025-01-31 22:25:58 +08:00
parent 683aa87738
commit c6cd1c7383
2 changed files with 13 additions and 5 deletions

View File

@ -2,10 +2,12 @@
title: Linuxcat周刊(第27期) title: Linuxcat周刊(第27期)
tags: tags:
- AI - AI
- Nvidia
-
categories: categories:
- Linuxcat周刊 - Linuxcat周刊
index_img: /img/weekly/2025/03/ index_img: /img/weekly/2025/03/photo_2025-01-30_21-11-07.jpg
banner_img: /img/weekly/2025/03/ banner_img: /img/weekly/2025/03/photo_2025-01-30_21-11-07.jpg
permalink: /weekly/2025-3/index.html permalink: /weekly/2025-3/index.html
date: 2025-01-31 17:22:44 date: 2025-01-31 17:22:44
--- ---
@ -16,6 +18,10 @@ date: 2025-01-31 17:22:44
{% endnote %} {% endnote %}
## 封面图 ## 封面图
![华盛顿空难](/img/weekly/2025/03/photo_2025-01-30_21-11-07.jpg)
美国华盛顿空难已打捞出28具遇难者遗体其中客机上27具直升机上1具。当局推测已无人生还现场工作重心将转至遗体打捞。
美国航空CEO罗伯特·艾索姆表示“不知道军机为何会进入PSA航班的航道”。
[via](https://apnews.com/article/congo-m23-goma-rwanda-tshisekedi-south-africa-ca81f34f52ea31b85dd845b049a0bb96)
## 正文 ## 正文
### 1 “人类终极考试”基准测试发布顶级AI系统表现惨淡准确率均未超10% ### 1 “人类终极考试”基准测试发布顶级AI系统表现惨淡准确率均未超10%
非营利组织“人工智能安全中心”CAIS与Scale AI联合推出名为“人类终极考试”的新型基准测试旨在评估前沿AI系统的综合能力。该测试由来自50个国家500多个机构的近1000名学科专家出题涵盖数学、人文学科和自然科学等领域题目形式多样包括结合图表和图像的复杂题型。 非营利组织“人工智能安全中心”CAIS与Scale AI联合推出名为“人类终极考试”的新型基准测试旨在评估前沿AI系统的综合能力。该测试由来自50个国家500多个机构的近1000名学科专家出题涵盖数学、人文学科和自然科学等领域题目形式多样包括结合图表和图像的复杂题型。
@ -54,10 +60,12 @@ DeepSeek 高效突破是通过实施大量细粒度优化和使用 Nvidia 的汇
1月29日凌晨阿里云公布了其全新的通义千问 Qwen 2.5-Max 超大规模 MoE 模型该模型预训练数据超过20万亿 tokens。目前开发者可在 Qwen Chat 平台免费体验模型,企业和机构也可通过阿里云百炼平台直接调用新模型 API 服务。在 Arena-Hard、LiveBench、LiveCodeBench 和 GPQA-Diamond 等基准测试中Qwen2.5-Max 表现超越了 DeepSeek V3同时在 MMLU-Pro 等其他评估中也展现出了极具竞争力的成绩。阿里云的基座模型在大多数基准测试中都展现出了显著的优势。阿里云称随着后训练技术的进步,下一个版本 Qwen2.5-Max 将会达到更高水平。 1月29日凌晨阿里云公布了其全新的通义千问 Qwen 2.5-Max 超大规模 MoE 模型该模型预训练数据超过20万亿 tokens。目前开发者可在 Qwen Chat 平台免费体验模型,企业和机构也可通过阿里云百炼平台直接调用新模型 API 服务。在 Arena-Hard、LiveBench、LiveCodeBench 和 GPQA-Diamond 等基准测试中Qwen2.5-Max 表现超越了 DeepSeek V3同时在 MMLU-Pro 等其他评估中也展现出了极具竞争力的成绩。阿里云的基座模型在大多数基准测试中都展现出了显著的优势。阿里云称随着后训练技术的进步,下一个版本 Qwen2.5-Max 将会达到更高水平。
> 消息来源: [通义千问](https://mp.weixin.qq.com/s/PkwwZWFOyG-mZMWXUMvM8w) | [风向旗参考快讯](https://t.me/xhqcankao/16834) > 消息来源: [通义千问](https://mp.weixin.qq.com/s/PkwwZWFOyG-mZMWXUMvM8w) | [风向旗参考快讯](https://t.me/xhqcankao/16834)
### 8 ### 8 谷歌利用 AI 为用户拨打本地商家电话
​谷歌正在测试一款新工具,让 AI 代替用户致电商家询问问题。这项名为“Ask for Me”功能可收集有关服务价格和可用性的信息但目前仅适用于美甲沙龙和汽车修理店。
在谷歌搜索实验室启用实验后在搜索中寻找本地美甲沙龙或汽车修理店时用户可能会看到“Ask for Me”提示。选择该选项后谷歌将会提出一系列问题比如是否需要换油或更换轮胎、车是什么类型以及希望何时预约。用户需要输入电子邮件地址或电话号码用于接收更新信息。商家可以在Google商家资料设置中选择不接收 AI 电话。
> 消息来源: [The Verge](https://www.theverge.com/news/603501/google-ask-for-me-search-labs) | [风向旗参考快讯](https://t.me/xhqcankao/16897)
### 9

Binary file not shown.

After

Width:  |  Height:  |  Size: 185 KiB