This commit is contained in:
mei 2025-01-11 16:20:35 +08:00
parent 9a9d8c470f
commit 9ef041f404

View File

@ -26,7 +26,7 @@ date: 2025-01-11 16:21:43
在圣莫尼卡地区,火灾烧毁了著名博物馆盖蒂庄园的部分植物,馆藏和博物馆建筑并未受火灾影响。
## 正文
### 1 马斯克同意我们已经耗尽了AI训练数据
马斯克同意其他人工智能专家的观点,即用于训练人工智能模型的真实世界数据所剩无几。马斯克在周三晚间与 Stagwell 董事长马克·佩恩在 X 上直播对话中表示:“我们现在已经基本耗尽了人类知识的累积总和……在人工智能训练方面。这基本上发生在去年。”确实,马斯克认为合成数据——由人工智能模型本身生成的数据——是未来的发展方向。“补充[真实世界数据]的唯一方法是使用合成数据,即人工智能生成[训练数据],”他说。“有了合成数据……[人工智能]将会自我评估并经历这个自我学习的过程。”微软的 Phi-4 于周三早上开源 (https://huggingface.co/microsoft/phi-4),其使用合成数据和真实数据进行训练。谷歌的 Gemma 模型也是如此。
马斯克同意其他人工智能专家的观点,即用于训练人工智能模型的真实世界数据所剩无几。马斯克在周三晚间与 Stagwell 董事长马克·佩恩在 X 上直播对话中表示:“我们现在已经基本耗尽了人类知识的累积总和……在人工智能训练方面。这基本上发生在去年。”确实,马斯克认为合成数据——由人工智能模型本身生成的数据——是未来的发展方向。“补充[真实世界数据]的唯一方法是使用合成数据,即人工智能生成[训练数据],”他说。“有了合成数据……[人工智能]将会自我评估并经历这个自我学习的过程。”[微软的 Phi-4 于周三早上开源](https://huggingface.co/microsoft/phi-4),其使用合成数据和真实数据进行训练。谷歌的 Gemma 模型也是如此。
> 消息来源: [Techcrunch](https://techcrunch.com/2025/01/08/elon-musk-agrees-that-weve-exhausted-ai-training-data/) | [风向旗参考快讯](https://t.me/xhqcankao/16386)
### 2 DeepSeek新模型误认身份暴露AI训练数据污染问题
@ -60,7 +60,7 @@ GitHub已删除研究人员在2024年7月发现的可疑账户和代码库。专
### 8 微软论文意外泄露OpenAI及Claude模型参数
近日微软在一篇医学相关论文中意外泄露了OpenAI及Claude系列模型的参数信息。论文中详细列出了GPT-4o、GPT-4o-mini、Claude 3.5 Sonnet等模型的参数规模其中GPT-4o约200BGPT-4o-mini约8BClaude 3.5 Sonnet约175B。尽管论文中附有免责声明称这些数字为估计值但仍引发广泛关注。
> 消息来源: 量子位 (https://mp.weixin.qq.com/s/bT_w-T9ElmPUXbYA1f7kCg)
> 消息来源: [量子位](https://mp.weixin.qq.com/s/bT_w-T9ElmPUXbYA1f7kCg)
### 9 末日主题验证码新玩法
Vercel公司推出新式验证码用户需在DOOM游戏中击杀至少三个怪物才能通过。此验证码在Hacker News引发热议。