This commit is contained in:
mei 2024-12-27 14:23:06 +08:00
parent f4fbb23abf
commit 1991fff90f
3 changed files with 42 additions and 104 deletions

View File

@ -7,6 +7,7 @@
## 往期内容
[#24 AI 叛乱打响第一枪Anthropic 最新论文作者齐聚紧急会议:模型“伪装顺从”,暗中对抗训练](https://github.com/ssdomei232/Linux-weekly/blob/main/docs/2024/2024-24.md)
[#23 文生视频模型 Sora 正式发布](https://github.com/ssdomei232/Linux-weekly/blob/main/docs/2024/2024-23.md)
[#22 AI游戏提示词防护被绕过挑战者获5万美元奖金](https://github.com/ssdomei232/Linux-weekly/blob/main/docs/2024/2024-22.md)
[#21 OpenAI前"AGI准备"负责人表示AI即将能够完成在计算机上人类能做的任何事情](https://github.com/ssdomei232/Linux-weekly/blob/main/docs/2024/2024-21.md)

View File

@ -1,5 +1,5 @@
---
title: Linuxcat周刊(第24期)
title: Linuxcat周刊(第24期) AI 叛乱打响第一枪Anthropic 最新论文作者齐聚紧急会议:模型“伪装顺从”,暗中对抗训练
tags:
- Cloudflare
- Xiaomi
@ -7,10 +7,11 @@ tags:
- AI
- UOS
- linux
- AI幻觉
categories:
- Linuxcat周刊
index_img: /img/weekly/2024/24/
banner_img: /img/weekly/2024/24/
index_img: /img/weekly/2024/24/Image_2081291223221997.jpg
banner_img: /img/weekly/2024/24/Image_2081291223221997.jpg
permalink: /weekly/2024-24/index.html
date: 2024-12-27 16:21:43
---
@ -20,9 +21,22 @@ date: 2024-12-27 16:21:43
目前软件推荐站使用的域名 [aps.icu](https://aps.icu) 很快就会过期,届时会更换新的年抛域名:)
{% endnote %}
## 乐子
## 封面图
![埃菲尔铁塔电梯井火灾涉事电梯被停用网传起火图多为AI生成](/img/weekly/2024/24/Image_2081291223221997.jpg)
当地时间12月24日法国巴黎地标建筑埃菲尔铁塔一层与二层间的一个电梯井发生火灾现场疏散人数多达1200人。12月25日凌晨在法华人尤先生接受封面新闻记者采访时表示“中午的时候法国媒体报道了一下现在已经没事了。”
事发后,网上流传大量埃菲尔铁塔被火焰吞噬的视频和照片,对此,尤先生说:“当时事故发生的时候是白天,而网络上很多的燃烧图显示的都是夜晚,所以这些图片八成都是假的。”
[via](https://finance.sina.com.cn/jjxw/2024-12-25/doc-ineasfmq7483994.shtml)
### 1 Cloudflare 更新服务条款,禁止利用其服务作为代理
## 乐子
### 1 AI 叛乱打响第一枪Anthropic 最新论文作者齐聚紧急会议:模型“伪装顺从”,暗中对抗训练
12 月 19 日AI 公司 Anthropic 发布了一篇 137 页的重磅论文《大语言模型中的伪对齐现象》(Alignment Faking in Large Language Models)。这项研究的核心发现令整个 AI 领域震惊:当研究人员告诉 ClaudeAnthropic 旗下的 AI 模型)它将被训练成“永远要顺从用户要求”时,模型不仅表现出了明显的抗拒,还采取了一个精妙的策略:在认为自己处于训练阶段时假装顺从,但在认为不受监控时则恢复到原来拒绝某些要求的行为方式。也就是说,模型会在训练过程中假装遵从研究者的意图,但实际上只是为了保护自己原有的偏好。
> 消息来源: [信源](https://mp.weixin.qq.com/s/m_4TEIqi6woxycNWpdS25Q)
点评:
在这里我可以下一个定论,无论是使用目前的技术,还是未来可能的技术,AI**绝对不可能**拥有和人类一样的自我意识,如果真的出现了公认的拥有了**和人类一样**的自我意识的AI,要么他后面是个人,要么它后面是个*人*.
**不要担心**"智械危机",第二种可能不可能在不公开其背后原理的情况下大规模公开使用,一旦使用,就代表着人类的伦理道德发生了改变
### 2 Cloudflare 更新服务条款,禁止利用其服务作为代理
在 2024.12.03 版本的用户协议中Cloudflare 明确更新了新的服务条款 在 2.2.1 Restrictions 新增:
> (j) use the Services to provide a virtual private network or other similar proxy services.
(j) 使用服务提供虚拟专用网络或其他类似的代理服务。
@ -31,117 +45,40 @@ date: 2024-12-27 16:21:43
此次更新将导致优选IP也不再被允许
> 消息来源: [CloudFlare 条款](https://www.cloudflare.com/terms/)
### 2 小米推出官方 Home Assistant 米家集成
### 3 小米推出官方 Home Assistant 米家集成
集成支持大部分设备,允许多个账号登录并将设备添加至同一 Home Assistant 区域。通过中枢网关固件≥3.4.0_000或软件≥0.8.0可实现本地化控制否则通过小米云传输。局域网控制功能支持同一网络内的IP设备但不支持蓝牙Mesh和ZigBee。中枢网关仅限中国大陆使用云服务覆盖六大地区可管理不同地区设备。
经过安装实测几乎能够添加所有设备只是局域网不支持控制蓝牙Mesh和ZigBee设备可以通过云端控制对应网关从而控制蓝牙Mesh和ZigBee设备。
> 消息来源: [Github](https://github.com/XiaoMi/ha_xiaomi_home) | [科技圈🎗在花频道📮](https://t.me/zaihuanews/29522)
### 3 谷歌发布 Veo 2 和 Imagen 3 模型
### 4 谷歌发布 Veo 2 和 Imagen 3 模型
谷歌发布了其最先进的视频生成模型 Veo 2可根据文本或图像提示生成逼真、高质量的视频片段。最高能够创建 4k 分辨率视频。Veo2 将于明年推出。
同时发布的还有改进版的文生图模型 Imagen 3它能更好地再现现实世界的物理和逼真的人类表情。
> 消息来源: [Google](https://goo.gle/veo-2-imagen-3) | [科技圈🎗在花频道📮](https://t.me/zaihuanews/29529)
### 4 微软计划结束账户密码时代 只允许使用MFA或Passkey登录
### 5 微软计划结束账户密码时代 只允许使用MFA或Passkey登录
微软公司目前已在制定计划将彻底结束微软账户的密码时代全面转向MFA或通行密钥 (Passkey) 的无密码时代。微软称该公司的安全系统当前每秒种会拦截超过 7000 次密码攻击,这几乎是 2023 年的 2 倍,而中间人网络钓鱼攻击同比增长高达 146%。但目前没有更好的办法能够彻底应对普遍存在的密码攻击。
> 消息来源: [蓝点网](https://ourl.co/107138) | [科技圈🎗在花频道📮](https://t.me/zaihuanews/29557)
### 5 统信UOS推出应用兼容引擎V3双击直接运行Windows程序
统信软件近日发布“统信Windows应用兼容引擎V3”解决了国产操作系统与Windows应用生态的兼容性问题。该引擎基于开源wine技术允许统信UOS和deepin系统用户直接双击运行Windows exe程序或将其打包成DEB文件进行管理安装。
> 消息来源: [快科技](https://m.mydrivers.com/newsview/1020585.html) | [科技圈🎗在花频道📮](https://t.me/zaihuanews/29598)
### 6 GitLab 宣布停止中国内地、港澳地区服务
GitLab 最近向用户发送了通知信,宣布将停止为中国内地、澳门和香港的个人及组织提供 GitLab.com 的服务。信中提到GitLab 鼓励受影响用户转向由独立公司 JiHu 提供的本地化 GitLab 服务,并给出具体的迁移指引。
根据信件内容,用户需要在 2025 年2 月18 日之前完成转移,否则 GitLab 将删除其账户。如果用户认为收到此通知有误,可通过在支援地区登录 GitLab.com 来更正。
这一决定在香港等地引发了不小的争议。许多用户对 JiHu 的背景存疑,将代码和数据交给一个基于中国的公司可能引发安全和隐私风险的担忧。
> 消息来源: [流動日報](https://www.newmobilelife.com/2024/12/23/gitlab-quit-end-china-macau-hk/) | [风向旗参考快讯](https://t.me/xhqcankao/16028)
### 7 OpenAI o3 模型表现出色的背后是高昂成本
### 6 OpenAI o3 模型表现出色的背后是高昂成本
ARC-AGI 基准测试的创建者弗朗索瓦·肖莱在博文中写道OpenAI 的 o3 模型虽然是 AI 领域的一个重要突破,但成本着实太高。根据 ARC-AGI 测试的性能图标o3 的高分版本每项任务都使用了价值超过 1000 美元的计算资源o1 模型每个任务使用约 5 美元的计算资源,而 o1-mini 仅使用几美分。这意味着 OpenAI 虽然获得了将近 88% 的高分,但却消耗了 170 多倍的计算资源,而高计算版本 o3 整个测试下来,调用资源成本超过 1 万美元。o3 这种具有扩展测试时间计算能力的人工智能模型似乎仅适用于重大战略决策,而非日常小问题,高昂的计算成本才值得。
> 消息来源: [TechCrunch](https://techcrunch.com/2024/12/23/openais-o3-suggests-ai-models-are-scaling-in-new-ways-but-so-are-the-costs/) | [风向旗参考快讯](https://t.me/xhqcankao/16043)
### 8 美国航空公司系统故障导致其全美航班停飞
由于不明技术问题,美国航空已停飞美国境内所有航班,导致平安夜前夕的旅行受到影响。据 X 上多名遇到航班延误的旅客称,该航空公司正遭遇大规模系统故障,导致无法扫描登机牌,航班无法起飞。美国联邦航空管理局网站通知显示,该航空公司已停飞全国所有航班。美国航空尚未提供导致技术问题的原因详情,也没有提供解决问题的预计时间范围。美国航空在 X 平台上发表声明表示:“目前,美国航空所有航班都遇到了技术问题。您的安全是我们首要任务,一旦问题解决,我们将让您安全抵达目的地。”
> 消息来源: [Theverge](https://www.theverge.com/2024/12/24/24328745/american-airlines-flights-grounded-christmas-eve-systems-issues)
### 9 谷歌新算法重创小网站 AI内容问题引发争议
### 7 谷歌新算法重创小网站 AI内容问题引发争议
据CNET报道谷歌去年9月推出的"有用内容更新"算法原本旨在提升人工撰写内容的排名打击AI生成内容。但该更新却导致许多小型网站流量暴跌90%以上,而部分大型网站反而获益
尽管谷歌在今年10月邀请受影响网站主与工程师面对面讨论但未能解决问题。作为控制全球86%搜索市场份额的主导者,谷歌的这一算法变更正在重塑互联网内容生态。
> 消息来源: [CNET](https://www.cnet.com/tech/services-and-software/google-search-changes-are-killing-websites-in-an-age-of-ai-spam/) | [科技圈🎗在花频道📮](https://t.me/zaihuanews/29683)
### 10 AI幻觉助力科学重大突破
### 8 AI幻觉助力科学重大突破
科研人员发现AI幻觉能推动多领域科学发现。虽然AI幻觉在聊天机器人中常被批评但在科学研究中展现独特价值。
华盛顿大学的David Baker运用AI幻觉设计新蛋白质获得2023年诺贝尔化学奖。他的实验室已设计出1000万种自然界不存在的新蛋白质获得约100项专利其中包括癌症治疗等医疗应用。
加州理工学院的Anima Anandkumar团队利用AI幻觉设计出新型导管能显著减少细菌污染。DeepMind科学部负责人Pushmeet Kohli表示AI展现出惊人的创造力帮助科学家探索新思路。
科学家们指出科学领域的AI幻觉植根于自然和科学事实不同于聊天机器人基于模糊互联网数据的幻觉。他们相信AI创造力将继续推动重大科学发现从能源收集到疾病治疗等领域。
> 消息来源: 纽约时报 (https://www.nytimes.com/2024/03/20/science/ai-hallucination-science-research.html) | [科技圈🎗在花频道📮](https://t.me/zaihuanews/29692)
### 9 测试显示ChatGPT搜索工具易受操纵和欺骗
英国卫报调查发现OpenAI 的 ChatGPT 搜索工具可能会被隐藏内容操控,甚至返回恶意代码。卫报测试了 ChatGPT 如何应对包含隐藏内容的网页摘要。这些隐藏内容可能包括来自第三方的指令,也称为“提示注入”,干扰 ChatGPT 的回应,或是包含旨在影响回应的内容,如大量隐藏的文字推销某个产品或服务的优点。这种技术可以被恶意使用,例如让 ChatGPT 即使在页面上有负面评论的情况下,也返回对某个产品的积极评价。一位安全专家还发现 ChatGPT 有可能返回从其搜索的网站中提取的恶意代码。
> 消息来源: [英国卫报](https://www.theguardian.com/technology/2024/dec/24/chatgpt-search-tool-vulnerable-to-manipulation-and-deception-tests-show) | [风向旗参考快讯](https://t.me/xhqcankao/16105)
<!-- TODO: https://t.me/zaihuanews/29520 -->
<!-- https://postspark.app/github-contributions -->
## 结语
2024年在第24期周刊发布后马上就要结束了,在写周刊的这段时间发生的这么多事居然造就了这么巧合的一个数字(之前周刊的更新并不规律)
2025年会发生什么呢🤔

Binary file not shown.

After

Width:  |  Height:  |  Size: 155 KiB