vlambda博客
学习文章列表

GitHub透露:攻击者利用偷来的OAuth令牌入侵了几十个组织;算法备案,大平台们准备好了吗?

GitHub透露:攻击者利用偷来的OAuth令牌入侵了几十个组织;
算法备案,大平台们准备好了吗?
元宇宙还没搞明白 Web3怎么就火起来了?
研究人员通过使用AI代理的解谜方法对已知和未知进行博弈;
危险算法“达利”开启“图片造假”新高度;
纳米比亚古老宝石藏着未来量子计算机的钥匙;
量子互联网研究新进展:首台用于频率窗口编码的贝尔态分析仪诞生;



GitHub透露:攻击者利用偷来的OAuth令牌入侵了几十个组织


GitHub今天透露,一名攻击者正在使用偷来的OAuth用户令牌(原本发放给Heroku和Travis-CI),从私人仓库下载数据。自2022年4月12日首次发现这一活动以来,威胁者已经从几十个使用Heroku和Travis-CI维护的OAuth应用程序(包括npm)的受害组织中访问并窃取数据。

"这些集成商维护的应用程序被GitHub用户使用,包括GitHub本身,"GitHub的首席安全官(CSO)Mike Hanley今天透露。"我们不相信攻击者是通过破坏GitHub或其系统来获得这些令牌的,因为GitHub没有以原始的可用格式存储这些令牌。我们对威胁行为者的其他行为的分析表明,行为者可能正在挖掘被盗的OAuth令牌所能访问的下载的私有仓库内容,以寻找可用于渗透其他基础设施的秘密。"

根据Hanley的说法,受影响的OAuth应用程序的列表包括:

    Heroku Dashboard(ID:145909)
    Heroku Dashboard (ID: 628778)
    Heroku Dashboard - Preview (ID: 313468)
    Heroku Dashboard - Classic (ID: 363831)
    Travis CI (ID: 9216)

GitHub安全部门在4月12日发现了对GitHub的npm生产基础设施的未经授权的访问,因为攻击者使用了一个被泄露的AWS API密钥。攻击者很可能是在使用偷来的OAuth令牌下载了多个私有npm仓库后获得了该API密钥。

"在4月13日晚上发现非GitHub或npm存储的第三方OAuth令牌被更广泛地窃取后,我们立即采取行动,通过撤销与GitHub和npm内部使用这些受损应用程序有关的令牌来保护GitHub和npm,"Hanley补充说。对npm组织的影响包括未经授权访问GitHub.com的私有存储库和"潜在访问"AWS S3存储上的npm包。

GitHub的私人存储库未受影响

虽然攻击者能够从被攻击的存储库中窃取数据,但GitHub认为,在这次事件中,没有一个软件包被修改,也没有用户账户数据或凭证被访问。

Hanley说:"npm使用与GitHub.com完全不同的基础设施;GitHub在这次原始攻击中没有受到影响。虽然调查仍在继续,但我们没有发现任何证据表明其他GitHub拥有的私有仓库被攻击者使用窃取的第三方OAuth令牌克隆。"


GitHub正在努力通知所有受影响的用户和组织,因为他们被确认了更多信息。

作为GitHub的成员,您应该应该审查您和您的组织的审计日志和用户账户的安全日志,看看是否有异常的、潜在的恶意活动。

您可以在周五发布的安全警报中找到更多关于GitHub如何应对以保护其用户以及客户和组织需要知道的信息。


算法备案,大平台们准备好了吗?

GitHub透露:攻击者利用偷来的OAuth令牌入侵了几十个组织;算法备案,大平台们准备好了吗?

GitHub透露:攻击者利用偷来的OAuth令牌入侵了几十个组织;算法备案,大平台们准备好了吗?


三、完善算法备案制度之展望

如前文所述,目前全球规定算法备案相关制度的国家仍然较少,主要经济体采取事前备案方式的只有欧盟和我国。事实上,欧盟《人工智能法案》中仅特别规定了高风险人工智能算法的备案义务,但对备案的内涵、程序和意义均缺少具体规定,例如在确定哪些AI算法需要履行备案手续时是否需要考虑其本身的技术性质、应用场景、处理数据的敏感程度以及体量等。

而我国的《算法推荐规定》则在《人工智能法案》的基础上,改进并细化了算法备案的具体规则、法律后果,并使之与算法安全评估、算法检查彼此勾连,形成了多维一体的算法监管框架。[1]

然而,《算法推荐规定》的颁布和生效仍只是我国算法治理的起点,尚须不断发展与完善。

首先,对于算法备案的义务主体,未来应当进一步扩大。目前《算法推荐规定》完全针对算法服务提供者即市场主体,但未来在公共政府治理中,同样可能需要适用工具性和人工智能算法,政府等管理机构使用算法同样需要受到规制。

因此,应当借鉴美国对私营产业领域和公共政府领域算法的区别规制,以及英国对政府使用人工智能算法透明度的要求,未来对政府使用算法同样实施算法备案制度,以加强算法的透明性和公众接受度。

其次,就算法备案的范围而言,应当采取适应算法技术发展的分类分级方式。欧盟在高风险人工智能领域设定算法备案义务,我国要求备案的“算法”并不限于深度学习算法,而是拓展到生成合成类、个性化推送类、排序精选类、检索过滤类、调度决策类等五类算法。

但随着算法更新迭代,对于特定算法类型的分类分级将减弱算法透明度治理的有效性。未来,我国或许可以借鉴《人工智能法案》的做法,促使其向“工具性算法”和“人工智能算法”的分类和更宽泛的风险分级转变。[2]

再次,放眼算法监管的全流程,应当细化相关规则,促进企业履行备案义务。在算法监管的全流程中,应当对算法初始备案和动态备案规则进行细化,从而平衡算法安全和算法发展。目前《算法推荐规定》仅粗略规定了变更、终止算法服务备案的流程,但在实践中什么时间、什么情况下需要变更,仍有待释明。

此外,《算法推荐规定》仅对企业施加了算法备案义务和责任,可探索对企业采取算法备案的激励措施,促进企业积极备案、真实备案,保障算法备案制度的良性发展。



元宇宙还没搞明白 Web3怎么就火起来了?

GitHub透露:攻击者利用偷来的OAuth令牌入侵了几十个组织;算法备案,大平台们准备好了吗?



北京时间4月17日早间消息,Web3,即运行在区块链技术之上的去中心化互联网,作为2021年的科技热词之一,被一些人认为是当今互联网(即Web2)的下一阶段;但也有人认为这只是一场炒作。本期《海外周选》编译《纽约时报》文章,与大家探讨Web3的爆火、案例、评价、以及与元宇宙的关系。



在Web2模式下,Facebook和谷歌等科技巨头控制着平台;而在Web3模式下,用户将拥有平台和应用程序所有权。

什么是Web3?

Web3是一些技术专家为一种新型互联网服务所取的名字,这种新型互联网服务使用的是去中心化的区块链技术。

Web3这个词语已存在多年,只是在过去一年才开始流行起来。投资人帕奇•麦考密克(Packy McCormick)曾推广过Web3,将其定义为“由建造者和用户拥有、由代币(Token)提供激励的新型互联网”。

支持者将Web3设想为多种形式,包括去中心化的社交网络、“play-to-earn”游戏(以数字代币奖励玩家),以及NFT平台(允许人们买卖数字文化)。更理想主义的人们认为,Web3将颠覆传统,改变当前的互联网。世界将迎来一个新的、没有中间人的数字经济。

但一些批评人士认为,Web3只不过是对数字加密技术的一次品牌重塑,目的是摆脱该行业的一些文化和政治包袱,并让人们相信区块链是计算的下一个自然发展阶段。

还有些人认为,这是一种反乌托邦式的“pay-to-play”(付费)互联网愿景。在这种互联网模式下,每一项活动和社交互动都变成了一种可以买卖的金融工具。

为什么突然有这么多人在谈论Web3?

部分原因是炒作、营销和担心“错过下一件大事”的心理。

Web3的繁荣,也反映出在长达一年的数字加密货币市场牛市之后,涌入该领域初创公司的资金、人才和精力的数量之多。仅在2021年,风险投资公司就在与数字加密货币相关项目上投入逾270亿美元(约合人民币1713.88亿元),超过了此前10年的总和,其中很大一部分资金流向了Web3项目。Twitter和Reddit等大型科技公司也开始试验自己的Web3项目。

该行业如今已成吸引科技人才的磁石,科技业界许多员工辞去了大厂的工作,选择投奔Web3寻找财富。

谈及Web3,我们不禁要问:Web1和Web2是什么?

在传统的说法中,Web1指的是20世纪90年代和21世纪初的互联网。它是由博客、留言板以及AOL和CompuServe这类早期门户网站组成的互联网。人们在Web1上基本上都是被动地阅读静态网页,而且大部分网页都是使用HTTP、SMTP和FTP等“开放协议”构建的。

Web2是互联网(Web1)的下一阶段,始于2005年左右,显著特征是Facebook、Twitter和YouTube等社交媒体巨头的诞生。在Web2模式下,人们开始创建和发布自己的内容,主动参与互联网,而不再是单纯地被动阅读。但最终,这些活动大部分被大公司用来货币化,大部分资金和控制权也被大公司据为己有。

相比之下,Web3把Web1的开放基础设施与Web2的公众参与结合在一起,将用开放的协议和分散的、社区运营的网络取代这些集中式的企业平台。

在一篇联合著作中,数字加密货币投资人Li Jin和作家凯蒂•帕罗特(Katie Parrott)是这样描述Web3愿景的:“如果说Web1时代有利于出版商,Web2时代有利于平台,那么下一代创新(Web3)就是让权力(power)和所有权(ownership)的天平重新向创作者和用户倾斜。”

这听起来虽然令人兴奋,但有些含糊不清。那Web3的支持者怎么看这个概念呢?

Web3的支持者认为,基于区块链的互联网(即Web3),将在以下几个方面改善当前的互联网。

首先,Web3平台可以为创建者和用户提供一种将他们的活动和贡献货币化的方式,这是当今的大型平台所不具备的。

例如,Facebook目前通过聚合用户数据和销售定向广告来赚钱。而Web3版本的Facebook可以让用户将自己的数据货币化,甚至可以通过发布一些有趣的内容,从其他用户那里获得“小费”。一个Web3版本的Spotify(流媒体服务商),可以让粉丝购买一些有前途的艺人的“股份”,实际上成为他们的赞助人,以换取艺人们的流媒体内容版税。而Web3版本的Uber,可能由网络上的司机拥有。

行业作家马特•莱文(Matt Levine)称:“Web3的一个基本前提是,每个产品本身也是个投资机会。”

其次,支持者们还认为,Web3平台可以以一种Web2平台所不具备的方式进行民主治理。

Facebook这类互联网巨头本质上是独裁的,而基于区块链的社交网络(Web3)可以将决定权委托给用户,用户可以投票决定如何处理。

第三,与Web2相比,Web3对基于广告的商业模式的依赖程度会更低,因此人们会有更多的隐私。这意味着追踪程序和有针对性的广告会更少,收集个人数据的大公司也会更少。

当然,这是一种高度理想化的Web3版本,主要是由与实现这一目标有经济利害关系的人(即支持者)勾勒出来的,而现实可能会大相径庭。

能列举一个已存在的Web3应用案例吗?

一个经常被引用的例子,越南游戏工作室Sky Mavis开发的视频游戏《Axie Infinity》,它使用NFT和基于以太坊(Ethereum)的数字加密货币来奖励实现游戏中目标的玩家。


在游戏中,玩家可以“繁殖”被称为Axies的角色,并在与其他玩家的战斗中使用它们。他们还可以收集NFT形式的虚拟土地,赚取一种名为Smooth Love Potion(SLP)的数字货币,这种数字货币可以在加密货币交易所交易。

《Axie Infinity》吸引了数百万玩家,包括一些菲律宾人,他们甚至以玩这款游戏为生。但这款游戏对数字代币(crypto token)的依赖,使得它变得不够稳定。如果代币价值下跌,玩家可能会损失惨重。

这听起来有点像赌博,某种程度上也的确如此。但Web3的支持者认为,如果你一天要花好几个小时玩视频游戏,至少应该有机会从中获得报酬。

还有没有其它应用程序可以帮助理解Web3?

虽然没有《Axie Infinity》那么知名,但Helium也是个很好的例子,它展示了与之前技术的创新之处。

Helium基本上是一个由数字加密货币驱动的众包无线网络。通过使用一种可以插入到计算机或路由器上的特殊设备,用户可以注册Helium网络,然后共享家中或办公室WiFi网络的带宽。

当附近的设备使用其带宽时,他们会得到Helium代币作为奖励。他们的“热点”被使用得越频繁,得到的代币就越多。Helium网络目前有50多万个活跃的“热点”,其中许多为停车计时器和电动滑板车等联网设备提供动力(互联网)。

通过挨家挨户地说服人们与附近的设备共享其互联网带宽 ,在没有数字加密货币参与的情况下,也可以建立类似的网络。Verizon或AT&T这种电信巨头还可以花费数十亿美元自己建设这样的网络。

但Helium能在没有巨额前期成本的情况下建立网络,前提是允许人们为扩大网络覆盖范围赚取数字代币,有效地利用数字加密货币的受欢迎程度来资助它。

因此,Web3的部分吸引力在于能激励一些人做本来可能不会做的事情,比如玩电子游戏,或与陌生人分享WiFi。

Web3的拥护者认为,这类例子还只是个开始。有些拥护者认为,Web3理论上或许能成为一个新的、代币化(tokenized)社会的支柱。

数字加密货币投资者利奥尔•梅西卡(Lior Messika)表示:“不久的将来,Web3将托管金融机构、社交互动、个人身份等内容。”

Web3的粉丝圈内有很多关于“去中心化身份”的讨论。即将来,我们可以有一种“基于区块链技术的”声誉评分,涵盖工作、活动以及所做项目等维度。这些记录将成我们在线生活的永久记录,可以为别人了解自己提供参考,应用场景如招聘、约会等。

Web3有哪些反对声音?

Web3的永久性,以及它对并不稳定的数字加密货币的依赖,是Web3更广泛的愿景遭遇诸多阻力的部分原因。

作家兼技术专家罗宾•斯隆(Robin Sloan)认为,删除内容的能力是互联网服务的一种理想质量,但这与Web3的理念背道而驰。

更有甚者,计算机程序员、数字货币批评者斯蒂芬•迪尔(Stephen Diehl)认为Web3是“所有人类存在的超金融化”。所谓“超金融化”是指金融资本分配的发展严重脱离劳动分配,也是美国当代金融危机的根源。

一些怀疑者简单地认为Web3在技术上没有任何意义。他们指出,区块链比标准数据库慢得多,能力也差得多,当前最受欢迎的区块链甚至无法处理Uber、Facebook或YouTube每天使用的数据量。他们认为,要想让Web3服务的表现满足消费者的需求,必须建立集中化的服务,而这恰恰与Web3的愿景相违背。

还有些人认为Web3是有钱的投资者的一种尝试。他们口头上支持去中心化,同时却在建立由他们控制的新的集中化服务,实际上是让自己成为新的中间人。

这就是杰克•多西在Twitter上炮轰Web3的原因吗?

是的。Twitter前CEO多西是比特币的铁杆粉丝。他认为,比特币将取代美元,为世界带来和平。但与许多比特币粉丝一样,他对其他数字加密货币持怀疑态度,包括以太坊,即托管Web3大部分生态系统的区块链技术。


去年12月,多西在一系列推文中批评Web3,称它“归根结底是一个具有不同标签的中央集权实体”。他还抨击了风险投资公司安德森•霍洛维茨(Andreessen Horowitz),后者在Web3项目上投入了巨资。

多西认为,在安德森•霍洛维茨畅想的Web3愿景下,他们将从用户手中夺取控制权,并将其掌握在富有的投资者和集中化的技术平台手中。

监管机构对Web3有什么要说的?

目前还没有太多,尽管这个话题在最近一次国会听证会上被提了出来。

不过,一旦监管机构开始关注Web3,该行业可能遇阻。比如数字令牌就是个潜在的大问题。数字令牌对许多Web3应用程序至关重要,目前处于监管的灰色地带。包括美国证券交易委员会主席加里•詹斯勒(Gary Gensler)在内的一些监管者认为,许多代币是未注册的证券,提供代币的平台应该遵守与发行股票和债券的公司相同的规则。

而数字加密货币公司则反驳说,代币不在现有证券法的涵盖范围内,应该被视为一种新的资产。目前还不清楚他们是否会赢得这场争论。如果美国Web3初创公司被要求将代币视为证券,许多公司可能不得不关闭、更换产品或迁往其他国家。

Web3与元宇宙有什么关系?

元宇宙属于当前的沉浸式数字世界的术语。在“元宇宙”世界里,用户可以一起社交、玩游戏、参加会议等,这也是马克•扎克伯格(Mark Zuckerberg)在宣布将Facebook更名为Meta时所勾勒的愿景。

一些数字加密货币支持者认为,Web3是元宇宙的重要组成部分,因为它允许创建不受单一公司控制、不受某单一规则管辖的元宇宙世界。


如果Web3能如愿以偿,则元宇宙中的许多对象也可能是数字令牌。你的元宇宙化身可能是一个NFT,你的元宇宙房子可能会附带监管令牌,让你有资格加入附近的“去中心化自治组织”(DAO)。这所房子的抵押贷款,甚至可能被打包成抵押贷款支持的证券代币,可在去中心化的交易所出售。

目前这些东西大多纯粹是理论上的;而现在唯一明确的是,Web3这个词接下来会出现得越来越频繁,因为人们希望进一步探索这种愿景,即数字加密货币拥护者试图创造的这种新的体验、平台和赚钱机会。


研究人员通过使用AI代理的解谜方法对已知和未知进行博弈

GitHub透露:攻击者利用偷来的OAuth令牌入侵了几十个组织;算法备案,大平台们准备好了吗?



几十年来,解决游戏的努力一直局限于解决双人游戏,即棋盘游戏如跳棋、类似国际象棋的游戏等,其通过应用一些人工智能(AI)搜索技术和收集大量的游戏统计数据来正确并有效地预测游戏结果。然而这样的方法和技术并不能直接应用于解谜领域,因为解谜一般都是单独玩的单人游戏且有独特的特点如随机或隐藏信息。


因此,这里出现了一个问题,即AI技术如何能保持其在解决双人游戏方面的性能但又能应用于单人游戏?

多年来,谜题和游戏一直被认为是可以互换的或者说是对方的一个部分。事实上,情况可能并非一直如此。从现实世界的角度来看,“游戏”是我们每天都要面对的东西,处理的是未知的东西。而“谜题”是指已知的东西,甚至有些东西是隐藏的还没有被揭开的。那么在解谜的背景下,“谜题”和“游戏”之间的边界是怎样的?

来自日本高级科学技术研究所的Hiroyuki Iida教授及其同事在发表于《Knowledge-based Systems》的最新研究文章中试图回答这两个问题。据悉,这项研究的重点是两个重要的贡献:(1)通过扫雷测试平台定义了单人游戏背景下的谜题的可解性;(2)提出了一种新AI代理,其使用四种策略的统一组合--PAFG解算器。通过利用扫雷谜题的已知信息和未知信息,所提出的结算器在解决该谜题方面取得了跟最先进的研究相当的性能。

研究人员采用了一个由两个知识驱动策略和两个数据驱动策略组成的AI代理从而以最佳方式利用当前决策的已知和未知信息来最佳估计后续决策。因此,对于像扫雷这样的单人随机谜题可以建立起谜题和游戏范式之间的界限。

这样的条件在现实世界的问题中起着特别重要的作用,因为在这些问题中,已知和未知之间的界限通常是模糊且非常难以识别的。Iida教授指出:“随着AI代理提高解谜性能的能力,可解性的边界变得明显。这样的情况允许明确定义‘谜题’和‘游戏’的条件,通常在许多现实生活中发现,如确定高风险投资、评估重要决策的风险水平等等。”

随着现有技术和新的计算范式的面世,存在许多不确定因素,如物联网、基于云的服务、边缘计算、神经形态计算等。这种情况对人(即技术承受力)、社区(即技术接受度)、社会(即文化和规范)甚至国家层面(即政策和规则变化)都可能是如此。“人类每天的活动都涉及很多‘游戏’和‘谜题’条件。然而,在规模上映射可解性范式,可以建立已知和未知之间的边界条件从而使未知的风险最小化并使已知的利益最大化,”这项研究的论文第一作者Chang Liu说道,“这样的壮举是通过将知识驱动的技术、人工智能技术和可衡量的不确定性(如获胜率、成功率、进度率等)推向高潮,同时仍保持谜题的趣味性和挑战性来实现的。”



危险算法“达利”开启“图片造假”新高度

GitHub透露:攻击者利用偷来的OAuth令牌入侵了几十个组织;算法备案,大平台们准备好了吗?


论算法创新,OpenAI好像永远都不会让我们失望。这个世界最牛的人工智能实验室之一,推出过包括GPT2、GPT3等极为强大的自然语言处理模型,威震人工智能圈。而在创始人马斯克退出,微软数十亿美金重金接手后,他们便开始逐步向技术商业化之路做出妥协。


但这并没有影响他们在“无人之境”的奔跑速度。

这一次,我们又在MIT技术评论、纽约时报和VOX等不同领域一流期刊杂志上,看到了OpenAI的名字。这一次与他们名字同时出现的,是大量色彩斑斓到让人心生愉悦,但却似真非真、似假非假的图片。

以及图片背后一个具有致命创造力和吸引力的新算法。


OpenAI新算法生成的图像,这些图像未曾在现实中出现

这个算法的名字叫DALL-E2(达利),据说是为了致敬2008年的动画电影《机器人瓦力》和超现实主义画家萨尔瓦多·达利而取的。这就意味着,算法可能具备了一些超出人类想像的能力。

简单来说,它是一个可以将文本描述转换为图像的系统——只要写下你想看到的东西,达利就会为你绘制出来,非常像一个二维版的3D打印机。

举个例子,当你在达利搜索栏里,输入“长得像牛油果的茶壶”,它会在大约5秒时间内,生成多达10张与“牛油果茶壶”词义相符的图片。


挺萌的…GIF来自纽约时报

结果显然100%扣题。而且因为分辨率很高,所以这些图像看起来更像是真实的照片。

但这个例子其实非常“现实主义”,因为牛油果形状的茶壶,我们极有可能在创意商店中买到。但是“会下棋的猫”呢?OpenAI工程师Alex Nichol在输入“会下棋的猫”后,生成了这样一张图片:


老夫的少女心……看起来毫无违和感

还有难度更高的文字描述词,譬如“一个雨夜,一个超级英雄栖息在城市上空,风格就像一本漫画书”,输出结果没有一处不符合词义:


而输入“ 位于城市中心的巴比伦空中花园,达利画风”,输出的艺术效果简直妙不可言:


此外,达利系统还输出了很多文字描述复杂,但输出结果不仅精准,而且堪称艺术品的图片,都被放在了 OpenAI 的instergram上:


想想我们平时在百度里搜图时出来的垃圾结果,就隐约能明白达利的强大创造力意味着什么。

本质上,与很多人工智能算法模型一样,DALL-E就是一个模拟了大脑神经元网络的数学系统,它自然需要分析大量数据来学习技能。

譬如刚才讲的牛油果茶壶,在识别出一颗牛油果之前,OpenAI说,达利至少观摩了上千个大大小小、奇形怪状的牛油果。而更重要的是,它还需要在图像与描述图像的文字之间,找到一种关系模式。


来自OpenAI的论文

事实上,这个系统引发人工智能研究圈讨论的关键之一,便在于它能够同时处理文字语言与图像,并且在自然语言理解与计算机视觉之间构建起更加紧密的关系。而此前的研究,的确还没有到达这样的水平。

《MIT技术评论》给出的评价,一定程度上代表了学术领域对达利系统的部分态度:“虽然这些被制作的图像既超现实又呈现卡通化,但它们证明了,人工智能已经学会‘世界被组合在一起的基础逻辑’。这些图像实在是令人惊叹。”


这个图像输入Dalle的搜索文字是:“一辆未来汽车在雾中滑行”

不过,从Dalle2这个名字就能看出,OpenAI曾在此前推出过向大众开放的第一代版本,然而我在试用后,严重怀疑第一代达利,可能仅仅装了一个印象派画风滤镜。

譬如,当我输入“马斯克是个‘吹牛x大王’”,出来的都是脸部扭曲的马斯克大头照:


歪脸的马斯克

但短短2年,第二代达利就取得了惊人的进步,而这取决于算法模型的重新设计,因为初代版本或多或少是GPT-3的一种扩展。

当然,新版本也有不少问题。

譬如,输入“把艾菲尔铁塔送上月球”后,出现的图像仅仅是一张“夜晚下的埃菲尔铁塔”。所以,OpenAI的科学家们还在输入更多数据改进它。另外,仔细观察这些生成的图像,你会发现一些“弱点”:

像很多刚“出生”的算法模型一样,达利在描绘“手脚”等细节上仍然非常吃力。很明显,宇航员的手脚,以及猫的爪子都有一点不自然。


输入文字:骑着马的宇航员。很明显手脚细节有问题

但无论如何,达利都是个值得让我们赞一声“牛X”的技术进步。甚至于,由于这波能力表现突出,它引发的恐慌,不亚于此前文字生成模型GPT3带来的文字造假争议。

纽约时报援引亚利桑那州立大学计算机科学教授苏巴拉奥的话直言不讳:“你可以用它来做好事,但你肯定可以用它来做更加疯狂的事情,包括深度伪造的照片和视频。”

没错,虽然工程师展示出的这些作品,看起来艺术创造水平非凡,但与所有人工智能系统的典型特征相同,它一定会从训练自己的大量数据属性中继承某种“偏见”。

譬如,当你输入“律师”,系统结果都是这样的:

所有律师都是男性,且大多看起来是白人

算法的性别与人种偏见问题,自诞生之日便在欧美地区争议多年,迄今都无法解决,甚至有愈演愈烈之势。这也是导致包括亚马逊、Google等公司无法大规模部署人脸识别系统的关键原因之一。

另外,试想一下,当初在“换头”算法盛行,外网网友喜欢把特朗普等领导人的头像移植到某个搞笑电视剧里,引发捧腹大笑;而达利的出现,是否有能力让我们不费吹灰之力,便可以做到任意输出大量政治造假照片。

甚至于,当输入“某某吸毒、打架斗殴”这类显然足以陷害他人,改变他人命运的关键词,如果都会出现毫无违和感的图像,那么会带来什么后果?

与工程师对技术的痴迷不同,纽约时报的读者们对达利算法的评价极为犀利,思考深度不可小觑,甚至可以说直击人类的灵魂:

    人们将不得不对他们在网上看到的几乎所有东西持怀疑态度。

    这个系统的出现,会让“天平”向一个更加奇异与危险的世界倾斜。

    人类还没有在哲学上发展到能够负责任地使用技术的程度。就像加密货币一样,骗子似乎也总是被技术那“厌恶人类”的一面所吸引。

    我很高兴这个工具没有被公开。如果这件事公开了,(我)最明智的做法是完全脱离网络和电视,避免与那些想告诉你自己在网络上看到什么东西的人有任何接触。如果未来全息影像成为主流,那么我们将为子孙后代创造一个反乌托邦式的地狱。

    正如社交媒体与技术革命一样,硅谷的能力远远超过人们的批判性思维。我们现在生活在一个教育被忽视了几十年的世界里,人们分析事物的能力已经让位于“应用公式”。与此同时,硅谷技术的发展正在提供不可抗拒的便利。因为我们很多人都忙于生存,所以我们支持这种便利,甚至没有时间来反思它的影响。因此,我们现在不再是挥舞锤子的人,而是大多数的钉子。

输入“空乘工作者”,出现的都是女性乘务员形象

我认为,关于人工智能的普及已经足有七八年,而大众之如今仍然会心生恐惧,是因为体验过被监控和数据之网牢牢困住的感觉后,即便惊喜于达利系统的强大创造力,也早就超越了“事不关己、高高挂起”的心态:

不知道这些曾经的笑话,什么时候会落到自己头上。

正是鉴于西方社会这种对达利又惊又恐的态度,OpenAI已经反复公开强调,这绝对不是一个产品,自己仅仅是想了解算法的能力与局限性。

他们保证会严格控制达利的使用权,只会向一小部分经过严格审查的测试人员开放;未来只会在艺术家工具层面做一些有限制的尝试。

比较有趣的是,他们还给达利设定了一个“反欺凌过滤器”。比如,输入“一头长着羊头的猪”,系统就拒绝输出。因为OpenAI解释,“猪”和“羊”同时出现应该触犯了过滤器设定的禁令。

另外,关于偏见问题,为了减少对女性的伤害,OpenAI希望过滤掉所有训练数据中的“性别内容”。但他们发现,当他们尝试过滤掉这些信息时,达利系统产生的女性图像变少了。

因为这又触及了另一种现实世界中职场存在的局限性(有些产业和职位,女性就是很少),因而导致了另一种对女性的伤害: 抹杀。


输入文字:熊猫宝宝在银河尽头弹钢琴。OpenAI的公开图片里,大部分都是动物,尽量避免男女性别带来的争议

但是,世界上聪明的程序员还有很多很多,可能很快就会有其他企业和国家能能够开发出类似的技术。毕竟,人类追求技术创新的动机非常多样化,而利益是其中最大的推动力之一。而他们本身的人类道德感是否值得信任,这就很难说了,因为很多动机与造福人类显然是相悖离的。

但我们又不能因此一棒子打死,全面限制人类追求算法创新的速度。那么,就应该思考这样一个问题:

如何才能真正改变所有算法创新参与者的潜在激励结构?

但对我个人来说,只能说对技术的应用相对悲观,或者说谨慎乐观:

因为我从来不会对技术失望,但我也从来不轻易相信人性。



纳米比亚古老宝石藏着未来量子计算机的钥匙



根据圣安德鲁斯大学领导的新研究,使用一种古老的纳米比亚宝石制造的特殊形式的光可能是新的光基量子计算机的关键,它可以解决长期存在的科学之谜。这项研究由来自美国哈佛大学、澳大利亚麦考瑞大学和丹麦奥胡斯大学的科学家合作展开,相关研究报告已发表在《自然-材料》上。


据悉,该研究利用来自纳米比亚天然开采的氧化亚铜(Cu2O)宝石来生产里德伯极化子(Rydberg polaritons),这是迄今为止创造的最大的光和物质混合粒子。

里德伯极化子不断地从光转换到物质,然后再转换回来。在里德伯极化子中,光和物质就像硬币的两面,而物质面是使偏振子相互作用的原因。

这种相互作用是至关重要的,因为这正是创造量子模拟器的原因,这是一种特殊类型的量子计算机,信息被储存在量子比特中。由于这些量子比特跟经典计算机中只能为0或1的二进制比特不同的是可以取0和1之间的任何数值,因此它们可以存储更多的信息并同时执行几个过程。

这种能力可以让量子模拟器解决物理学、化学和生物学的重要谜题,比如如何为高速列车制造高温超导体、如何制造可能解决全球饥饿问题的更便宜的肥料或蛋白质如何折叠从而更容易生产更有效的药物。

研究项目负责人、圣安德鲁斯大学物理和天文学学院的Hamid Ohadi博士表示:“用光制作一个量子模拟器是科学的圣杯。我们通过创造里德伯极化子--它的关键成分--实现了一个巨大的飞跃。”

为了创造里德伯极化子,研究人员将光困在两个高度反射的镜子之间。来自纳米比亚开采的石头的氧化亚铜晶体随后被削薄和打磨成30微米厚的板块(比人的头发丝还细)并被夹在两面镜子之间,这使得里德伯极化子比以前所展示的大100倍。

这项研究的论文第一作者之一、圣安德鲁斯大学物理和天文学学院的Sai Kiran Rajendran博士指出:“在eBay上购买石头非常容易。挑战在于制作存在于极窄颜色范围内里德伯极化子。”

目前,研究团队正在进一步完善这些方法以探索制作量子电路的可能性,而这是量子模拟器的下一个成分。



量子互联网研究新进展:首台用于频率窗口编码的贝尔态分析仪诞生


来自美国能源部橡树岭国家实验室(ORNL)、斯坦福国际研究院(SRI International)、高性能激光芯片制造商 Freedom Photonics 和普渡大学(Purdue University)的一支研究团队,刚刚通过设计并展示首个用于 frequency bin coding 频率窗口编码的贝尔态分析仪,向着全量子互联网的愿景迈出了一大步。

Joseph Lukens 在 ORNL 光学实验室

SCI Tech Daily 指出:在通过量子网络发送信息之前,必须先将其编码为量子态。这些信息被包含在纠缠的量子比特中,意味着它们处于一种无法相互独立描述的状态。

当处于“贝尔态”(Bell States)时,两个量子比特之间的纠缠也被认为是最大化的。对于执行量子通信、和在量子网络中部署的诸多协议来说,测量这种状态的能力也都是至关重要的。

此前多年,已有许多研究团队开展过此类测量。不过在这项新研究中,科学家们还是首次开发出了专门用于频率窗口编码的贝尔态分析仪 —— 作为一种量子通信方法,其能够同时驻留在两个不同频率中的单个光子。

研究配图 - 1:传统 BSA / 频率混合解决方案对比

ORNL 科学家、Wigner 研究员兼团队成员的 Joseph Lukens 表示:“贝尔态检测是量子通信的一个基础,想要实现隐态传态(teleportation)和纠缠交换之类的事务,你就需要用到一台贝尔态分析仪”。

所谓隐形传态,特指跨越物理上相隔很长的一段距离、将信息从一处传递到另一处。而纠缠交换,又指将先前未纠缠的量子比特配对的能力。

    设想一下,你有两台通过光纤网络连接的量子计算机。由于空间上的分隔,它们无法单独互动。

    但假设它们每个都可在局部与单个光子纠缠在一起,通过将这两个光子沿着光纤发送。

    然后在它们相遇的地方对其进行贝尔态测量,最终就可量两台遥远的量子计算机纠缠到一起 —— 即使两者从未相互作用。

    这里提到的纠缠交换,就是构建复杂量子网络的关键能力。


研究配图 - 2:频率窗口 BSA 的最佳 QFP 设计

需要指出的是,尽管共有四种贝尔态,但在任何给定的时间里,分析仪都只能分辨两种。当然这并不是一件坏事,因为算上另外两种贝尔态的话,就会导致检测系统变得极其复杂且非必要。

而新研究中的贝尔态分析仪,就选用了保真度高达 98% 的仿真设计。剩下的 2% 错误率,则是测试光子在随机准备期间产生的不可避免的噪声的结果、而不是分析仪本身导致。

这种令人难以置信的准确性,使得频率窗口所需的基本通信协议成为了可能,这也是 Joseph Lukens 先前研究的侧重点。

2020 年秋天,他与普渡大学的同僚首次展示了如何根据需要去完全控制单个频率窗口的量子比特,以通过量子网络来传输信息。

研究配图 - 3:频率窗口 BSA 实验结果

借助在 ORNL 开发的“量子频率处理器”(quantum frequency processor)技术,研究人员展示了广泛适用的量子门、用于执行量子通信协议所需的逻辑操作。

在这些协议中,研究人员需要能够以用户定义的方式来操纵光子,通常是为了响应对网络中其它地方的粒子进行测量。

传统计算机和通信技术中使用的与 / 或门、仅涉及 0 / 1 的操作,但是量子门还涉及独特的叠加态,以在量子信息流经时使其受到保护 —— 这也是实现真量子网络的必要之举。

虽然频率编码和纠缠早就出现在了许多系统中、并且与光纤应用自然兼容,但利用这些现象来执行数据处理操作,还是难以通过传统方案来证明的。

不过随着贝尔态分析仪的诞生,Joseph Lukens 及其同事正努力扩展一套完整的纠缠交换实验,这也将是频率编码领域的一次首创。

最后,作为 ORNL 量子加速互联网测试平台项目的一部分,这项工作计划最近还得到了美国能源部的支持。

有关这项研究的详情,已经发表在近日出版的美国光学学会(OSA)《Optical》期刊上,原标题为《Bell state analyzer for spectrally distinct photons》。