vlambda博客
学习文章列表

【科普】吴飞教授:《走进人工智能》---第8讲 群智之力量:验证码识别与蛋白质合成

由高等教育出版社、高等教育电子音像出版社出品,浙江大学上海高等研究院联合上海人工智能实验室智能教育中心共同打造了原创人工智能前沿科普有声通识数字栏目——《走进人工智能》,主理人为浙江大学上海高等研究院常务副院长,浙江大学人工智能研究所所长、中国图象图形学学会理事、动画与数字娱乐专业委员会副主任 吴飞教授 ,本栏目已在喜马拉雅平台正式上线。




本期内容为《走进人工智能》:第8讲 群智之力量:验证码识别与蛋白质合成

第8讲 群智之力量:验证码识别与蛋白质合成 进度条

《走进人工智能》

第8讲
从个体智能到群体智能:整体大于部分总和∣自私个体之间的合作

群智之力量:验证码识别与蛋白质合成

美国《科学》(Science)杂志2016年1月发表了“群智之力量”的论文,对体现人类合作的以任务分配为核心的众包计算 (Crowdsourcing)和以任务协同求解为模式的群智计算等进行了解释。

以任务分配为核心的众包计算指企业或机构将应该由雇员完成的工作拆分为若干小任务,通过公开招募的方式外包给志愿者或付费工作者来完成。大家应该对验证码比较熟悉,我们在登录或访问一些网站时会自动弹出验证码图片,如果能够正确输入验证码图片中的信息,就被认为是人类账号登录而非机器人账号登录,从而完成人机验证,允许访问网站。验证码识别就是早期众包计算的一个例子。2002年,卡内基梅隆大学路易斯·冯·安(Luis von Ahn)提出以众包计算模式来对扫描成图像的古代书籍中的单词进行识别。当时,对扫描成图像的文字进行自动识别是一大挑战。路易斯·冯·安提出:既然每天有很多人在电脑前识别出一些计算机程序无法识别的字符,那么能不能在进行人机验证的同时顺便把古籍文字识别这一工作“众包”给互联网用户呢?于是,在用户登录网站时,系统会显示两个单词让用户来识别,其中一个是程序无法辨认、因此需要用户来识别的单词,另外一个是系统已知答案的单词。当已知答案的单词被用户正确识别出来之后,系统就把这个用户看作是人类。系统相信他对另一个程序无法辨认的单词的识别结果,并将识别结果添加到数据库中。这样,一旦越来越多的用户使用验证码识别系统,就会有越来越多的程序难以识别的文字被人类识别出来,从而完成古籍电子化工作。

众包计算任务也可由众多志愿者自发进行,比如2013年4月,美国波士顿马拉松赛爆炸案发生之后,波士顿警察局通过众包收集到不同渠道拍摄的图片和影像资料,让互联网用户自发地从海量数据中寻找犯罪嫌疑人,有效提升了破案效率。

以任务协同求解为模式的群智计算指不同用户有组织地合作完成同一任务。2008 年,蛋白质结构设计领军人物、美国科学院院士、华盛顿大学戴维·贝克(David Baker)教授与本校计算机相关研究人员合作,设计了一款支持多人在线的蛋白折叠游戏Foldit。在游戏中,给定一个目标蛋白,让互联网用户使用各种氨基酸组装出这个蛋白。这个游戏一经发布就吸引了有志于蛋白组装事业的互联网用户,注册玩家数量迅速达到24万人。很快,一个个蛋白就在全世界玩家的围攻之下被组装完毕。2010年,戴维·贝克将游戏玩家通过群体智慧完成所有蛋白组装的结果在英国《自然》(Nature)杂志上以《使用多人在线游戏预测蛋白质结构》(Predicting protein structures with a multiplayeronline game)发表。为了突出游戏玩家的贡献,这篇论文作者栏中写上了“超过57,000个游戏玩家”,作者单位为互联网(Worldwide)。

产品名称:走进人工智能∣有声通识十五讲

主理人:吴飞

出品机构:高等教育出版社 、高等教育电子音像出版社

合作机构:浙江大学上海高等研究院、上海人工智能实验室智能教育中心

出品时间:2022年1月