大多(duō)数人在谈论人工(gōng)智能的未来(lái)时,都会联想到黑客帝国中邪恶的网络或者终结者中的电子人杀人机器。
当今的人(rén)工智能无法完全取代(dài)人类的工作,机器人不会带来世界末日。无论是伦(lún)理学家还是计(jì)算机科学家都不认为机器人的未来会走(zǒu)向世界末日(rì)。对人类(lèi)来说,人(rén)工智能的(de)前景非常广阔,可以让我们的世界(jiè)越来越美好(hǎo)。
本文描述的场景不仅可以帮助你理解(jiě)当(dāng)前AI的使用方式,而且还可以让你(nǐ)想象(xiàng)AI未来(lái)的发(fā)展潜力。
AI的社会成本
当前AI技术面(miàn)临的最大难题是由于数据集不完整而导致的(de)错误,主要问题之一是决策方面的(de)偏见。人(rén)们已(yǐ)经意识到(dào)这些错误,并(bìng)正在(zài)逐(zhú)步克服。
考(kǎo)虑一下美国刑事(shì)司法系统(tǒng)做(zuò)出带有偏见(jiàn)决(jué)策的那段历史,金融业和教(jiāo)育(yù)机构也存在同样的偏见,机器学习模(mó)型也在重复人为的偏见。
COMPAS系统是一(yī)个带有偏见的AI示例。美(měi)国有几个州使用该软件来确定犯罪分子的风险等级(jí)。COMPAS使用了具有少量风险因(yīn)素和特征的(de)数据(jù)集,最终的算法将黑人(rén)被(bèi)告标记为高风险的偏向性更高。这些(xiē)虚假标志出现在黑人(rén)身上的(de)概率是白人(rén)的两倍(bèi),结(jié)果导(dǎo)致黑(hēi)人被判刑的频率高于白人,且更(gèng)严(yán)厉。
当AI模型使(shǐ)用(yòng)有限的视觉数(shù)据集时,也会引发有偏见(jiàn)的决策。例(lì)如,仅在高加索人脸数据集上(shàng)训练了人脸识别系(xì)统,然后(hòu)将其应用于(yú)现实世界中的各种人群。
最后的误差就很严(yán)重:非裔美国人和亚洲(zhōu)人被(bèi)误识别的比率比(bǐ)白种人(rén)高10-100倍。美国国家标(biāo)准技术研究院(yuàn)(The National Institute of Standards and Technology,即NIST)发现(xiàn),由于存在(zài)这些(xiē)差(chà)异,许多当前的面部识别系统不能在执法和国家安全领域使用。
为了避(bì)免(miǎn)偏差,负责人脸识别应用程序开发的数据科学工程师必须考虑(lǜ)在多样性的数(shù)据集上训练模型。
面临禁止的人脸识别
对于政府和企业来说(shuō),人脸识别是一项前(qián)景广阔(kuò)的技术,但事实并(bìng)非如此。由于某些原(yuán)因,社会并不(bú)赞同。
美国奥克兰和(hé)旧金山的(de)警(jǐng)察部门和公(gōng)共机(jī)构禁止使用(yòng)面(miàn)部识别技术,俄勒冈(gāng)州、加利福尼亚(yà)州(zhōu)和新(xīn)罕布什尔州的(de)警察部门不能在警用摄像(xiàng)机(jī)中使用该(gāi)技术。四分之(zhī)一的美(měi)国居民认为,联邦政府(fǔ)应(yīng)限制(zhì)面部(bù)识(shí)别(bié)技术的使(shǐ)用。而且(qiě)除了美国之外,别的国家也有类似的现象。
-
欧盟的通用数据(jù)保护条例(General Data Protection Regulation,即GDPR)发现面部识(shí)别(bié)不符(fú)合条例(lì)要求。2019年,一(yī)所瑞典(diǎn)学校以受限的方式使用软(ruǎn)件来(lái)跟踪(zōng)学(xué)生的出勤(qín)率,虽然学生(shēng)家长同意收集生物识别信息,然而欧盟还是(shì)对该校进行了罚款。DPA裁定面部识别之类的生物识别(bié)技术(shù)属于隐私数(shù)据,根据(jù)该法规,除(chú)非参与识别活动(dòng)的人同(tóng)意收集隐私数据,否则不能收集和存储隐私(sī)数(shù)据。
2020年(nián)初,欧洲委(wěi)员会就是(shì)否禁止在公共场所进行(háng)面部识别展开了辩论,拟(nǐ)议的禁令将持续五年。这(zhè)项禁(jìn)令从未真正实施(shī)过,委员会人工智能白皮书(shū)的最终版本中已经删除了这项禁令。
目前,美国有自己的(de)地(dì)方法律(lǜ),与GDPR接近。加(jiā)州的(de)消费者隐私法(fǎ)案与GDPR如出(chū)一(yī)辙,是美国数据隐(yǐn)私(sī)的默认标准。法(fǎ)规和(hé)指导方针(zhēn)限制了面部识别技术(shù)的创新。
尽管消费者团体和政府机构(gòu)设定了各种限制,但创新(xīn)者仍在开(kāi)发面部(bù)识别软件,这项技术在中国和(hé)美国越来越(yuè)受(shòu)欢迎。2019年(nián),面部识别的(de)市场价值高(gāo)达50.7亿美元(美国),到2025年,经(jīng)济学家预(yù)计,在未(wèi)来五(wǔ)年(2020年-2025年(nián))的复合年增长率为12.5%的情况下,该领域的市(shì)场价值(zhí)将达到101.9亿美元(yuán)。有人预测,面(miàn)部识别技术有望进入零售市场,用于提高销售以及个性化购物体验。
AI技术的另一面(miàn)
现(xiàn)代监(jiān)控(kòng)基础设施需要面部识别技(jì)术,中国等国家依(yī)靠这种技术来维持社(shè)会控制,这(zhè)种用途让禁止和提高(gāo)面部识别限制的呼声(shēng)越来越(yuè)高。然而,面部识(shí)别是一种可用于其(qí)他(tā)方面的多用途技术,面部识别(bié)技术可以在(zài)公共(gòng)健康与安(ān)全中发挥至(zhì)关重要的作用(yòng)。
政府和私营企(qǐ)业正在使用(yòng)面部识别技术(shù)来遏制COVID-19。代理商可以要(yào)求(qiú)当(dāng)地(dì)居民或员工在扫描QR码之前提供旅行历史、姓名、身份证号码和体温(wēn)。扫描后,再授予区域的访(fǎng)问权限。此外(wài),社交媒体(tǐ)平台也在积极跟踪人(rén)们的(de)出行,并启用了热线供用户报告疾(jí)病(bìng),这(zhè)些信息提供了(le)有关热点和区域分布的信息。
在(zài)中国(guó),面部识别技术可以检测到人群中体(tǐ)温较高(gāo)的(de)人,还可(kě)以(yǐ)检(jiǎn)测某个人是否戴口罩。报告显示,面部识别技术(shù)可以识别戴(dài)口(kǒu)罩的(de)人,准(zhǔn)确率达95%。面向(xiàng)消(xiāo)费者的应用可以捕获个人健康信息,向用户(hù)提供有关附近(jìn)人员健康的信息(xī)。
在2008年北京奥运(yùn)会之(zhī)后,面部(bù)识别技术就进入了公(gōng)共领域。自2015年以来,中国政府机构、金融服务和零售部门都(dōu)开始广泛使用(yòng)面部识别(bié)技术。虽然人们对于该项技术的广泛使用感到担(dān)忧,但公众似乎接受了实际的使用,并且在某些情(qíng)况(kuàng)下(xià)(包括抑(yì)制COVID-19的传播)对该项技术(shù)表示赞赏。
揭露危险
自然语(yǔ)言处理是人工智能改(gǎi)变未来的另一个例子。在COVID-19迅速传播到中国以外的国家之前(qián),自然语言处理技术(shù)提供了可以(yǐ)挽救生(shēng)命的情报。
BlueDot是一个AI平台,使用自然语言处理和机器学习来追(zhuī)踪全球(qiú)的传染病,其实现采用了可快速浏(liú)览大量资源的算法。该算法(fǎ)旨在标记流行病的早期迹象,在2019年12月(yuè)的最后几周里,该平台在(zài)中国武汉发现了一群确诊(zhěn)的“异常肺(fèi)炎(yán)”患者。一周以后,世(shì)界卫生组织(WHO)正(zhèng)式发表声明(míng),称武汉一名患者患有“新型冠(guàn)状病毒”。
BlueDot并不是唯一可以在数千个(gè)来(lái)源中标记出关键领域的AI。全球(qiú)电子商务(wù)巨头阿里(lǐ)巴巴创建了由自然语言处理模型提供支(zhī)持(chí)的(de)StructBERT,该模(mó)型能够快速(sù)处理病毒基因序列,并筛选蛋白(bái)质。阿里巴巴已经将该平台用于对抗COVID-19,研究人员和科(kē)学家可以免费使用该模型来(lái)加速疫苗的开(kāi)发。
寻找治疗新病毒的方(fāng)法
透(tòu)过2020年2月发布的两(liǎng)份论文,我们可以看到人工智能如何(hé)改变公共卫生和(hé)生(shēng)物(wù)技术未来。
一(yī)篇论文描述了总部位于韩国的Deargen开(kāi)发和实现机器学习模型的(de)过程,该模型确定了四种可减缓COVID-19影(yǐng)响的抗病毒药物。Deargen的MT-DTI是一种学(xué)习模型,依赖于(yú)化(huà)学序列(而不是2D或3D分子结构),该模(mó)型可以(yǐ)预测(cè)目标分(fèn)子(例如病毒(dú))是否会与(yǔ)目标蛋白结合。阿扎那(nà)韦(Atazanavir)是一种抗HIV药物,已获得FDA批准。MT-DTI发现,阿扎那韦(wéi)可以与位于SARS-CoV-2分子外部的蛋(dàn)白质结合,并阻止其与人(rén)蛋白质结合的能力,SARS-CoV-2引发了COVID-19。
总部位于香港的(de)Insilico Medicine还于2月发布(bù)了另一篇论文。Insilico使用基于AI的平(píng)台对(duì)数(shù)千个(gè)新颖分子(zǐ)进(jìn)行建模,希望寻找可以(yǐ)破坏SARS-CoV-2复制的新型分子。
这些公司只是众多致力于寻找抗(kàng)病毒方法的科技公司、学(xué)术研究实验室(shì)和政(zhèng)府(fǔ)科(kē)学家中的(de)两家。人们创建了一个开放的数(shù)据集来(lái)帮(bāng)助(zhù)组之间的通信,COVID-19开放研究数(shù)据(jù)集(CORD-19)是所有该(gāi)主题研究的中(zhōng)心枢纽(niǔ),其(qí)中的数据可通过计算机读取,且在不(bú)断(duàn)更(gèng)新。任何访(fǎng)问数据库(kù)的人(rén)都可以获取存储的数据(jù),并将其轻松(sōng)地(dì)应用(yòng)于机(jī)器(qì)学习模型和AI技术,这可以加快目前全球的研究速度(dù)。
COVID-19后的AI未来
人工智能(néng)的(de)未来取决于人类管理和创新解决方案。科学家(jiā)和研究(jiū)人员在他们的脑海(hǎi)中构(gòu)思治愈的方法,人类的创(chuàng)造力利(lì)用机器解析的数(shù)据,并以有意(yì)义的方式将其组合在一(yī)起。如(rú)果没有(yǒu)人(rén)类提供的输入,AI只是一个有效的(de)数(shù)据收集器,仅(jǐn)此(cǐ)而已(yǐ)。COVID-19危机凸显了AI的(de)真正威力,创新(xīn)人员可通过设置模型(xíng)来确定AI的实用性以(yǐ)及价值(zhí)。
现在决策者可以做些什么(me)?
此(cǐ)次疫(yì)情迟早会结束。虽(suī)然疫情给(gěi)经济带(dài)来的影响(xiǎng)尚待确定,但COVID-19对经济的影响(xiǎng)存在若(ruò)干情况。
决策者可以(yǐ)选择发展(zhǎn)、创新和采用新技术。我们所要做的(de)事了解真实情况,并伺机而动(dòng)。