能夠識(shí)別圖片中的物體的智能工具
人工智能研究最有趣的領(lǐng)域之一就是計(jì)算機(jī)視覺(computer vision),從無人駕駛汽車內(nèi)部構(gòu)件到機(jī)器猜年齡,計(jì)算機(jī)視覺系統(tǒng)軟件擁有著很大的開發(fā)潛能。
近期,計(jì)算機(jī)科學(xué)家史蒂芬·沃爾夫勒姆(Stephen Wolfram)發(fā)布了一種新工具,名叫“沃爾夫勒姆圖片識(shí)別項(xiàng)目”( Wolfram Image Identification Project)。用戶借助這項(xiàng)工具首先需要上傳或者鏈接到一張圖片,然后就可以看到計(jì)算機(jī)如何來識(shí)別圖片中物體。
沃爾夫勒姆是這樣描述他的工具的:跟很多計(jì)算機(jī)視覺項(xiàng)目不同,沃爾夫勒姆項(xiàng)目圍繞一種“人工神經(jīng)網(wǎng)絡(luò)”而建立。人工神經(jīng)網(wǎng)絡(luò)實(shí)際上是一種軟件框架,它的設(shè)計(jì)靈感來自能夠進(jìn)行圖片識(shí)別的生物大腦。沃爾夫勒姆構(gòu)造的“人工神經(jīng)網(wǎng)絡(luò)”是可以通過數(shù)千萬標(biāo)簽圖片“訓(xùn)練”出來的。
“我們不需要用老方法來描述一個(gè)物體,比如椅子。我們所做的一切就是提供很多類型的椅子。你也可以這么說,‘任何跟我們想將其定義為椅子的物體’。這樣,我們就會(huì)把那些跟我們所定義的‘椅子’很接近圖片貼上‘椅子’標(biāo)簽,其他則排除在外。”沃爾夫勒姆表示。
Business Insider網(wǎng)站通過測(cè)試發(fā)現(xiàn),在多數(shù)情況下,這款圖片識(shí)別器能夠至少抓住圖片中的“關(guān)鍵點(diǎn)”。比如,它能夠?qū)⑾@?middot;克林頓和瑪麗莎·梅耶爾準(zhǔn)確地歸類為“人”,不過它無法識(shí)別按名字來識(shí)別出他們。它能夠?qū)aris cafe Le Comptoir歸類為“一座建筑”。
不過,在某些情況下,沃爾夫勒姆識(shí)別工具會(huì)完全忽略掉圖片中的人,將焦點(diǎn)集中于某些沒有生命的物體上。比如,在拳王格羅夫金(Gennady Golovkin)一張拳擊比賽圖片中,這項(xiàng)算法鎖定在了拳擊手套上,并提供了有關(guān)這雙拳擊手套的其他信息,比如重量和材質(zhì)。
在另一張肯德基宣傳廣告圖片中,該算法忽視掉了里面的主人公,只是將焦點(diǎn)放在了主人公身旁的汽車,并將其識(shí)別為“交通”。
對(duì)于三星手機(jī),這項(xiàng)工具將其識(shí)別為“遠(yuǎn)程控制”,跟上面提到的拳擊手套一樣,系統(tǒng)還提供一些文字介紹。
在這張?zhí)厮估噲D片中,系統(tǒng)注意到了汽車前面站立的人(特斯拉CEO馬斯克),但是它將馬斯克身后的汽車歸類為“兩門”小轎車,而不是四門汽車。
在另一張視頻游戲Doom4截圖中,系統(tǒng)將圖片中的士兵竟然識(shí)別為一只“蜘蛛”,并在下面提供有關(guān)這類蜘蛛的名稱和最大年齡信息。
智能界(jwnfls.cn)是中國首家專注于報(bào)道智能科技前沿的綜合垂直門戶,秉承“引領(lǐng)未來智能生活”的理念,持續(xù)關(guān)注智能家居、可穿戴設(shè)備、智能醫(yī)療、機(jī)器人、3D打印、智駕等諸多科技前沿領(lǐng)域,提供最前沿、最時(shí)尚、最實(shí)用、最專業(yè)的硬件產(chǎn)品介紹、硬件評(píng)測(cè)、服務(wù)定制、最新資訊、圈子交流等服務(wù),致力于成為最具價(jià)值的智能科技信息互動(dòng)平臺(tái)。
智能界【微信公眾號(hào)ID:znjchina】【新浪/騰訊微博:@智能界】
數(shù)量:6 | 申請(qǐng)人數(shù):970 | 申領(lǐng):100積分 |
最新評(píng)論