能夠識別圖片中的物體的智能工具
人工智能研究最有趣的領(lǐng)域之一就是計算機視覺(computer vision),從無人駕駛汽車內(nèi)部構(gòu)件到機器猜年齡,計算機視覺系統(tǒng)軟件擁有著很大的開發(fā)潛能。
近期,計算機科學家史蒂芬·沃爾夫勒姆(Stephen Wolfram)發(fā)布了一種新工具,名叫“沃爾夫勒姆圖片識別項目”( Wolfram Image Identification Project)。用戶借助這項工具首先需要上傳或者鏈接到一張圖片,然后就可以看到計算機如何來識別圖片中物體。
沃爾夫勒姆是這樣描述他的工具的:跟很多計算機視覺項目不同,沃爾夫勒姆項目圍繞一種“人工神經(jīng)網(wǎng)絡(luò)”而建立。人工神經(jīng)網(wǎng)絡(luò)實際上是一種軟件框架,它的設(shè)計靈感來自能夠進行圖片識別的生物大腦。沃爾夫勒姆構(gòu)造的“人工神經(jīng)網(wǎng)絡(luò)”是可以通過數(shù)千萬標簽圖片“訓練”出來的。
“我們不需要用老方法來描述一個物體,比如椅子。我們所做的一切就是提供很多類型的椅子。你也可以這么說,‘任何跟我們想將其定義為椅子的物體’。這樣,我們就會把那些跟我們所定義的‘椅子’很接近圖片貼上‘椅子’標簽,其他則排除在外。”沃爾夫勒姆表示。
Business Insider網(wǎng)站通過測試發(fā)現(xiàn),在多數(shù)情況下,這款圖片識別器能夠至少抓住圖片中的“關(guān)鍵點”。比如,它能夠?qū)⑾@?middot;克林頓和瑪麗莎·梅耶爾準確地歸類為“人”,不過它無法識別按名字來識別出他們。它能夠?qū)aris cafe Le Comptoir歸類為“一座建筑”。
不過,在某些情況下,沃爾夫勒姆識別工具會完全忽略掉圖片中的人,將焦點集中于某些沒有生命的物體上。比如,在拳王格羅夫金(Gennady Golovkin)一張拳擊比賽圖片中,這項算法鎖定在了拳擊手套上,并提供了有關(guān)這雙拳擊手套的其他信息,比如重量和材質(zhì)。
在另一張肯德基宣傳廣告圖片中,該算法忽視掉了里面的主人公,只是將焦點放在了主人公身旁的汽車,并將其識別為“交通”。
對于三星手機,這項工具將其識別為“遠程控制”,跟上面提到的拳擊手套一樣,系統(tǒng)還提供一些文字介紹。
在這張?zhí)厮估噲D片中,系統(tǒng)注意到了汽車前面站立的人(特斯拉CEO馬斯克),但是它將馬斯克身后的汽車歸類為“兩門”小轎車,而不是四門汽車。
在另一張視頻游戲Doom4截圖中,系統(tǒng)將圖片中的士兵竟然識別為一只“蜘蛛”,并在下面提供有關(guān)這類蜘蛛的名稱和最大年齡信息。
智能界(jwnfls.cn)是中國首家專注于報道智能科技前沿的綜合垂直門戶,秉承“引領(lǐng)未來智能生活”的理念,持續(xù)關(guān)注智能家居、可穿戴設(shè)備、智能醫(yī)療、機器人、3D打印、智駕等諸多科技前沿領(lǐng)域,提供最前沿、最時尚、最實用、最專業(yè)的硬件產(chǎn)品介紹、硬件評測、服務(wù)定制、最新資訊、圈子交流等服務(wù),致力于成為最具價值的智能科技信息互動平臺。
智能界【微信公眾號ID:znjchina】【新浪/騰訊微博:@智能界】
數(shù)量:6 | 申請人數(shù):211 | 申領(lǐng):100積分 |
最新評論