阿里安全 AI神經網絡打假 戴口罩也能知道你是誰
- 來源:中國信息化周報 smarty:if $article.tag?>
- 關鍵字:人工智能,分類性能,智慧城市 smarty:/if?>
- 發(fā)布時間:2020-09-08 15:14
近幾年,人工智能技術發(fā)展的如火如荼。就在前不久,兩年一度的世界計算機視覺領域頂級會議ECCV2020的各項挑戰(zhàn)賽結果出爐。其中,在圖像分類賽中,阿里安全的高效AI分類技術超越三星、深蘭科技、同濟大學等國內外多支隊伍的同類技術,獲得冠軍。
目前人工智能的崛起以海量的帶標簽訓練數據作為基石,海量數據可以保障AI模型的效果,但是數據的收集和標注需要昂貴的人力成本,進行訓練則需要消耗大量計算資源。ECCV2020分類比賽的難題是,與其他比賽動輒使用十幾萬的數據不同,ECCV2020的分類比賽共有1000個類別,每個類別僅有50張圖片作為訓練數據。比賽要求選手在不使用任何預訓練模型和額外數據情況下,從零訓練模型。這意味著訓練難度巨大,幾乎是不可能完成的任務。
不過,這也正是ECCV2020為了考驗參賽隊伍如何對來之不易的訓練數據進行充分利用,促使AI神經網絡進行高效學習,降低神經網絡訓練過程中的人力和計算資源消耗,也就是說,參賽隊伍要打造一個高效能、低成本的分類AI。
阿里安全圖靈實驗室算法工程師夜清介紹,阿里安全智能算法團隊從三個技術方向進行了突破:利用隨機抽取的兩張訓練圖像,使用數據增強并進行拼接,最大程度豐富訓練樣本資源;設計獨特的神經網絡結構,加入顯著性特征模塊挖掘樣本的特點,提升分類性能;利用分層語義結構,讓AI模型更好地挖掘數據,實現(xiàn)更好的學習效果。
阿里安全圖靈實驗室資深算法專家華棠認為,高效AI分類技術極大程度上解決了計算資源消耗和數據標注的人力成本問題,為自動駕駛、物體識別、智慧城市等領域提供了新的思路和方法。
在線下新零售場景中,對于新上架的一件商品,原來AI工程師們需要從不同的角度、光照條件和位置拍攝,收集幾千甚至上萬張圖片并進行標注,用于訓練模型,才可以保證AI模型能充分學習到該商品的特征。而在阿里安全提出的方案下,商品圖片數量縮減到50張以下,就能保證模型的識別能力。
“我們的方法還可以與自監(jiān)督有效的結合,在學習更好的數據表征基礎上,指導模型高效學習,獲得更好的識別能力。”夜清說。
目前,阿里安全這項基于小規(guī)模圖像的高效AI技術已應用在知識產權商標識別、通用商品識別和動植物保護等場景中。這類場景類別數量多,每個類別樣本數量較少,而預訓練任務和目標任務存在差異,預訓練模型可能損害目標任務的準確率,這個方案恰恰能夠解決上述問題。
“以某知名品牌運動鞋上新為例,一段時間內我們僅能獲得該產品不同的配色以及商品幾個不同角度的圖片。在僅有少量商品展示圖的情況下,通過高效AI方案,我們在新產品問世的極短時間內實現(xiàn)新款商品識別能力的覆蓋,降低新產品被山寨和假冒的風險。”華棠說。
