shanghai security defense & alarm association 愛建網(wǎng)">
近日,在由全球多媒體領(lǐng)域頂級學會ACM MM主辦的“大規(guī)模復雜場景人體視頻解析”挑戰(zhàn)賽中,依圖算法奪得第一,評價指標wf-mAP@avg達0.26,將以往學術(shù)界中的基準算法提升了近3倍,以絕對優(yōu)勢奪得“行為識別”賽道冠軍。
行為識別是指以人為基礎(chǔ)單位,只分析人的行為,關(guān)注單人的動作以及多人的動作。這項技術(shù)正在智能城市、安全生產(chǎn)、智能商業(yè)、智慧娛樂等社會生產(chǎn)生活的方方面面起到作用,比如實時檢測工人是否遵循操作流程生產(chǎn)作業(yè)以防暴力分揀、針對短視頻中人的行為進行摘要理解從而自動為用戶推薦視頻。
學術(shù)界以往常用f-mAP@avg來作為行為識別的評價指標,此次競賽采用的評價指標wf-mAP@avg更注重對難度較大的擁擠場景的考察和少見動作的識別,同時對于人體框的定位精確性要求也更高。
由于挑戰(zhàn)賽是首次舉辦,參賽團隊在賽前無法獲取識別的類別、數(shù)據(jù)集的大小和識別的具體需求。在不到兩個月里,依圖將算法與場景進行深度結(jié)合,從視頻中自動提取到了準確豐富的場景信息,并借助多年來的算法積淀和對行業(yè)場景的理解等“先驗知識”,對特定的14類任務進行了深度算法優(yōu)化。
在此基礎(chǔ)上,依圖團隊在僅使用單模型的情況下,取得了優(yōu)于其他團隊使用復雜多模型融合策略取得的成績。同時,這也意味著依圖仍可以進一步通過融合多個模型提升算法性能。
目前,依圖行為識別算法的性能仍在持續(xù)迭代,實際運用該技術(shù)落地實戰(zhàn)的項目難度已遠超比賽的數(shù)據(jù)集。未來,依托于高性能自研AI芯片,依圖將加速AI技術(shù)落地、解鎖更多城市生產(chǎn)生活場景。
關(guān)于 ACM MM Grand Challenge
ACM是全球最大的計算機領(lǐng)域?qū)I(yè)性學術(shù)組織,其評選的圖靈獎(A.M.Turing Award)被公認為世界計算機領(lǐng)域的諾貝爾獎。而ACM MM是全球多媒體領(lǐng)域的頂級會議,屬中國計算機學會(CCF)指定的A類國際會議。
在此次比賽中,包括亞馬遜、騰訊、大華科技、中山大學等上百支隊伍參與了超過56000個復雜事件下的人體行為解析。該比賽也是行為識別方向最接近真實場景的大規(guī)模挑戰(zhàn)賽。
滬公網(wǎng)安備 31011202001934號