圖像分類是機(jī)器學(xué)習(xí)和模式識(shí)別領(lǐng)域中一個(gè)十分重要的研究熱點(diǎn),其目的是基于標(biāo)簽已知且完整的圖像數(shù)據(jù)集訓(xùn)練一個(gè)分類器,并對(duì)新樣本的標(biāo)簽進(jìn)行預(yù)測(cè)和分類。傳統(tǒng)的圖像分類問題通常是單標(biāo)簽分類問題,即一張圖片僅對(duì)應(yīng)一個(gè)類別標(biāo)簽。然而,現(xiàn)實(shí)世界的圖像往往具有多義性,即一張圖片通常和多個(gè)類別標(biāo)簽相關(guān)聯(lián)。針對(duì)傳統(tǒng)的單標(biāo)簽學(xué)習(xí)框架難以解決的多義性問題,通過給樣本對(duì)象明確地指定一組相關(guān)類別標(biāo)簽的標(biāo)簽子集,多標(biāo)簽學(xué)習(xí)框架應(yīng)運(yùn)而生?,F(xiàn)有的大多數(shù)多標(biāo)簽學(xué)習(xí)算法都是假設(shè)訓(xùn)練樣本的標(biāo)簽集是完整的,然而,在實(shí)際應(yīng)用中,訓(xùn)練樣本的標(biāo)簽往往是不完整的。并且,訓(xùn)練樣本的標(biāo)簽通常采用人工標(biāo)注,耗時(shí)又耗力,而且由于人工標(biāo)注存在主觀性,標(biāo)簽語義存在歧義,致使訓(xùn)練樣本的部分標(biāo)簽漏標(biāo)、缺失。隨著互聯(lián)網(wǎng)和社交媒體的發(fā)展,大量由用戶標(biāo)注并上傳的圖像數(shù)據(jù)唾手可得,但是這些圖像數(shù)據(jù)往往存在標(biāo)簽缺失問題。如何利用這些容易獲取卻具有標(biāo)簽缺失問題的數(shù)據(jù)來訓(xùn)練一個(gè)健壯、有效的多標(biāo)簽分類算法,仍然是一個(gè)亟待解決的問題。本文主要研究針對(duì)存在標(biāo)簽缺失問題的多標(biāo)簽圖像分類問題,主要研究?jī)?nèi)容如下:1.利用標(biāo)簽間固有的關(guān)聯(lián)性以及示例間的相似性,提出了一種基于示例級(jí)和標(biāo)簽級(jí)關(guān)聯(lián)的多標(biāo)簽圖像分類算法。該算法首先采用線性重組策略計(jì)算每個(gè)示例與其近鄰示例間的相似性,其次采用標(biāo)簽矩陣的低秩表示挖掘標(biāo)簽間的高階關(guān)聯(lián)性,然后采用一種加權(quán)最小二乘損失函數(shù)保證給定標(biāo)簽與預(yù)測(cè)標(biāo)簽的一致性,最后,通過拉普拉斯流形正則化聯(lián)合兩種關(guān)聯(lián)以及損失函數(shù)構(gòu)建最終的目標(biāo)函數(shù)。在多個(gè)圖像數(shù)據(jù)集上的實(shí)驗(yàn)證明,該算法能夠有效處理標(biāo)簽缺失問題。2.基于低秩特征映射與低秩標(biāo)簽恢復(fù),提出了一種針對(duì)標(biāo)簽缺失問題的雙重低秩的多標(biāo)簽圖像分類算法。該算法首先假設(shè)算法的特征映射系數(shù)矩陣具有低秩性,來挖掘特征空間中的標(biāo)簽關(guān)聯(lián)。然后假設(shè)標(biāo)簽關(guān)聯(lián)矩陣是一個(gè)低秩矩陣,來挖掘標(biāo)簽間的高階關(guān)聯(lián)性,并同時(shí)利用低秩的標(biāo)簽關(guān)聯(lián)恢復(fù)原標(biāo)簽矩陣的缺失標(biāo)簽。然后通過保證預(yù)測(cè)標(biāo)簽與恢復(fù)后的標(biāo)簽之間的一致性,將標(biāo)簽關(guān)聯(lián)的提取、標(biāo)簽恢復(fù)與模型的訓(xùn)練結(jié)合到一起。最后通過正則化引入示例級(jí)的關(guān)聯(lián)性。