MaGGIe introduceert de I-HIM50K en M-HIM2K datasets, met meer dan 180.000 gesynthetiseerde menselijke maskers om de robuustheid van instance matting te evalueren.MaGGIe introduceert de I-HIM50K en M-HIM2K datasets, met meer dan 180.000 gesynthetiseerde menselijke maskers om de robuustheid van instance matting te evalueren.

Synthetiseren van Multi-Instance Human Matting Data met MaskRCNN en BG20K

Samenvatting en 1. Inleiding

  1. Gerelateerd Werk

  2. MaGGIe

    3.1. Efficiënte Gemaskeerde Geleide Instance Matting

    3.2. Feature-Matte Temporele Consistentie

  3. Instance Matting Datasets

    4.1. Beeld Instance Matting en 4.2. Video Instance Matting

  4. Experimenten

    5.1. Pre-training op beelddata

    5.2. Training op videodata

  5. Discussie en Referenties

\ Aanvullend Materiaal

  1. Architectuurdetails

  2. Beeld matting

    8.1. Dataset generatie en voorbereiding

    8.2. Trainingsdetails

    8.3. Kwantitatieve details

    8.4. Meer kwalitatieve resultaten op natuurlijke beelden

  3. Video matting

    9.1. Dataset generatie

    9.2. Trainingsdetails

    9.3. Kwantitatieve details

    9.4. Meer kwalitatieve resultaten

8. Beeld matting

Deze sectie breidt het beeldmattingproces uit en biedt aanvullende inzichten in datasetgeneratie en uitgebreide vergelijkingen met bestaande methoden. We gaan dieper in op de creatie van I-HIM50K en M-HIM2K datasets, bieden gedetailleerde kwantitatieve analyses en presenteren verdere kwalitatieve resultaten om de effectiviteit van onze aanpak te onderstrepen.

8.1. Dataset generatie en voorbereiding

De I-HIM50K dataset werd gesynthetiseerd uit de HHM50K [50] dataset, die bekend staat om zijn uitgebreide collectie menselijke beeldmattes. We gebruikten een MaskRCNN [14] Resnet-50 FPN 3x model, getraind op de COCO dataset, om afbeeldingen met één persoon eruit te filteren, wat resulteerde in een subset van 35 053 afbeeldingen. Volgens de InstMatt [49] methodologie werden deze afbeeldingen gecomponeerd tegen diverse achtergronden uit de BG20K [29] dataset, waardoor multi-instance scenario's ontstonden met 2-5 onderwerpen per afbeelding. De onderwerpen werden van grootte veranderd en gepositioneerd om een realistische schaal te behouden en overmatige overlapping te vermijden, zoals aangegeven door instance IoU's die niet hoger waren dan 30%. Dit proces leverde 49 737 afbeeldingen op, met gemiddeld 2,28 instances per afbeelding. Tijdens de training werden geleidingsmaskers gegenereerd door de alfa-mattes te binariseren en willekeurige dropout-, dilatatie- en erosie-operaties toe te passen. Voorbeeldafbeeldingen van I-HIM50K worden getoond in Fig. 10.

\ De M-HIM2K dataset werd ontworpen om de modelrobuustheid tegen variërende maskerkwaliteiten te testen. Het omvat tien maskers per instance, gegenereerd met verschillende MaskRCNN modellen. Meer informatie over de modellen die voor dit generatieproces zijn gebruikt, wordt getoond in Tabel 8. De maskers werden aan instances gekoppeld op basis van de hoogste IoU met de ground truth alfa-mattes, waarbij een minimale IoU-drempel van 70% werd gegarandeerd. Maskers die niet aan deze drempel voldeden, werden kunstmatig gegenereerd uit ground truth. Dit proces resulteerde in een uitgebreide set van 134 240 maskers, met 117 660 voor samengestelde en 16 600 voor natuurlijke afbeeldingen, wat een robuuste benchmark biedt voor het evalueren van gemaskeerde geleide instance matting. De volledige dataset I-HIM50K en M-HIM2K zal worden vrijgegeven na acceptatie van dit werk.

\ Figuur 10. Voorbeelden van I-HIM50K dataset. (Best te bekijken in kleur).

\ Tabel 8. Tien modellen met variërende maskerkwaliteit worden gebruikt in MHIM2K. De MaskRCNN modellen zijn afkomstig van detectron2 getraind op COCO met verschillende instellingen.

\

:::info Auteurs:

(1) Chuong Huynh, University of Maryland, College Park (chuonghm@cs.umd.edu);

(2) Seoung Wug Oh, Adobe Research (seoh,jolee@adobe.com);

(3) Abhinav Shrivastava, University of Maryland, College Park (abhinav@cs.umd.edu);

(4) Joon-Young Lee, Adobe Research (jolee@adobe.com).

:::


:::info Dit artikel is beschikbaar op arxiv onder CC by 4.0 Deed (Attribution 4.0 International) licentie.

:::

\

Marktkans
Multichain logo
Multichain koers(MULTI)
$0.03826
$0.03826$0.03826
+2.79%
USD
Multichain (MULTI) live prijsgrafiek
Disclaimer: De artikelen die op deze site worden geplaatst, zijn afkomstig van openbare platforms en worden uitsluitend ter informatie verstrekt. Ze weerspiegelen niet noodzakelijkerwijs de standpunten van MEXC. Alle rechten blijven bij de oorspronkelijke auteurs. Als je van mening bent dat bepaalde inhoud inbreuk maakt op de rechten van derden, neem dan contact op met service@support.mexc.com om de content te laten verwijderen. MEXC geeft geen garanties met betrekking tot de nauwkeurigheid, volledigheid of tijdigheid van de inhoud en is niet aansprakelijk voor eventuele acties die worden ondernomen op basis van de verstrekte informatie. De inhoud vormt geen financieel, juridisch of ander professioneel advies en mag niet worden beschouwd als een aanbeveling of goedkeuring door MEXC.