Wir verwenden tabellarische Datensätze, die ursprünglich von OpenML stammen und zu einer Reihe von Benchmark-Datensätzen vom Inria-Soda-Team auf HuggingFace zusammengestellt wurden. Wir trainieren mit 28.855 Trainingsproben und testen mit den verbleibenden 9.619 Proben. Alle MLPs werden mit einer Batch-Größe von 64, 64 und 0,0005 trainiert, und wir untersuchen 3 Schichten mit jeweils 100 Neuronen. Wir definieren hier die sechs wichtigsten Metriken, die in unserer Arbeit verwendet werden.Wir verwenden tabellarische Datensätze, die ursprünglich von OpenML stammen und zu einer Reihe von Benchmark-Datensätzen vom Inria-Soda-Team auf HuggingFace zusammengestellt wurden. Wir trainieren mit 28.855 Trainingsproben und testen mit den verbleibenden 9.619 Proben. Alle MLPs werden mit einer Batch-Größe von 64, 64 und 0,0005 trainiert, und wir untersuchen 3 Schichten mit jeweils 100 Neuronen. Wir definieren hier die sechs wichtigsten Metriken, die in unserer Arbeit verwendet werden.

Der Geek-Leitfaden zum ML-Experimentieren

2025/09/21 13:47

Abstrakt und 1. Einleitung

1.1 Post-Hoc-Erklärung

1.2 Das Uneinigkeitsproblem

1.3 Förderung des Erklärungskonsenses

  1. Verwandte Arbeiten

  2. Pear: Post-HOC-Explainer-Agreement-Regularizer

  3. Die Wirksamkeit des Konsens-Trainings

    4.1 Übereinstimmungsmetriken

    4.2 Verbesserung der Konsensmetriken

    [4.3 Konsistenz zu welchem Preis?]()

    4.4 Sind die Erklärungen noch wertvoll?

    4.5 Konsens und Linearität

    4.6 Zwei Verlustterme

  4. Diskussion

    5.1 Zukünftige Arbeit

    5.2 Fazit, Danksagungen und Referenzen

Anhang

A ANHANG

A.1 Datensätze

In unseren Experimenten verwenden wir tabellarische Datensätze, die ursprünglich von OpenML stammen und vom Inria-Soda-Team auf HuggingFace [11] zu einem Satz von Benchmark-Datensätzen zusammengestellt wurden. Wir geben einige Details zu jedem Datensatz an:

\ Bank Marketing Dies ist ein binärer Klassifikationsdatensatz mit sechs Eingabemerkmalen und ist ungefähr klassenbalanciert. Wir trainieren mit 7.933 Trainingsproben und testen mit den verbleibenden 2.645 Proben.

\ California Housing Dies ist ein binärer Klassifikationsdatensatz mit sieben Eingabemerkmalen und ist ungefähr klassenbalanciert. Wir trainieren mit 15.475 Trainingsproben und testen mit den verbleibenden 5.159 Proben.

\ Electricity Dies ist ein binärer Klassifikationsdatensatz mit sieben Eingabemerkmalen und ist ungefähr klassenbalanciert. Wir trainieren mit 28.855 Trainingsproben und testen mit den verbleibenden 9.619 Proben.

A.2 Hyperparameter

Viele unserer Hyperparameter sind über alle unsere Experimente hinweg konstant. Zum Beispiel werden alle MLPs mit einer Batch-Größe von 64 und einer anfänglichen Lernrate von 0,0005 trainiert. Außerdem haben alle von uns untersuchten MLPs 3 versteckte Schichten mit jeweils 100 Neuronen. Wir verwenden immer den AdamW-Optimierer [19]. Die Anzahl der Epochen variiert von Fall zu Fall. Für alle drei Datensätze trainieren wir 30 Epochen, wenn 𝜆 ∈ {0,0, 0,25} und sonst 50 Epochen. Beim Training linearer Modelle verwenden wir 10 Epochen und eine anfängliche Lernrate von 0,1.

A.3 Uneinigkeitsmetriken

Wir definieren hier jede der sechs Übereinstimmungsmetriken, die in unserer Arbeit verwendet werden.

\ Die ersten vier Metriken hängen von den Top-𝑘 wichtigsten Merkmalen in jeder Erklärung ab. Lassen Sie 𝑡𝑜𝑝_𝑓 𝑒𝑎𝑡𝑢𝑟𝑒𝑠(𝐸, 𝑘) die Top-𝑘 wichtigsten Merkmale in einer Erklärung 𝐸 darstellen, lassen Sie 𝑟𝑎𝑛𝑘 (𝐸, 𝑠) den Wichtigkeitsrang des Merkmals 𝑠 innerhalb der Erklärung 𝐸 sein, und lassen Sie 𝑠𝑖𝑔𝑛(𝐸, 𝑠) das Vorzeichen (positiv, negativ oder null) des Wichtigkeitswerts des Merkmals 𝑠 in der Erklärung 𝐸 sein.

\

\ Die nächsten zwei Übereinstimmungsmetriken hängen von allen Merkmalen innerhalb jeder Erklärung ab, nicht nur von den Top-𝑘. Lassen Sie 𝑅 eine Funktion sein, die die Rangfolge der Merkmale innerhalb einer Erklärung nach Wichtigkeit berechnet.

\

\ (Hinweis: Krishna et al. [15] geben in ihrem Papier an, dass 𝐹 eine vom Endbenutzer angegebene Menge von Merkmalen sein soll, aber in unseren Experimenten verwenden wir alle Merkmale mit dieser Metrik).

A.4 Ergebnisse des Junk-Feature-Experiments

Wenn wir zufällige Merkmale für das Experiment in Abschnitt 4.4 hinzufügen, verdoppeln wir die Anzahl der Merkmale. Wir tun dies, um zu überprüfen, ob unser Konsensverlust die Erklärungsqualität beeinträchtigt, indem irrelevante Merkmale häufiger in die Top-𝐾 aufgenommen werden als bei natürlich trainierten Modellen. In Tabelle 1 berichten wir den prozentualen Anteil der Zeit, in der jeder Erklärer eines der zufälligen Merkmale in die 5 wichtigsten Merkmale aufgenommen hat. Wir beobachten, dass wir über alle Bereiche hinweg keinen systematischen Anstieg dieser Prozentsätze zwischen 𝜆 = 0,0 (ein Baseline-MLP ohne unseren Konsensverlust) und 𝜆 = 0,5 (ein MLP, das mit unserem Konsensverlust trainiert wurde) sehen

\ Tabelle 1: Häufigkeit von Junk-Features, die Top-5-Ränge erhalten, gemessen in Prozent.

A.5 Weitere Uneinigkeitsmatrizen

Abbildung 9: Uneinigkeitsmatrizen für alle in diesem Papier betrachteten Metriken zu Bank Marketing-Daten.

\ Abbildung 10: Uneinigkeitsmatrizen für alle in diesem Papier betrachteten Metriken zu California Housing-Daten.

\ Abbildung 11: Uneinigkeitsmatrizen für alle in diesem Papier betrachteten Metriken zu Electricity-Daten.

A.6 Erweiterte Ergebnisse

Tabelle 2: Durchschnittliche Testgenauigkeit für die von uns trainierten Modelle. Diese Tabelle ist nach Datensatz, Modell, den Hyperparametern im Verlust und dem Gewichtsverfallskoeffizienten (WD) organisiert. Durchschnitte sind über mehrere Versuche und wir berichten die Mittelwerte ± einen Standardfehler.

A.7 Zusätzliche Diagramme

Abbildung 12: Die Logit-Oberflächen für MLPs, die jeweils mit einem anderen Lambda-Wert trainiert wurden, auf 10 zufällig konstruierten Drei-Punkt-Ebenen aus dem Bank Marketing-Datensatz.

\ Abbildung 13: Die Logit-Oberflächen für MLPs, die jeweils mit einem anderen Lambda-Wert trainiert wurden, auf 10 zufällig konstruierten Drei-Punkt-Ebenen aus dem California Housing-Datensatz.

\ Abbildung 14: Die Logit-Oberflächen für MLPs, die jeweils mit einem anderen Lambda-Wert trainiert wurden, auf 10 zufällig konstruierten Drei-Punkt-Ebenen aus dem Electricity-Datensatz.

\ Abbildung 15: Zusätzliche Trade-off-Kurvendiagramme für alle Datensätze und Metriken.

\

:::info Autoren:

(1) Avi Schwarzschild, University of Maryland, College Park, Maryland, USA und Arbeit abgeschlossen während der Tätigkeit bei Arthur (avi1umd.edu);

(2) Max Cembalest, Arthur, New York City, New York, USA;

(3) Karthik Rao, Arthur, New York City, New York, USA;

(4) Keegan Hines, Arthur, New York City, New York, USA;

(5) John Dickerson†, Arthur, New York City, New York, USA (john@arthur.ai).

:::


:::info Dieses Papier ist auf arxiv verfügbar unter der CC BY 4.0 DEED-Lizenz.

:::

\

Marktchance
SIX Logo
SIX Kurs(SIX)
$0.01282
$0.01282$0.01282
-3.89%
USD
SIX (SIX) Echtzeit-Preis-Diagramm
Haftungsausschluss: Die auf dieser Website veröffentlichten Artikel stammen von öffentlichen Plattformen und dienen ausschließlich zu Informationszwecken. Sie spiegeln nicht unbedingt die Ansichten von MEXC wider. Alle Rechte verbleiben bei den ursprünglichen Autoren. Sollten Sie der Meinung sein, dass Inhalte die Rechte Dritter verletzen, wenden Sie sich bitte an service@support.mexc.com um die Inhalte entfernen zu lassen. MEXC übernimmt keine Garantie für die Richtigkeit, Vollständigkeit oder Aktualität der Inhalte und ist nicht verantwortlich für Maßnahmen, die aufgrund der bereitgestellten Informationen ergriffen werden. Die Inhalte stellen keine finanzielle, rechtliche oder sonstige professionelle Beratung dar und sind auch nicht als Empfehlung oder Billigung von MEXC zu verstehen.

Das könnte Ihnen auch gefallen

Blitz-OP nach doppeltem Drama: Teamarzt von NFL-Rivalen flickt Superstar Mahomes wieder zusammen

Blitz-OP nach doppeltem Drama: Teamarzt von NFL-Rivalen flickt Superstar Mahomes wieder zusammen

Die Saison endet für Patrick Mahomes doppelt bitter. Seine Kansas City Chiefs verpassen die Playoffs und der Superstar verletzt sich schwer am Knie. Er wird sof
Teilen
N-tv2025/12/16 16:34
Sui präsentiert Innovation auf der Korea Blockchain Week 2025

Sui präsentiert Innovation auf der Korea Blockchain Week 2025

Der Beitrag Sui präsentiert Innovation auf der Korea Blockchain Week 2025 erschien auf BitcoinEthereumNews.com. Joerg Hiller 30.09.2025 04:13 Suis Präsenz auf der Korea Blockchain Week 2025 unterstrich seinen wachsenden Einfluss im Bereich digitaler Vermögenswerte mit wichtigen Diskussionen über KI, Gaming und Blockchain-Fortschritte. Die Korea Blockchain Week (KBW) 2025 diente als bedeutende Plattform für Sui, die seine Führung, Partner und Community zusammenbrachte, um seinen wachsenden Einfluss im Bereich digitaler Vermögenswerte hervorzuheben. Laut Sui Foundation unterstrich die einwöchige Veranstaltungsreihe Suis institutionelle Relevanz und kulturellen Einfluss in der Asien-Pazifik-Region. EastPoint: Die Bühne bereiten Die Veranstaltung begann mit EastPoint:Seoul, einer privaten Konferenz, bei der Schlüsselfiguren, darunter Kevin Boon, Präsident von Mysten Labs, die Zukunft digitaler Vermögenswerte in Korea diskutierten. Boons Einblicke in die regulatorischen Entwicklungen in den USA boten lokalen Interessenvertretern eine globale Perspektive, die begierig waren, die Auswirkungen auf koreanische Märkte zu verstehen. Einfluss und Innovation bei der KBW Während der KBW: IMPACT-Konferenz präsentierte Sui seine Vordenkerrolle und Community-Engagement. Bemerkenswerte Sitzungen umfassten Präsentationen von Adeniyi Abiodun und Kostas Chalkias, beide Mitbegründer von Mysten Labs. Abiodun stellte den Sui Stack als Koordinationsschicht für Anwendungen und KI vor, während Chalkias die Schnittstelle zwischen Blockchain und KI erforschte und neue Grenzen in der digitalen Technologie aufzeigte. Community-Engagement und Gaming-Fokus Die Veranstaltungen zur Wochenmitte konzentrierten sich auf Community-Building und Gaming, wobei über 800 Partner und Entwickler an einem eleganten Abendtreffen in Seongsu teilnahmen. Branchenführer diskutierten die Flexibilität von Suis Architektur im Spieldesign und bei der Implementierung. Der Tag endete mit einer interaktiven Gaming-Veranstaltung, "Ready. Sui. Play!" in Gangnam, die Entwickler und Spieler in praktische Erfahrungen einbezog. Sui Builder House: APAC Die Woche gipfelte in der Sui Builder House: APAC-Veranstaltung, die 600 Teilnehmer anzog, die begierig waren, regionale Strategien und Produktinnovationen zu erkunden. Das Programm beinhaltete bedeutende Ankündigungen, darunter neue Produktmeilensteine wie Slush- und BTCfi-Integrationen, und zeigte, wie...
Teilen
BitcoinEthereumNews2025/10/01 11:54
Bitcoin-Kurs bekommt harte Schläge – Markt hält Atem an vor 14:30 Uhr

Bitcoin-Kurs bekommt harte Schläge – Markt hält Atem an vor 14:30 Uhr

De bitcoin prijs van de afgelopen 24 uur. - Bron: CoinGecko
Teilen
Crypto-insiders2025/12/16 16:16