banner

Blog

Jul 19, 2023

Unbeaufsichtigt echt

Wissenschaftliche Berichte Band 12, Artikelnummer: 20783 (2022) Diesen Artikel zitieren

2447 Zugriffe

1 Zitate

96 Altmetrisch

Details zu den Metriken

Wir präsentieren die reale Datenverarbeitung gemessener Elektronenflugzeitdaten über neuronale Netze. Konkret geht es um den Einsatz entwirrter Variations-Autoencoder auf Daten eines Diagnoseinstruments zur Online-Wellenlängenüberwachung am Freie-Elektronen-Laser FLASH in Hamburg. Ohne Vorkenntnisse ist das Netzwerk in der Lage, Darstellungen von Single-Shot-FEL-Spektren zu finden, die ein niedriges Signal-Rausch-Verhältnis aufweisen. Dies enthüllt auf direkt für den Menschen interpretierbare Weise entscheidende Informationen über die Photoneneigenschaften. Es werden die zentrale Photonenenergie und die Intensität sowie sehr detektorspezifische Merkmale identifiziert. Das Netzwerk ist außerdem in der Lage, Daten zu bereinigen, also Rauschen zu beseitigen, sowie Artefakte zu entfernen. Dies ermöglicht bei der Rekonstruktion die Identifizierung von Signaturen mit sehr geringer Intensität, die in den Rohdaten kaum erkennbar sind. In diesem speziellen Fall erhöht das Netzwerk die Qualität der diagnostischen Analyse bei FLASH. Diese unbeaufsichtigte Methode hat jedoch auch das Potenzial, die Analyse anderer ähnlicher Arten von Spektroskopiedaten zu verbessern.

Freie-Elektronen-Laser (FEL) ermöglichen Atom- und Molekularwissenschaften im Femtosekunden- bis Attosekundenbereich, indem sie hochintensive Photonenpulse auf dieser Zeitskala erzeugen. Allerdings erzeugen FELs, die auf dem Prinzip der selbstverstärkten spontanen Emission (SASE)1,2 basieren, wie FLASH3, räumliche, spektrale und zeitliche Pulseigenschaften, die von Puls zu Puls stark schwanken. Daher ist eine zuverlässige Photonendiagnostik auf Einzelschussbasis für eine fundierte Datenanalyse wissenschaftlicher Benutzerexperimente, die an solchen Einrichtungen durchgeführt werden, unerlässlich. Durch das nachträgliche Sortieren der aufgezeichneten Daten nach verschiedenen Eigenschaften wie Intensität oder Wellenlänge können Signaturen physikalischer Prozesse sichtbar gemacht werden, die sonst in den Datensätzen verborgen oder sogar verborgen wären. Eine Reihe diagnostischer Instrumente an FELs werden zur Messung der Photoionisation von Gaszielen verwendet, wie zum Beispiel der Gas Monitor Detector (GMD)4,5 zur Messung der absoluten Pulsenergie, THz-Streaking6,7 zur Bestimmung der Photonenpuls-Zeitstruktur8, sowie das Online-Photoionisationsspektrometer OPIS9,10 (siehe Abb. 1) und die sogenannte Cookie-Box8,11, die mithilfe der Photoelektronenspektroskopie Informationen über die spektrale Verteilung der FEL-Strahlung erhalten. Diese Diagnoseverfahren haben den Vorteil, dass sie nahezu nicht-invasiv gestaltet werden können. Bei einem Photoionisationsprozess kann aufgrund der hohen FEL-Intensität eine erhebliche Raumladung10 im ionisierten Gastarget im Interaktionsbereich der Instrumente erzeugt werden. Diese Raumladung akkumuliert sogar bei hohen FEL-Pulswiederholungsraten, da die erzeugten Zielgasionen nicht schnell genug durch Coulomb-Abstoßung zerstreut werden oder mit frischen, gewerkschaftlich organisierten Atomen wieder aufgefüllt werden können, bevor der nächste FEL-Puls eintrifft. Bei Instrumenten, die auf Photoelektronenspektroskopie basieren, wie z. B. OPIS, kann die Raumladung die diagnostische Messung verfälschen, da sie die kinetische Energieverteilung der Photoelektronen verändert. Um solche durch Raumladungen verursachten schädlichen Auswirkungen zu minimieren, wird OPIS bei niedrigen Zielgasdrücken betrieben. Aus diesem Grund zeigen die Einzelschussspektren von OPIS normalerweise niedrige Zählraten und folglich umfassen Photolinien nur eine kleine Anzahl von Einzelelektronenereignissen, die als Spitzen im Spektrum erscheinen, die nicht klar von zufälligen Rauschspitzen zu unterscheiden sind (siehe Abb. 1). ). Um aussagekräftige Wellenlängenergebnisse zu erhalten, wird üblicherweise ein gleitendes Mittelwertschema über variable Zeitintervalle angewendet. Daher konnten in der Vergangenheit in den meisten Fällen keine zuverlässigen Schuss-zu-Schuss-Informationen bereitgestellt werden, die für Experimente wichtig sind. Wir stellen hier eine Methode vor, um die Photoneneigenschaften im Single-Shot-Auflösungsmodus trotz der geringen Statistik aufzudecken, indem wir künstliche Intelligenz einsetzen, die sich einen speziellen Typ von Autoencoder zunutze macht, der die vom Diagnosegerät erhaltenen Daten komprimiert und verständlich darstellt Weg.

Herkömmliche Analysemethoden wie die Hauptkomponentenanalyse (PCA) sind robust und haben ihre Leistungsfähigkeit in verschiedenen Anwendungen unter Beweis gestellt10, können jedoch durch zwei Hauptprobleme eingeschränkt werden: (a) Die Methode ist linear und daher grundsätzlich nicht in der Lage, nichtlineare Effekte zu beschreiben, und (b) Die Darstellungen der Daten (die Hauptkomponenten und ihre Skalierungsfaktoren) sind nicht unbedingt einfach zu interpretieren. Aufgrund ihrer guten Skalierbarkeit, ihrer hohen Dimensionalität und ihrer Fähigkeit, nichtlineare Effekte zu beschreiben, haben sich neuronale Netze in den letzten Jahrzehnten als leistungsstarkes Analysewerkzeug in allen Bereichen der Wissenschaft durchgesetzt12. Autoencoder (AE)-Netzwerke13, die aus Schichten von Neuronen aufgebaut sind, sind in der Lage, Daten auf eine niedrigere Dimensionalität, den sogenannten latenten Raum, zu komprimieren. Während ein einschichtiges AE-Netzwerk einer PCA-Analyse entspricht12, können Probleme höherer Komplexität und mit nichtlinearen Effekten durch Hinzufügen mehrerer Schichten von Neuronen zum Encoder und Decoder gelöst werden. Bei Verwendung eines solchen Netzwerks kann die latente Raumdarstellung typischerweise nicht einfach zur Wissensextraktion genutzt werden und muss weiterverarbeitet werden, um sie in Parameter umzuwandeln, die der Mensch interpretieren kann. Dies kann beispielsweise mit einem anderen neuronalen Netzwerk erfolgen. Allerdings erfordert dieser Prozess das Setzen von Labels für das Training des Netzwerks, also die Zuordnung der tatsächlichen Werte bestimmter physikalischer Eigenschaften zum Zeitpunkt der Messung zu den aufgezeichneten Daten, die in unserem Fall wie auch in vielen anderen Anwendungen nicht verfügbar sind. Variations-Autoencoder14,15-Netzwerke (VAE) führen eine Abtastoperation an einem Mittelwert- und Standardabweichungsvektor im dimensionalen Engpass des Netzwerks durch. Indem man diese beiden Vektoren durch die Verwendung eines zusätzlichen Termes in der Verlustfunktion dazu zwingt, einer Normalverteilung nahe zu kommen, erstellt man eine Darstellung mit einem gegebenen Wertebereich und einer gegebenen Variation. Durch Variation des Latentraums innerhalb dieser Grenzen ist es möglich, mit dem Decoder-Teil des Netzwerks künstliche Datenproben zu erstellen, die mögliche Messergebnisse darstellen. Diese Idee wurde durch sogenannte \(\beta\)-VAE-Netzwerke16 umgesetzt, in denen der Entflechtungsterm in der Verlustfunktion durch einen Faktor namens \(\beta\) skaliert wird. Somit ist es möglich, das Gewicht zwischen einer perfekten Rekonstruktion (d. h. Abweichung des mittleren quadratischen Fehlers der Roh- und der rekonstruierten Daten) und einer perfekten Entflechtung der latenten Raumvektorkomponenten auszugleichen, wodurch ein Kompromiss zwischen der Entflechtung (\(L_{ \text {dis}}\)) und Rekonstruktionsqualität (\(L_{\text {rec}}\)), beide dargestellt in der Gesamtverlustfunktion (\(L_{\text {all}}\)):

Im Allgemeinen ist es eine Herausforderung, den besten absoluten Wert von \(\beta\) zu finden16,17. \(\beta\) hängt stark von den Daten ab, also vom Rauschpegel, der Größe und Form des interessierenden Bereichs und davon, welches Maß zur Bewertung der Rekonstruktionsqualität verwendet wird.

FLASH3 arbeitet in einem sogenannten Burst-Modus-Muster und erzeugt Bündelzüge mit einer Burst-Wiederholungsrate von 10 Hz. Jeder Bündelzug besteht aus bis zu mehreren hundert Einzelphotonenpulsen, abhängig von der Bündelwiederholungsrate von bis zu 1 MHz. Bei FLASH218 liegen die Pulsenergie und die Pulsdauer bei über 1–1000 µJ bzw. 10–200 fs und decken einen Wellenlängenbereich von 4–90 nm ab. Für die Online-FEL-Wellenlängenüberwachung mit OPIS (siehe Abb. 1, Einzelheiten siehe 9) wurde ein Edelgastarget, in unserer Studie Neon (Gasdruck \(4,4 \times 10^{-7}\) mbar), in die Wechselwirkungskammer eingeführt wird durch die FLASH-Impulse ionisiert. Die kinetische Energie \(E_{kin}\) der erzeugten Photoelektronen wird von vier unabhängig voneinander arbeitenden Elektronen-Flugzeitspektrometern (eTOF) gemessen. Mit der Kenntnis der Bindungsenergie \(E_{bin}\) der angeregten Orbitale kann man für unsere Studie Neon 2p und 2s die Photonenenergie \(E_{pho}\) über berechnen

Im eTOF wandern die Photoelektronen entlang einer Driftröhre von 309 mm Länge und werden dann von Mikrokanalplattendetektoren (MCP) erfasst. An die Driftröhren können Verzögerungsspannungen angelegt werden, um die Photoelektronen abzubremsen und so die Energieauflösung der eTOF-Spektrometer zu erhöhen.

Elf repräsentative Einzelschuss-Flugzeitspektren (Proben), die mit den vier OPIS-Elektronenspektrometern (eTOF 0–3) aufgenommen wurden: Die grauen Spuren unten zeigen kein Photoelektronensignal, während die anderen zehn Spuren oben Ne 2p-Photoelektronen enthalten Linien mit sukzessive längeren Flugzeiten, was auf eine abnehmende FEL-Photonenenergie hinweist. Die Rohdaten werden durch farbige, fette Diagramme dargestellt, während die Rekonstruktion der entsprechenden Proben durch schwarze, dünne Linien dargestellt wird. Zur besseren Sichtbarkeit sind die Grundlinien durch einen vertikalen Versatz von 0,1 voneinander getrennt. Die vier oberen Felder zeigen die vollständigen Flugzeitspektren der Elektronen, die den Eingang des neuronalen Netzwerks darstellen, während in den unteren vier Feldern eine Vergrößerung des entsprechenden interessierenden Bereichs, in dem die 2p-Linie erwartet wird, dargestellt wird . Die Vergrößerungsachse wird in kinetische Energie des Photoelektrons umgewandelt. Hauptmerkmale der Kurven sind beschriftet, wie z. B. Peakposition, zufällige Treffer, Grundlinienstörungen, eine Zick-Zack-Struktur, die Eingabeaufforderung, 2s- und 2p-Linie, elektronische Reflexion aufgrund von Impedanzfehlanpassung an der Kabelverbindung und die entsprechende Detektorreaktionsfunktion. Diese werden (abgesehen von den Zufallstreffern) rekonstruiert und im latenten Raum kodiert. Die vergrößerten Einschübe stellen Merkmale dar, die im Originalmaßstab schwer zu erkennen sind. Alle Skalen sind linear.

Zeitverläufe der verstärkten Signale der MCP-Detektoren werden mittels schneller Analog-Digital-Wandler (ADCs) mit einer Abtastrate von 7 GS/s und einer vertikalen Auflösung von 8 Bit aufgezeichnet. Jedes Einzelschussspektrum besteht aus 3500 ADC-Kanälen und die Summe der vier eTOF-Spektren stellt eine Trainingsdatenprobe mit einer Dimensionalität von \(4 \times 3,5\,\text {k = 14 k}\) dar (einschließlich nur einer Schätzung). Anzahl der Elektronen im Bereich von 0 bis 20). Einige Beispiele sind in Abb. 1 dargestellt. Die Intensität der Photoelektronenlinien in den aufgezeichneten TOF-Spektren ist in allen vier eTOFs vergleichbar und liegt im Durchschnitt innerhalb von 15 % der Amplitude (Standardabweichung). Allerdings variieren die Photolinienintensitäten in Einzelschussspektren aufgrund statistischer Effekte erheblich zwischen den vier eTOFs. Abbildung 1 zeigt eine Reihe normalisierter Einzelschussdaten, die unterschiedlichen Werten der Photonenenergie der FEL-Strahlung für unterschiedliche Flugzeiten der Neon-2p-Elektronen entsprechen. Es wird ein Zeitrahmen für die kontinuierliche Wellenlängenüberwachung gewählt, in dem die OPIS-Betriebsparameter (Gasziel, Kammerdruck, Spektrometerverzögerung) unverändert bleiben. In diesem Zeitintervall wurde die FEL-Photonenenergie zwischen 214 und 226 eV mit einem vorgegebenen unregelmäßigen Muster abgetastet. In OPIS wurde Neon als Zielgas verwendet und die Bremsspannung auf 170 V eingestellt, was zu einer reduzierten kinetischen Endenergie von 22,4 bis 34,4 eV bzw. 0,0 bis 7,5 eV der detektierten 2p- bzw. 2s-Photoelektronen führte. Es wurden rund 40 Millionen Proben erfasst.

Das ultimative Ziel besteht darin, ein Netzwerk zu trainieren, das alle gewünschten Informationen in einem niedrigdimensionalen latenten Raum liefert, dh jede latente Raumkomponente sollte eine Eigenschaft des zugrunde liegenden Kernprinzips darstellen, die vom menschlichen Verstand interpretiert und daher direkt als Information verwendet werden kann für die Experimente. Für die Verlustfunktion wird der mittlere quadratische Fehler (MSE) als Kriterium für die Rekonstruktionsqualität verwendet. Die Entflechtung wird durch die Kullback-Leibler (KL)-Divergenz20 des Mittelwerts und des Standardabweichungsvektors im Vergleich zu einer Normalverteilung beschrieben. Um automatisch im Wertebereich von [0,1] zu bleiben, wird die Ausgabeschicht mit einer Sigmoidfunktion aktiviert. Um die Hyperparameter des neuronalen Netzwerks zu optimieren, wurden etwa 700 verschiedene Netzwerke trainiert. Die beste Leistung wurde mit vollständig verbundenen und Mish-aktivierten 22 Schichten erzielt, wobei der Decoder und der Encoder aus 5 bzw. 4 Schichten bestanden. Es wurden Batchgrößen von 252 in Kombination mit dem Adam-Optimierer23 und einer geplanten abnehmenden Lernrate im Bereich von \(10^{-5}\) bis \(10^{-7}\) über 25.000 Epochen hinweg verwendet. Der optimierte Wert von \(\beta\) beträgt 0,034. Von den insgesamt 40 Millionen aufgezeichneten Datenproben wurden 33 Millionen für das Training verwendet, 1 Million für die Validierung und die restlichen 6 Millionen stellen Testdaten dar, die außerhalb des Trainingsprozesses verwendet wurden. Die beste Leistung des Encoders und Decoders wird erreicht, wenn die Schichten so gewählt werden, dass die Dimensionalität für jede Schicht um den gleichen Faktor reduziert wird, was für 5 Schichten und einen 12-dimensionalen latenten Raum, genannt z, die Dimensionalitäten der Schichten bedeutet Sind

Der Schritt von 24 bis 12 ist der Abtastvorgang. Der Decoder ist die gespiegelte Version des Encoders ohne den Abtastvorgang. Die Zahl 12 wurde abgeleitet, indem ein Netzwerk trainiert wurde, das nur mit einem eindimensionalen z begann und dann sukzessive die Größe des dimensionalen Engpasses vergrößerte. Bei einer Größe über 12 konnte der endgültige Verlustwert nicht wesentlich verbessert werden. Wir verwenden die Notation \(z=\left\{ z_{0},z_{1},z_{2},...,z_{11}\right\}\), um die einzelnen Komponenten \(z_ {i}\) des latenten Raums.

Ziel von OPIS-Messungen ist es, Werte bestimmter physikalischer Größen aufzudecken. Um zu analysieren, ob das Netzwerk einen latenten Raum gefunden hat, der diese Mengen darstellt, werden Etiketten durch herkömmliche Analyse der Rohdaten erstellt. Um zuverlässige Etiketten bereitzustellen, müssen die Daten bestimmte Kriterien erfüllen, was nur für einen kleinen Teil der verfügbaren Daten gilt. Beispielsweise gilt für die Flugzeit der Photoelektronen, also die Photolinienposition auf der TOF-Skala (bezeichnet mit der Bezeichnung \(T_{0,1,2,3}\)), eine konventionelle Linienprofilanpassung nach der Methode der kleinsten Quadrate Es wurde eine Analyse des stärksten Peaks in jedem der vier eTOFs durchgeführt. Hier wurden die Kriterien für die Unterscheidung eines gültigen Photoelektronenlinienmerkmals von Rauschen oder zufälligen Elektronentreffern so definiert, dass (a) die Spitzenamplitude größer als ein Schwellenwert für die Mindestintensität sein muss (0,5 auf der Skala in Abb. 1) und ( b) Die Peak-Mittelpositionen müssen innerhalb eines kleinen TOF-Bereichs (15 TOF-Kanäle) liegen. Durch die Anwendung dieses Filters wird die Größe der Testdaten erheblich reduziert, es werden jedoch qualitativ hochwertige Daten zurückgegeben. Etwa 3 % der Daten erfüllen dieses Kriterium und können zum Vergleich zwischen den Etiketten und dem Latentraum beitragen. Die Labels für die einzelnen Intensitäten für jeden eTOF namens \(I_{0,1,2,3}\) werden zusätzlich im Prozess des Peak-Fit-Verfahrens erstellt. Auch die Strahlposition des FEL in der Ebene senkrecht zur Ausbreitungsachse schwankt. Um eine robuste und einfache Bezeichnung für diese Ausrichtungsvariationen zu haben, wird die 2p-Elektronen-Flugzeitdifferenz berechnet, was zu \(P_{02}\) (eTOF0 im Vergleich zum entgegengesetzt positionierten eTOF2) und \(P_{ 13}\) (eTOF1 im Vergleich zum entgegengesetzt positionierten eTOF3). Dies wird in den Zusatzinformationen (SI) ausführlich erläutert. Die „Grundlinie 1“-Störung \(B_{1}\) kann identifiziert werden, indem eTOF0 hinsichtlich Diskontinuitäten ausgewertet wird, dh der scharfen „Kante“-Funktion bei hohen Flugzeitwerten. Zur Identifizierung wird die Summe der Intensitäten von 40 ADC-Kanälen vor der Kante dividiert durch 40 nach dem Schritt in der Trace-Grundlinie berechnet. Die zweite Störung \(B_{2}\) (siehe „Grundlinie 2“ und „Zentrale Intensität“ in Abb. 1) ist ein umfassenderes Merkmal, das den zentralen Teil jedes TOF-Spektrums abdeckt. Die Identifizierung und Kennzeichnung erfolgt durch Aufsummieren des zentralen Teils der Spektren, der dann durch den Mittelwert der Daten in Spektralbereiche am Anfang und am Ende des Spektrums geteilt wird. Für die Datenerfassung wird die effektive Abtastrate von 7 GSamples/s durch zeitliche Verschachtelung von vier ADC-Chips erreicht, die jeweils mit 1,75 GS/s abtasten. Wir haben festgestellt, dass das Netzwerk eine Korrelation kodiert, die direkt auf systematische Verschachtelungsmängel hinweist: In großen Teilen der Daten ist die Verstärkung der jeweiligen verschachtelten ADCs jedes eTOF-Kanals nicht identisch, was zu einer charakteristischen Zick-Zack-Struktur in den Daten führt ( siehe Vergrößern und „Zick-Zack“ in Abb. 1). Dies lässt sich leicht beschriften, indem man alle ungeraden und alle geraden ADC-Kanäle separat addiert und diese beiden Summen dann dividiert, was die Bezeichnungen \(L_{0,1,2,3}\) ergibt. Für die Photonenenergie ist ein OPIS-unabhängiger Wert der eingestellte Wellenlängenparameter \(\lambda _{FEL}\), der nur die nominelle Wellenlänge darstellt, die dem FLASH-Beschleuniger- und Undulator-Aufbau entspricht. Die tatsächliche FEL-Wellenlänge kann einen gewissen Versatz aufweisen, der hauptsächlich auf zwei Faktoren zurückzuführen ist: Erstens kann die Energie des Elektronenstrahls in der Undulatorsektion aufgrund von Strahlsteuerungskomponenten wie FLASH2-Extraktion und Bündelkomprimierung von dem in der Beschleunigersektion gemessenen Energiewert abweichen Schikanen18. Zweitens kann die Elektronenstrahlbahn im Undulatorabschnitt von der Nennbahn abweichen, insbesondere wenn die Undulatoren mit variabler Lücke auf Wellenlängenscans abgestimmt sind. Darüber hinaus schwankt die Wellenlänge aufgrund des SASE-Prozesses innerhalb einer Bandbreite von typischerweise \(\sim\) 1%3, was in unserem Fall einer Photonenenergiebandbreite von etwa 2 eV entspricht. Daher ist die Bezeichnung \(\lambda _{FEL}\) eine „geschätzte“ Bezeichnung mit nur mäßiger Bedeutung für die Einzelschuss-Photonenenergie. Zusätzlich wurde parallel zu unserer Studie ein Magnetflaschenexperiment21 durchgeführt, dessen Daten als Querreferenz für die Wellenlänge verwendet werden, die im SI dargestellt wird.

Diese Beschriftungen, die sich aus dem oben genannten Feature-Engineering-Prozess ergeben, werden mit den \(z_{i}\)-Werten verglichen, die das Netzwerk für die Daten in Abb. 2 ableitet. Die Rekonstruktionsqualität (schwarze Kurven in Abb. 1) ist beeindruckend hoch für einen 12-dimensionalen Engpass. Das Netzwerk findet die korrekte Position der 2p-Photoelektronen, es rekonstruiert die individuelle MCP-Antwortfunktion für jedes der 4 eTOFs, es verwirft zufällige unkorrelierte Ereignisse und ist auch in der Lage, die Grundlinienstörung zu reproduzieren. Zusätzlich zu diesen Erkenntnissen ist die Neon-2s-Linie nur dann in der Rekonstruktion enthalten, wenn die Photonenenergie tatsächlich hoch genug ist, um die verwendete Verzögerungsspannung der Flugröhren zu überwinden. Angesichts der Tatsache, dass für unsere Daten der Ionisationsquerschnitt für Ne 2s im Vergleich zu Ne 2p im Photonenenergiebereich von 214 eV bis 226 eV fünfmal kleiner ist und dass sich die 2s-Photolinienintensität über ein größeres TOF-Intervall ausbreitet, Das ist ein beeindruckendes Ergebnis19. Ne-2s-Signaturen lassen sich in den Rohdaten weder mit dem Auge noch mit herkömmlichen Analysemethoden identifizieren. Ebenso beeindruckend ist die Rekonstruktion des sogenannten Prompt-Signals, das durch das Auftreffen gestreuter Photonen auf die MCPs entsteht und somit ein weiteres winziges Peak-Feature an einer festen TOF-Position erzeugt. Dieses Signal markiert den Referenzpunkt t = 0 für die Bestimmung der Photoelektronenflugzeit und ist daher von hoher Bedeutung.

Gezeigt wird die Struktur des \(\beta\)-VAE-Netzwerks (a) und die unbeaufsichtigte Kodierung des zugrunde liegenden Kernprinzips (b), also Position, Intensität, Grundlinie, Zeigen und Verschachtelung. Die Dichtediagramme stellen die Abhängigkeit des latenten Raums von den Beschriftungen dar, die durch herkömmliche Datenanalyse unter Verwendung hochwertiger Daten (3 % des Datensatzes) abgeleitet wurden. Die Werte in der entsprechenden Achse (\(z_{i}\) und Beschriftungen) sind für die verarbeiteten Testproben Min-Max-normalisiert. Alle Skalen sind linear.

Eine entscheidende Information für die meisten Experimente an SASE-FEL-Quellen ist die zentrale Photonenenergie eines einzelnen Schusses. Bei OPIS-Messungen entspricht es der Peakposition in den eTOF-Spektren, die in zwei Komponenten von z kodiert ist, nämlich \(z_{0}\) und \(z_{1}\). In den \(z_{0,1}\)-Positionskarten zeigt es eine Abhängigkeit, die Sinus- bzw. Cosinusfunktionen ähnelt. Allerdings ist die Position nicht im perfekten Sinus-Cosinus- oder Kreisverfahren kodiert. Dies wird zu einer Phase \(\phi\) kombiniert, die definiert ist durch:

Vergleich der Leistung zwischen der herkömmlichen Analyse und dem neuronalen Netzwerk: (a) Die durchschnittliche Differenz der Netzwerkvorhersage der Flugzeitposition (blau) im Vergleich zur erwarteten Position am gegebenen \(\lambda _{FEL} \) aus der Kalibrierung ist deutlich geringer als der durchschnittliche Fehler der herkömmlichen Analyse (orange). Die erwartete Bandbreite wird in TOF-Kanäle (rot) in die STD umgewandelt. Die STD aus den Vorhersagen des neuronalen Netzwerks sind nahezu identisch mit der Bandbreite. (b) Für den 25 \(\lambda _{FEL}\) werden die ermittelten TOF-Positionen des Netzwerks und der traditionellen Analyse mit einer Kalibrierungskurve gemäß der OPIS-Instrumentenkalibrierung verglichen, die unabhängig im Instrument ermittelt wurde Inbetriebnahmekampagnen. (c) Es wird eine Beispielaufnahme (grau) gezeigt, die mehrere Peaks an verschiedenen Positionen in den eTOFs aufweist. Die erwartete Position innerhalb der angegebenen Bandbreite wird rot angezeigt. Während die herkömmliche Analyse nicht entscheiden kann, welcher der Peaks als echtes Photoelektronensignal bezeichnet werden soll, rekonstruiert das Netzwerk die Peaks an der richtigen Position und ignoriert alle anderen Peaks in den Rohdaten.

Um eine möglichst genaue Wellenlänge bereitzustellen, wird \(\phi\) mit einem zusätzlichen neuronalen Netzwerk korrigiert. Ein Bruchteil der Daten (3 % hochwertige Daten), bei denen alle vier eTOFs die gleichen Informationen für die Wellenlänge liefern, d. h. klare Fotolinien an ähnlichen Positionen, werden zum Trainieren eines vollständig verbundenen Mehrschicht-Perzeptrons (MLP)24 verwendet. Dieses MLP projiziert \(\phi\) auf die durchschnittlichen, nach der Methode der kleinsten Quadrate angepassten TOF-Positionen der 2p-Peaks aller vier eTOFs (siehe ergänzende Informationen). Die Leistungsfähigkeit der Methode wird dreifach bewertet: Sie wird mit (a) den Ergebnissen der herkömmlichen Datenanalyse (siehe Abschnitt „Methoden“), (b) \(\lambda _{FEL}\) und (c) dem Zentrum verglichen der Masse des Magnetflaschen-Experiments (siehe Ergänzende Informationen). Der Vergleich mit \(\lambda _{FEL}\) erfolgt mithilfe der Kalibrierungskurve von OPIS, die in Abb. 3b für das Netzwerk und die traditionelle Analyse dargestellt ist. Die Ergebnisse sind in Abb. 3a zusammengefasst. Der durchschnittliche Unterschied der Netzwerkvorhersage in TOF-Kanälen ist im Vergleich zur herkömmlichen Methode um den Faktor 2 kleiner. Die geschätzte Bandbreite des FEL wird in TOF-Kanälen in einen Standardabweichungswert (STD) übersetzt. Dieser STD der Bandbreite liegt nahe am STD der Netzwerkvorhersagen, wohingegen das herkömmliche Ergebnis deutlicher davon abweicht. Um zu zeigen, wie das Netzwerk die herkömmliche Analyse übertrifft, zeigt Abb. 3c eine Aufnahme, die schwer zu analysieren ist. An verschiedenen TOF-Positionen treten mehrere Peaks mit ähnlicher Amplitude auf. \(\lambda _{FEL}\) einschließlich der Bandbreite wird angezeigt, um den Bereich anzugeben, in dem die Photoelektronen erwartet werden. Das Netzwerk rekonstruiert den Peak im richtigen Bereich, dargestellt in Abb. 3c. Im Gegensatz dazu hat die herkömmliche Methode Schwierigkeiten, den/die richtigen Peak(s) zu identifizieren. Als SASE-Schwankungsunabhängiger Vergleich wird die vorhergesagte Wellenlänge auch mit dem Massenschwerpunkt der 2p-Photolinie von Schwefel aus 2-Thiouracil im Magnetflaschenexperiment verglichen, das parallel zu unserer Studie durchgeführt wurde. Auch hier zeigt sich eine gute Übereinstimmung, die im SI dargestellt ist.

Neben der Wellenlängenabfrage werden während des unbeaufsichtigten Trainingsprozesses mehrere andere Merkmale im latenten Raum kodiert. Das Netzwerk kodiert die Intensitätsverteilung der 4 eTOFs in \(z_{2}\), \(z_{3}\) und \(z_{4},\), die in Abb. 2 dargestellt ist. \(B_{ 1}\) und \(B_{2}\) sind in zwei separaten Komponenten von z kodiert, nämlich \(z_{4}\) und \(z_{5}\), wie in Abb. 2 gezeigt. Interessanterweise \(B_{1}\) kommt nur in zwei spezifischen Bündeln der Impulsfolge vor und \(B_{2}\) ist sogar auf nur ein Bündel beschränkt (siehe Bündel-Nr. vs. \(z_{i}\)-Karten). ), was auf synchronisiertes elektronisches Rauschen in der Beschleunigerumgebung als Ursache hinweist. \(B_{1}\) und \(B_{2}\) werden in einem Ein-/Aus-Zustand codiert und daher können \(z_{4}\) und \(z_{5}\) einen Extremwert verwenden Bereich für „ein“ und während die Grundlinienstörung „aus“ ist, können sie den Rest des Wertebereichs für die Kodierung eines anderen Merkmals verwenden. Infolgedessen kodiert \(z_{4}\) auch die Intensität von eTOF3, während \(z_{5}\) auch \(P_{13}\) kodiert. Das Netzwerk verwendet die sechste Dimension von z für die andere zeigebezogene Bezeichnung \(P_{02}\). Die lineare Abhängigkeit von \(z_{5}\) vs. \(P_{13}\), kombiniert mit der kreuzförmigen Abhängigkeit von \(z_{4}\) vs. \(P_{13}\), Damit lässt sich nun die Variation der räumlichen Strahlposition bestimmen, die ebenfalls ein wichtiger Parameter für die Experimente sein kann. \(L_{0,1,2,3}\) sind vollständig in \(z_{7}\) kodiert. Die Komponenten \(z_{8-11}\) beeinflussen die Rekonstruktion nur geringfügig und gelten daher als ungenutzt. Allerdings erhöht die Reduzierung der Dimensionalität des latenten Raums den Gesamtverlust, was zu einer komplizierteren Kodierung der handgefertigten Etiketten führt.

Beispiel für die Datenbereinigung: Die Rohdaten (grau) werden über das Netzwerk wie in Schwarz dargestellt rekonstruiert. Alle zufälligen Treffer werden verworfen, der Geräuschpegel reduziert und das Aufforderungssignal rekonstruiert. Eine Modifikation des Latentraums ermöglicht die Beseitigung des Interleaving-Problems und die Beseitigung der Grundlinienstörung (Magenta).

Allein durch die Rekonstruktion der Daten durch das Netzwerk werden bereits automatisch alle Zufallstreffer aus den Rohdaten entfernt. Zusätzlich wird der Geräuschpegel der Grundlinie stark reduziert. Schließlich kann bei beiden Teilen des Netzwerks der Encoder verwendet werden, um die 12D-Darstellung der einzelnen Samples zu erhalten, und folglich kann man die beeinträchtigten Daten selektiv von all diesen Effekten bereinigen, was in Abb. 4 dargestellt ist. Da der latente Raum Wenn die Darstellung verstanden wird, kann man einfach \(z_{7}\) von 0,8 (der vom Netzwerk bestimmt wurde, um die beste Rekonstruktion dieser spezifischen Stichprobe zu erreichen) auf den Durchschnittswert von 0,0 ändern und dann den Decoder damit ausführen Mit diesem modifizierten \(z_{7}\)-Wert ist es möglich, den Interleaving-Effekt zu eliminieren. Ein ähnliches Verfahren (siehe Ergänzende Informationen) kann verwendet werden, um die Grundlinienstörung zu beseitigen.

Um die hohen Wiederholraten von FEL-Maschinen mit supraleitenden Beschleunigern, die aufgrund des SASE-Betriebsmodus FEL-Strahlung mit stark schwankenden Photoneneigenschaften liefern, voll auszunutzen, sind Informationen über die wesentlichen Parameter auf Einzelschussbasis erforderlich. Idealerweise sollten diese Informationen von völlig unabhängigen Diagnosegeräten bereitgestellt werden, die parallel zum laufenden Benutzerexperiment betrieben werden können. Auf diese Weise kann eine bestmögliche Analyse – auch nahezu in Echtzeit – ermöglicht werden, die alle Möglichkeiten der Datensortierung, Binning und ähnlicher Methoden berücksichtigt, um die Abhängigkeiten von den Photoneneigenschaften für den untersuchten physikalischen Prozess aufzudecken . Dies ist besonders wichtig für photonenhungrige experimentelle Techniken wie Koinzidenzmessungen, die auf der Anhäufung einer großen Anzahl einzelner Photonenwechselwirkungsereignisse beruhen. Durch die Mittelung von Datenproben, die eine Spanne unterschiedlicher Werte von Photoneneigenschaften abdecken, kann eine Verwischung oder sogar Verschleierung von Abhängigkeitseffekten vermieden werden. OPIS kann in Kombination mit dem trainierten \(\beta\)-VAE-Netzwerk diese Fähigkeit bereitstellen und ermöglicht somit die Verwendung der FEL-Eigenschaft „Wellenlänge“ als unabhängigen Sortierparameter für jede experimentelle Datenanalyse. Die nächsten Schritte werden darin bestehen, allgemeinere Netzwerke zu trainieren. Die OPIS-Betriebsparameter, dh die Zielgasspezies, der Kammerdruck und die Verzögerungsspannungen an den eTOFs, wurden für die in dieser Arbeit präsentierten Ergebnisse auf festen Werten gehalten. Wir haben Spektren für eine Vielzahl von Kombinationen dieser Parameter aufgezeichnet und werden dies auch tun. Zunächst werden dedizierte Netzwerke für verschiedene Betriebsparameter trainiert. Dabei kann für jede Betriebsart ein spezifisches Netzwerk zur Online-Analyse genutzt werden. Zweitens wird nur ein einziges Netzwerk für alle Betriebsparameter trainiert, sodass für alle Betriebsmodi dasselbe Netzwerk verwendet werden kann. Anschließend werden diese beiden Ansätze verglichen.

Wir haben gezeigt, dass ein optimiertes \(\beta\)-VAE-Netzwerk in der Lage ist, das zugrunde liegende Kernprinzip hochdimensionaler Photoelektronen-Flugzeitspektroskopiedaten ohne vorherige Kenntnisse auf unbeaufsichtigte Weise zu finden. Alle Rohdaten mit niedrigem Signal-Rausch-Verhältnis werden entrauscht und zufällige Treffer, die nicht mit den beobachteten Photoionisationsprozessen korrelieren, werden verworfen. Dadurch sind die rekonstruierten Spektren von deutlich höherer Qualität und können in bestimmten Fällen sehr deutlich Photoelektronenmerkmale zeigen, die in den Rohdaten verdeckt sind und mit herkömmlichen Analysemethoden nicht einfach verarbeitet werden können. Die Darstellung im Latentraum deckt alle wesentlichen physikalischen Eigenschaften des Spektrums ab und bietet direkten Zugriff auf wesentliche Informationen wie die Single-Shot-FEL-Wellenlänge. Die Inferenzzeit des trainierten Netzwerks ist schnell und daher kann es als Online-Tool während der Photonendiagnosemessung eingesetzt werden und liefert wichtige Informationen für FLASH-Benutzerexperimente in Echtzeit. Dies ermöglicht oder verbessert die Datenanalyse im laufenden Betrieb, was dazu beiträgt, die Effizienz einer Strahlzeit zu steigern. Beispielsweise kann durch eine statistische Überwachung der Datenqualität für den untersuchten Effekt die Erfassungszeit und Auswertung der Erkenntnisse optimiert werden. Diese begleitende Analyse bietet dem Benutzer die Möglichkeit, die Messungen während der gesamten Versuchskampagne spontan anzupassen. Darüber hinaus profitiert auch jede Offline-Datenanalyse nach dem Experiment von den vom \(\beta\)-VAE-Netzwerk bereitgestellten Labels. In dieser Hinsicht kann die Möglichkeit, bestimmte Eigenschaften der Daten zu isolieren oder zu eliminieren, indem die Werte der VAEs, die diese Eigenschaften darstellen, auf Null gesetzt werden, für eine detaillierte und tiefgreifende Analyse des Datensatzes sehr nützlich sein.

Für genaue Wellenlängenmessungen mit OPIS ist eine Gerätekalibrierung erforderlich. In OPIS-Inbetriebnahmekampagnen wurden für jede Verzögerungsspannungseinstellung Umrechnungsfunktionen empirisch ermittelt, die den gemessenen Flugzeitwerten kinetische Energie zuordnen. Bei diesen Kalibrierungsmessungen war entweder die Photonenenergie oder die kinetische Energie des Elektrons genau bekannt (Gl. (2)). Dies wurde durch simultane Messungen zusammen mit einem optischen Gitterspektrometer als Referenz sowie durch Nutzung der intrinsischen Kalibrierungsmöglichkeiten mittels Auger-Prozessen erreicht. Auger-Elektronen werden mit einer festen kinetischen Energie emittiert, die der Differenz der beiden am Auger-Übergang beteiligten Elektronenorbitale entspricht, und können daher als direkte kinetische Energiemarker im TOF-Spektrum dienen. Darüber hinaus können Schemata verwendet werden, bei denen die FEL-Wellenlänge abgestimmt wird, bis die TOF-Position einer Photolinie eines bestimmten Orbitals genau mit der Position der Auger-Linie übereinstimmt. Dies bestimmt auch die Wellenlänge und definiert somit die kinetische Energie an der TOF-Position für andere Photoelektronenlinien im gleichen Spektrum. Ausführlichere Informationen zur OPIS-Kalibrierung finden Sie in Ref. 9,10.

Tabelle 1 zeigt den Hyperparameterraum, der beim Training von \(\sim\) 700 Netzwerken untersucht wurde. Die Batch-Größe, der \(\beta\)-Parameter, die Lernrate und die Proben pro Epoche wurden bei einem festen Wert sowie innerhalb eines Planungsprozesses getestet. Neben der Bewertung des Gesamtverlusts, der eine Kombination aus dem MSE-Rekonstruktionsverlust und dem KL-Divergenz-Entflechtungsverlust des latenten Raums darstellt, erfolgte auch die Bewertung des Netzwerks im Hinblick auf die Interpretierbarkeit des latenten Raums mit den handgefertigten Etiketten durchgeführt über die Methode der kleinsten Quadrate, wie in Abb. 2 gezeigt. Für den Rekonstruktionsverlust wurden auch der absolute Fehler (AE) und die binäre Kreuzentropie (BCE) getestet. Die Komponenten von z in Abb. 2 (und der Text) sind zur besseren Lesbarkeit neu angeordnet. Beim stochastischen Gradientenabstiegsoptimierer (SGD) wurde der Impuls von 0 bis 0,9 getestet. Die 40 Millionen Samples werden aufgeteilt und zufällig in 40 einzelne HDF5-Dateien mit jeweils einer Million Samples gemischt. 33 dieser Dateien werden für das Training verwendet, eine Million Proben als Validierungsdaten während des Trainingsprozesses und die restlichen sechs Millionen zum anschließenden Testen des trainierten Netzwerks. Für das Laden von Daten wird eine Epoche als Optimierungsschritt definiert, innerhalb dessen das Netzwerk eine Datei, also eine Million Samples, verarbeitet. Während des Trainings setzt das Netzwerk das Training mit derselben Million Samples für eine feste Anzahl von Epochen fort, bis die Daten durch eine weitere Million Samples aus einer anderen Datei ersetzt werden und so weiter. Die Speicherung der Daten, bezogen auf einen festen Teil der Daten von einer Million Stichproben, wird nur in sehr tiefen Netzwerken und auch erst nach einigen tausend Epochen beobachtet. Aufgrund dieses Effekts werden die Trainingsdaten im Speicher alle 10 Epochen ersetzt, wodurch sichergestellt wird, dass keine Überanpassung auftritt und gleichzeitig eine schnelle Datenübertragung zur GPU ermöglicht wird, die zum Trainieren des Netzwerks verwendet wird. Ein weiterer Hinweis darauf, dass diese Art des Trainings das Endergebnis nicht beeinträchtigt, besteht darin, dass keine abrupten Änderungen in der Verlustfunktion zu beobachten sind, wenn der Datensatz nach 10 Epochen ersetzt wird. Wenn die Anzahl der Epochen für dieselben Daten auf 1 festgelegt ist, kann der Prozess so interpretiert werden, dass die gesamten Trainingsdaten von 33 Millionen Stichproben alle 33 Epochen verarbeitet werden. Die Daten wurden Min-Max-normalisiert, dh der vertikale 8-Bit-Ganzzahlbereich von [0,255] wurde in Gleitkommawerte im Intervall [0,1] umgewandelt.

Der MLP für die Phasenkorrektur von \(z_{0}\) und \(z_{1}\) hat die folgende Netzwerkarchitektur

während die Eingabe die Phase ist und das Vorhersageziel durch die durchschnittliche TOF-Position gegeben ist, die durch Anpassen aller 4 eTOF-Spektren abgeleitet wird. Es wurde über 2000 Epochen mit 200.000 Stichproben, einer Stapelgröße von 100 und einer Lernrate von \(10^{-5}\) trainiert, während Mish-Aktivierung und der Adam-Optimierer verwendet wurden. Die Daten wurden nicht normalisiert. Die Vorhersagequalität wurde in MSE gemessen.

Es wurden mehrere Methoden getestet, um die Single-Shot-Rohdaten robust und effizient zu verarbeiten. Der Vergleich erfolgte hinsichtlich der Übereinstimmung der Daten mit \(\lambda _{FEL}\). Die besten Ergebnisse wurden durch ein iteratives Verfahren erzielt, das nur den interessierenden Bereich, TOF-Kanäle [600, 1000], analysiert, der dem vergrößerten Bereich in Abb. 3c entspricht. Zunächst wird ein Schwellenwert von 0,2 (in Bezug auf die in Abb. 1 gezeigten Werte) festgelegt, um alle möglichen Peakpositionen in allen vier eTOFs zu bestimmen (mehrere Peaks in einem eTOF sind möglich). Diese Spitzenpositionen sind ganzzahlige Werte der Maximalposition(en). Zweitens werden die Peakpositionen aller Detektoren verglichen. Wenn im selben Fenster von 20 TOF-Kanälen für mehrere Detektoren mehr als ein Peak vorhanden ist, wird eine weitere Verarbeitung dieser Peaks durchgeführt. Andernfalls, wenn die Amplitude eines Peaks höher ist (um einen Absolutwert von 0,15), wird die weitere Verarbeitung nur für diesen einzelnen Peak durchgeführt. Wenn nicht, wird die Verarbeitung für alle gefundenen Peaks fortgesetzt. Alle verbleibenden Peakpositionen werden dann optimiert, indem der Schwerpunkt des Peaks berechnet wird (mit Gleitkommagenauigkeit). Darüber hinaus wurde auch geprüft, ob andere Analysemethoden, z. B. Anpassungsroutinen zur Optimierung der kleinsten Quadrate, besser geeignet sein könnten. Es stellt sich heraus, dass die Verwendung dieser anderen Methoden keinen Vorteil bringt, jedoch den Nachteil einer starken Erhöhung der Rechenzeit mit sich bringt. Als Endergebnis wird dann der Mittelwert aller ermittelten Peakpositionen herangezogen.

Die während der aktuellen Studie verwendeten und analysierten Datensätze sowie der Code für den Trainingsprozess des neuronalen Netzwerks sind auf begründete Anfrage beim entsprechenden Autor erhältlich.

Kondratenko, AM & Saldin, EL Erzeugung kohärenter Strahlung durch einen relativistischen Elektronenstrahl in einem Undulator. Teil. Beschleunigung. 10, 207–216 (1980).

CAS Google Scholar

Zhirong, H. & Kwang-Je, K. Übersicht über die Theorie der Freie-Elektronen-Röntgenlaser. Physik. Rev. ST Accel. Balken 10(3), 034801 (2007).

Artikel Google Scholar

Ackermann, W. et al. Betrieb eines Freie-Elektronen-Lasers im Wellenlängenbereich vom extremen Ultraviolett bis zum Wasserfenster. Nat. Photonics 1, 336–342 (2007).

Artikel Google Scholar

Sorokin, A. et al. Ein Röntgengasmonitor für Freie-Elektronen-Laser. J. Synchrotronstrahlung. 26, 1092–1100 (2019).

Artikel CAS PubMed PubMed Central Google Scholar

Tiedtke, K. et al. Gasdetektor für Röntgenlaser. J. Appl. Physik. 103, 094511 (2008).

Artikel Google Scholar

Grguraš, I. et al. Charakterisierung ultraschneller Röntgenpulse an Freie-Elektronen-Lasern. Nat. Photonics 6, 852–857 (2012).

Artikel Google Scholar

Frühling, U. et al. Einzelbild-THz-Feld-Röntgen-Streifenkamera. Nat. Photonics 3, 523–528 (2009).

Artikel Google Scholar

Hartmann, N. et al. Attosekunden-Zeit-Energie-Struktur von Röntgenlaserpulsen mit freien Elektronen. Nat. Photonics 12, 215–220 (2018).

Artikel CAS Google Scholar

Braune, M. et al. Ein nicht-invasives Online-Photoionisationsspektrometer für FLASH2. J. Synchrotronstrahlung. 23, 10–20 (2016).

Artikel CAS PubMed PubMed Central Google Scholar

Braune, M. et al. Nicht-invasive Online-Wellenlängenmessungen an FLASH2 und aktueller Benchmark. J. Synchrotronstrahlung. 25, 3–15 (2018).

Artikel PubMed PubMed Central Google Scholar

Walter, P. et al. Mehrfach auflösendes Elektronenspektrometer-Array für zukünftige Experimente mit Freie-Elektronen-Lasern. https://arxiv.org/abs/2103.07603.

Bishop, Christopher M. Mustererkennung und maschinelles Lernen (Springer, Berlin, 2006).

MATH Google Scholar

Kramer, M. Nichtlineare Hauptkomponentenanalyse unter Verwendung autoassoziativer neuronaler Netze. AIChE J. 37(2), 233–243 (1991).

Artikel CAS Google Scholar

An, J. & Cho, S. Variations-Autoencoder-basierte Anomalieerkennung unter Verwendung der Rekonstruktionswahrscheinlichkeit. In Special Lecture on IE, Bd. 2 (2015).

Kingma, DP & Welling, M. Eine Einführung in Variations-Autoencoder. Gefunden. Trends Mach. Lernen. 12(4), 307–392 (2019).

Artikel MATH Google Scholar

Higgins, I. et al.\(\beta\)-VAE: Erlernen grundlegender visueller Konzepte mit einem eingeschränkten Variationsrahmen. Veröffentlicht als Konferenzbeitrag auf der ICLR 2017.

Burgess, C. et al. Entwirrung in \(\beta\)-VAE verstehen. http://arxiv.org/abs/1804.03599.

Faatz, B. et al. Gleichzeitiger Betrieb von zwei Freie-Elektronen-Lasern für weiche Röntgenstrahlung, angetrieben von einem Linearbeschleuniger. Neue J. Phys. 18, 062002 (2016).

Artikel Google Scholar

Wuilleumier, F. & Krause, MO Photoionisation von Neon zwischen 100 und 2000 eV: Einzel- und Mehrfachprozesse, Winkelverteilungen und Unterschalenquerschnitte. Physik. Rev. A 10, 242 (1974).

Artikel CAS Google Scholar

Kullback, S. & Leibler, RA Über Information und Suffizienz. Ann. Mathematik. Stat. 22(1), 79–86 (1951).

Artikel MathSciNet MATH Google Scholar

Metje, J. et al. URSA-PQ: Ein mobiles und flexibles Pump-Probe-Instrument für Gasphasenproben am FLASH-Freie-Elektronen-Laser. Appl. Wissenschaft. 10(21), 7882 (2020).

Artikel CAS Google Scholar

Misra, D. Mish: Eine selbstregulierte nicht-monotone Aktivierungsfunktion, eingereicht am 23. August 2019 (v1), letzte Überarbeitung am 13. August 2020 (v3). https://arxiv.org/abs/1908.08681.

Kingma, D. & Ba, J. Adam: Eine Methode zur stochastischen Optimierung. Eingereicht am 22. Dezember 2014 (v1), letzte Überarbeitung am 30. Januar 2017 (v9). https://arxiv.org/abs/1412.6980.

Hastie, T., Tibshirani, R. & Friedman, J. Die Elemente des statistischen Lernens: Data Mining, Inferenz und Vorhersage (Springer, Berlin, 2009).

Buchen Sie MATH Google Scholar

Referenzen herunterladen

Die Autoren danken DESY (Hamburg, Deutschland), einem Mitglied der Helmholtz-Gemeinschaft HGF, für die Bereitstellung der experimentellen Einrichtungen. Teile dieser Forschung wurden bei FLASH2 durchgeführt. GH dankt Irina Higgins für die fruchtbaren Diskussionen über die Anwendung, Interpretation und Präsentation von \(\beta\)-VAE. Sie danken für die Hilfe und Unterstützung des Joint Laboratory Artificial Intelligence Methods for Experiment Design (AIM-ED) zwischen dem Helmholtz-Zentrum Berlin für Materialien und Energie und der Universität Kassel. Teilweise gefördert durch den Innovationspool des BMBF-Projekts: Data-X – Datenreduktion für die Photonen- und Neutronenwissenschaft. Teilweise gefördert durch das BMBF-Projekt: 05K20CBA. Wir danken dem Schwedischen Forschungsrat für die finanzielle Unterstützung im Rahmen des Röntgen Ångström Cluster (RÅC)-Programms (Nr. 2019-06093).

Open-Access-Förderung ermöglicht und organisiert durch Projekt DEAL.

Helmholtz-Zentrum Berlin für Materialien und Energie GmbH, Albert-Einstein-Strasse 15, 12489, Berlin, Germany

Gregor Hartmann, Peter Feuer-Forson, David Meier, Felix Möller, Luis Vera Ramirez & Jens Viefhaus

Deutsches Elektronen-Synchrotron (DESY), Notkestrasse 85, 22607, Hamburg, Germany

Gesa Goetzke, Stefan Düsterer, Markus Guehr, Kai Tiedtke & Markus Braune

Institut für Physik und Astronomie, University of Potsdam, Karl-Liebknecht-Strasse 24/25, 14476, Potsdam-Golm, Germany

Fabiano Lever & Markus Gühr

Intelligente eingebettete Systeme, Universität Kassel, Wilhelmshöher Allee 73, 34121, Kassel, Deutschland

David Meier

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

GH und MB haben das Manuskript gemeinsam mit Beiträgen aller Autoren verfasst. MB hat das OPIS-Instrument entworfen und in Betrieb genommen. MB, SD, FL, KT und MG führten das Experiment durch, um die verwendeten Daten aufzuzeichnen. GH hat den \(\beta\)-VAE-Code für diese Studie geschrieben. FL führte die Datenanalyse der Magnetflaschendaten durch. GH, GG, PF, LV, DM, FM, SD, MB und JV interpretierten und optimierten das \(\beta\)-VAE-Netzwerk.

Korrespondenz mit Gregor Hartmann.

Die Autoren geben an, dass keine Interessenkonflikte bestehen.

Springer Nature bleibt neutral hinsichtlich der Zuständigkeitsansprüche in veröffentlichten Karten und institutionellen Zugehörigkeiten.

Open Access Dieser Artikel ist unter einer Creative Commons Attribution 4.0 International License lizenziert, die die Nutzung, Weitergabe, Anpassung, Verbreitung und Reproduktion in jedem Medium oder Format erlaubt, sofern Sie den/die Originalautor(en) und die Quelle angemessen angeben. Geben Sie einen Link zur Creative Commons-Lizenz an und geben Sie an, ob Änderungen vorgenommen wurden. Die Bilder oder anderes Material Dritter in diesem Artikel sind in der Creative Commons-Lizenz des Artikels enthalten, sofern in der Quellenangabe für das Material nichts anderes angegeben ist. Wenn Material nicht in der Creative-Commons-Lizenz des Artikels enthalten ist und Ihre beabsichtigte Nutzung nicht gesetzlich zulässig ist oder über die zulässige Nutzung hinausgeht, müssen Sie die Genehmigung direkt vom Urheberrechtsinhaber einholen. Um eine Kopie dieser Lizenz anzuzeigen, besuchen Sie http://creativecommons.org/licenses/by/4.0/.

Nachdrucke und Genehmigungen

Hartmann, G., Goetzke, G., Düsterer, S. et al. Unüberwachte Wissensextraktion aus der realen Welt mittels entwirrter Variations-Autoencoder für die Photonendiagnostik. Sci Rep 12, 20783 (2022). https://doi.org/10.1038/s41598-022-25249-4

Zitat herunterladen

Eingegangen: 21. Juni 2022

Angenommen: 28. November 2022

Veröffentlicht: 01. Dezember 2022

DOI: https://doi.org/10.1038/s41598-022-25249-4

Jeder, mit dem Sie den folgenden Link teilen, kann diesen Inhalt lesen:

Leider ist für diesen Artikel derzeit kein gemeinsam nutzbarer Link verfügbar.

Bereitgestellt von der Content-Sharing-Initiative Springer Nature SharedIt

Durch das Absenden eines Kommentars erklären Sie sich damit einverstanden, unsere Nutzungsbedingungen und Community-Richtlinien einzuhalten. Wenn Sie etwas als missbräuchlich empfinden oder etwas nicht unseren Bedingungen oder Richtlinien entspricht, kennzeichnen Sie es bitte als unangemessen.

AKTIE