Prozessbetrug anzeige Muster

by

1Die Studie ist Teil der Entwicklung eines Betrugserkennungssystems, das 2018 eingeführt wurde. Brockett, PL, Xia, X und Derrig, RA. 1998. “Mit Kohonens selbstorganisierender Feature-Karte, um Autokörperverletzungen aufzudecken, wird Betrug aufgedeckt”. Journal of Risk and Insurance, S. 245–274. DOI: doi.org/10.2307/253535 Künstliche Intelligenz, insbesondere maschinelles Lernen, wird verwendet, um Muster in Zahlungsdaten zu identifizieren. Neu ist im Zusammenhang mit Betrug, wie die Betrugsbekämpfung immer raffinierter wird und wie die Finanzindustrie mit neuen Methoden damit umgeht3. Belhadji, EB, Dionne, G und Tarkhani, F. 2000. “Ein Modell zur Aufdeckung von Versicherungsbetrug”. Die Genfer Dokumente zu Risiko- und Versicherungsfragen und -praxis, 25(4): 517–538.

DOI: doi.org/10.1111/1468-0440.00080 Prototyp, der den Red-Flag-Ansatz mit dem Prozessmining kombiniert. Unser Ziel ist es, C1 zu maximieren. Dies bedeutet, dass sich alle aufgedeckten Betrugsfälle in denselben Clustern befinden. Der Grenzwert C1 = 1 impliziert, dass alle J-Cluster nur aufgedeckte Betrugsfälle enthalten. Daher müssen wir diese Funktion mit einer anderen Funktion ausbalancieren. Unser Hauptziel ist es daher, eine Vielzahl von halbüberwachten Machine Learning-Modellen zu präsentieren, die auf ein Problem der Betrugsversicherung angewendet werden. Damit wollen wir eine Methodik entwickeln, die die Ergebnisse bei Klassifizierungsanomalieproblemen dieser Art verbessern kann. Der Schlüssel besteht darin, Annahmen über die unbekannten Betrugsfälle bei der Lösung wiederkehrender praktischer Probleme (verzerrte Daten, unbeschriftete Daten, dynamische und sich ändernde Muster) zu vermeiden, da dies die Ergebnisse verzerren kann. Wenn wir jedoch einige Labeldaten zu jeder Klasse haben, können wir einen halbüberwachten Algorithmus implementieren, wie die Etikettenausbreitung (Zhu und Ghahramani, 2002) oder die Etikettenstreuung (Zhou et al., 2004). Diese Methoden erfordern jedoch, dass wir einige Informationen über jede Klasse in unserem Problem haben, was nicht immer möglich ist. Tatsächlich ist die Entsorgung von Etikettendaten informationen über jede Klasse bei bestimmten praktischen Problemen recht selten. Darüber hinaus stehen wir vor dem Problem unausgewogener Daten, was bedeutet, dass wir selten saubere und regelmäßige Daten haben, die die Bevölkerung repräsentieren.

Bei Betrugsproblemen sind die Daten als Norm sehr unausgewogen, was zu einer hohen, aber voreingenommenen Erfolgsquote führt. Vor diesem Hintergrund schlagen wir die Anwendung unbeaufsichtigter Modelle vor, um die Zielvariable neu zu kennzeichnen. Um dies zu tun, verwenden wir eine neue Metrik, die misst, wie gut wir uns der Minderheitenklasse annähern. Wir können das Modell dann in einen halbüberwachten Algorithmus umwandeln. Nach Abschluss des Umetikettierungsprozesses kann unser Problem auf ein überwachtes Modell vereinfacht werden. Dies ermöglicht es uns nicht nur, eine objektive Grenze zu setzen, sondern auch einen Genauigkeitsgewinn bei der Verwendung von Teilinformationen zu erzielen, wie Trivedi et al. (2015) gezeigt haben. Die Implementierung geeigneter Machine Learning-Algorithmen zur Mustererkennung kann dazu führen: Das Basismodell verbessert die Homogenität der Betrugs- und Nicht-Betrugscluster erheblich. Insbesondere bietet es einen Gewinn von 33% in der Präzisionspunktzahl und von 6,2–6,8% im F-Score. Nian, K, Zhang, H, Tayal, A, Coleman, T und Li, Y. 2016. “Automatische Betrugserkennung durch unbeaufsichtigtes Spektralranking für Anomalien”.

share