logo GEM System a.s.

Fraud Detection software pro detekci podvodného jednání

Sofistikovaný hodnotící systém k odhalování podvodů je podle definovaných ukazatelů schopen ohodnotit jakékoliv entity dle míry odlišnosti od ostatních a vysvětlit, které ukazatele primárně přispěly do vypočteného hodnocení.

Z pohledu banky nebo pojišťovny Fraud Detection systém není nic jiného než chytrý vyhledávač anomálií nebo shod se známými vzory, který by měl k této činnosti využít všechny dostupné informace. V praxi neexistují řešení, která vybalíme z krabice a začnou samy pracovat. V ideálním případě je nutné využít všech stávajících vědomostí o vašem byznysu a zkombinovat je s efektivním IT produktem pro vytvoření komplexního a hlavně užitečného Fraud Detection systému.

Vyhledávání známých vzorů podvodů je možné nad daty, u kterých jsme na dostatečně velkém vzorku schopni jasně odlišit podvody od korektních případů. Potom je už musíme "jen" prohnat chytrými algoritmy strojového učení a po nezbytném čase ladění získáme klasifikátor - systém, který s určitou pravděpodobností rozeznává podvody, tj. identifikuje hledané entity. Problém je, že tento přístup není možné použít pro všechny typy dat.

V mnoha oblastech nemáme k dispozici předem jasně rozlišená korektní a podvodná data, na kterých by se systém mohl učit, a proto se musíme více spoléhat na starou dobrou statistiku. Když se člověk pokouší identifikovat podvod, nebo podezřelé entity mezi několika příklady, intuitivně se soustřeďuje na ty vybočující od průměru. Situaci komplikuje jen fakt, že informací o entitě je obvykle velké množství a lidská mysl není schopná tyto informace pojmout a komplexně zhodnotit.

Tento přirozený způsob je možné pojmout algoritmicky a při chytře nadefinovaném datovém modelu získáme ohromné možnosti, jak naše data využít a sofistikovaně vyhledávat ty anomálie, které jsou objektem našeho zájmu.

Ukázkový příklad

Řekněme, že naším cílem je výběr pěti poboček ze sta, na které se má zaměřit kontrola. Logickým krokem je v tomto případě seřadit všechny pobočky dle stupně "podezřelosti" a zaměřit naší pozornost na pět nejhorších. Zní to jednoduše, ale jak správně tyto pobočky ohodnotit a následně seřadit?

Je horší, pokud pobočka A má o 30% více zrušených účtů než průměr, pobočka B má o 30% více nesplacených úvěrů než průměr, nebo že pobočka C má o 15% vyšší oba ukazatele? Evidentně to závisí ještě na dalších aspektech.

A jak se vypořádat s realitou, když těchto ukazatelů je několik desítek až stovek, jsou navzájem propojené a k tomu v čase proměnné? Při hledání odpovědi na tuto otázku jsme se inspirovali výzkumem provedeném na jihokorejských univerzitách a testovaném na datech jihokorejské Health Insurance Review Agency.

GEM Fraud Detection

Na základě této studie jsme v GEM System navrhli a otestovali komplexní hodnotící systém, který je schopný dle definovaných ukazatelů (jednotkové náklady, počet zrušených účtů na zaměstnance atd.) ohodnotit jakékoliv entity (pobočky, klienty, pojištěnce, poskytovatele péče atd.) dle míry odlišnosti od ostatních a vysvětlit, které ukazatele primárně přispěly do vypočteného hodnocení.

Samozřejmostí je porovnávání jednotlivých ukazatelů v čase, protože abnormální růst je často dobrým vodícím znakem pro nekorektní chování. Entity jsou pak seřazeny dle dosažených výsledků a rozděleny do skupin dle míry anomálie.

Grafické zobrazení profilů entit napomáhá identifikovat příčiny vysokého skóre, takže kontrolní nebo revizní pracovník hned porozumí hodnocení dané entity.

Popis hodnotící metody

Základem je definice ukazatelů, pro které platí následující pravidlo - čím je ukazatel vyšší, tím spíše se jedná o podezřelé chování. Pro jednotlivé ukazatele se pak v rámci relevantní skupiny spočítají průměry a nadprůměrné hodnoty se statisticky vyhodnotí vzhledem k variabilitě, přičemž hodnoty dále od průměru mají větší vliv a tudíž je jejich míra anomálie vyšší.

Výsledným produktem je vážený součet individuálních měr anomálií, které vytváří výslednou kompositní míru anomálie (KMA). Vzhledem k faktu, že ne všechny ukazatele mají stejný vliv na podezřelé chování, je dalším důležitým aspektem relativní váha ukazatelů. Ta se v první fázi stanovuje manuálně na základě expertních odhadů a postupem času je automaticky přizpůsobována dle zpětné vazby od uživatelů.

Entity jsou dále pomocí clusteringu rozděleny do pěti skupin dle logaritmu úrovně míry anomálie (UMA). Skupina 4 pak obsahuje nejpodezřelejší entity, na které by se měla zaměřit kontrola. V praxi to není ještě konec.

V mnohých případech nás také zajímá jemnější segmentace v rámci skupin dle hodnot ukazatelů. Proto je v poslední fázi vytvořen rozhodovací strom, který entity zařadí do skupin ne dle měr anomálie, ale dle původních hodnot ukazatelů.

To vytvoří segmenty entit s podobným chováním a kontrola pak může být lépe cílená.

Článek GEM System a.s. ze dne čtvrtek 27. října 2016

Další články od GEM System a.s.

Prediktivní model zpracování a vyhodnocení business dat

Migrace datového skladu na nový HW a nejnovější verzi Oracle DB

GEM System certifikací TISAX garantuje požadavky informační bezečnosti v automotive

Oracle databáze pro zdravotnicka zařízení

Elektronická spisová služba ProfiSpis

GEM System a MotionPass spolupracují na automotive projektech

Elektronická spisová služba postavená na DXESS.BS

Certifikace SAFe 6 Agilist pro tým vývojářů GEM System

Systémová a business analýza v projektu Target Centrac pro Volkswagen Financial Services

Realizace implementace provozního úložiště dat pro Škoda Auto

Budujeme budoucnost IT s Kubernetes

Jak reagovat na změny v licencování produktů VMware

Kubernetes spojuje světy IT a byznysu bez ztráty efektivity či kontroly

Koncept Kubernetes clusteru on-premise

Inovativní a agilní řízení IT projektů

IS SPOT - informační systém ČNB pro správu zkouškových otázek

Migrace řešení na poskytování krátkodobých úvěrů bývalé Equa bank do IT infrastruktury RB

Kontejnerizace a DevOps významně pomáhají v řízení a provozu IT

GEM System je držitelem certifikace ISO 10006

Prediktivní řízení nákupů s řešením Microsoft Power BI

Správa identit nasazením open source Keycloak

eMobilita ŠKODA AUTO s nástroji podpory od GEM system

Projekt vědomostní báze pomáhá dealerům ŠKODA AUTO

Moderní dispečink UAMK s integrací ERP s GIS

Podnikové řešní na platformě Oracle BI

Analýza dat pro plánování a řízení marketingových kampaní

Provozní systém postavený na BPM řešení

Optimalizace procesu vývoje pokladního systému AWIS Kasa

Expresní úpravy v systému VZP pro registraci uprchlíků z Ukrajiny

Modernizace integrační platformy pro VZP ČR

Výhody nasazení kontejnerové platformy a Kubernetes clusteru on-premise

Automatizace řízení firemních procesů

Schvalování faktur postavené na procesní platformě GEM Process Manager

Automatizace a efektivní obchodní procesy

Řezy, transformace a anonymizace dat s GEM Winch

Ochrana osobních údajů s řešením GEM GDPR Suite

S GEM GDPR budete mít osobní údaje pod kontrolou

LBO systém přináší personalizovanou nabídku posádkám vozidel ŠKODA AUTO

Digitální transformace firmy s využitím oborových řešení Azure

Překonejte jakékoli výzvy s využitím Azure - vašeho partnera v cloudu

Power BI řešení pro reporting dat v systému SAP

Reportingové řešení na platformě Microsoft Power BI

Kdo není agilní, jako by nebyl

GEM Traffic Manager

GEM System je Gold Partner společnosti Microsoft

Zabezpečení cloudové aplikace s pomocí DevOps

Nástroje a postupy DevOps pomáhají v tvorbě lepších produktů

Billingové řešení připravuje podklady pro účetní systém

SAFe metodika agilního vývoje IT produktů

Produktový vývoj s podporou agilní metodiky Scrum