Купить крипто Рынки Спот ФьючерсыGOLD Сбережения Центр событий

Еще

Мошенничество — это не просто неприятность; это индустрия объемом 12,5 миллиардов долларов. Согласно данным FTC за 2024 год, зарегистрированные потери от мошенничества резко возросли. Традиционные системы, основанные на правилахМошенничество — это не просто неприятность; это индустрия объемом 12,5 миллиардов долларов. Согласно данным FTC за 2024 год, зарегистрированные потери от мошенничества резко возросли. Традиционные системы, основанные на правилах

Создайте систему защиты от мошенничества с искусственным интеллектом в реальном времени с помощью Python, XGBoost и BERT

Источник: Hackernoon

2025/12/15 04:04

5м. чтение

REAL$0.07535-0.07%

SLEEPLESSAI$0.01834-5.70%

BERT$0.010319+0.57%

T$0.006143-2.22%

Для обратной связи или замечаний по поводу данного контента, свяжитесь с нами по адресу crypto.news@mexc.com

Для разработчиков и системных архитекторов задача двояка:

Мошенничество с транзакциями: Обнаружение аномалий в структурированных финансовых данных (Кто отправил деньги? Куда? Сколько?).
Коммуникационное мошенничество (Спам/Фишинг): Обнаружение злонамеренных намерений в неструктурированном тексте (SMS-ссылки, фишинговые электронные письма).

Традиционные системы, основанные на правилах ("Если сумма > 10 000 долларов, отметить"), слишком хрупки. Они генерируют ложные срабатывания и пропускают развивающиеся векторы атак.

В этом инженерном руководстве мы создадим Двухуровневую систему защиты. Мы реализуем высокоскоростную модель XGBoost для мониторинга транзакций и BERT-based NLP-движок для обнаружения спама, обернув все это в облачную микросервисную архитектуру.

Давайте приступим к созданию.

Архитектура: Реальное время и облачные технологии

Мы не создаем пакетное задание, которое выполняется за ночь. Мошенничество происходит за миллисекунды. Нам нужен движок вывода в реальном времени.

Наша система состоит из двух отдельных конвейеров, подающих данные в центральный механизм принятия решений.

Технический стек

Язык: Python 3.9+
Структурированное обучение: XGBoost (Extreme Gradient Boosting) и Random Forest.
NLP: Hugging Face Transformers (BERT) и Scikit-learn (Naïve Bayes).
Развертывание: Docker, Kubernetes, FastAPI.

Часть 1: Защитник транзакций (XGBoost)

При работе с табличными финансовыми данными (Сумма, Время, Местоположение, ID устройства), XGBoost в настоящее время является королем горы. В наших тестах он достиг 98,2% точности и 97,6% прецизионности, превзойдя Random Forest как по скорости, так и по надежности.

Проблема: Несбалансированные данные

Мошенничество редко. Если у вас 100 000 транзакций, возможно, только 30 из них являются мошенническими. Если вы обучите модель на этом, она будет просто угадывать "Легитимно" каждый раз и достигнет 99,9% точности, пропуская при этом каждый случай мошенничества.

Решение: Мы используем SMOTE (Synthetic Minority Over-sampling Technique) или взвешивание классов во время обучения.

План реализации

Вот как настроить классификатор XGBoost для оценки транзакций.

import xgboost as xgb from sklearn.model_selection import train_test_split from sklearn.metrics import precision_score, recall_score, f1_score import pandas as pd # 1. Load Data (Anonymized Transaction Logs) # Features: Amount, OldBalance, NewBalance, Location_ID, Device_ID, TimeDelta df = pd.read_csv('transactions.csv') X = df.drop(['isFraud'], axis=1) y = df['isFraud'] # 2. Split Data X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42) # 3. Initialize XGBoost # scale_pos_weight is crucial for imbalanced fraud data model = xgb.XGBClassifier( objective='binary:logistic', n_estimators=100, learning_rate=0.1, max_depth=5, scale_pos_weight=10, # Handling class imbalance use_label_encoder=False ) # 4. Train print("Training Fraud Detection Model...") model.fit(X_train, y_train) # 5. Evaluate preds = model.predict(X_test) print(f"Precision: {precision_score(y_test, preds):.4f}") print(f"Recall: {recall_score(y_test, preds):.4f}") print(f"F1 Score: {f1_score(y_test, preds):.4f}")

Почему XGBoost выигрывает:

Скорость: Он обрабатывает табличные данные значительно быстрее, чем глубокие нейронные сети.
Разреженность: Он изящно обрабатывает отсутствующие значения (что часто встречается при снятии отпечатков устройств).
Интерпретируемость: В отличие от "Черного ящика" нейронной сети, мы можем вывести важность признаков, чтобы объяснить, почему транзакция была заблокирована.

Часть 2: Охотник за спамом (NLP)

Мошенничество часто начинается со ссылки. "Нажмите здесь, чтобы обновить свой KYC." \n Для обнаружения этого нам нужна обработка естественного языка (NLP).

Мы сравнили Naïve Bayes (легкий, быстрый) с BERT (глубокое обучение).

Naïve Bayes: 94,1% точности. Хорош для простого спама с ключевыми словами.
BERT: 98,9% точности. Необходим для "контекстного" фишинга (например, социально спроектированных писем, которые не выглядят как спам).

План реализации (BERT)

Для производственной среды мы дообучаем предварительно обученную модель Transformer.

from transformers import BertTokenizer, BertForSequenceClassification import torch # 1. Load Pre-trained BERT model_name = "bert-base-uncased" tokenizer = BertTokenizer.from_pretrained(model_name) model = BertForSequenceClassification.from_pretrained(model_name, num_labels=2) def classify_message(text): # 2. Tokenize Input inputs = tokenizer( text, return_tensors="pt", truncation=True, padding=True, max_length=512 ) # 3. Inference with torch.no_grad(): outputs = model(**inputs) # 4. Convert Logits to Probability probabilities = torch.nn.functional.softmax(outputs.logits, dim=-1) spam_score = probabilities[0][1].item() # Score for 'Label 1' (Spam) return spam_score # Usage msg = "Urgent! Your account is locked. Click http://bad-link.com" score = classify_message(msg) if score > 0.9: print(f"BLOCKED: Phishing Detected (Confidence: {score:.2%})")

Часть 3: Рабочий процесс "Жесткой остановки"

Обнаружение бесполезно без действия. Самая инновационная часть этой архитектуры — Логика вмешательства.

Мы не просто регистрируем мошенничество; мы перехватываем путь пользователя.

Рабочий процесс:

Пользователь получает SMS: "Обновите способ оплаты."
Пользователь нажимает: Клик направляется через наш микросервис.
Сканирование в реальном времени: URL и тело сообщения оцениваются моделью BERT.
Точка принятия решения:

Безопасно: Пользователь перенаправляется на фактический платежный шлюз.
Мошенничество: Появляется предупреждение "Жесткая остановка".

Примечание: В отличие от стандартных фильтров электронной почты, которые перемещают элементы в папку "Спам", эта система находится между кликом и пунктом назначения, предотвращая загрузку пользователем вредоносной нагрузки.

Ключевые метрики

При развертывании в производство "Точность" — это показатель тщеславия. Вам нужно следить за Прецизионностью и Полнотой.

Ложные срабатывания (падение прецизионности): Вы блокируете законного пользователя от покупки кофе. Они злятся и перестают использовать ваше приложение.
Ложные пропуски (падение полноты): Вы позволяете хакеру опустошить счет. Вы теряете деньги и репутацию.

В нашем исследовании XGBoost обеспечил наилучший баланс:

Точность: 98,2%
Полнота: 95,3% (Он поймал 95% всех случаев мошенничества).
Задержка: Быстрый вывод, подходящий для блокировки в реальном времени.

Заключение

Эра ручного обзора мошенничества закончилась. С взрывным ростом объемов транзакций единственная масштабируемая защита — это ИИ.

Объединяя XGBoost для структурированных данных транзакций и BERT для неструктурированных коммуникационных данных, мы создаем надежный щит, который защищает пользователей не только от финансовых потерь, но и от социальной инженерии, которая им предшествует.

Следующие шаги для разработчиков:

Контейнеризация: Оберните приведенные выше скрипты Python в Docker.
Предоставление API: Используйте FastAPI для создания конечной точки /predict.
Развертывание: Отправьте в Kubernetes (EKS/GKE) для возможностей автоматического масштабирования.

\ \

Возможности рынка

RealLink Курс (REAL)

$0.07535

$0.07535$0.07535

-0.06%

USD

График цены RealLink (REAL) в реальном времени

Не пропустите U-Фест с 200 000$

Получите mystery box, 12% APR и подарки на 200$!

Отказ от ответственности: Статьи, размещенные на этом веб-сайте, взяты из общедоступных источников и предоставляются исключительно в информационных целях. Они не обязательно отражают точку зрения MEXC. Все права принадлежат первоисточникам. Если вы считаете, что какой-либо контент нарушает права третьих лиц, пожалуйста, обратитесь по адресу crypto.news@mexc.com для его удаления. MEXC не дает никаких гарантий в отношении точности, полноты или своевременности контента и не несет ответственности за любые действия, предпринятые на основе предоставленной информации. Контент не является финансовой, юридической или иной профессиональной консультацией и не должен рассматриваться как рекомендация или одобрение со стороны MEXC.

Новости 24/7 в прямом эфире

Еще

Федеральная резервная система планирует экстренное заседание; потенциальное вливание 5 трлн долларов в экономику может повлиять на настроения рынка.

Автор: Crypto King17:50

Биткоин растет на фоне новостей о мирном соглашении с Ираном, что свидетельствует о возможном геополитическом влиянии на рынок криптовалют.

Автор: CryptoSavingExpert ®16:36

Наблюдается тренд на пампы OG-коинов. Фокус на $TURBO и $TRB. Плечо используется несмотря на рыночные условия.

Автор: van00sa14:14

Майкл Сейлор сигнализирует о возможной покупке биткоина компанией Strategy, что указывает на рост институционального интереса.

Автор: Nehal13:36

Подчёркнут позитивный настрой в отношении золота; потенциальная значимость для тенденций рынка XAUT.

Автор: DEG10:43

Быстрое чтение

Еще

Биткойн держит около 78 тысяч долларов: приток ETF еженедельно достиг 996 миллионов долларов, поскольку макроэкономические попутные ветры устойчивы на рынке

Цены на криптовалюту

Биткоин

BTC

$77,834.35

$77,834.35$77,834.35

-0.27%

Эфириум

ETH

$2,321.14

$2,321.14$2,321.14

-1.13%

Солана

SOL

$85.29

$85.29$85.29

-1.46%

USDCoin

USDC

$0.9999

$0.9999$0.9999

+0.02%

Рипл

XRP

$1.4157

$1.4157$1.4157

-0.92%

Бросайте кости, выигрыш до 1 BTC

Приглашайте друзей и разделите 500 000 USDT!

Создайте систему защиты от мошенничества с искусственным интеллектом в реальном времени с помощью Python, XGBoost и BERT

Архитектура: Реальное время и облачные технологии

Технический стек

Часть 1: Защитник транзакций (XGBoost)

Проблема: Несбалансированные данные

План реализации

Часть 2: Охотник за спамом (NLP)

План реализации (BERT)

Часть 3: Рабочий процесс "Жесткой остановки"

Ключевые метрики

Заключение

Вам также может быть интересно

EUR/GBP стабилизируется выше 0,8650: ключевые решения BoE и ЕЦБ на фоне нестабильности на Ближнем Востоке

Western Union планирует запустить стейблкоин USDPT в следующем месяце и готовит Stable Card для глобальных потребителей

Стейблкоин USDPT: Western Union планирует запуск на Solana

Популярные новости

Биткоин может быстро достичь нового исторического максимума после решения квантовой проблемы, говорит основатель Capriole

Буровые компании видят перспективы в послевоенном восстановлении энергетики

ПРОВЕРКА ФАКТОВ: Мартин Ромуальдес не приносил извинений семье Дутерте

Франция предъявила обвинения 88 подозреваемым в предполагаемых криптовалютных атаках с гаечным ключом

Как финтех и ИИ меняют подход институтов к анализу глобальных рыночных нарративов

Новости 24/7 в прямом эфире

Быстрое чтение

Купить BEEG в 2026 году или подождать? Честное руководство для входа, в котором нуждается каждый инвестор

Изменение цены Ethereum (ETH) за 7 дней

Ethereum (ETH) Бычий Прогноз Цены

Есть ли у Биткойна проблема "стратегии"? Одна компания теперь владеет 4% поставок

Биткойн держит около 78 тысяч долларов: приток ETF еженедельно достиг 996 миллионов долларов, поскольку макроэкономические попутные ветры устойчивы на рынке

Цены на криптовалюту