Строим ML-пайплайны для прогноза доходности и вероятности роста на основе лаговых доходностей, техиндикаторов и коррелированных инструментов.
Тестируем линейные, нелинейные и вероятностные модели: логистическая регрессия, Random Forest, XGBoost, LightGBM, квантили и мультигоризонтные таргеты.
Ищем аномалии рынка и разрывы корреляций, проектируем стратегии на основе outlier-фильтров, time-lagged корреляций и мультикритериальных сигналов.
Что входит?
Проект Alpha Forecast:
ноутбук с построением признаков по 30 «спутникам» целевой монеты (pandas_ta RSI/EMA/ATR/ROC и др.), таргетами future_return и моделями GradientBoosting, RandomForest, Ridge, XGBRegressor;
блок Cor_strat для поиска пар с разрывом корреляции и визуального анализа спредов;
мульти-таргетная постановка с MultiOutputClassifier(LGBMClassifier) по нескольким горизонтам (future_return_1/2/3) и сборкой сигналов, когда все горизонты согласованы.
ноутбук First_lesson.ipynb с тремя типами моделей: классификация «выше/ниже» (LogisticRegression, RandomForestClassifier), регрессия доходности (RandomForestRegressor, Ridge, XGBRegressor) и вероятностный подход через LightGBM с квантильными прогнозами и сравнением с Buy&Hold;
установка и использование shap для интерпретации вклада признаков в XGBoost;
заготовка multi_parser.ipynb для массовой выгрузки данных по USDT-фьючерсам через pybit.unified_trading.HTTP.
Модуль «Поиск аномалий рынка, глубокое обучение в трейдинге, Pre-HFT архитектура»:
ноутбук Second_lesson.ipynb с Random Forest и LightGBM + Optuna, ансамблями моделей, фильтрами уверенности и outlier-стратегиями на основе Isolation Forest (лог-доходность, high-low range, объём, свечное тело, z-score);
эталонный датасет ZRXUSDT_h1.csv с часовыми свечами и объёмами для воспроизведения экспериментов и адаптации под собственные данные;
ссылки на внешние источники рыночных данных для построения Pre-HFT-архитектур.