Проекты в банковском секторе, промышленности, телекоммуникационных услугах, недвижимости.
Проекты курса "Специалист по Data Science буткемп" Яндекс Практикум
Название проекта | Описание | Стек |
---|---|---|
Выпускной проект: телекоммуникации | Обучила модели для прогноза оттока клиентов на основе персональных данных клиентов, информации об их тарифах и услугах | matplotlib, seaborn, numpy, sklearn, LogisticRegression, RandomForestClassifier, CatBoostClassifier, LGBMClassifier, DummyClassifier |
Определение возраста покупателей | Построила модель, которая по фотографии определит приблизительный возраст человека | matplotlib, PIL, numpy, tensorflow, keras, ResNet, Sequential, ImageDataGenerator, Adam |
Проект для «Викишоп» | Обучила модель классифицировать комментарии на позитивные и негативные | numpy, nltk, sklearn, matplotlib, wordcloud, TfidfVectorizer, LogisticRegression, RandomForestClassifier, DecisionTreeClassifier, CatBoostClassifier |
Прогнозирование заказов такси | Построила модель прогнозирования количества заказов такси на следующий час | matplotlib, statsmodels, numpy, sklearn, lightgbm, catboost, LGBMRegressor, RandomForestRegressor, CatBoostRegressor |
Определение стоимости автомобилей | Построила модель для определения стоимости на исторические данных: технические характеристики, комплектации и цены автомобилей | matplotlib, numpy, sklearn, lightgbm, catboost, LGBMRegressor, RandomForestRegressor, CatBoostRegressor |
Защита персональных данных клиентов | Разработала метод преобразования данных, по которому сложно восстановить персональную информацию | numpy, matplotlib, seaborn, sklearn, LinearRegression |
Восстановление золота из руды | Обучила модель, которая предсказывает коэффициент восстановления золота из золотосодержащей руды и помогает оптимизировать производство, чтобы не запускать предприятие с убыточными характеристиками | numpy, matplotlib, seaborn, sklearn, RandomForestRegressor, LinearRegression |
Выбор локации для скважины | Построила регрессионную модель машинного обучения, которая поможет определить регион, где добыча принесёт наибольшую прибыль | numpy, matplotlib, seaborn, sklearn, LinearRegression |
Отток клиентов банка | Обучила модели классификации на основе исторических данных о поведении клиентов и расторжении договоров с банком | sklearn, matplotlib, DecisionTreeClassifier, RandomForestClassifier, LogisticRegression |
Рекомендация тарифов оператора мобильной связи | Построила модель для задачи классификации, которая выберет подходящий тариф, на основе данных о поведении клиентов | sklearn, matplotlib, DecisionTreeClassifier, RandomForestClassifier |
Исследование компьютерных игр | Выявила закономерности, определяющие успешность компьютерной игры (это позволит сделать ставку на потенциально популярный продукт и спланировать рекламные кампании) | pandas, matplotlib, numpy, scipу, seaborn |
Исследование объявлений о продаже квартир | Провела исследовательский анализ данных и установила параметры, влияющие на стоимость объектов (это позволит построить автоматизированную систему) | python, pandas, matplotlib |