Ce projet a pour objectif d'entraîner un algorithme d'apprentissage automatique à reconnaître la fraude financière. Pour ce faire, nous utilisons Scikit Learn.
Il est important de noter que, pour que ce code fonctionne, vous devrez télécharger l'ensemble de données, car il est trop volumineux pour GitHub. Vous pouvez trouver l'ensemble de données ici : https://www.kaggle.com/datasets/ealaxi/paysim1 Vous devrez le placer dans un répertoire nommé "data_set" et l'appeler "financial_fraud.csv" (ou modifier la ligne concernée dans le code).
Pour ce projet, vous devrez également télécharger les bibliothèques Pandas et Scikit Learn. Vous pouvez le faire avec les commandes suivantes :
pip install pandas
pip install -U scikit-learn
This project aims to train a Machine Learning Algorithm to recognize financial fraud. In order to do this we use Scikit Learn.
It is important to note that for this code to work, you will need to download the Data Set, as it is too big for GitHub. You can found the Data Set here : https://www.kaggle.com/datasets/ealaxi/paysim1 You shall put it into a "data_set" directory and name it "financial_fraud.csv" (or change the concerned line in the code)
For this project, you also need to download both Pandas and Scikit Learn libraries. You can do this with these commands :
pip install pandas
pip install -U scikit-learn