#!/usr/bin/python3

import pickle

# Chargement des données.
#
# Il faudra vraisemblablement adapter le chemin vers le fichier wooldridge.pkl.

fid = open('C:/Users/claire.loupias/Desktop/wooldridge23.pkl', 'rb')
alldatasets = pickle.load(fid)
fid.close()

# Base de données nécessaire à l'exercice 3.1
dataset = alldatasets['bwght']
#
# Question 2.
#
# Calculons la corrélation entre cigs et faminc

from scipy.stats import pearsonr

corr, _ = pearsonr(dataset.cigs, dataset.faminc)

print("La corrélation entre cigs et faminc est : ", corr)

#
# Question 3.
#

import statsmodels.formula.api as smf

# Estimons le modèle par les MCO (avec cigs et faminc)
results = smf.ols('bwght ~ cigs + faminc', data=dataset).fit()
print(results.summary())

# Estimons le modèle par les MCO (avec cigs seulement)
results = smf.ols('bwght ~ cigs', data=dataset).fit()
print(results.summary())





