#!/usr/bin/python3

import pickle

# Lecture de la base de données.
#
# Il faudra vraisemblablement adapter le chemin vers le fichier wooldridge.pkl.

fid = open('C:/Users/claire.loupias/Desktop/wooldridge23.pkl', 'rb')
alldatasets = pickle.load(fid)
fid.close()

dataset = alldatasets['hprice1']
#
# Question 1.
#

import numpy as np
dataset['logged_price'] = np.log(dataset['price'])

# Estimons le modèle par les MCO
import statsmodels.formula.api as smf
results = smf.ols('logged_price ~ sqrft + bdrms', data=dataset).fit()
print(results.summary())

theta = 150*results.params.sqrft + 1*results.params.bdrms

print('La valeur estimée pour θ est ', theta)

#
# Question 3.
#
dataset['sqrft_minus_150_bdrms'] = dataset['sqrft']- 150*dataset['bdrms']

# Estimons le modèle par les MCO
results = smf.ols('logged_price ~ sqrft_minus_150_bdrms + bdrms', data=dataset).fit()
print(results.summary())

