import requests

def download_scrutin(num):
    """Télécharge un scrutin en fonction de son numéro."""
    url = "http://www2.assemblee-nationale.fr/scrutins/detail/(legislature)/14/(num)/%d"%num
    return requests.get(url).text

# https://www.reddit.com/r/Python/comments/34tdr2/a_simple_progress_bar_for_ipython_notebooks/
from ipywidgets import FloatProgress
from IPython.display import display
f = FloatProgress(min=0, max=100)
display(f)

d = {}
N = 1238
for num in range(1, N + 1):
    f.value = 100 * num / N
    key = str(num)
    if key not in d.keys():
        d[key] = download_scrutin(num)

from bs4 import BeautifulSoup
soup = BeautifulSoup(d['1'], 'html.parser')

groups = soup.find_all('div', {"class": "TTgroupe"})

g = groups[0]
g.select('li')[:10]

[<li>            Ibrahim <b>Aboubacar</b></li>,
 <li> Patricia <b>Adam</b></li>,
 <li> Sylviane <b>Alaux</b></li>,
 <li> Jean-Pierre <b>Allossery</b></li>,
 <li> Pouria <b>Amirshahi</b></li>,
 <li> François <b>André</b></li>,
 <li> Sylvie <b>Andrieux</b></li>,
 <li> Nathalie <b>Appéré</b></li>,
 <li> Christian <b>Assaf</b></li>,
 <li> Pierre <b>Aylagas</b></li>]

def mps_in_group(g):
    """Retourne les noms de tous les députés présents dans un groupe."""
    return [tag.text.strip() for tag in g.select('li')]

mps_in_group(g)[:10]

['Ibrahim\xa0Aboubacar',
 'Patricia\xa0Adam',
 'Sylviane\xa0Alaux',
 'Jean-Pierre\xa0Allossery',
 'Pouria\xa0Amirshahi',
 'François\xa0André',
 'Sylvie\xa0Andrieux',
 'Nathalie\xa0Appéré',
 'Christian\xa0Assaf',
 'Pierre\xa0Aylagas']

def all_mps(source):
    """Extrait tous les députés votants lors d'un scrutin."""
    soup = BeautifulSoup(source, 'html.parser')
    groups = soup.find_all('div', {"class": "TTgroupe"})
    all_mps = []
    for g in groups:
        all_mps += mps_in_group(g)
    return all_mps

len(all_mps(d['1']))

544

def extract_information(line):
    """Extrait les informations d'une ligne du tableau des scrutins."""
    elems = line.find_all('td')
    # numéro de scrutin
    num = elems[0].text
    # date
    date = elems[1].text
    # objet
    obj = elems[2].text
    # pour
    pour = int(elems[3].text)
    # contre
    contre = int(elems[4].text)
    # abstention
    abstention = int(elems[5].text)
    return num, date, obj, pour, contre, abstention

data = []
for offset in range(0, 1300, 100):
    url = "http://www2.assemblee-nationale.fr/scrutins/liste/(offset)/{}/(legislature)/14/(type)/TOUS/(idDossier)/TOUS".format(offset)
    r = requests.get(url)
    soup = BeautifulSoup(r.text, 'html.parser')
    elems = soup.select('tbody tr')
    data += [extract_information(line) for line in elems]

import pandas as pd

df = pd.DataFrame(data, columns=('numero', 'date', 'objet', 'pour', 'contre', 'abstention'))

day_mapping = {0: '01-lundi', 1: '02-mardi', 2: '03-mercredi', 
               3:'04-jeudi', 4: '05-vendredi', 5: '06-samedi', 6: '07-dimanche'}

df['presents'] = df['pour'] + df['contre'] + df['abstention']
df['absents'] = 577 - df.presents
df.date = pd.to_datetime(df.date, dayfirst=True)
df['jour'] = [day_mapping[date.dayofweek] for date in df.date]
df.numero = df.numero.str.extract('(\d+)')

df.head()

%%time
df['votants'] = [all_mps(d[num]) for num in df.numero]

Wall time: 1min 1s

df.head()

%matplotlib inline
import matplotlib.pyplot as plt
plt.style.use('bmh')

df.presents.plot(legend=True)
df.votants.apply(lambda item: len(item)).plot(legend=True)

<matplotlib.axes._subplots.AxesSubplot at 0x11beed30>

coherent = (df.presents == df.votants.apply(lambda item: len(item)))

coherent.value_counts()

False    708
True     530
dtype: int64

from collections import Counter

c = Counter()
for voting in df[coherent].votants:
    c.update(voting)

len(c)

623

df2 = pd.DataFrame(c.most_common(), columns=['depute', 'scrutins'])
df2

fig, ax = plt.subplots()
df2.scrutins.hist(bins=25)
plt.xlabel('nombre de scrutins')
plt.ylabel('compte du nombre de députés')

<matplotlib.text.Text at 0x11fc90f0>

df2.describe()

coherent.value_counts()

False    708
True     530
dtype: int64

rarely = df2.depute[df2.scrutins < 117] 
often = df2.depute[df2.scrutins > 167]

def marker_size(mp_list, group):
    """Compte le nombre de personnes dans group présent dans la liste mp_list."""
    return len([member for member in mp_list if member in group.values])

marker_size(df.ix[0].votants, rarely)

29

marker_size(df.ix[0].votants, often)

81

fig, ax = plt.subplots(figsize=(10, 7))
df.plot.scatter(ax=ax, x='pour', y='contre', s=[marker_size(v, rarely) for v in df[coherent].votants])
plt.title('implication des députés qui participent\n"moins souvent que les autres"')
plt.plot([0, 577], [0, 577], label='majorité')
plt.legend(loc='upper left')
plt.ylim(-10, 577)
plt.xlim(-10, 577)

(-10, 577)

fig, ax = plt.subplots(figsize=(10, 7))
df.plot.scatter(ax=ax, x='pour', y='contre', s=[marker_size(v, often) for v in df[coherent].votants])
plt.title('implication des députés qui participent\n"plus souvent que les autres"')
plt.plot([0, 577], [0, 577], label='majorité')
plt.legend(loc='upper left')
plt.ylim(-10, 577)
plt.xlim(-10, 577)

(-10, 577)

fig, ax = plt.subplots(figsize=(10, 7))
df.plot.scatter(ax=ax, x='pour', y='contre', s=[abs(marker_size(v, often) - marker_size(v, rarely)) for v in df[coherent].votants])
plt.title('implication des députés qui participent\n"plus souvent que les autres"')
plt.plot([0, 577], [0, 577], label='majorité')
plt.legend(loc='upper left')
plt.ylim(-10, 577)
plt.xlim(-10, 577)

(-10, 577)

sommaruga = df2.depute[df2.depute.str.contains("Sommaruga")]

fig, ax = plt.subplots(figsize=(10, 7))
df.plot.scatter(ax=ax, x='pour', y='contre', s=[25*marker_size(v, sommaruga) for v in df[coherent].votants])
plt.title('implication de Julie Sommaruga')
plt.plot([0, 577], [0, 577], label='majorité')
plt.legend(loc='upper left')
plt.ylim(-10, 577)
plt.xlim(-10, 577)

(-10, 577)

relevant = ['Julie\xa0Sommaruga' in mp for mp in df.votants]
df[relevant].presents.hist()
plt.xlabel('nombre de députés présents')
plt.ylabel('compte du nombre de scrutins')

<matplotlib.text.Text at 0x123ab358>

df.presents.hist()
plt.vlines(df[df.numero == '1238'].presents, 0, 700, label="prolongation état d'urgence")
plt.legend(fontsize=10)
plt.xlabel('nombre de députés présents')
plt.ylabel('compte du nombre de scrutins')

<matplotlib.text.Text at 0x12748eb8>

	numero	date	objet	pour	contre	abstention	presents	absents	jour
0	1238	2016-02-16	l'ensemble du projet de loi prorogeant l'appli...	212	31	3	246	331	02-mardi
1	1237	2016-02-10	l'ensemble du projet de loi constitutionnelle ...	317	199	51	567	10	03-mercredi
2	1236	2016-02-09	l'ensemble de l'article premier du projet de l...	116	19	11	146	431	02-mardi
3	1235	2016-02-09	l'amendement n° 1 du Gouvernement à l'article ...	132	7	7	146	431	02-mardi
4	1234	2016-02-09	l'amendement n° 2 du Gouvernement à l'article ...	104	34	7	145	432	02-mardi

	numero	date	objet	pour	contre	abstention	presents	absents	jour	votants
0	1238	2016-02-16	l'ensemble du projet de loi prorogeant l'appli...	212	31	3	246	331	02-mardi	[Jean-Pierre Allossery, François André, Nathal...
1	1237	2016-02-10	l'ensemble du projet de loi constitutionnelle ...	317	199	51	567	10	03-mercredi	[Ibrahim Aboubacar, Patricia Adam, Jean-Pierre...
2	1236	2016-02-09	l'ensemble de l'article premier du projet de l...	116	19	11	146	431	02-mardi	[Ibrahim Aboubacar, Patricia Adam, Jean-Pierre...
3	1235	2016-02-09	l'amendement n° 1 du Gouvernement à l'article ...	132	7	7	146	431	02-mardi	[Ibrahim Aboubacar, Patricia Adam, Jean-Pierre...
4	1234	2016-02-09	l'amendement n° 2 du Gouvernement à l'article ...	104	34	7	145	432	02-mardi	[Ibrahim Aboubacar, Patricia Adam, Jean-Pierre...

	depute	scrutins
0	Gilles Lurton	296
1	Bruno Le Roux	283
2	Marie-Anne Chapdelaine	271
3	Suzanne Tallard	264
4	Dominique Lefebvre	262
5	Gérard Sebaoun	261
6	Bernadette Laclais	260
7	Françoise Descamps-Crosnier	257
8	Jean-Luc Laurent	247
9	Denys Robiliard	246
10	Frédéric Reiss	245
11	Fanélie Carrey-Conte	244
12	Jean-Yves Le Bouillonnec	239
13	Catherine Lemorton	232
14	Marc Le Fur	230
15	Frédérique Massat	226
16	Marie-Noëlle Battistel	224
17	Joëlle Huillier	224
18	François de Rugy	224
19	Jean-Claude Buisine	223
20	Christine Pires Beaune	222
21	Chantal Guittet	221
22	Valérie Corre	220
23	Jean-Jacques Urvoas	220
24	Véronique Massonneau	220
25	Brigitte Bourguignon	220
26	Guillaume Chevrollier	220
27	Guillaume Larrivé	219
28	Corinne Erhel	217
29	Françoise Dubois	216
...	...	...
593	Laurence Arribagé	63
594	Edouard Fritch	61
595	Aurélie Filippetti	55
596	Jean-Marc Ayrault	55
597	Victorin Lurel	54
598	Maina Sage	49
599	Frédéric Cuvillier	46
600	Jean-Luc Drapeau	42
601	Gérard Menuel	41
602	Laurent Degallaix	38
603	Guy Bailliart	33
604	Franck Montaugé	30
605	Arnaud Viala	29
606	Kader Arif	27
607	David Comet	25
608	Marie Le Vern	21
609	Jean-Claude Gouget	20
610	Geneviève Fioraso	19
611	Pierre Ribeaud	18
612	Geneviève Gosselin	16
613	Daphna Poznanski-Benhamou	14
614	Corinne Narassiguin	14
615	Alain Vidalies	12
616	Pierre Moscovici	10
617	David Vergé	10
618	Dolores Roqué	6
619	Henri Plagnol	3
620	Gérard MENUEL	1
621	Eduardo Rihan-Cypel	1
622	Jacques-Alain Bénisti	1

	scrutins
count	623.000000
mean	140.033708
std	45.680216
min	1.000000
25%	117.000000
50%	139.000000
75%	167.000000
max	296.000000

Les députés français et l'absentéisme aux scrutins de l'assemblée nationale : analyse par député

Téléchargement des données des scrutins¶

Extraction des noms des participants au scrutin¶

Un grand tableau avec pandas¶

Extraction de la présence par député¶

Et ma députée ?¶

Réflexion¶

Comments