forked from cristianpb/datalab.mi
-
Notifications
You must be signed in to change notification settings - Fork 0
/
Copy pathdatalab.html
228 lines (202 loc) · 11.1 KB
/
datalab.html
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
---
layout: default
title: Laboratoire de la donnée
description: Transformez votre métier par la donnée
permalink: /datalab
---
<main role="main">
<section class="section section-dark" id="haut">
<div class="container">
<h2 class="section__title">{{ page.title }}</h2>
<p class="section__subtitle">{{ page.description }}</p>
</div>
</section>
<section class="section section-white" id="typography">
<div class="container">
<div class="row">
<div>
<h2>Le datalab</h2>
<p class="lead-text"> Depuis juin 2016, le datalab soutient la mise en
oeuvre de cas d'usages de valorisation des données conduits
avec les directions métiers.
</p>
<h3> Le patrimoine de donnée </h3>
<p>
Le <b>patrimoine des données</b> du Ministère de l'Intérieur a été cartographié en 2017 (<a href="http://catalog.datalab.mi">lien interne</a>) en cinq grands domaines : les biens, les personnes morales, les personnes physiques, les titres et les données administratives et géographiques. </p>
<p>Les enjeux, précisés dans
<a href="http://catalog.datalab.mi/fr/posts/patrimoine-des-donnees-du-ministere-de-linterieur/">un article interne</a>,
relèveront à terme du <i>big data</i>. Les données de détail, enfouies au sein de plusieurs systèmes d'information, sont le plus
souvent sous-exploitées. Le Laboratoire de la donnée propose un accompagnement pour les valoriser.
</p>
<div class="typography__sample"><div class="text-quote"><p>
Le Laboratoire de la donnée accompagne les métiers dans l'exploration et la valorisation de leurs données avec l'appui de <i>data scientists</i> confirmés.
</p></div></div>
<h3>La data science</h3>
<p>La <i>data science</i> complète le métier traditionnel
du décisionnel et des statistiques. Grâce à des techniques avancées de traitement de la donnée et de modélisation, les <i>data scientists</i> mettent en exergue des situations métiers anormales et/ou apportent des solutions
à des problèmes identifiés par les métiers.</p>
L'application de ces technologies nécessite une étape importante de préparation des données, occupant environ 60% du temps du <i>data scientist</i> selon <a href="https://visit.figure-eight.com/data-science-report.html"> une étude publiée en 2016</a>. Une fois les données nettoyées et organisées, le <i>data scientist</i> se consacre ensuite à l'élaboration d'algorithmes, la construction de statistiques simples ou l'implémentation de
règles de gestion.</p>
<p>Les techniques d'apprentissage profond (<i>deep learning</i>), souvent assimilées à l'intelligence artificielle (IA), ne sont pertinentes
que dans des cas bien ciblés et lorsqu'il y a déjà une maturité dans la maîtrise des données.
</p>
<div class="typography__sample"><div class="text-quote"><p>
La compréhension du métier et de ses problématiques est un prérequis au succès des projets de <i>data science</i>.
</p></div></div>
<p>Ainsi, l'organisation d'ateliers réunissant experts métier et spécialistes de la donnée permet aux premiers de partager leurs connaissances et ainsi d'initier efficacement ce type de projets. Plusieurs itérations sont ensuite nécessaires pour répondre au mieux aux problématiques des métiers.</p>
</div>
<div>
<h3> </h3>
<p><img width="100%" src="{{ 'img/illustrations/patrimoine_donnees_mi_familles.png' | relative_url }}" alt=""></p>
<h3> </h3>
<p><img width="100%" src="{{ 'img/illustrations/pyramide_datascience.png' | relative_url }}" alt=""></p>
</div>
</div>
</div>
</section>
<section class="section section-grey">
<div class="container">
<div class="tiles">
<h2>Le programme EIG</h2>
<p>Chaque année depuis 2016, les administrations ont la possibilité de soumettre leurs projets ambitieux de valorisation de la donnée à <a href="https://www.etalab.gouv.fr/">Etalab</a>, département de la Direction interministérielle du numérique (DINUM) chargé de la conception et de la mise en oeuvre de la stratégie de l'Etat dans le dommaine de la donnée. Etalab sélectionne les "défis" qui intégreront le programme <a
href="https://www.etalab.gouv.fr/fr/entrepreneurs-dinteret-general">
Entrepreneurs d'intérêt général</a> (EIG). </p>
<p>A travers son programme, Etalab organise le recrutement de profils experts en data, web ou design. Ces derniers sont ensuite intégrés dans les administrations pour une durée de 10 mois. Le Ministère de l'Intérieur a déjà bénéficié de ce programme pour quatre défis.</p>
<div class="cards">
<div class="row">
<div class="card">
<div class="card__cover">
<img src="{{ '/assets/images/datalab/cartav.png' | relative_url }}" la alt="Shiba Inu" />
</div>
<div class="card__content">
<h3>CartAV</h3>
<p>Augmenter la sécurité sur les routes en exploitant les données de verbalisations et d’accidents.</p>
</div>
<div class="card__extra">
<div class="label label--active">2017</div>
</div>
</div>
<div class="card">
<div class="card__cover">
<img src="{{ '/assets/images/datalab/matchID-logo.png' | relative_url }}" alt="French Bulldog" />
</div>
<div class="card__content">
<h3>MatchID</h3>
<p>Fiabiliser les statistiques de la sécurité routière en rapprochant le Fichier national des permis de conduire (SNPC) avec les registres de décès.
</p>
</div>
<div class="card__extra">
<div class="label label--active">2017</div>
</div>
</div>
<div class="card">
<div class="card__cover">
<img src="{{ '/assets/images/datalab/previsecours_logo.png' | relative_url }}" alt="Corgi" />
</div>
<div class="card__content">
<h3>Previsecours</h3>
<p>Aider les sapeurs-pompiers dans la prévision de leurs interventions.</p>
</div>
<div class="card__extra">
<div class="label label--active">2018</div>
</div>
</div>
<div class="card">
<div class="card__cover">
<img src="{{ '/assets/images/datalab/ia-flash.png' | relative_url }}" alt="Corgi" />
</div>
<div class="card__content">
<h3>IA Flash</h3>
<p>Fiabiliser la constatation des contraventions à partir de la
reconnaissance d’images.</p>
</div>
<div class="card__extra">
<div class="label label--active">2019</div>
</div>
</div>
</div>
</div>
</div>
</section>
<section class="section section-white" id="typography">
<div class="container">
<div class="row">
<div>
<h2>L'offre entrepôt</h2>
<p class="lead-text">Initié au premier semestre 2018, l'entrepôt vise à industrialiser
l'offre de valorisation des données, en permettant de raccourcir pour passer du POC à la mise
en production. L'architecture de cet entrepôt et le choix des briques technologiques qui le compose sont assurés par le Laboratoire de la donnée.
</p>
<p>
L'offre entrepôt accompagne les directions métiers dans le déploiement d'une plateforme "data" standardisée à l'échelle du Ministère de l'Intérieur pour le traitement et la visualisation de leurs données.
<br/>
Les produits actuellement dans l'offre sont :
</p>
<ul>
<li><b>Data Science Studio </b> (DSS, de la société Dataiku) : transformation et
mise en qualité de la donnée, <i>machine learning</i>.</li>
<li><b>Tableau Software</b> : visualisation des données, <i>reporting</i>.</li>
<li><b>Vertica</b> : système de bases de données relationnelles, optimisé pour l'analytique.</li>
</ul>
<h3>Les services de l'entrepôt</h3>
<p>
Le déploiement de l'entrepôt repose sur la sécurité du cloud pour le cloisonnement
et la protection des données. La fonction d'administration des données préconise
un déploiement séparant :
</p>
<ul class="description">
<li>un entrepôt statistique par direction métier ou programme :
cet entrepôt peut contenir des dérivées de données nominatives pseudonimisées
pour peu qu'elles n'aient pas d'impact à large échelle. Il doit permettre
l'étude de tendances comportementales en conservant la maille la plus fine
des données (individu, véhicule, accident) sans viser des individus.
</li>
<li>un entrepôt par domaine réglementaire, contenant les données nominatives
pour, d'une part, assurer la mise en qualité des données et, d'autre part,
assurer les traitement d'anonymisation et les traitements de lutte
contre la fraude.
</li>
</ul>
<div>
<h3> </h3>
<p><img width="60%" src="{{ 'img/logo_metiers/lentrepot_outils.png' | relative_url }}" alt=""></p>
</div>
</div>
</div>
</section>
<section class="section section-grey">
<div class="container">
<div class="tiles">
<h2>Équipe</h2>
<div class="grid">
{% for person in site.data.datalab.equipe %}
<div class="tile">
<h3>{{ person.nom }}</h3>
<p>{{ person.role }}</p>
</div>
{% endfor %}
</div>
</div>
</div>
</section>
<section class="section section-white" id="form">
<div class="container">
<form action="https://formspree.io/[email protected]" method="POST">
<h1>Nous contacter</h1>
<div class="form__group">
<label for="message">E-mail</label>
<input type="email" type="text" name="e-mail" id="email" placeholder="email">
</div>
<div class="form__group">
<label for="name">Nom</label>
<input type="name" type="text" name="name" id="name" placeholder="nom">
</div>
<div class="form__group">
<label for="message">Message</label>
<textarea name="message" placeholder="Message" id="message"></textarea>
</div>
<button class="button" type="submit" value="Send" name="subscribe" id="submit">Valider</button>
</form>
</div>
</section>
</main>