Mon Accueil
39 views | +0 today
Follow
Your new post is loading...
Your new post is loading...
Scooped by Julien Damon
Scoop.it!

GE Datalandia

GE Datalandia | Mon Accueil | Scoop.it
Check out Datalandia, GE's epic summer blockbuster series about a small town saved by Big Data.
Julien Damon's insight:

Vous pensiez que la série du moment était Game of Throne, mais c'était sans compter sur "Datalandia, la ville sauvé par la Big Data" !!

more...
No comment yet.
Scooped by Julien Damon
Scoop.it!

Visual debugging with RStudio

Visual debugging with RStudio | Mon Accueil | Scoop.it
Introduction From release 098.208 the last RStudio IDE comes with a visual debugger. Now debugging with R and RStudio becomes a simple and efficient task.
more...
No comment yet.
Scooped by Julien Damon
Scoop.it!

Parallel Computing in R using Bot

Parallel Computing in R using Bot | Mon Accueil | Scoop.it
Genetics of Intra-Species Variations
Julien Damon's insight:

Un package qui pourrait être très utile dans un environnement distribué. Reste à voir une comparaison avec une solution type rmr2.

more...
No comment yet.
Rescooped by Julien Damon from Data Science by Bluestone
Scoop.it!

Les fondements scientifiques de la Data Science : statistique descriptive et analyse visuelle (1/2) | Le portail d'information de Bluestone

Les fondements scientifiques de la Data Science : statistique descriptive et analyse visuelle (1/2) | Le portail d'information de Bluestone | Mon Accueil | Scoop.it

Via Arnaud Laroche
more...
No comment yet.
Rescooped by Julien Damon from e-Xploration
Scoop.it!

L'ideal "data scientists" : A la recherche des 'Data scientists' | #datascience #bigdata

Le Big Data analytique implique des compétences nouvelles visant les technologies de traitement de données très diverses. D'où le job de Data Scientist.

Via Duarte Terencio, Pascale Mousset, luiy
more...
Pascale Mousset's comment, June 25, 2013 4:13 AM
Tres technique mais compréhensible globalement par une non experte. Big data is future !
Duarte Terencio's comment, June 25, 2013 8:57 AM
Une partie du futur ..
luiy's curator insight, June 25, 2013 10:28 AM
Comment ces problématiques se traduisent-elles sur le terrain ? Aujourd’hui, la réalisation d’analytiques sur le Big Data nécessite des compétences que ne possèdent pas tous les développeurs d’outils de BI ou les utilisateurs de tableurs de type Excel ! Ces compétences doivent porter sur le pilotage des données Big Data en environnements non structurés et l’application de statistiques. Nous sommes donc là en présence de deux métiers qui s’ignorent : l’informaticien et le statisticien.

Pourtant un métier pourrait émerger, dont la promesse est de réunir ces deux compétences : le Data scientist. La fonction a un nom, il  faut maintenant trouver la perle rare qui saura réunir ces compétences. Comme son nom l’indique, ce nouveau métier réunit les mondes de la donnée, donc du stockage en Big Data et du traitement de la donnée, et celui des sciences – mathématiques et statistiques…

 

Ne le cherchez pas dans les cursus de formation universitaires et de formation des ingénieurs, ces deux mondes ne cohabitent pas… ou tout du moins pas encore. Certaines universités américaines proposent déjà des formations de Data Scientist, les écoles européennes et françaises suivront. Attendons encore 2 à 3 ans avant que sortent des moules les premiers ingénieurs Data scientists diplômés.

 

En attendant, le focus des entreprises qui lancent des solutions de Big Data analytique porte principalement sur le déploiement des infrastructures de stockage et de compilation des données. Autour des technologies Hadoop.

 

Quelques intégrateurs et sociétés de services ont commencé à compenser l’absence de Data scientist par la réunion d’équipes pluridisciplinaires réunissant des spécialistes des IT et des statisticiens. Un mariage délicat pour le moment, surtout concentré sur la création des premiers PoC (Proof of concept). Les entreprises les plus avancées dans le Big Data analytique sont rares, mais existent, à l’image d’IBM. Le recrutement de scientifiques et statisticiens par une société dont la culture est à la fois orientée IT et R&D leur offre un avantage unique, celui de disposer de Data scientists.

Si la perle rare du Big Data analytique, le Data Scientist, existe, encore faut-il la trouver… ou faire appel au bon partenaire.

Scooped by Julien Damon
Scoop.it!

How to run R in the cloud (for teaching)

How to run R in the cloud (for teaching) | Mon Accueil | Scoop.it
(This article was first published on » R, and kindly contributed to R-bloggers) Last week, we launched the early stage beta version of our interactive online learning platform for R: DataMind.org. The development of this educational...
more...
No comment yet.
Rescooped by Julien Damon from Data Science by Bluestone
Scoop.it!

Les fondements scientifiques de la Data Science : analyse explicative et modélisation prédictive (2/2) | Le portail d'information de Bluestone

Les fondements scientifiques de la Data Science : analyse explicative et modélisation prédictive (2/2) | Le portail d'information de Bluestone | Mon Accueil | Scoop.it

Via Arnaud Laroche
more...
No comment yet.
Scooped by Julien Damon
Scoop.it!

A possibility for use R and Hadoop together | Milano R net

A possibility for use R and Hadoop together | Milano R net | Mon Accueil | Scoop.it
Milano R net | MilanoR.net - Milano R User Group Site
Julien Damon's insight:

A mon avis, le point important est celui-là : 

" Regarding the HDFS files, rmr2 supports different formats such as “csv” and “json”. However, in order to avoid any drawback, the best choice is to convert all the files into the “native” format. For instance, the csv format does not have any key, so it uses the first column of the table as the key and it's necessary to be careful in writing the algorithms. "

more...
No comment yet.
Scooped by Julien Damon
Scoop.it!

Plotting principal component analysis with ggplot #rstats

Plotting principal component analysis with ggplot #rstats | Mon Accueil | Scoop.it
(This article was first published on Strenge Jacke! » R, and kindly contributed to R-bloggers)
This script was almost written on parallel to the sjPlotCorr script because it uses a very similar ggplot-base.
Julien Damon's insight:

Une autre façon de voir une ACP ^^

more...
No comment yet.