Exploration de données
1.7K views | +0 today
Follow
Exploration de données
Veille autour de l'exploration de données
Curated by cyberlabe
Your new post is loading...
Your new post is loading...
Scooped by cyberlabe
Scoop.it!

Lancement de l'Observatoire des usages du big data

Lancement de l'Observatoire des usages du big data | Exploration de données | Scoop.it
ObservatoireBigData.fr se propose d'évangéliser sur les usages et l'impact du big data dans les organisations à travers une étude approfondie, une veille quotidienne, ainsi qu'un point sur les formations à disposition des futurs professionnels.
more...
No comment yet.
Scooped by cyberlabe
Scoop.it!

Quand Twitter et Foursquare permettent de prévoir la gentrification d'un quartier

Quand Twitter et Foursquare permettent de prévoir la gentrification d'un quartier | Exploration de données | Scoop.it
Des check-ins Foursquare aux localisations des tweets, des chercheurs proposent d’utiliser les données issues des réseaux sociaux pour anticiper les vagues de gentrification. En effet, ce laboratoire de l’Université de Cambridge propose une méthode qu’ils ont appliquée pour Londres, mêlant plus d’un demi million de tweets et check-ins, à des données comme la criminalité, le recensement et les évolutions du marché du logement. Ainsi, le groupe a pu déterminer en dix mois les futurs quartiers de la hype londonnienne. Après collecte et analyse des données, il apparaît que les quartiers les plus hétérogènes socialement et qui sont assidûment fréquentés par des utilisateurs de Twitter sont les plus enclins à subir une vague de gentrification. Grossièrement, selon le dicton urbain, savoir où les hipsters se géolocalisent permet de connaître les lieux de la hype, before they are cool.
more...
No comment yet.
Scooped by cyberlabe
Scoop.it!

Vers l’intelligence artificielle généraliste

Vers l’intelligence artificielle généraliste | Exploration de données | Scoop.it
(...) De manière alternative, les approches génériques visent à jouer intelligemment à une grande variété de jeux, sans expertise ni technologie dédiée à un jeu particulier. Dans ce cadre, le General Game Playing (GGP)1 consiste à développer des algorithmes qui, juste après avoir reçu les règles d’un nouveau jeu, sont capables de jouer correctement à ce jeu sans aucune intervention humaine. Les règles du jeu sont décrites dans un langage logique, appelé Game Description Language (GDL). Les approches génériques recourent elles aussi à des méthodes basées sur l’exploration et la réduction de l’arbre des séquences d’actions possibles, mais elles s’appuient également sur d’autres techniques générales d’apprentissage et de planification utilisées en IA.
more...
No comment yet.
Scooped by cyberlabe
Scoop.it!

Avec Playground, le créateur d'Android rêve d'intelligence artificielle

Avec Playground, le créateur d'Android rêve d'intelligence artificielle | Exploration de données | Scoop.it
d’après Rubin, pour créer une intelligence artificielle efficace, il faut récolter des données dans le monde réel. Pour le père d’Android, le meilleur moyen pour éduquer les IA sur le monde réel est de leur donner accès aux capteurs présents dans de plus en plus d’appareils, qui capturent des sons, des images, des mouvements ou encore des données météorologiques.

Il a également confié au magazine qu’il travaille actuellement sur une dashcam, un type de caméra utilisée notamment en voiture pour garder une trace vidéo d’un trajet en cas d’accident. La dashcam de Rubin serait différente puisqu’elle devrait être portée directement sur soi et enregistrerait le monde autour de son utilisateur (quelqu’un a dit « Google Glass » ?). Il compte l’offrir gratuitement en échange d’un accès à ses données, qui pourront servir à créer une carte en temps réel du monde — un outil qu’on imagine inestimable pour l’apprentissage d’une intelligence artificielle.
more...
No comment yet.
Scooped by cyberlabe
Scoop.it!

Comment rater son projet big data en 10 leçons

Comment rater son projet big data en 10 leçons | Exploration de données | Scoop.it
Si vous croyez que le "big data", et la "data science" en particulier, relève de la magie et est l'affaire de magiciens compétents en mathématique, informatique, visualisation, métier … Lisez ces lignes. Si vous n'y croyez pas... Lisez les aussi.
more...
No comment yet.
Scooped by cyberlabe
Scoop.it!

Intelligence artificielle : Google a battu un champion humain au jeu de go

Intelligence artificielle : Google a battu un champion humain au jeu de go | Exploration de données | Scoop.it
C’est une nouvelle frontière de franchie pour l’intelligence artificielle : vingt ans presque jour pour jour après le premier match entre l’ordinateur Deep Blue d’IBM et le champion du monde d’échecs Garry Kasparov (lire ci-dessous), le groupe américain Google vient d’annoncer qu’un système conçu par une de ses filiales, DeepMind, avait réussi à battre un joueur professionnel de go. L’exploit, réalisé dans le plus grand secret au mois d’octobre 2015, fait la une du dernier numéro de la revue « Nature », publié ce jeudi. Lors de la rencontre, le système d’intelligence artificielle conçu par DeepMind, baptisé AlphaGo, a battu par cinq victoires à zéro un professionnel de 35 ans, Fan Hui, considéré comme le meilleur joueur de go d'Europe.
more...
No comment yet.
Scooped by cyberlabe
Scoop.it!

The Amazing Ways Uber Is Using Big Data

The Amazing Ways Uber Is Using Big Data | Exploration de données | Scoop.it
Uber’s entire business model is based on the very Big Data principle of crowd sourcing. Anyone with a car who is willing to help someone get to where they want to go can offer to help get them there.

Uber holds a vast database of drivers in all of the cities it covers, so when a passenger asks for a ride, they can instantly match you with the most suitable drivers.

Fares are calculated automatically, using GPS, street data and the company’s own algorithms which make adjustments based on the time that the journey is likely to take. This is a crucial difference from regular taxi services because customers are charged for the time the journey takes, not the distance covered.
more...
No comment yet.
Rescooped by cyberlabe from Réseaux sociaux et numériques
Scoop.it!

Metadata Investigation : Inside Hacking Team

Metadata Investigation : Inside Hacking Team | Exploration de données | Scoop.it
There is an ongoing debate over the significance of metadata. We wanted to question а somewhat heretical argument that bulk metadata contain sensitive information about private life of internet users and confront it with a ruling opinion that such statement is overrated. We have therefore undertaken the following social and scientific experiment using different methodologies. The purpose of this research is to investigate and consequently inform the scientific and popular audience about the real importance of metadata for our privacy.
more...
No comment yet.
Scooped by cyberlabe
Scoop.it!

Musimap, la start-up belge qui va faire valser la Silicon Valley

Musimap, la start-up belge qui va faire valser la Silicon Valley | Exploration de données | Scoop.it
Musimap émule les interactions complexes que le cerveau et le corps humain entretiennent avec la musique. Notre algorithme est sensible aux émotions et en cela il ressent, raisonne et répond à la musique tels que les humains le font. Nous avons développé une technologique cognitive informatique ancrée dans une approche socio-psychologique et musicologique, par opposition à une simple extraction de données ou à une approche limitée à l’analyse de signaux électroacoustiques. En fait, pour décoder l’ADN de la musique, il est nécessaire de prendre en considération l’ensemble de la palette des émotions humaines, ce que nous avons fini par faire en utilisant 390 humeurs complexes, bien au-delà des 5 ou 6 humeurs que la plupart des technologies d’analyse de signal arrivent à proposer. Il est nécessaire aussi de comprendre l’état d’esprit de chaque auditeur dans son environnement particulier. Nous travaillons avec plus de 100 situations d’écoute afin de réaliser cela. En d’autres termes, il est nécessaire de remettre des critères émanant des sciences moles dans l’équation afin d’effectuer une recommandation musicale sensible aux émotions et au conexte individuel et ainsi, de relever le défi complexe de la découverte musicale.
more...
No comment yet.
Scooped by cyberlabe
Scoop.it!

La tour de guet des algorithmes - New Inquiry

La forme de pouvoir des Big Data n’est pas panoptique, mais pan-analytique, estime le philosophe Colin Koopman pour le New Inquiry. Dans un panoptique, les détenus sont disposés autour d’une tour de guet centrale qui fait comprendre sa surveillance en étant visible en permanence. Une prise de conscience qui vise à discipliner les prisonniers devenant leurs propres gardiens. Mais la surveillance des algorithmes et des données des gouvernements et entreprises ne procède pas du même mécanisme : ils fonctionnent via l’invisibilité. La tour de guet est invisible. En ce sens, nous ne devenons pas les sujets de nos données, puisque nous ne sommes pas vraiment confrontés à ce qu’elles disent de nous.
more...
No comment yet.
Scooped by cyberlabe
Scoop.it!

Uber Goes Unconventional: Using Driver Phones as a Backup Datacenter - High Scalability -

Uber Goes Unconventional: Using Driver Phones as a Backup Datacenter - High Scalability - | Exploration de données | Scoop.it

In How Uber Scales Their Real-Time Market Platform one of the most intriguing hints was how Uber handles datacenter failovers using driver phones as an external distributed storage system for recovery.

Rather than use a traditional backend replication scheme where databases sync state between datacenters to achieve a measure of k-safety, Uber did something different, what they do is store enough state on driver phones so that if a datacenter failover occurs trip information can not be lost on the failover.

more...
No comment yet.
Scooped by cyberlabe
Scoop.it!

Ngram, un bon outil pour les Sciences Humaines ?

Ngram, un bon outil pour les Sciences Humaines ? | Exploration de données | Scoop.it

Une récente étude parue dans PLosOne jette un doute sur l’efficacité du procédé, remarquée par le blog du “neuroskeptic” dans Discover Magazine ainsi que par Wired. En effet, pour s’assurer de la pertinence d’une tendance, il faut être certain que le corpus sur lequel s’effectue la recherche est bien équilibré. Or ce ne serait pas le cas. Les textes techniques seraient surreprésentés dans les décennies récentes.

more...
No comment yet.
Scooped by cyberlabe
Scoop.it!

La Banque dans une ville qui change

La banque jouit d’un avantage dans la connaissance d'une partie des déplacements de ses clients : par les écritures bancaires passées avec les cartes de paiement et demain avec le paiement sans contact, elle connait les lieux et horaires de transaction et donc la finalité d’une partie de leurs déplacements (achats, travail, loisirs…) que les autres acteurs observent sans forcément comprendre ou relier. Dès lors, sous respect de la législation, variable d’un pays à un autre, il devient tout d'abord possible de passer des partenariats avec différentes enseignes et d’échanger la connaissance client acquise contre des programmes de fidélité rétrocédés sous forme de coupons ou de réductions… Ceci correspond aux pratiques actuelles de ciblage de plus en plus poussées (géomarketing) à la différence fondamentale près que la Banque a une vue complète des écritures de chacun.

Mais, il y a plus. Si on change de niveau d'analyse et d’ordre de grandeur de la puissance de calcul utilisée, lorsqu’on agrège les millions d’écritures bancaires, on voit apparaître la vie économique d’une ville, comme lorsqu’on agrège sur Waze les données de transport de tous les individus. Il se dessine alors une toute nouvelle vision de la ville pouvant être adossée à une panoplie de services qui ne sont pas tant destinés à ses habitants qu’à ses élus ou aux entreprises implantées sur son territoire. En effet, la banque en tant qu’intermédiaire financier peut devenir un observatoire privilégié de l’ensemble des transactions, apprécier les rapports de force entre acteurs marchands et fournir à chacun une carte de son environnement. De là, appréciant mieux sa zone de chalandise, une enseigne peut adapter sa publicité dans la ville, son fléchage et donc commencer à modifier les flux urbains…

more...
No comment yet.
Scooped by cyberlabe
Scoop.it!

L'intelligence géolocalisée, nouvelle discipline de l'intelligence économique

L'intelligence géolocalisée, nouvelle discipline de l'intelligence économique | Exploration de données | Scoop.it
(...) Leurs informations permettent à Foursquare et Swarm de se constituer une base de données géolocalisées remarquable sur les comportements des consommateurs, ce que Jeff Glueck qualifie d’intelligence géolocalisée, une forme d’intelligence économique rendue possible par la généralisation de l’usage du smartphone. (...) Foursquare propose ses données aux marques du retail et aux analystes de marché dans un outil dénommé Place Insights. Son offre illustre le développement de nouveaux types de données, grâce à la révolution numérique et à la multiplication des senseurs, au service des entreprises et investisseurs.
more...
No comment yet.
Scooped by cyberlabe
Scoop.it!

This fake Rembrandt was created by an algorithm

This fake Rembrandt was created by an algorithm | Exploration de données | Scoop.it
"The work was created by teams from Dutch museums Mauritshuis and Rembranthuis, alongside Microsoft, ING and the Delft University of Technology. Creating a faithful replication of a Rembrandt painting required huge amounts of data, with the team describing it was a "marriage" between technology and art. (...)
With the help of several art experts, 346 Rembrandt paintings – digitised using 3D scans – were analysed by a deep learning algorithm. The algorithm isolated common Rembrandt subjects to create the "most consistent subject" – a white, middle aged man with facial hair, "wearing black clothes with a white collar and a hat". "

more...
No comment yet.
Scooped by cyberlabe
Scoop.it!

Surge pricing – plus que le marché, moins que la subordination, un dispositif

Surge pricing – plus que le marché, moins que la subordination, un dispositif | Exploration de données | Scoop.it
(28 janvier, Paris) Les taxis sont en grève mais pas les algorithmes de Uber qui hier ont travaillé dur! Nous parlons du Surge Pricing qui est au taxi ce que le Yield management est aux compagnies aériennes. Un mécanisme qui analyse l’offre et la demande de manière très locale et la régule en variant les prix localement et temporairement. C’est la vertu du big data, et un exemple très concret d’application, son originalité est sa vitesse d’exécution et la granularité.
more...
No comment yet.
Scooped by cyberlabe
Scoop.it!

Food tech : Handpick repense la façon de faire ses courses

Food tech : Handpick repense la façon de faire ses courses | Exploration de données | Scoop.it

La start-up californienne Handpick s’est fait connaître par sa capacité à analyser les données dans le domaine de l’alimentaire. Surfant sur la vague du « food porn » ou de « foodographie », où des millions d’internautes « partagent » leur repas, Handpick aspire et analyse un milliard de publications en provenance des réseaux sociaux pour comprendre ce que les gens aiment manger, à quel moment, dans quelles régions géographiques, etc.

Cette force d’analyse leur a permis d’utiliser ces informations pour composer des repas en kit qui correspondent à ces attentes identifiées. Toujours en s’aidant des données disponible sur l’internet, en l’occurrence deux millions de recettes provenant de blogs et sites, Handpick a essayé de composer le triangle magique de la nourriture : quels ingrédients, pour quelle recette et pour quelle typologie de consommateurs.

more...
No comment yet.
Scooped by cyberlabe
Scoop.it!

Ceci est le futur de l'investissement... et probablement hors de votre portée

Ceci est le futur de l'investissement... et probablement hors de votre portée | Exploration de données | Scoop.it

Les données alternatives renvoient à tout ce qui est brut ou non structuré et elles se distinguent des archives de l'entreprise, des historiques de prix du marché ou des présentations d'investisseurs.

Le secteur d'activités a vu le jour au milieu d'une explosion des données disponibles lors des dix dernières années, en recueillant tout, des données mobiles aux offres d'emploi, en passant par les données de circulation.

"Il existe un catégorie entière de données émergentes, et cela provient du déploiement de millions de capteurs dans le monde entier à l'initiative des gouvernements, des entreprises ou des consommateurs", explique Adam Broun, directeur des opérations de Kensho, une start-up de la filière soutenue par Goldman Sachs.

 

 

more...
No comment yet.
Scooped by cyberlabe
Scoop.it!

Uber utilise les données du smartphone pour identifier les mauvais conducteurs

Uber utilise les données du smartphone pour identifier les mauvais conducteurs | Exploration de données | Scoop.it

Dans une note de blog, le service de véhicule avec chauffeur estime que si la communication est essentielle, aussi bien avec le conducteur qu'avec le client, lorsque la situation s'avère conflictuelle, « la technologie peut aider à révéler la vérité. »
C'est pour cette raison qu'Uber explique avoir mis en place « un programme pilote permettant de vérifier les évaluations à l'aide des technologies mobiles. Les gyroscopes dans les téléphones peuvent capter les petits mouvements, tandis que les GPS et accéléromètres montrent combien de fois un véhicule démarre et s'arrête, ainsi que sa vitesse. »
Uber cherche à récupérer toutes ces données, de sorte à pouvoir les analyser concrètement en cas de conflit entre le conducteur et le passager, ou même l'inverse : « Si les évaluations sont exactes, nous pouvons entrer en contact avec le conducteur. Si au contraire elles ne le sont pas, nous pouvons nous assurer que le classement d'un chauffeur ne sera pas affecté. »

more...
No comment yet.
Scooped by cyberlabe
Scoop.it!

L’exploitation intelligente du Big Data ouvre l’ère de la société prédictive

L’exploitation intelligente du Big Data ouvre l’ère de la société prédictive | Exploration de données | Scoop.it
Certaines ruptures technologiques sont particulièrement visibles et frappent les esprits : c’est par exemple le cas pour les tablettes numériques, les voitures électriques ou encore de l'éclairage par LED. Mais certaines révolutions techniques se déroulent sous nos yeux sans que nous en soyons vraiment conscients : tel est le cas des « Données massives » (Big Data).
more...
No comment yet.
Scooped by cyberlabe
Scoop.it!

Lire, écouter, regarder et jouer en ligne à l’heure de la personnalisation : découvrez le nouveau cahier IP - CNIL - Commission nationale de l'informatique et des libertés

Lire, écouter, regarder et jouer en ligne à l’heure de la personnalisation : découvrez le nouveau cahier IP - CNIL - Commission nationale de l'informatique et des libertés | Exploration de données | Scoop.it

Indispensables pour naviguer dans l’immensité des catalogues de contenus, les algorithmes peuvent tout autant favoriser la découverte qu’enfermer les individus dans des goûts stéréotypés ou des horizons limités. Le 3ème cahier IP explore cette utilisation intensive des données personnelles au travers de tendances clefs et émergentes, d’interviews d’experts (Nicolas Curien, Eric Schérer, Olivier Ertzscheid, Dominique Cardon, Antonio Casilli) et de scénarios exploratoires.

 

 

more...
No comment yet.
Scooped by cyberlabe
Scoop.it!

De la diversité des Big Data - SSRN

De la diversité des Big Data - SSRN | Exploration de données | Scoop.it
Rob Kitchin et Gavin McArdle dans un article de recherche soulignent que les Big Data sont définies de multiples manières dans la littérature. La plupart du temps, elles sont définies par les 3 V : volume, vitesse et variété. Mais on trouve parfois de nombreuses autres caractéristiques comme l’exhaustivité, la résolution, l’indexicalité, la relationalité, l’évolutivité, l’extensionnalité… Reste que le terme manque finalement de clarté et a tendance à être un fourre-tout pour désigner toute large sélection de données.

Les deux chercheurs s’intéressent donc dans leur article à ce qui rend les Big Data des Big Data. En s’intéressant à des jeux de données, ils montrent que des 7 caractéristiques principales (le volume, la vélocité, la variété, l’exhaustivité, la résolution et l’indexabilité, la relationalité, l’extensionalité et la scalabilité), très peu de jeux de données possèdent l’ensemble de ces caractéristiques. En fait, le champ des Big data recouvre une grande variété de formes, et les caractéristiques les plus partagées sont la vitesse et l’exhaustivité.
more...
No comment yet.
Scooped by cyberlabe
Scoop.it!

Quel monde construisons-nous ?

“Nous entrons dans un monde de prédiction. Un monde où de plus en plus de gens vont être en mesure de porter des jugements sur les autres sur la base de données.” De nombreux militants s’activent à combattre et réguler ce nouvel écosystème de la prédiction. C’est très bien quand ces technologies sont conçues pour faire le mal. Mais le plus souvent ces outils seront conçus pour être utiles, pour accroître l’efficacité, pour identifier les personnes qui ont besoin d’aide. Ils pourront être à la fois utilisé pour faire le bien et pour être terrifiants. Comment pouvons-nous apprendre à utiliser ces informations pour responsabiliser ?

Pour danah boyd, le problème est que la diversité des gens qui construisent, financent et utilisent ces outils pour imaginer notre avenir est extraordinairement réduite. Pour elle, l’enjeu est d’élargir la diversité d’approche du développement comme de l’usage de ces technologies. “Si les gens ne comprennent pas ce que ces systèmes font, comment pouvons-nous espérer que les gens les contestent ?”
more...
No comment yet.
Scooped by cyberlabe
Scoop.it!

Un robot journaliste qui est gratuit

Un robot journaliste qui est gratuit | Exploration de données | Scoop.it
En premier lieu, vous devez fournir des données sous forme de Templates. Par exemple, des ventes trimestrielles avec chaque champs qu’on peut transformer en variable. Wordsmith prend ces données et les structure pour qu’elles soient lisible en simple texte.

L’accès est disponible gratuitement en bêta, mais il faudra avoir suffisamment de données pour que ce robot journaliste soit efficace. Quoi qu’il en soit, les rédacteurs web et les journalistes humains ont encore de beaux jours devant eux.
more...
No comment yet.
Scooped by cyberlabe
Scoop.it!

Science et statistique : errare humanun est

Science et statistique : errare humanun est | Exploration de données | Scoop.it

(...) Pour bien nous faire comprendre le problème, elle rapporte une recherche menée par Brian Nosek, un des fondateurs du Centre pour l’Open Science, consistant à donner à plusieurs équipes scientifiques un jeu de données identiques. Le jeu de données devait permettre de savoir si les arbitres de football donnaient plus de cartons rouges aux joueurs à la peau sombre qu’aux joueurs à la peau claire. 29 équipes de chercheurs ont joué avec ces données utilisant plusieurs méthodes d’analyses. 20 équipes ont conclu que les arbitres de football ont donné plus de cartons rouges aux joueurs à la peau foncée et 9 équipes n’ont trouvé aucune relation significative entre la couleur de la peau et les cartons rouges.

Ces résultats montrent surtout que les choix subjectifs faits par les équipes ont une importance capitale dans le traitement de données. Pour Christie Aschwanden, cela montre aussi combien une seule analyse ne suffit pas pour trouver un résultat définitif. Chaque résultat est une vérité temporaire. Mais ce qui rend la science si puissante est sa capacité d’auto-correction. Si de fausses conclusions sont publiées, de nouvelles études viendront les remettre en cause…

more...
No comment yet.