Your new post is loading...
Your new post is loading...
Les services de renseignement américains n’ont plus accès aux services de Dataminr, qui fournit des services d’analyse des données de Twitter, selon plusieurs sources anonymes citées par le Wall Street Journal.
Dataminr est la seule entreprise à laquelle Twitter donne la possibilité d’analyser l’intégralité des tweets postés sur le réseau social en temps réel. Ce dernier a décidé de restreindre l’accès à ses données et d’empêcher l’entreprise de fournir cette prestation aux services de renseignement. Datamnir pourra cependant continuer à travailler avec les médias ou les entreprises du secteur financier.
Le journal Le Monde publie une tribune de 75 personnalités issues de la science, du numérique et de la culture soutenant la libre diffusion de la culture et des savoirs. Ils plaident pour une définition positive du domaine public dans le projet de loi sur le numérique et souhaitent sécuriser les nouvelles pratiques en matière de recherche.
Affiner les politiques publiques en fonction des besoins des Pékinois : un véritable casse-tête pour les autorités chinoises, qui se penchent désormais sur l’exploitation des données de transport. Le principe ? Suivre de près l’utilisation des lignes de métro et bus pour cibler les zones urbaines les plus pauvres… Et leur consacrer des programmes sociaux adaptés. New Scientist analyse le phénomène.
Les opportunités offertes par le Text et le Datamining (TDM) réalisés tous deux aujourd’hui à grande échelle seraient-elles freinées par des considérations juridiques en Europe ? Ces usages doivent-ils relever d’une exception au droit d’auteur ou faire l’objet de négociations contractuelles avec ceux qui disposent des droits sur les œuvres et les données ?
Le collectif SavoirsCom1 tient à saluer la prise de position commune de l’ADBU et du consortium Couperin relative au text and data mining (TDM), suite à leur audition par le Conseil supérieur de la propriété littéraire et artistique (CSPLA). Le consortium et l’association mettent en garde contre les menaces que fait encourir à la recherche la voie contractuelle. Celle-ci s’avère inadaptée aux pratiques des chercheurs et comporte des dispositions susceptibles de porter atteinte à leur indépendance. Certaines clauses sont synonymes de limitation de la portée de l’exception de courte citation et de restriction des conditions de réutilisation des données de la recherche. Enfin, la voie contractuelle est la porte ouverte à la constitution d’un nouveau marché de services basé sur la fourniture d’extractions de données, marché sur lequel les éditeurs garderaient la haute main. Couperin et l’ADBU montrent bien comment le droit à l’exploration des données scientifiques est indissociable du droit de lire et comment les pratiques de TDM ne télescopent pas mais neutralisent la revendication de droits de propriété intellectuelle liés aux bases de données.
Le selfie, le diminutif d’auto-portrait en anglais self-portrait est devenu à la mode depuis l’arrivée des réseaux sociaux et surtout d’instagram. Le selfie consiste donc à se prendre en photo et d’ajouter optionnellement le hashtag #selfie à la photo. Je ne coupe pas à la mode, et j’envoie régulièrement sur mon compte instagram thierryroget des petits selfies.
L'accumulation de toutes sortes de données, open ou big data, pourrait faire croire à une source de connaissance en soi. Mais il n'en est rien : les données ne sont jamais neutres.
Si la pratique n'est pas encore démontrée, le personnal pricing (ou tarif personnalisé) deviendrait le nouveau phénomène du e-commerce : la collecte de nos informations personnelles permettrait de nous proposer des rabais… Ou au contraire des prix plus élevés !
Selon Joe Macri, vice-président d’AMD, les interfaces naturelles et l’informatique contextuelle définiront la prochaine génération d’appareils connectés. De passage à Montréal dans le cadre de l’International Conference on Computer Design, ce dernier a donné ce matin une conférence sur le « surround computing », un terme créé par AMD pour décrire cette nouvelle réalité.
Decideo Introduction de la 7ème édition de l'Université d'été GS1 : Big Data ...Decideo... des interrogations pour la protection de la vie privée du consommateur.
Le QG démocrate a son Big BrotherleJDD.frLe QG démocrate a son Big Brother. "En 2008, on avait deux campagnes parallèles, le Web et le porte-à-porte.
SERIE D'ETE #1 - Vie privée, données personnelles... Internet nous espionne. Premier volet de notre enquête sur les mythes et fantasmes du web.
|
Le "QQOQCCP" du data mining : telle est la méthode proposée par Philippe Nanopoulos, de Base Plus, afin d'appréhender tous les enjeux de l'extraction des données. Le 'QQOQCCP' du data mining : telle est la méthode proposée par Philippe Nanopoulos, de Base Plus, afin d'appréhender tous les enjeux de l'extraction des données.
Un article scientifique a été publié le 7 juin dernier qui démontre pour la première fois que les pratiques de Text et Data Mining (exploration de données) sont moins développées dans les pays où le niveau de protection par le droit d’auteur est le plus élevé et ne prévoit pas de mécanisme spécifique pour les sécuriser. Ecrit par Christian Handke, Lucie Guibault et Joan-Jospeh Vallbé, cet article s’intitule : « Is Europe Falling Behind Text et Data Mining : Copyright’s Impact On Data Mining In Academic Research » et il est disponible en Open Access ici. Il a également fait l’objet d’une communication à laquelle j’ai pu assister lors du dernier congrès de la Ligue des bibliothèques européennes de recherche (LIBER) qui s’est tenu la semaine dernière à Londres.
Mardi dernier, l’ADBU et AEF organisaient une journée d’étude sur le thème « Quelle(s) stratégie(s) de recherche face à la nouvelle massification des données ?« . Dans ce contexte, on m’avait demandé de faire un point concernant l’évolution du cadre juridique des pratiques d’exploration de données (Text et Data Mining). Je poste ci-dessous ma présentation, qui étant donné le temps qui m’était imparti n’avait pas vocation à traiter le sujet en profondeur, mais à rappeler les points essentiels.
Après Elsevier et Gallica, voici un nouvel épisode de ma série sur le data mining. Cette fois-ci je m’attaque à L’industrie majeure du web, celle qui fait figure de métaphore de l’internet tout entier : Google. Ou, plus exactement, son service d’indexation bibliométrique des articles scientifiques, Google Scholar (même si les problématiques abordées ici sont largement applicables à l’ensemble de l’écosystème Google). Les techniques de data mining (ou extraction automatique des données en bon français) s’apparentent à autant de sympathiques secrétaires, prompts à assister le chercheur dans la moindre de ses tâches. Ils peuvent être employées dans des projets d’analyse classique portant sur un corpus proprement délimité (c’était l’objectif de ma petite application d’extraction des textes journalistiques hébergés sur Gallica, Pyllica). Ils ont aussi une vocation plus méta : permettre de saisir rapidement un champ de recherche en moissonnant les méta-données bibliographiques.
La Commission européenne a publié vendredi le rapport Triaille commandé au cabinet De Wolf & Partners, sur les conflits juridiques entre le droit d'auteur et les pratiques d'exploration de données (data mining). Le rapport confirme que le droit doit évoluer vers plus de flexibilité, avec l'ajout d'une nouvelle exception qui favoriserait l'innovation.
Licences for Europe [1], initiative prise en février 2013 par la Commission européenne pour trouver des solutions juridiques en matière de droit d’auteur, un groupe de travail sur le Text et le Data Mining pour la recherche scientifique créé dans ce cadre, une discussion bloquée dès la première réunion, le 4 février 2013, et une lettre ouverte [2] adressée à la Commission européenne, un rapport récent sur la situation au Royaume-Uni, il n’en fallait pas plus pour reprendre ce sujet, détaillé en novembre 2011 [3].
Faites-vous attention aux autorisations que vous délivrez aux applications que vous installez sur votre téléphone ou tablette Android ? Peut-être le devriez-vous. Notamment lorsque vous installez des jeux pour vos chers et tendres bambins.
iOS, le système mobile des iPhone et iPad, cache un identifiant publicitaire (IFA : Identifier For Advertising) : son rôle est de transmettre à des régies publicitaires nos habitudes de navigation web et de téléchargement d'applications. Comment désactiver cette collecte de données ?
Facebook sait probablement si vous êtes gay, ou célibataire (quand bien même vous ne l'ayez pas expressément précisé sur votre profil), et peut-être même si vous êtes infidèle, ou bien cocu(e). Google, de son côté, sait probablement si vous êtes enceinte, ménopausée, diabétique ou anorexique, si vous avez un cancer, ou allez bientôt être opéré... entre autres. Si c'est gratuit, c'est que vous êtes le produit !
Google ira fouiner dans vos vidéosLe Matin Online«Encore une fois, on a l'impression que l'utilisateur perd le contrôle sur ce qui est fait avec ses données, dénonce Nick Pickles, responsable confidentialité pour l'ONG Big Brother Watch, dans le...
Le livre prend sa revanche. Après des années à se faire dire par les esprits obtus qu’il était dangereux en raison de la diversité des idées transportées dans ses pages, le livre, dans sa version numérique, serait-il en train de le devenir vraiment en menaçant désormais non pas les adeptes de la vacuité qu’il a toujours effrayés, mais plutôt les lecteurs eux-mêmes ?
Mitt Romney est un gars heureux. Le candidat républicain à l’investiture suprême face à Barack Obama est plutôt du genre à récolter facilement des fonds pour sa campagne.
|