DataOps
30.0K views | +0 today
Follow
 
Scooped by Mickael Ruau
onto DataOps
Scoop.it!

Le paradoxe de Simpson

Le paradoxe de Simpson | DataOps | Scoop.it
Non, le paradoxe de Simpson ne tire pas son nom de Homer, mais de Edward Simpson, le statisticien qui l'a décrit pour la première fois en 1951. Il s'agit d'un de ces paradoxes mathématiques qui peu...
No comment yet.
DataOps
Data Engineering: databases, NoSQL, Big Data...
Curated by Mickael Ruau
Your new post is loading...
Your new post is loading...
Scooped by Mickael Ruau
Scoop.it!

Calculer l'âge d'une personne avec Excel - Blogs - Forum du club des développeurs et IT Pro

Calculer l'âge d'une personne avec Excel - Blogs - Forum du club des développeurs et IT Pro | DataOps | Scoop.it

Je me souviens d'une discussion sur le forum dans laquelle il était question d'âge. Les réponses farfelues d'un des membres m'avaient quelque peu irritées, puisqu'il partait de l'idée qu'il suffisait de diviser le nombre de jours entre la date de calcul et la date de naissance par 365 pour trouver la date. De plus, il arrondissait pour avoir une année entière. Du coup, à 47.5 ans, on passait
No comment yet.
Scooped by Mickael Ruau
Scoop.it!

Les petits papiers de SQLPro - Métadonnées

Les petits papiers de SQLPro - Métadonnées | DataOps | Scoop.it
La technique des métadonnées est pertinente pour laisser toute liberté aux utilisateurs de rajouter autant de rubriques de données qu'ils le souhaitent sans jamais de crainte quant à leur volume ni leur facilité d'interrogation. Et tout cela sans jamais modifier l'architecture de la base de données…
No comment yet.
Scooped by Mickael Ruau
Scoop.it!

PlanetScale, un outil qui permet de déployer une base de données cloud, entièrement gérée avec MySQL MySQL 8.0

PlanetScale, un outil qui permet de déployer une base de données cloud, entièrement gérée avec MySQL MySQL 8.0 | DataOps | Scoop.it


PlanetScale propose deux types de branches de bases de données : développement et production. Les branches de développement fournissent des copies isolées du schéma de la base de données sur lesquelles l’utilisateur peut apporter des modifications, faire des expériences ou exécuter des tests d'intégrité. Les branches de développement fournissent des copies isolées du schéma de votre base de données dans lesquelles vous pouvez effectuer des changements, faire des expériences ou exécuter le CI.

Les branches de production sont des bases de données hautement disponibles destinées au trafic de production. Elles sont protégées par défaut contre les modifications directes de schéma et incluent des sauvegardes quotidiennes automatisées. PlanetScale permet de ramifier les schémas de bases de données de la même façon qu’un code peut être ramifié.
No comment yet.
Rescooped by Mickael Ruau from #CyberSecurity #CyberSécurité #Security #Sécurité #InfoSec #CyberDefence #GDPR #RGPD #DevOps #DevSecOps #SecDevOps
Scoop.it!

#CyberSécurité, #RGPD, #HDS: La #CNIL adopte un #référentiel sur les entrepôts de #données de #santé

#CyberSécurité, #RGPD, #HDS: La #CNIL adopte un #référentiel sur les entrepôts de #données de #santé | DataOps | Scoop.it
Les entrepôts de données de santé sont des bases de données destinées à être utilisées notamment à des fins de recherches, d’études ou d’évaluations dans le domaine de la santé. Ces traitements peuvent être soumis à l’autorisation de la CNIL. Afin de simplifier les démarches pour les responsables de ces bases de données sensibles, tout en fournissant un encadrement juridique et technique rigoureux, la CNIL a lancé le 8 mars 2021 une consultation publique concernant un projet de référentiel.

Via Frederic GOUTH
No comment yet.
Scooped by Mickael Ruau
Scoop.it!

Apprendre à optimiser les performances de MySQL

Apprendre à optimiser les performances de MySQL | DataOps | Scoop.it
Les bases de données SQL et plus particulièrement MySQL restent une des pierres angulaires de l'immense majorité des sites Internet. MySQL fonctionne très bien out of the box, cependant, dès que la base se trouve assez sollicitée, on s'aperçoit que les réglages par défaut méritent une petite optimisation. Jetons un œil à tout ça !

Récemment, un des serveurs de Peerus commençait à avoir de sacrés pics de chargement (load) lors des heures de forte charge, avec MySQL pour principal responsable. Une grosse centaine de connexions simultanées et quelques dizaines de requêtes par seconde sur des bases de plusieurs dizaines de giga-octets. C'est un peu plus que le WordPress moyen, mais rien d'ingérable pour un MySQL bien réglé.

Dès lors, avant d'imaginer prendre un serveur plus puissant, sharder (partitionnement horizontal) les tables ou je ne sais quoi encore, il faut tirer le maximum de notre cher SGBDR.

Nous nous concentrerons ici sur le moteur InnoDB, lequel tend à supplanter MyISAM. Cependant, ce n'est pas la réponse magique à tous les types d'usages. Par ailleurs, même si nous parlons de MySQL, c'est avec son fork MariaDB que j'ai l'habitude de travailler depuis quelques années. Vu le peu de soin qu'Oracle apporte au développement de MySQL, Maria est même devenu la variante MySQL par défaut dans Debian.
No comment yet.
Scooped by Mickael Ruau
Scoop.it!

MangoDB : une véritable alternative Open Source à MongoDB, un proxy open source, qui convertit les requêtes du protocole filaire de MongoDB en SQL

MangoDB : une véritable alternative Open Source à MongoDB, un proxy open source, qui convertit les requêtes du protocole filaire de MongoDB en SQL | DataOps | Scoop.it
MongoDB est une technologie qui change la vie de nombreux développeurs, leur permettant de créer des applications plus rapidement qu'avec des bases de données relationnelles. Cependant, MongoDB a abandonné ses racines Open Source, en changeant la licence en SSPL, ce qui le rend inutilisable pour...
No comment yet.
Scooped by Mickael Ruau
Scoop.it!

How to Think Like a Computer Scientist: Learning with Python

How to Think Like a Computer Scientist: Learning with Python | DataOps | Scoop.it
Table of Contents

1 The way of the program
2 Variables, expressions and statements
3 Functions
4 Conditionals and recursion
5 Fruitful functions
6 Iteration
7 Strings
8 Lists
9 Tuples
10 Dictionaries
11 Files and exceptions
12 Classes and objects
13 Classes and functions
14 Classes and methods
15 Sets of objects
16 Inheritance
17 Linked lists
18 Stacks
19 Queues
20 Trees
Appendix A: Debugging
Appendix B: Creating a new data type
Appendix C: Recommendations for further reading Index
No comment yet.
Scooped by Mickael Ruau
Scoop.it!

The Crystal Ball Instruction Manual - version 1.1 Volume One: Introduction to Data Science

The Crystal Ball Instruction Manual - version 1.1 Volume One: Introduction to Data Science | DataOps | Scoop.it
A perfect introduction to the exploding field of Data Science for the curious, first-time student. The author brings his trademark conversational tone to the important pillars of the discipline: exploratory data analysis, choices for structuring data, causality, machine learning principles, and introductory Python programming using open-source Jupyter Notebooks. This engaging read will allow any dedicated learner to build the skills necessary to contribute to the Data Science revolution, regardless of background.
Mickael Ruau's insight:

Table of Contents

  • 1 Introduction 
  • 2 A trip to Jupyter 
  • 3 Three kinds of atomic data 
  • 4 Memory pictures 
  • 5 Calculations 
  • 6 Scales of measure 
  • 7 Three kinds of aggregate data
  • 8 Arrays in Python (1 of 2) 
  • 9 Arrays in Python (2 of 2) 
  • 10 Interpreting Data 
  • 11 Assoc. arrays in Python (1 of 3) 
  • 12 Assoc. arrays in Python (2 of 3) 
  • 13 Assoc. arrays in Python (3 of 3) 
  • 14 Loops 
  • 15 EDA: univariate 
  • 16 Tables in Python (1 of 3) 
  • 17 Tables in Python (2 of 3) 
  • 18 Tables in Python (3 of 3) 
  • 19 EDA: bivariate (1 of 2) 
  • 20 EDA: bivariate (2 of 2) 
  • 21 Branching 
  • 22 Functions (1 of 2) 
  • 23 Functions (2 of 2) 
  • 24 Recoding and transforming 
  • 25 Machine Learning: concepts 
  • 26 Classification: concepts 
  • 27 Decision trees (1 of 2) 
  • 28 Decision trees (2 of 2) 
  • 29 Evaluating a classifier 
No comment yet.
Scooped by Mickael Ruau
Scoop.it!

EBCDIC, le mode de codage des caractères sur 8 bits créé par IBM à l'époque des cartes perforées, est incompatible avec le GDPR

EBCDIC, le mode de codage des caractères sur 8 bits créé par IBM à l'époque des cartes perforées, est incompatible avec le GDPR | DataOps | Scoop.it

La cour d'appel de Bruxelles a rendu un arrêt intéressant. Un client s'est plaint que sa banque orthographiait mal son nom. La banque n'avait pas de support pour les signes diacritiques. Des signes comme á, è, ô, ü, ç, etc. Ces accents sont courants dans de nombreuses langues. Il était donc un peu surprenant que la banque ne les prenne pas en charge. La banque ayant refusé d'orthographier correctement le nom de son client, ce dernier a déposé une plainte au titre du RGPD en vertu de la loi sur la protection des données.

Mickael Ruau's insight:

L'orthographe correcte du nom d'une personne est une donnée à caractère personnel conformément à l'article 4, paragraphe 1, du RGPD. Le client d’une banque de Belgique a demandé sur la base de l'article 16 du RGPD, d'écrire son nom avec les diacritiques appropriés. La banque a fait valoir que cela n'était pas possible avec ses systèmes informatiques actuels et ne pouvait donc pas répondre à la demande. En réponse, le client a déposé une plainte auprès de l'autorité belge de protection des données.

La personne concernée a le droit d'obtenir du responsable du traitement, sans retard injustifié, la rectification des données à caractère personnel inexactes la concernant. 2Tenant compte des finalités du traitement, la personne concernée a le droit de faire compléter des données à caractère personnel incomplètes, y compris en fournissant une déclaration complémentaire.

La Chambre des Litiges a jugé le 15 mai 2019 que l'argument de la Banque concernant l'impossibilité technique n'était pas suffisant. La chambre du contentieux a jugé que la Banque devait se conformer à la demande du client Y.

No comment yet.
Scooped by Mickael Ruau
Scoop.it!

Hyperlambda is twice as fast as Entity Framework - DZone Performance

Hyperlambda is twice as fast as Entity Framework - DZone Performance | DataOps | Scoop.it
O/RM design patterns are fundamentally incompatible with RDBM systems. Simply for no other reasons than what is considered "best practices" when it comes to architecture and design of complex systems, where we have been taught for decades that we're supposed to centre our designs around an "OO model", also when we are creating our database access layers. Combine this with the clumsy attempts from Entity Framework and other O/RM libraries of trying to make a statically typed programming language feature dynamic and automatic tracking of changes done to objects, for then to "save" your objects to your database, and you've got the recipe for disaster. This isn't really as much Entity Framework's fault, but rather a fundamental incompatibility with your RDBMS and your OO model.
Mickael Ruau's insight:

 

In addition to the performance differences illustrated in the above video, the typical O/RM project also adds AutoMapper to the spaghetti sauce, resulting in that the whole reason you used a strongly typed programming language in the first place is completely thrown out the window, since AutoMapper eliminates static type checking, in addition to that it complicates your code by orders of magnitudes, scattering your logic related to a single concept, across multiple files, and sometime multiple projects, resulting in additional dependencies, effectively turning your strongly typed programming language into a big ball of mud - While also typically adding System.Reflection to the mix. For the record, reflection is ~400 times slower than a virtual method invocation according to Jon Skeet.

No comment yet.
Scooped by Mickael Ruau
Scoop.it!

Les dangers de MySQL et MariaDB

Les dangers de MySQL et MariaDB | DataOps | Scoop.it
Cet article a pour but de démontrer que MySQL/MariaDB n’est pas compatible avec la sureté, la qualité et les performances.Il en est même dangereux !
Mickael Ruau's insight:

Un chiffrement passoire

Tous les SGBD prétendent faire du chiffrement. Mais lorsque l’on examine à la loupe ce qui est fait et comment cela est fait, cela donne froid dans le dos pour certains SGBD du monde libre. Il en est ainsi de MySQL/MariaDB comme de PostGreSQL.

L’étude de la problématique de chiffrement et via les préconisations de la CNIL et les règlements du RGPD(7), montre sans équivoque que presque toutes les données d’une base contenant des personnes physiques devraient être chiffrées. Certes le nom, le prénom, mais aussi les emails, numéros de téléphone doivent l’être, mais aussi la combinaison d’une adresse ou d’une action unitaire et d’une date. De fil en aiguille c’est la base entière qu’il faut chiffrer. Pour cela les grands éditeurs (Oracle, Microsoft SQL Server) proposent une méthode globale appelée TDE (Transparent Data Encryption) pour chiffrer de manière élégante et sans impact sur les performances relationnelles, la totalité des données de la base. Cette technologie est hors de portée du monde libre.

Dans MySQL/MariaDB, le chiffrement impose la connaissance des clefs dans l’appel de fonction de déchiffrement ou bien le stockage de la clef à titre de fichier dans le système de fichiers à la portée du serveur. Un peu comme si vous laissiez votre voiture fermée à clef avec les clefs dessus. Lorsque l’on sait que la majorité des vols de données sont le fait d’attaques internes à l’entreprise, ce niveau de sécurité est plus qu’illusoire.

Un exemple de déchiffrement nous est donné par la commande suivante :

SELECT DECRYPT(MaColonne 'Mon mot de passe').

Bref, il suffit d’aller lire les sources sur les postes de développeurs pour connaître la clef, ou encore de parcourir les exécutables des applications des postes clients.

C’est en partie pour cette raison – une clef d’accès inscrite en clair dans un fichier de code source – que la CNIL a condamné la société UBER France à une amende de 400 000 €.

Dans les SGBD professionnels, comme SQL Server, la totalité du système de chiffrement repose sur une arborescence interne. Les clefs de chiffrement des données sont stockées dans la base de manière chiffrée, et ce chiffrement est généré par une clef « maître » de la base dont la génération a elle-même été entreprise par une clef maître de l’instance, générée lors de l’installation. Aucun fichier, aucun mot de passe. Les mécanismes sont automatiques et reposent généralement sur le fait que vous possédez un certificat adéquat. La plupart des clefs ne pouvant même pas être sauvegardées (sinon, c’est à nouveau un « trou » de sécurité).

Une autre possibilité offerte par les grands SGBDR, est de confier la gestion des clefs à un HSM (Hardware Security Module) c’est-à-dire un système électronique de génération et stockage des clefs, autodestructif en cas d’intrusion.

Mais le chiffrement dans MySQL est encore plus passoire qu’on ne le croit. En effet si vous désirez utiliser des outils de trace pour suivre les performances, alors ces derniers traceront les informations en clair et d’autres ne fonctionneront plus !

No comment yet.
Scooped by Mickael Ruau
Scoop.it!

How To Secure MySQL 8 With SSL/TLS on Ubuntu 20.04 - DZone Database

How To Secure MySQL 8 With SSL/TLS on Ubuntu 20.04 - DZone Database | DataOps | Scoop.it
In this tutorial, we will show you how to secure MySQL connections with SSL/TLS on Ubuntu 20.04.
No comment yet.
Scooped by Mickael Ruau
Scoop.it!

Using the Range and the New Multirange Data Type in PostgreSQL 14

Using the Range and the New Multirange Data Type in PostgreSQL 14 | DataOps | Scoop.it
Range data types were already a powerful feature to store multiple non-contiguous ranges, but now PostgreSQL 14 has introduced multi-range data types.
No comment yet.
Scooped by Mickael Ruau
Scoop.it!

DPO : la Cnil publie un guide pratique - L'INFORMATICIEN & L'INFO CYBER-RISQUES - L'1FO Tech par L'Informaticien - L'INFORMATICIEN - L'1FO Tech par L'Informaticien

DPO : la Cnil publie un guide pratique - L'INFORMATICIEN & L'INFO CYBER-RISQUES - L'1FO Tech par L'Informaticien - L'INFORMATICIEN - L'1FO Tech par L'Informaticien | DataOps | Scoop.it
On compte aujourd’hui en France près de 30 000 DPO, ou Data Protection Officer, délégué à la protection des données personnelles en bon français. Quelque 80 000 organisations, dont 26 000 dans le public, en ont désigné un à ce jour. On est bien loin des 18 000 organismes dotés de CIL dans la période pré-RGPD. Et c’est justement pour poursuivre sur cette lancée que la Cnil vient de publier un guide relatif au DPO.

Ce document de 56 pages s’adresse moins aux délégués qu’aux entreprises et aux collectivités qui les désignent (ce qui ne signifie par pour autant que les DPO doivent faire l’impasse sur la lecture de ce guide, bien au contraire). Le guide, profitant de trois années d’accompagnement des DPO par la Cnil s’articule autour de quatre chapitres sur le rôle du DPO, sa désignation, l’exercice de ses missions et son accompagnement par le gendarme des données personnelles.
No comment yet.
Scooped by Mickael Ruau
Scoop.it!

Python for Everybody: Exploring Data Using Python 3

Python for Everybody: Exploring Data Using Python 3 | DataOps | Scoop.it
I never seemed to find the perfect data-oriented Python book for my course, so I set out to write just such a book. Luckily at a faculty meeting three weeks before I was about to start my new book from scratch over the holiday break, Dr. Atul Prakash showed me the Think Python book which he had used to teach his Python course that semester. It is a well-written Computer Science text with a focus on short, direct explanations and ease of learning.The overall book structure has been changed to get to doing data analysis problems as quickly as possible and have a series of running examples and exercises about data analysis from the very beginning.
Mickael Ruau's insight:

Table of Contents

  • 1 Why should you learn to write programs?
  • 2 Variables, expressions, and statements
  • 3 Conditional execution
  • 4 Functions
  • 5 Iteration
  • 6 Strings
  • 7 Files
  • 8 Lists
  • 9 Dictionaries
  • 10 Tuples
  • 11 Regular expressions
  • 12 Networked programs
  • 13 Using Web Services
  • 14 Object-Oriented Programming
  • 15 Using databases and SQL
  • 16 Visualizing data
  • A Contributions
  • B Copyright Detail
No comment yet.
Scooped by Mickael Ruau
Scoop.it!

What if … MySQL’s Repeatable Reads Cause You to Lose Money?

What if … MySQL’s Repeatable Reads Cause You to Lose Money? | DataOps | Scoop.it


I have a shop and I decide to grant a bonus discount to a selected number of customers that:

Have an active account to my shop
Match my personal criteria to access the bonus

My application is set to perform batch operations in a moment of less traffic and unattended. This includes reactivating dormant accounts that customers ask to reactivate.

What we will do is to see what happens, by default, and then see what we can do to avoid pitfalls.
The Scenario

I will use three different connections to connect to the same MySQL 8.0.27 instance. The only relevant setting I have modified is the Innodb_timeout that I set to 50 seconds.

Session 1 will simulate a process that should activate the bonus feature for the selected customers
Session 2 is an independent process that reactivates the given list of customers
Session 3 is used to collect lock information
No comment yet.
Scooped by Mickael Ruau
Scoop.it!

When to Use Reverse ETL and When It Is an Anti-pattern - DZone Integration

When to Use Reverse ETL and When It Is an Anti-pattern - DZone Integration | DataOps | Scoop.it
Most enterprises store their massive volumes of transactional and analytics data at rest in data warehouses or data lakes. Sales, marketing, and customer success teams require access to these data sets. Reverse ETL is a buzzword that defines the concept of collecting data from existing data stores to provide it easy and quick for business teams.

This blog post explores why software vendors (try to) introduce new solutions for Reverse ETL, when it is needed, and how it fits into the enterprise architecture.
No comment yet.
Scooped by Mickael Ruau
Scoop.it!

AuraDB Free est maintenant disponible gratuitement sur le cloud

Neo4j a annoncé la disponibilité générale de Neo4j AuraDB Free, son service gratuit de DBaaS. Avec l'arrivée de AuraDB Free, Neo4j souhaite rendre sa plate-forme de base de données de graphes accessible à tous, et ce, gratuitement dans le cloud. Ceci avec pour objectif d'accélérer l'adoption de cette technologie dans des applications modernes. Les développeurs peuvent désormais prendre en main, prototyper et développer sans se soucier de la gestion de l'infrastructure. Cette version gratuite de la plateforme offre un accès rapide et facile aux graphes à travers un service entièrement hébergé dans le cloud.

« Neo4j AuraDB Free est une offre gratuite de notre base de données graphes, il ne s'agit pas d'une offre d'essai et sa sortie témoigne de notre volonté d'affirmer notre parcours open source ! », déclare Emil Eifrem, PDG et co-fondateur de Neo4j. « Certaines de nos applications les plus innovantes proviennent de notre communauté et nous espérons qu'AuraDB Free favorisera davantage de créativité et réduira les frictions. Aujourd'hui, nous nous efforçons d'offrir aux développeurs passionnés par les graphes le moyen le plus simple d'apprendre, de tester et de grandir avec nous dans le cloud. », conclut-il.

Neo4j AuraDB FreeM est accessible à tous et disponible en suivant ce lien. AuraDB Free comprend une base de données de graphes gratuite avec toutes les fonctionnalités de base et des outils pour les développeurs, dont Neo4j Bloom pour la visualisation des données.
No comment yet.
Scooped by Mickael Ruau
Scoop.it!

L’atelier matrice d’erreur : démystifier les performances du ML avec ses utilisateurs | OCTO Talks !

L’atelier matrice d’erreur : démystifier les performances du ML avec ses utilisateurs | OCTO Talks ! | DataOps | Scoop.it
Lorsque l’atelier a démarré, les participants y ont spontanément pris part et cela nous a permis de tirer un maximum de valeur à chaque étape et eux une compréhension progressive des enjeux. Avec de nombreux supports visuels et des explications précises, nous avons passé très peu de temps à répondre à des questions et plus de temps à débattre. Tout au long de l’atelier, nous avons remarqué un tel engouement qu’il fallait parfois intervenir pour pas que les débats s’éternisent. Chacun a pu donner son avis et cela nous offre plus de perspectives. Par exemple, nous avons découvert que pour les grands centres d’examen il est important d’avoir une prédiction légèrement supérieure plutôt qu’inférieure à la vraie valeur alors que c’est le constat inverse pour les petits centres. On en ressort que tout le monde n’était pas forcément d’accord sur leurs attendus mais l’atelier a donc permis de discuter de ces différences. Cela nous permet de trouver des attentes communes et de réfléchir à la réponse qu’on peut apporter sur celles qui diffèrent.
No comment yet.
Scooped by Mickael Ruau
Scoop.it!

Interroger une base MariaDB depuis Oracle - Blogs - Forum du club des développeurs et IT Pro

Interroger une base MariaDB depuis Oracle - Blogs - Forum du club des développeurs et IT Pro | DataOps | Scoop.it
On trouve différents tutoriels, la plupart en anglais, au sujet de la création d'un database_link dans Oracle pour accéder à une base MySQL. L'un parle du cas spécifique de l'accès à une base MariaDB mais ses exemples de code m'ont posé quelques soucis de compréhension entraînant par la suite un refus de fonctionnement et quelques prises de tête pendant pas mal de temps.
Je vais donc décrire ici pas à pas ce qu'il faut faire pour que ça fonctionne.
No comment yet.
Scooped by Mickael Ruau
Scoop.it!

Data Fabric vs. Data Lake: Operational Comparison - DZone Database

Data Fabric vs. Data Lake: Operational Comparison - DZone Database | DataOps | Scoop.it
In this article, we will focus on which is the most appropriate big data store for high-scale, real-time, operational use cases – data fabric vs data lake.
Mickael Ruau's insight:

Conclusion

In the data fabric vs data lake comparison, the architecture of choice for real-time operational use cases is obviously data fabric. But data fabric solutions and data lakes are actually complementary in that data fabric can prepare trusted data for data lakes, while data lakes can provide operational intelligence to data fabric for immediate use.

No comment yet.
Scooped by Mickael Ruau
Scoop.it!

Qu’est-ce que le DataOps (Data Operations) ?

Qu’est-ce que le DataOps (Data Operations) ? | DataOps | Scoop.it
Selon Gartner, le DataOps doit réconcilier les opérateurs avec les consommateurs des données pour favoriser l’exploitation de l’analytique dans toute l’entreprise. Quelles sont les différences avec le DevOps ?
No comment yet.
Scooped by Mickael Ruau
Scoop.it!

The Data Journalism Handbook

The Data Journalism Handbook | DataOps | Scoop.it
Table of Contents

01 Front Matter

02 Introduction

03 In The Newsroom

04 Case Studies

05 Getting Data

06 Understanding Data

07 Delivering Data
No comment yet.
Scooped by Mickael Ruau
Scoop.it!

Apprendre à manipuler la clause SQL JOIN : du modèle MCD à la requête SQL, un tutoriel François de Sainte Marie

Apprendre à manipuler la clause SQL JOIN : du modèle MCD à la requête SQL, un tutoriel François de Sainte Marie | DataOps | Scoop.it

Je voudrais montrer ici en quoi le désir de bien faire, doublé d’une connaissance insuffisante de la théorie relationnelle, en particulier de l’opérateur Join, peuvent se révéler dangereux quand il s’agit d’« optimiser » un MLD (modèle logique des données).
No comment yet.
Scooped by Mickael Ruau
Scoop.it!

MongoDB 5.0 Time Series Collections

MongoDB 5.0 Time Series Collections | DataOps | Scoop.it
The Time Series collection is a new feature in MongoDB 5.0, providing comparable performance to index usage on regular collections but saving disk space.
No comment yet.