Conjunto de maga dato
Un conjunto de maga dato es un coleccion de maga dato. Na el caso del maga tabular dato, ta corresponde un conjunto de maga dato a uno o mas maga tabla na un base de maga dato, donde ta representa cada columna con un particular variable, y ta corresponde cada fila a un cierto registro del conjunto na cuestion. Ta alista el conjunto de maga dato con maga valor para cada variable, por ejemplo el altura y el peso de un objeto, para cada miembro del conjunto. Tambien puede el maga conjunto de maga dato consisti de un coleccion de maga documento o maga archivo.
Na el disciplina de maga abierto dato, un conjunto de maga dato es el unidad de medida del informacion liberao na un publico repositorio de maga dato. Ta agrega el europeo portal data.europa.eu con mas de un million de maga conjunto de maga dato.
Maga propiedad
revisaTa defini manada caracteristica con el estructura y el maga propiedad de un conjunto de maga dato. Ta inclui ellos con el numero y el maga tipo de maga atributo o maga variable, ademas de cuanto estadistico parametro aplicable a ellos, como el tipico desviacion y el curtosis.
Puede el maga valor maga numero, como maga real numero o maga entero, por ejemplo representando con el altura de un persona na maga centimetro, pero tambien maga nominal medida (i.e. hinde numerico), por ejemplo representando con el etnia de un persona. Mas generalmente, puede el maga valor cualquier uno del maga tipo descrio como un nivel de medida. Para cada variable (o columna), normalmente del mismo tipo el maga valor. Puede existi maga faltante valor, que hay que indica de algun modo.
Na el estadistica, usualmente ta proveni el maga dato de maga real observacion obtenio por un muestreo de un estadistico poblacion, y ta corresponde cada fila al maga observacion de un elemento de aquel poblacion. Ademas, puede el maga conjunto de maga dato generao por maga algoritmo con el fin de proba con algun maga tipo de software. Ta presenta pa algun maga moderno software de estadistico analisis (como SPSS) con el de ellos resultao na el clasico forma. Si faltante o sospechoso el maga dato, utilizable un metodo de imputacion para completa con un conjunto de maga dato (mira tambien con limpieza de maga dato).
Maga clasico
revisaNa el estadistico literatura, extensivamente usao cuanto clasico conjunto de maga dato:
- Conjunto de maga dato flor iris — Multivariante conjunto de maga dato introducio por si Ronald Fisher (1936)
- Base de maga dato MINST — Maga imagen de maga cifra escrio a mano habitualmente utilizao para proba con maga algoritmo de clasificacion, agrupacion y procesamiento de maga imagenes
- Categorico analisis de maga dato
- Robusto estadistica
- Temporal serie
- Maga extremo valor
- Bayesiano analisis de maga dato
- El cuarteto de si Anscombe