domingo, 4 de diciembre de 2016

CÓMO COMPARAR DATASETS SAS CON PROC COMPARE

En ocasiones, trabajando con SAS, hemos hecho una transformación arriesgada en nuestros datos y necesitamos comprobar que todo el dataset o algunas de sus variables siguen teniendo los mismos valores que antes.

Un sencillo procedimiento para lograrlo es utilizar el comando “proc compare”, que compara una tabla A con una tabla B, informándonos de si los datos son idénticos o desiguales. Tras la ejecución del comando podremos ver detalles como número de variables y número de observaciones de cada conjunto de datos, entre otros. Pero, sobre todo, obtendremos la relación de variables con valores comunes y diferentes.

Por defecto, podremos ver una relación de los primeros 50 valores diferentes de ambas tablas. Para anular ese tipo de listado, podemos colocar la opción “Novalues”.

Para contar en el reporte con el listado de variables no coincidentes que están en uno de los datasets y no en el otro, podemos utilizar la opción “Listvar”.

Si lo que necesitamos es comparar sólo los valores de determinadas variables, utilizamos el subcomando “var” seguido de las variables que queremos incluir.



 proc compare base=a compare=b novalues;
 run;



Por último, puede ser útil la posibilidad de comparar dos variables diferentes dentro de un mismo dataset, para comprobar que dos maneras de crear una columna conducen a los mismos resultados. En ese caso usaremos el subcomando “with” seguido de los nombres de las variables que necesitamos contrastar.

No hay comentarios:

Publicar un comentario