Herramientas de exploración de datos

Aunque la visualización puede ayudar a clarificar y comunicar el significado de los datos, es necesario asegurarse de que los puntos de vista de datos de las que nos comunicamos son correctos - que requiere gran cuidado y atención en la fase de análisis de datos. Aquí hay algunas herramientas gratuitas que puede utilizar para algunas tareas de análisis de datos avanzados.

Hablando de Tableau Public

Tableau Public es una aplicación de escritorio gratuita que tiene como objetivo ser un paquete completo para la tabla de decisiones. Si el nombre suena familiar, puede ser porque Tableau Public es sólo la versión gratuita del popular programa de Tableau Desktop. Como parte de la limitación de dominio público, la aplicación no le permite guardar archivos de forma local en el ordenador. Todo su trabajo deben subirse al servidor de la nube de Tableau Public, a menos que compre el software.

Tableau Public crea tres niveles de documento - la hoja de trabajo, el tablero de instrumentos, y la historia. En la hoja de cálculo, puede crear gráficos individuales a partir de los datos que ha importado desde Access, Excel o un archivo .csv en formato de texto. A continuación, puede utilizar Tableau hacer fácilmente cosas como elegir entre diferentes tipos de datos gráficos o columnas de arrastre en diferentes ejes o subgrupos.

Usted tiene que tratar con un poco de una curva de aprendizaje cuando se trabaja con el flujo de la aplicación y su nomenclatura - por ejemplo, dimensiones son datos categóricos y medidas son datos numéricos.

Tableau ofrece muchos diferentes tipos de gráficos por defecto - gráficos de barras, diagramas de dispersión, gráficos de líneas, gráficos de burbujas, diagramas de Gantt, e incluso los mapas geográficos. Tableau Public puede incluso mirar el tipo de datos que tiene y sugiere tipos de gráficos que se pueden utilizar para representar mejor de los casos. Por ejemplo, imagine que tiene dos dimensiones y una medida. En esta situación, un gráfico de barras es una opción popular porque tiene dos categorías de datos y sólo una medida numérica de estas dos categorías.

Pero si usted tiene dos dimensiones y dos medidas, un diagrama de dispersión podría ser una buena opción porque el gráfico de datos diagrama de dispersión permite visualizar dos conjuntos de datos numéricos para dos categorías de datos.

Se puede utilizar un tablero de instrumentos Tableau para combinar listas con anotaciones de texto o con otros gráficos de datos. También puede utilizar el panel de control para añadir filtros interactivos, tales como casillas de verificación o deslizadores, de modo que los usuarios pueden interactuar con sus datos de visualizar solamente ciertas series de tiempo o categorías. Con una historia de Tableau, puede combinar varios cuadros de mando en una especie de presentación de diapositivas que muestra una historia lineal revelado a través de sus datos.

Puede utilizar galería de Tableau Public compartir todas las hojas de trabajo, cuadros de mando, y las historias que se generan dentro de la aplicación. También les puede incrustar en sitios web que enlace con el servidor Tableau nube pública.

Ponerse al día en Gephi

Recuerde que en la escuela cuando se les enseñó cómo usar papel cuadriculado para hacer matemáticas y luego dibujar gráficos de los resultados? Bueno, al parecer, que la nomenclatura es incorrecta. Esas cosas con una x-eje y y-eje se llama en realidad gráficos. Los gráficos son en realidad topologías de red.

Gephi es un paquete de software de código abierto que puede utilizar para crear diseños gráfico y luego manipularlos para obtener los resultados más claros y eficaces. Los tipos de visualización basados ​​en la conexión que puede crear en Gephi son muy útiles en todos los tipos de análisis de red - del análisis de datos de medios sociales para el análisis de las interacciones de proteínas o transferencia horizontal de genes entre bacterias.

Para ilustrar un análisis de redes, imagine que desea analizar la interrelación de las personas en sus redes sociales. Se puede utilizar para presentar Gephi forma rápida y sencilla los diferentes aspectos de la interconexión entre sus amigos de Facebook.

Video: Excel Avanzado 2010 Herramientas de análisis Tablas de datos y Solver Vídeo 16

Por lo tanto, imagina que eres amigo de Alice. Usted y Alice compartir 10 de los mismos amigos en Facebook, pero Alice también tiene un 200 amigos adicionales con los que no están conectados. Uno de los amigos que comparten Alice y Bob recibe su nombre. Usted y Bob compartir 20 de los mismos amigos en Facebook también, pero Bob tiene sólo 5 amigos en común con Alice. Sobre la base de los amigos comunes, que puede suponer fácilmente que usted y Bob son los más similares, pero se puede utilizar para Gephi gráfico El amigo vincula entre sí mismo, Alice y Bob.

Por poner otro ejemplo, imagina que tienes un gráfico que muestra los caracteres que aparecen en el mismo capítulo que el que otros personajes de inmensa novela de Victor Hugo Los Miserables. (En realidad, no hay que imaginar IT- la siguiente figura muestra sólo un gráfico de este tipo, creada en la aplicación Gephi.) Las burbujas más grandes indican que estos personajes aparecen con más frecuencia, y los más líneas unidas a una burbuja, más él o ella co-ocurre con los demás - la gran burbuja en el centro-izquierda es, por supuesto, Jean Valjean.

Cuando se utiliza Gephi, la aplicación automáticamente los colores de sus datos en diferentes grupos. Mirando a los del grupo de caracteres en azul (el color algo más oscuro, en esta imagen en blanco y negro) son caracteres superior izquierda, que en su mayoría aparecen sólo entre sí (son los amigos de Fantine, como Félix Tholomyés - si sólo ha visto el musical, que no aparecen en esa producción). Estos personajes están conectados con el resto de los personajes del libro a través de un solo carácter, Fantine. Si un grupo de personajes sólo aparecen juntos y nunca con cualquier otro carácter, que estarían en un grupo aparte de su cuenta y no unidos al resto de la gráfica de ninguna manera.

Video: Excel: Herramienta Análisis Y si (Tabla de datos)

Para tomar un ejemplo final, echa un vistazo a la siguiente figura, que muestra un gráfico de la red eléctrica de Estados Unidos y los grados de interconexión entre miles de instalaciones de generación de energía y de distribución de energía. Este tipo de gráfica se denomina comúnmente como una gráfico de bolas de pelo, por obvias razones. Puede hacer que sea menos densa y más visualmente clara, pero haciendo ese tipo de ajustes es tanto un arte como una ciencia. La mejor manera de aprender es a través de la práctica, ensayo y error.

Video: Clase 3- Excel: Herramienta de Datos

El aprendizaje automático con la suite de WEKA

Aprendizaje automático es la clase de la inteligencia artificial que está dedicada a la elaboración y aplicación de algoritmos a los datos, de manera que los algoritmos pueden aprender y detectar patrones en grandes conjuntos de datos de forma automática. Waikato Medio Ambiente para el Análisis del Conocimiento (WEKA) Es un popular suite de herramientas que es útil para máquinas herramientas de aprendizaje. Fue escrito en Java y desarrollado en la Universidad de Waikato, Nueva Zelanda.

WEKA es una aplicación independiente que se puede utilizar para analizar los patrones en sus bases de datos y luego visualizar los patrones en todo tipo de formas interesantes. Para usuarios avanzados, el verdadero valor de WEKA se deriva de su conjunto de algoritmos de aprendizaje que se pueden utilizar para agrupar o clasificar sus datos.

WEKA incluso le permite ejecutar diferentes algoritmos de aprendizaje automático en paralelo a ver cuáles realizar de manera más eficiente. WEKA se puede ejecutar a través de una interfaz gráfica de usuario (GUI) o por la línea de comandos. Gracias a la documentación muy bien escrita Weka Wiki, la curva de aprendizaje para WEKA no es tan pronunciada como se podría esperar de una pieza de software esta poderosa.

Artículos Relacionados