10 Recursos libres para la ciencia de datos

Una cosa excelente sobre la ciencia de datos es que usted no tiene que gastar un montón de dinero en aplicaciones de software y datos de origen con el fin de comenzar a cosechar sus beneficios. Usted puede simplemente comenzar con sus propios datos y comenzar a utilizar las aplicaciones de código abierto o lenguajes de programación con el fin de comenzar a derivar información valiosa.

Incluso los datos contextuales se pueden recoger de forma gratuita a partir de fuentes de datos abiertas. Es probable que usted va a obtener mejores resultados, más exactas (con menos esfuerzo) si usted tiene dinero para gastar en costosas herramientas y fuentes de datos dirigidos exactos, pero esto no es un requisito absoluto por cualquier medio.

Muchos de los recursos que aquí se presentan se hacen disponibles como parte de la contribución de la organización a la donación movimiento abierto - un movimiento que aboga por el libre intercambio de la propiedad intelectual en los ámbitos del arte, la educación, el software, los datos y la tecnología, entre otros. Tres componentes principales del movimiento de apertura de datos son abiertos, de código abierto, y conocimiento abierto.

Información abierta iniciativas se basan en la premisa de que los datos deben ser hechas libremente y abiertamente a disposición del público en general para su uso, reutilización y republicación. datos abiertos pueden ser emitidos bajo algún tipo de requisito de licencia abierta, pero es generalmente libre de restricciones de derechos de autor y de patentes.

los fuente abierta movimiento del software comenzó en la década de 1970 y se basa en la premisa de que los usuarios de software deben ser capaces de compartir libremente el software. El movimiento de código abierto también aboga por que los desarrolladores se les debe permitir construir derivado de código abierto o de obras de propiedad sobre ella.

Por último, la conocimiento abierto el movimiento se ha posicionado en la parte superior de otros movimientos abiertos y establece la idea de que el conocimiento en todas sus formas debe hacerse libre y abiertamente a disposición del público en general. El movimiento del conocimiento abierto también aboga por que la gente debe tener la libertad de usar, reutilizar, compartir y publicar ese conocimiento.

El acceso de datos abierta a través de Conocimiento Abierto

El mayor impulsor del movimiento del conocimiento abierto es la organización sin ánimo de lucro, conocimiento abierto. Esta organización define conocimiento abierto como las percepciones útiles, significativas y valiosas derivados de fuentes de datos abiertas. La página web Conocimiento Abierto es una excelente fuente para el encuentro y la colaboración con los datos abiertos y entusiastas de la ciencia de datos.

Encontrar datos libres en Banco Mundial Open Data

Mundial de Datos Open Bank es una fuente increíblemente robusto de los datos demográficos y en las naciones en desarrollo. Los temas incluyen la salud, la infraestructura, la pobreza, el comercio, el desarrollo urbano, la agricultura y el desarrollo rural y el medio ambiente, entre muchos otros. Los datos sobre las métricas de indicadores del Banco Mundial también están a disposición del público. Esos son una gran base para hacer un análisis comparativo entre las naciones en desarrollo.

libre de la fuente de datos espaciales de OpenStreetMap

OpenStreetMap (OSM) es una excelente fuente de datos geográficos libres y abiertas que se pueden utilizar para analizar los datos en Sistemas de Información Geográfica (GIS) o para el desarrollo de aplicaciones web basadas en la localización. En el OSM página de exportación se puede descargar toda la base de datos (masiva) de los datos espaciales de OSM. (Para descargar extractos de datos solamente de los continentes, países y ciudades que desea, asegúrese de usar las Descargas Geofabrik Option- también se puede utilizar extractos de metro de OSM función para descargar los datos metropolitana en las ciudades más grandes del mundo.)

Recopilar datos del gobierno libre de Data.gov

Data.gov es una enorme fuente si usted está en busca de datos disponible en los negocios, el medio ambiente, la salud pública, y la investigación y desarrollo (I&D) en los EE.UU.. Data.gov es impresionante, ya que, además de conjuntos de datos tabulares estándar, sino que también ofrece fuentes de datos espaciales que se puede descargar y utilizar para el análisis en SIG.

Calcular con lenguas nacidas del movimiento de código abierto

lenguajes de programación amigable ciencia de datos, como R y Pitón son de código abierto y de uso gratuito para su análisis o desarrollo de aplicaciones. Ambas lenguas son ideales para el análisis de datos y visualización. R tiene la ventaja de ofrecer capacidades más sofisticadas de visualización de datos estadísticos y, mientras que las ventajas de Python es que es mucho más fácil de aprender que R.

Analizar los datos de forma gratuita con la aplicación Datos Aplicada

Si no desea utilizar código para escribir rutinas personalizadas para su análisis, a continuación, se puede optar por utilizar una aplicación basada en web gratuito en su lugar. Aplicada de datos ofrece una funcionalidad robusta para la creación de tablas dinámicas, mapas de árboles, y los pronósticos predictivos. También tiene características que se pueden utilizar para la correlación, atípico, y el análisis de asociación.

Hacer mapas con GeoCommons

GeoCommons es una aplicación gratuita de mapeo basado en la web. Su característica más sobresaliente es su integración de tablas relacionadas y funcionalidad de Google Earth. Con GeoCommons, puede cargar los datos y automáticamente codificación geográfica de sus identificadores. Usted tiene la opción de visualizar los datos mediante un chloropleth (para lo cual se puede concebir una serie de planes automatizadas o manuales para colorear) o la visualización de datos usando las burbujas y los marcadores (como las banderas y las gotitas que transmiten datos por tamaño o por color).

Video: Ser o no ser un Científico de Datos Big Data Analytics Summit Peru 2016

GeoCommons también le permite insertar un gráfico de línea simple, gráfico de barras, gráfico de columnas, o diagrama de dispersión (por lo general no es algo que es fácil de hacer en un mapa) para mostrar la relación entre dos variables cuantitativas. Por último, GeoCommons integra marcadores o área categórica visualizaciones con Google Earth para que pueda ver sus datos espaciales en una representación esférica, giratorio, zoom-poder del planeta. (Tenga en cuenta que, con el fin de utilizar esta función, es necesario instalar el complemento de Google Earth en.)

Hacer mapas con Datawrapper

Datawrapper es una herramienta gratuita, de código abierto que se puede utilizar para crear visualizaciones simples. Tiene dos características que no se encuentran en otros lugares - un gráfico de datos Elección del buñuelo que se asemeja a la disposición de los diversos cámaras del Parlamento o congresos, y una funcionalidad resaltado fácil que se puede utilizar para enfatizar importancia el núcleo de una visualización de datos, poniendo de relieve un solo punto de datos en un gráfico . Datawrapper ofrece las siguientes opciones en el tipo de datos gráfica: Los gráficos de columnas, gráficos circulares, gráficos de anillos, gráficos de anillos elección, mapas y gráficos de barras.

Video: ¿Qué es Científico de datos?

Hacer infografías interactivas fresco con Infoactive.co

Infoactive.co Es un bajo costo, aplicación de diseño de visualización de datos basado en la web. Dispone de una plantilla atractiva destacando los minimalista texto y visualizaciones que están de moda en estos días “-diseño plano”. La aplicación cuenta con capacidades de agregar eventos de ratón en off, el filtrado de datos, e incluso las conexiones de datos a vivir actualización, fuentes en línea tales como Google Sheets.

Conexión de su Infoactive.co infografía con los datos que se almacenan en una hoja de Google puede producir resultados dinámicos. Cada vez que la hoja de cálculo se actualiza, la visualización InfoActive se actualiza al mismo tiempo.

Infoactive.co ofrece muchas opciones en el tipo de gráfico de datos - incluyendo gráficos de columnas, gráficos circulares, gráficos de anillos, iconos porcentuales, gráficos de líneas, gráficos de área, mapas y gráficos de barras. También, así como una golosina poco acerca Infoactive.co - la puesta en marcha nació como resultado de una campaña de Kickstarter éxito !! Eso sólo sirve para demostrar que nunca se puede predecir realmente desde donde va a nacer éxito.

Carta con ChartBuilder

ChartBuilder es sorprendente porque es aún más fácil de crear gráficos en la aplicación ChartBuilder que en Microsoft Excel. Lo que es más, los gráficos ChartBuilder pueden ser más atractivos y de aspecto profesional-que los diseñados en la aplicación estándar de Excel. Se puede utilizar de forma gratuita ChartBuilder para hacer gráficos de líneas, gráficos de columnas, gráficos de barras y gráficos de dispersión.

Video: Qué es la Ciencia de Datos | Cba3.0 | 06-08-2015 | Bloque I Parte I

Lo que es más, la aplicación le permite hacer fáciles las operaciones de copiar y pegar para importar los datos y luego generar resultados útiles en cuestión de segundos. Aunque el sitio no ofrece capacidades de almacenamiento de datos, sus visualizaciones se pueden descargar con un solo clic, ya sea como imágenes de mapa de bits o gráficos vectoriales SVG.

Artículos Relacionados