10 Los recursos gratuitos para la ciencia de datos
Una cosa excelente sobre la ciencia de datos es que usted no tiene que gastar un montón de dinero en aplicaciones de software y los datos de origen con el fin de comenzar a cosechar sus beneficios. Usted puede simplemente comenzar con sus propios datos y comenzar a utilizar las aplicaciones de código abierto o lenguajes de programación con el fin de comenzar a derivar información valiosa.
Conteúdo
- El acceso de datos abierta a través de conocimiento abierto
- Encuentre los datos gratuitas en banco mundial open data
- Fuente libre de datos espaciales de openstreetmap
- Recopilar datos del gobierno libre de data.gov
- Calcule con lenguas nacidas del movimiento de código abierto
- Analizar los datos de forma gratuita con la aplicación datos aplicada
- Hacer mapas con geocommons
- Hacer mapas con datawrapper
- Hacer infografías interactivas frescas con infoactive.co
- Carta con chartbuilder
Incluso los datos contextuales se pueden recoger de forma gratuita a partir de fuentes de datos abiertas. Es probable que usted va a obtener mejores resultados, más exactos (con menos esfuerzo) si usted tiene dinero para gastar en costosas herramientas y fuentes de datos exacta-dirigidos, pero esto no es un requisito absoluto por cualquier medio.
Muchos de los recursos que se presentan aquí se ponen a disposición como parte de la contribución de la organización donando a la movimiento abierto - un movimiento que aboga por el libre intercambio de la propiedad intelectual en los ámbitos del arte, la educación, software, datos y tecnología, entre otros. Tres componentes principales del movimiento abierto son datos abiertos, de código abierto, y conocimiento abierto.
Datos abiertos iniciativas se basan en la premisa de que los datos deben hacerse libremente, y abiertamente a disposición del público en general para su uso, reutilización y republicación. Datos abiertos podrían ser emitidos bajo algún tipo de requisito de licencia abierta, pero es generalmente libre de restricciones de derechos de autor y patentes.
los código abierto movimiento del software comenzó a finales de 1970 y se basa en la premisa de que los usuarios de software deberían ser capaces de compartir libremente el software. El movimiento de código abierto también aboga por que los desarrolladores deberían permitirse construir derivado de código abierto o de obras de propiedad sobre ella.
Por último, la conocimiento abierto el movimiento se ha posicionado en la parte superior de otros movimientos abiertos y establece la idea de que se debe hacer libre y abiertamente disponibles conocimiento en todas las formas al público en general. El movimiento del conocimiento abierto también aboga por que la gente debe tener la libertad de usar, reutilizar, compartir y publicar ese conocimiento.
El acceso de datos abierta a través de Conocimiento Abierto
El mayor defensor del movimiento del conocimiento abierto es la organización sin fines de lucro, Conocimiento Abierto. Esta organización define conocimiento abierto como las ideas útiles, significativas y valiosas derivadas de fuentes de datos abiertas. El sitio web Conocimiento Abierto es una fuente excelente para reunirse y colaborar con los datos abiertos y entusiastas de la ciencia de datos.
Encuentre los datos gratuitas en Banco Mundial Open Data
Banco Mundial Open Data es una fuente increíblemente robusto de los datos y los datos demográficos en los países en desarrollo. Los temas incluyen la salud, la infraestructura, la pobreza, el comercio, el desarrollo urbano, la agricultura y el desarrollo rural y el medio ambiente, entre muchos otros. Los datos sobre las métricas de indicadores del Banco Mundial también se ponen a disposición del público. Esos son una gran base para hacer un análisis comparativo entre las naciones en desarrollo.
Fuente libre de datos espaciales de OpenStreetMap
OpenStreetMap (OSM) es una excelente fuente de datos geográficos, abiertas gratuitas que se pueden utilizar para el análisis de los datos en los Sistemas de Información Geográfica (SIG) o para el desarrollo de aplicaciones web basadas en la localización. En la página de OSM exportación se puede descargar toda la (masiva) de base de datos de los datos espaciales de OSM. (Para descargar extractos de datos únicamente de los continentes, países y ciudades que desea, asegúrese de usar los Geofabrik Descargas opcionalmente también puede utilizar extractos de metro de OSM cuentan para descargar datos metropolitana en las ciudades más grandes del mundo.)
Recopilar datos del gobierno libre de Data.gov
Data.gov es una enorme fuente si usted está buscando datos disponible en los negocios, el medio ambiente, la salud pública, y la investigación y desarrollo (RD) en los EE.UU.. Data.gov es impresionante, ya que, además de los conjuntos de datos tabulares estándar, también ofrece fuentes de datos espaciales que se pueden descargar y utilizar para el análisis en SIG.
Calcule con lenguas nacidas del movimiento de código abierto
Lenguajes de programación amigable ciencia de datos, como R y Python son de código abierto y de uso gratuito para su análisis o desarrollo de aplicaciones. Ambas lenguas son ideales para el análisis de datos y visualización. R tiene la ventaja de ofrecer capacidades más sofisticadas de visualización de estadísticas y de datos, mientras que la ventaja de Python es que es mucho más fácil de aprender que R.
Analizar los datos de forma gratuita con la aplicación Datos Aplicada
Si no desea utilizar código para escribir rutinas personalizadas para su análisis, entonces usted podría optar por usar una aplicación basada en web gratuito en su lugar. Datos Aplicada ofrece una funcionalidad robusta para la creación de tablas dinámicas, mapas de los árboles, y los pronósticos predictivos. También tiene características que se pueden utilizar para la correlación, atípico, y el análisis de asociación.
Hacer mapas con GeoCommons
GeoCommons es una aplicación gratuita de mapeo basado en web. Su característica más sobresaliente es su integración de tablas relacionadas y funcionalidad de Google Earth. Con GeoCommons, puede cargar los datos y automáticamente geocodificar sus identificadores. Usted tiene la opción de visualizar los datos mediante un chloropleth (para lo cual se puede diseñar una serie de esquemas automatizados o manuales para colorear) o visualizar datos utilizando burbujas y marcadores (como las banderas y las gotitas que transmiten los datos por tamaño o por el color).
GeoCommons también le permite insertar un gráfico sencillo de línea, gráfico de barras, gráfico de columnas, o gráfico de dispersión (en general, no algo que es fácil de hacer en un mapa) para mostrar la relación entre dos variables cuantitativas. Por último, GeoCommons integra marcadores o área categórica visualizaciones con Google Earth para que pueda ver sus datos espaciales en un rotativo, representación esférica, zoom poder del planeta. (Tenga en cuenta que, con el fin de utilizar esta función, es necesario instalar el Google Earth plug-in.)
Hacer mapas con Datawrapper
Datawrapper es una herramienta de código abierto que se puede utilizar para crear visualizaciones simples. Tiene dos características que no se encuentran en otro lugar - un gráfico de datos Elección Donut que se asemeja a la disposición de varias casas del parlamento o congresos, y una funcionalidad resaltado fácil que usted puede utilizar para enfatizar importancia central de una visualización de datos, poniendo de relieve sólo un punto de datos en un gráfico . Datawrapper ofrece las siguientes opciones en datos de tipo gráfico: gráficos de columnas, gráficos circulares, gráficos de donuts, gráficos donuts elección, mapas y gráficos de barras.
Hacer infografías interactivas frescas con Infoactive.co
Infoactive.co es un bajo costo, aplicación de diseño de visualización de datos basado en la web. Cuenta con una plantilla atractiva destacando aquellos minimalista "-diseño plano " texto y visualizaciones que están de moda en estos días. La aplicación cuenta con capacidades de agregar eventos de ratón-sobre, filtrado de datos, e incluso las conexiones de datos a vivir actualización, fuentes en línea tales como Hojas de Google.
Conexión del Infoactive.co infografía con los datos que se almacenan en una Hoja de Google puede producir resultados dinámicos. Cada vez que se actualiza la hoja de cálculo, la visualización Infoactive se actualiza al mismo tiempo.
Infoactive.co ofrece muchas opciones en el tipo de gráfico de datos - incluyendo gráficos de columnas, gráficos circulares, gráficos de donuts, iconos porcentuales, gráficos de líneas, gráficos de áreas, mapas y gráficos de barras. También, así como un poco de chisme sobre Infoactive.co - la puesta en marcha nació como resultado de una exitosa campaña de Kickstarter !! Eso sólo sirve para demostrar que nunca puedes predecir de donde nacerá el éxito.
Carta con ChartBuilder
ChartBuilder es increíble porque es aún más fácil de crear gráficos en la aplicación ChartBuilder que en Microsoft Excel. Lo que es más, los gráficos ChartBuilder pueden ser más atractivos y de aspecto profesional que los diseñados en la aplicación estándar de Excel. Puede utilizar ChartBuilder gratis para hacer gráficos de líneas, gráficos de columnas, gráficos de barras y gráficos de dispersión.
Lo que es más, la aplicación le permite realizar operaciones de copiar y pegar fáciles de importar sus datos y luego generar resultados utilizables en cuestión de segundos. Aunque el sitio no ofrece capacidades de almacenamiento de datos, sus visualizaciones se pueden descargar con un solo clic, ya sea como imágenes de mapa de bits o gráficos vectoriales SVG.