El portal de datos federal: data.gov
Si usted está buscando para los datos que el gobierno federal podría tener, pero no está seguro de qué agencia está involucrada, inicie su búsqueda en el portal de datos federal. Allí encontrará un catálogo de búsqueda de los datos de todas las agencias federales. Puede buscar datos por palabra clave y obtener información sobre lo que está disponible, la fuente para cada conjunto de datos, los formatos disponibles, y dónde encontrar los datos.
El portal de datos no es una fuente de datos, la información sólo de lo que se dispone de datos y dónde conseguirlo. Y el portal no cubre todos los bits de datos gubernamentales disponibles. Por lo tanto, si usted encuentra algo que es útil para usted en Data.gov, el seguimiento mediante la investigación de la web de la agencia que en realidad establece que los datos para la búsqueda de información y datos adicionales.
Si necesitas algo que no se puede encontrar, póngase en contacto con la agencia directamente. Usted puede ser capaz de hablar con alguien que pueda ayudarle a encontrar lo que necesita, o al menos averiguar por qué los datos que desea no está disponible.
Si bien no hay nada nuevo acerca de los datos públicos, el portal facilita ciertas nuevas iniciativas. Se requiere que todos los datos del gobierno federal recién generada para ser puesto a disposición del público en formatos abiertos, legibles por máquina, manteniendo la privacidad y la seguridad. El concepto clave aquí es la máquina de lectura, proporcionando datos en formatos que sean apropiados para el cálculo de utilización, especialmente su uso en el desarrollo de aplicaciones.
Las agencias también están obligados a
Crear un inventario único de datos agencia: Se deben documentar y rastrear los activos de datos como lo hacen los equipos, muebles y otros bienes.
Publicar una oferta pública de datos: En la lista deberá ser publicado en las páginas web de la agencia, incluyendo todos los activos de datos que son públicos o que puedan hacerse públicos.
Desarrollar nuevos mecanismos de retroalimentación pública: Deben proporcionar maneras para el público para proporcionar información relacionada con las prioridades de intercambio de datos.
El portal de datos federal también permite a los gobiernos locales para añadir a sus conjuntos de datos para el catálogo del portal. Esto no es obligatorio y no muchas ciudades están dispuestos a participar, pero puede venir a través de algunos datos locales en el catálogo, y usted puede esperar ver más en el futuro.
Mientras este portal usted puede llevar a una amplia y diversa gama de datos, nada de eso se ha creado específicamente para el uso de minería de datos. Todo ello se recogió originalmente para compartir uso- gobierno con el público es secundario.
Privacidad y seguridad requisitos prevenir algunos datos de que se haga público, y algunos datos sólo se pueden compartir en forma agregada. (Por ejemplo, los ingresos de un individuo puede ser privado, mientras que el ingreso promedio de un grupo de personas es público.) Y las iniciativas de datos abiertos son impulsados por los programadores, no los mineros de datos, por lo que los datos no pueden organizarse o formateados como usted prefiera.
El portal de datos es un punto de partida, no un destino final, en su búsqueda de datos. No todos los conjuntos de datos del gobierno están incluidas en el catálogo y algunos que son no pueden ser etiquetados con las palabras clave que usted elija para su búsqueda. Pero Data.gov le puede guiar a muchos conjuntos de datos útiles y proporcionar pistas a las agencias que pueden tener más que ofrecer. Usted puede incluso descubrir algunas joyas inesperadas para mejorar su trabajo de minería de datos.