Conceptos básicos de los tipos de datos y estructuras de programación R para análisis predictivo

En la programación R para el análisis predictivo, los datos tipos

Conteúdo

Tipos de datos
Estructuras de datos

a veces se confunden con los datos estructuras. Cada variable en la memoria de programa tiene un tipo de datos. Claro, usted puede conseguir lejos con tener varias variables en el programa y seguir siendo manejable. Pero eso probablemente no va a funcionar muy bien si usted tiene cientos (o miles) de variables- que tienes que dar a cada variable de un nombre para que pueda acceder a él.

Es más eficiente para almacenar todas esas variables en una colección lógica.

Tipos de datos

Al igual que otros lenguajes de programación de pleno derecho, R ofrece muchos tipos de datos y estructuras de datos. No hay necesidad de especificar el tipo que usted está asignando a una variable del intérprete lo hará por usted. Sin embargo, puede especificar o convertir el tipo si la necesidad arises- esto se llama fundición. Tres tipos de datos son los siguientes:

Numérico: Estos son los números típicos decimales. Estos se llaman flotadores (corto para números de punto flotante) O dobles en otros idiomas.
Caracteres: Estos son sus cadenas formadas con combinaciones de letras, caracteres y números. Ellos no están destinados a tener un significado numérico. Estos se llaman cuerdas en otros idiomas.
Lógico: CIERTO o FALSO. Siempre capitalizar estos valores en R. se llaman Estos valores Booleanos en otros idiomas.

La comparación de una cadena de números a una serie numérica se traduce en el intérprete de la conversión de la cadena de números en una numérico y luego hacer una comparación numérica.

Ejemplos de tipos de datos son los siguientes:

> I lt; - 10 # numérico> j lt; - 10.0 # numérico> k lt; - "10" carácter #> m lt; - i == j # lógica> n lt; - i == k # lógica

Después de ejecutar esas líneas de código, puede conocer sus valores y tipos mediante el uso de la str () función. Esa operación se parece a esto:

> Str (i) num 10> str (j) num 10> str (k) chr "10"> str (m) logi TRUE> str (n) logi CIERTO

La expresión en el n asignación es un ejemplo de la intérprete convertir temporalmente el tipo de datos de k en un numérico para hacer la evaluación entre numérico yo y el carácter k.

Estructuras de datos

R tendrá un lugar para almacenar los grupos de tipos de datos con el fin de trabajar con él de manera eficiente. Estos se llaman estructuras de datos.

Un ejemplo real de este concepto es un garaje de estacionamiento: Es una estructura que almacena los automóviles de manera eficiente. Está diseñado para aparcar tantos coches como sea posible, y permite a los automóviles para entrar y salir de manera eficiente la estructura. Además, no hay otros objetos además de los automóviles deben ser estacionados en una estructura de estacionamiento.

Las estructuras de datos son:

Vectores: Vectores almacenan un conjunto de valores de un mismo tipo de datos. Piense en ello como un pastillero semanal. Cada compartimiento en el pastillero sólo puede almacenar un cierto tipo de objeto. Después de poner unas pastillas en uno de los compartimentos, todos los demás compartimentos también deben llenarse con cero pastillas o más píldoras.
No se puede poner monedas en ese mismo caja- tienes que usar una diferente " píldora caja " (vector) para eso. Del mismo modo, una vez que se almacena un número en un vector, todos los valores futuros también deben ser números. De lo contrario, el intérprete convierte todos sus números a caracteres.
Matrices: LA matriz se parece a una hoja de cálculo Excel: Esencialmente es una mesa que consiste en filas y columnas. Los datos rellena las celdas vacías por fila o columna fin, en el que se especifiquen al crear la matriz.
Todas las columnas deben tener el mismo tipo de datos.
Las tramas de datos: Una trama de datos es similar a una matriz, excepto las columnas de una trama de datos pueden contener diferentes tipos de datos. Los conjuntos de datos utilizados en el modelado predictivo se cargan en tramas de datos y se almacenan allí para su uso en el modelo.
Factores: LA factor es como un vector con un número limitado de valores distintos. El número de valores distintos que se conoce como su nivel. Puede utilizar factores para tratar una columna que tiene un número limitado y conocido de los valores como valores categóricos. De forma predeterminada, los datos de carácter se carga en tramas de datos como factores.

Se accede a vectores, matrices y cuadros de datos mediante el uso de notación de matriz. Por ejemplo, debe escribir v [5] para acceder al quinto elemento del vector v. Para una matriz de dos dimensiones y trama de datos, se pone en el número y la columna de la fila número, separado por una coma, dentro de los corchetes. Por ejemplo, se escribe m [2,3] para acceder a la segunda fila, el valor tercera columna de la matriz m.

Las estructuras de datos son un tema avanzado en ciencias de la computación. Por ahora, estamos pegando a la práctica. Sólo recuerde que las estructuras de datos fueron construidas para almacenar tipos de datos específicos y tienen funciones para la inserción de datos, eliminación y recuperación.

Sobre el autor

¿Cómo añadir variables a una trama de datos en r

Una trama de datos se puede ampliar con nuevas variables en R. Usted puede, por ejemplo, obtener datos de otro jugador en el equipo de la abuela. O es posible que desee calcular una nueva variable de las otras variables del conjunto de datos, como…

¿Cómo crear una trama de datos a partir de una matriz en la r

Puede crear una trama de datos a partir de una matriz en R. Echa un vistazo a la cantidad de canastas anotadas por la abuela y su amiga Geraldine. Si crea una matriz baskets.team con el número de cestas tanto para damas, se obtiene lo siguiente:>…

¿Cómo crear una trama de datos desde cero en r

La conversión de una matriz para una trama de datos en R no puede ser usado para construir una trama de datos con diferentes tipos de valores. Si se combinan ambos datos numéricos y de caracteres en una matriz, por ejemplo, todo se convierte en…

Cómo determinar una estructura de datos en r

La primera decisión que tiene que hacer antes de analizar los datos es cómo representar que los datos dentro R. Si los datos tiene sólo una dimensión, entonces usted ya sabe que los vectores representan este tipo de datos muy bien. Sin embargo,…

¿Cómo extraer variables, observaciones, y los valores de una trama de datos en r

En muchos casos, puede extraer los valores de una trama de datos en I fingiendo que es una matriz. Pero a pesar de las tramas de datos pueden parecer matrices, que definitivamente no lo son. A diferencia de las matrices y matrices, cuadros de datos…

Cómo identificar y corregir dimensiones caído en r

Cada función en I espera que sus datos estén en un formato específico. Eso no quiere decir simplemente si se trata de un número entero, carácter, o factor, sino también si usted proporciona un vector, una matriz, una trama de datos, o una…

Cómo mirar la estructura de los vectores en r

LA vector es un conjunto unidimensional de valores, todos del mismo tipo. Es la unidad más pequeña se puede trabajar con en R. Un único valor es técnicamente un vector también - un vector con un solo elemento. En matemáticas vectores se…

Cómo subconjunto tramas de datos en r

Ahora que ha revisado las reglas para la creación de subconjuntos, puede probar con algunas tramas de datos en R. Sólo tienes que recordar que una trama de datos es un objeto bidimensional y contiene filas, así como columnas. Esto significa que…

Cómo utilizar tablas de datos en r

Un primer paso en todos los análisis, utilizando R o no, consiste en calcular las estadísticas descriptivas para su conjunto de datos. Tienes que llegar a conocer los datos que ha recibido antes de poder decidir con precisión qué modelos de…

Cómo usar factores o datos numéricos en r

Antes de intentar describir sus datos en R, usted tiene que asegurarse de que sus datos están en el formato correcto. Esto significaAsegurarse de que todos sus datos están contenidos en una trama de datos (o en un vector de si se trata de una sola…

Cómo trabajar con los nombres de las variables en r

Las variables en una trama de datos en I siempre necesita tener un nombre. Para acceder a los nombres de las variables, se puede tratar de nuevo una trama de datos como una matriz y utilizar la función COLNAMES () Me gusta esto:> COLNAMES…

Observaciones de nomenclatura en r

Una diferencia importante entre una matriz y una trama de datos en R es que las tramas de datos siempre han llamado observaciones. Mientras que el rownames () retornos de función NULO si no especificó los nombres de las filas de una matriz,…

maniqui-es.com » Computadoras y software » Big Data » La ciencia de datos » Conceptos básicos de los tipos de datos y estructuras de programación R para análisis predictivo