Conceptos básicos de los tipos de datos y estructuras de programación R para análisis predictivo

En la programación R para el análisis predictivo, los datos tipos

a veces se confunden con los datos estructuras. Cada variable en la memoria de programa tiene un tipo de datos. Claro, usted puede conseguir lejos con tener varias variables en el programa y seguir siendo manejable. Pero eso probablemente no va a funcionar muy bien si usted tiene cientos (o miles) de variables- que tienes que dar a cada variable de un nombre para que pueda acceder a él.

Es más eficiente para almacenar todas esas variables en una colección lógica.

Tipos de datos

Al igual que otros lenguajes de programación de pleno derecho, R ofrece muchos tipos de datos y estructuras de datos. No hay necesidad de especificar el tipo que usted está asignando a una variable del intérprete lo hará por usted. Sin embargo, puede especificar o convertir el tipo si la necesidad arises- esto se llama fundición. Tres tipos de datos son los siguientes:

  • Numérico: Estos son los números típicos decimales. Estos se llaman flotadores (corto para números de punto flotante) O dobles en otros idiomas.

  • Caracteres: Estos son sus cadenas formadas con combinaciones de letras, caracteres y números. Ellos no están destinados a tener un significado numérico. Estos se llaman cuerdas en otros idiomas.

  • Lógico: CIERTO o FALSO. Siempre capitalizar estos valores en R. se llaman Estos valores Booleanos en otros idiomas.

La comparación de una cadena de números a una serie numérica se traduce en el intérprete de la conversión de la cadena de números en una numérico y luego hacer una comparación numérica.

Ejemplos de tipos de datos son los siguientes:

> I lt; - 10 # numérico> j lt; - 10.0 # numérico> k lt; - "10" carácter #> m lt; - i == j # lógica> n lt; - i == k # lógica

Después de ejecutar esas líneas de código, puede conocer sus valores y tipos mediante el uso de la str () función. Esa operación se parece a esto:

> Str (i) num 10> str (j) num 10> str (k) chr "10"> str (m) logi TRUE> str (n) logi CIERTO

La expresión en el n asignación es un ejemplo de la intérprete convertir temporalmente el tipo de datos de k en un numérico para hacer la evaluación entre numérico yo y el carácter k.

Estructuras de datos

R tendrá un lugar para almacenar los grupos de tipos de datos con el fin de trabajar con él de manera eficiente. Estos se llaman estructuras de datos.

Un ejemplo real de este concepto es un garaje de estacionamiento: Es una estructura que almacena los automóviles de manera eficiente. Está diseñado para aparcar tantos coches como sea posible, y permite a los automóviles para entrar y salir de manera eficiente la estructura. Además, no hay otros objetos además de los automóviles deben ser estacionados en una estructura de estacionamiento.

Las estructuras de datos son:

  • Vectores: Vectores almacenan un conjunto de valores de un mismo tipo de datos. Piense en ello como un pastillero semanal. Cada compartimiento en el pastillero sólo puede almacenar un cierto tipo de objeto. Después de poner unas pastillas en uno de los compartimentos, todos los demás compartimentos también deben llenarse con cero pastillas o más píldoras.

    No se puede poner monedas en ese mismo caja- tienes que usar una diferente " píldora caja " (vector) para eso. Del mismo modo, una vez que se almacena un número en un vector, todos los valores futuros también deben ser números. De lo contrario, el intérprete convierte todos sus números a caracteres.

  • Matrices: LA matriz se parece a una hoja de cálculo Excel: Esencialmente es una mesa que consiste en filas y columnas. Los datos rellena las celdas vacías por fila o columna fin, en el que se especifiquen al crear la matriz.

    Todas las columnas deben tener el mismo tipo de datos.

  • Las tramas de datos: Una trama de datos es similar a una matriz, excepto las columnas de una trama de datos pueden contener diferentes tipos de datos. Los conjuntos de datos utilizados en el modelado predictivo se cargan en tramas de datos y se almacenan allí para su uso en el modelo.

  • Factores: LA factor es como un vector con un número limitado de valores distintos. El número de valores distintos que se conoce como su nivel. Puede utilizar factores para tratar una columna que tiene un número limitado y conocido de los valores como valores categóricos. De forma predeterminada, los datos de carácter se carga en tramas de datos como factores.

Se accede a vectores, matrices y cuadros de datos mediante el uso de notación de matriz. Por ejemplo, debe escribir v [5] para acceder al quinto elemento del vector v. Para una matriz de dos dimensiones y trama de datos, se pone en el número y la columna de la fila número, separado por una coma, dentro de los corchetes. Por ejemplo, se escribe m [2,3] para acceder a la segunda fila, el valor tercera columna de la matriz m.

Las estructuras de datos son un tema avanzado en ciencias de la computación. Por ahora, estamos pegando a la práctica. Sólo recuerde que las estructuras de datos fueron construidas para almacenar tipos de datos específicos y tienen funciones para la inserción de datos, eliminación y recuperación.




» » » » Conceptos básicos de los tipos de datos y estructuras de programación R para análisis predictivo