in

Configuración de formatos de archivo de texto de ancho fijo

Configuración de formatos de archivo de texto de ancho fijo

Estás aquí: Empezando > Configuración de formatos de archivo de texto de ancho fijo

Cuando define un nuevo almacén de datos que se conecta a un archivo de texto de ancho fijo, el asistente de Nuevo almacén de datos le pedirá que defina los nombres y tamaños de los campos de datos en el archivo.

Los datos de un archivo de texto de ancho fijo se organizan en filas y columnas, con una entrada por fila. Cada columna tiene un ancho fijo, especificado en caracteres, que determina la cantidad máxima de datos que puede contener. No se utilizan delimitadores para separar los campos del archivo. En cambio, cantidades más pequeñas de datos se rellenan con espacios para llenar el espacio asignado, de modo que el comienzo de una columna determinada siempre se puede especificar como un desplazamiento desde el comienzo de una línea. El siguiente fragmento de archivo ilustra las características comunes a muchos archivos planos. Contiene información sobre los automóviles y sus propietarios, pero no hay encabezados en las columnas del archivo ni información sobre el significado de los datos. Además, los datos se han distribuido con un solo espacio entre cada columna, para facilitar la lectura:

Para analizar correctamente los datos en un archivo de texto de ancho fijo, OEDQ debe estar informado de los tamaños de columna implícitos en ese archivo. Esto se hace en el asistente Nuevo almacén de datos y se puede editar como parte de la configuración del almacén de datos más adelante, si es necesario.

Cuando ingresa por primera vez a la pantalla de configuración del almacén de datos para un archivo de texto de ancho fijo, la tabla de columnas está vacía. En la siguiente captura de pantalla, se ha completado con la información de mapeo para algunas de las columnas en nuestro archivo de muestra:

Cada columna se describe a OEDQ por su posición inicial y ancho, en caracteres. A cada columna también se le asigna un nombre, que se utiliza en las instantáneas de datos y el procesamiento posterior para que los datos puedan identificarse. Los nombres los define el usuario en el momento en que se define el almacén de datos y deben ser descriptivos, para una máxima usabilidad posterior.

Observe que las posiciones de las columnas de datos se definen en términos de punto de inicio y ancho. Tenga en cuenta también que el primer carácter de una línea está en la posición 1, no en cero. Proporcionar un ancho y un punto de partida para cada columna significa que OEDQ no asume que una columna continúa hasta el comienzo de la siguiente, con el resultado de que:

  • Cualquier espacio que se haya incluido en el archivo para facilitar la lectura, como un solo espacio entre columnas, se puede omitir automáticamente.
  • No es necesario definir asignaciones para cada columna del archivo. Si existen columnas innecesarias, simplemente se pueden omitir de las definiciones de columna en la configuración del almacén de datos. Por ejemplo, no hemos incluido la tercera columna del archivo en nuestras asignaciones, pero debido a que los límites de las columnas circundantes están bien definidos, no se incluirán datos extraños en el conjunto de datos.
  • No es necesario especificar las columnas en el mismo orden en que aparecen en el archivo. El orden de las columnas especificado aquí se reflejará en cualquier instantánea creada a partir de la fuente de datos.

Los botones a la derecha de la tabla de columnas se pueden usar para agregar o eliminar registros, o mover el registro seleccionado hacia arriba o hacia abajo en la lista.

Archivos que no contienen caracteres de nueva línea

De forma predeterminada, se asume que los archivos de ancho fijo se formatearán como ya se describió, con una nueva línea que separa una fila de la siguiente. Sin embargo, algunos archivos no utilizan caracteres de nueva línea para separar filas. Los datos aparecerán así en un editor de texto:

En este caso, el ancho de todo el registro también debe especificarse como parte de la configuración del almacén de datos, para que OEDQ pueda subdividir correctamente los datos en filas. Para hacer esto,

  • Marque la casilla de verificación Registros de ancho fijo debajo de la tabla de columnas, y
  • Especifique el tamaño total del registro, en caracteres, en el cuadro Tamaño del registro:

Calidad de datos empresariales de Oracle® Versión de ayuda 9.0
Copyright © 2006,2011 oracley / o sus afiliadas. Reservados todos los derechos.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

1yMQItROR9uD0 RLf7sFp4g

¿Cómo funciona DBSCAN y por qué deberíamos usarlo?

Tutorial de C # (C Sharp)