Por Juan Coria, Gonzalo Sisto, Rodolfo Figueroa y Marcelo Giaquinta (YPF) y Ricardo Handson (Axonier).
Un repaso por la estrategia de la operadora argentina para integrar los numerosos archivos físicos y digitales generados a través de su amplia e histórica operatoria.
Planteo del problema
Dentro del ámbito de la información técnica de Upstream, YPF posee una veintena de Archivos Físicos conteniendo más de un millón y medio de elementos distribuidos en las distintas operaciones del país y un Gestor Documental con más de dos millones de documentos digitales.
Respecto de los Archivos Físicos, no existía una solución integrada y centralizada para gestionarlos conjuntamente, por consiguiente, la catalogación de los elementos carecía de validaciones estándares y dificultaba la implementación de un proceso homogéneo de gestión de préstamos y devoluciones. Esto generaba -entre otros- inconsistencias en la clasificación entre los diferentes archivos técnicos e impedimento de consultas en forma remota de existencia de material en los distintos sitios lo que impactaba en la disponibilidad y uso de la información.
Sobre el Gestor Documental se requería una reorganización de los metadatos para poder soportar nuevas clasificaciones y una actualización de la aplicación para incorporar nuevas funcionalidades.
En este contexto se implementó un proyecto para integrar estos ambientes de información y ampliar las facilidades de búsqueda, explotación y administración del contenido.
Se comenzó con la revisión, reorganización e integración de los metadatos del Gestor Documental como del catálogo de los Archivos Físicos y continuó con la búsqueda e implementación de una única plataforma que debía reemplazar a las dos existentes, que estuviera acorde con los avances tecnológicos actuales, que incorporara nuevas funcionalidades y que sea “amigable” tanto con usuarios finales como así también con los administradores del contenido de estas.
Desarrollo técnico del trabajo
Análisis y redefinición del modelo de metadatos basado en Dimensiones
Con el objetivo de clasificar la información estratégica proveniente de los diferentes sectores y nuevas áreas incorporadas a la compañía a través del tiempo, se buscó unificar los criterios de clasificación de la información física y digital, ya que no solo se busca almacenar el contenido de los documentos y los elementos físicos, sino que también se deben de clasificar correctamente dentro de la estructura documental y dotarlos de los metadatos necesarios para garantizar su accesibilidad, integridad y autenticidad.
El proceso requiere que previamente se haya definido el modelo de clasificación, el cual en estos ambientes se basa en la definición de un conjunto de metadatos tanto para la identificación de contenido como para resto de la gestión de los mismos.
La premisa fue obtener un modelo de clasificación lógica con el propósito de encontrar la información de manera más rápida y eficiente y que no se basara solamente en “navegar” a través de una jerarquía de documentos o los datos de un elemento físico, sino que cada elemento o documento debe estar descripto a partir de meta atributos integrados, comunes y únicos, que permitan accederlos directamente.
Para el desarrollo del nuevo modelo de metadatos y la migración del actual al mismo, se trabajó en base a:
- Análisis de las clasificaciones existentes del Gestor Documental, de los Archivos Físicos y de otros entornos como bases de datos con información relacionada
- Usos del lenguaje y nombres locales: los términos históricamente utilizados en YPF fueron tomados en cuenta –por relevamiento- para ajustar el modelo; ya que a través de ellos se clasifican, interpretan el contenido y busca la información por parte de los usuarios
- Asegurar el orden, clasificación y relación con otros entornos que modelo existente resolvía: en el modelo del Gestor Documental, cada documento estaba asociado a 65 metadatos, que reflejaban las distintas maneras, usos y necesidades de ordenar, clasificar y buscar la información que se fueron necesitando al través del tiempo. Algunos definidos por los administradores y otras necesarias por la lógica de las aplicaciones que los gestionaban.
- Modelos estándares: se revisaron las definiciones, metodologías y sugerencias de estándares de la industria y otros (PPDM, Energistics, Dublin Core, etc) y como también de otros proveedores de taxonomías
- Requerimientos Legales: establecidos por las Autoridades de Aplicación (Nacionales y Provinciales, Entes de Control, etc) y procesos del negocio relacionados con dichos requerimientos.
- Compatibilidad: el nuevo modelo de clasificación debía ser compatible con los propios modelos de repositorios (BD) existentes, dado que en general los documentos y elementos físicos están asociados con grandes volúmenes de información digital almacenadas en dichas bases de datos y que poseen sus modelos de metadatos y mediante el cual es accedida por los usuarios.
En función de estos criterios de análisis se generó un nuevo modelo basado en “dimensiones”. El concepto trata de agrupar los metadatos que en subconjuntos de la misma “naturaleza”, esto es identificar el sentido con el cual se definió y utiliza cada metadato. A modo de ejemplo, se identificaron dimensiones para la gestión de los elementos/documentos, para la administración de seguridad, para la asociación con procesos del negocio, para las ubicaciones geográficas, para la relación con otros repositorios, etc. Esto simplifica el diseño, mantenimiento y extensión del modelo completo. Por otro lado, si los elementos de cada subdimensión tienen una relación de jerarquía entre los mismos, permite -por cada dimensión- la creación de “facetas” (facets) lo que brinda -de ser necesario- distintos “árboles de navegación” en jerarquías especializadas y consistentes, evitando así la definición de una única jerarquía para todos los metadatos, que en general es muy difícil de lograr sin sacrificar niveles de clasificaciones. En resumen, las facetas permiten que un mismo elemento pueda ser encontrado “navegando” jerarquías de metadatos de distintas naturalezas.
Una de las dimensiones más importante está formada por los metadatos que describen la asociación de los (contenidos de) documentos/elementos con el Upstream. Para mantener la simplicidad del modelo, se dividió la posible información del Upstream a gestionar en “activos o maestros” por especialidad y de esta manera luego se utiliza metadatos de “tipo y subtipo” específica.
El modelo resultante fue aplicado, soportando la información técnica existente y permitiendo la integración entre los ambientes Documental y de Archivos Técnicos.
Evaluación de arquitecturas y elección de la nueva plataforma técnica
Siguiendo los lineamientos estratégicos de la Compañía, se analizaron algunas herramientas disponibles en el mercado que fueran capaces de cubrirlos y además resolver los procesos de negocio actuales, cubrir las deficiencias o faltantes y sentar las bases en un punto que permita el crecimiento, incorporar nuevos orígenes y una fácil evolución hacia nuevas herramientas y plataformas con la respectiva integración.
Para este fin, de debía lograr integrar, no solo dos procesos claves de Upstream, sino además la información de los Archivos Físicos que estaba soportada en sistemas stand- alone, lo cual representaba un fuerte trabajo en normalización y posterior migración de información.
Dentro de la evaluación se ponderaron ciertos requisitos de mínima, que fueron: plataforma en la nube, la cual debía ser factible de elegir por YPF, ser líder en la industria, con amplia experiencia a nivel internacional en implementaciones que la envergadura de YPF requiere y que agilice y facilite la integración, tanto en la misma nube como contra sistemas on-premise para el intercambio de información, sea API compatible trabajando vía servicios.
El logro de encontrar esta combinación de componentes aseguró estar en un punto óptimo, tanto tecnológico como de capacidad de crecimiento para encarar los nuevos desafíos que la industria requiere día a día.
La evaluación consistió en la ejecución de pruebas de concepto de empresas que disponían plataformas con estas características, las cuales fueron evaluadas por especialistas de las distintas áreas involucradas para poder analizar la factibilidad de las mismas, entre las que se destacaron: Tecnología de Operaciones, Data Management, Data Governance, Seguridad, Ciberseguridad, Arquitectura, Infraestructura, Especialidades Técnicas y SSII.
Esta fue una de las primeras implementaciones de aplicaciones de Upstream de YPF en el mundo de “la nube”, lo cual representó un desafío adicional no solo tecnológicamente, sino que en paralelo se estaban desarrollando los conocimientos técnicos, definición de políticas y demás temas implicados en la transformación. Esto brindó un sinfín de lecciones aprendidas y experiencias adquiridas para los nuevos desafíos.
Resultados obtenidos
Luego de la ejecución de un proyecto donde participaron una variedad de equipos técnicos, el éxito de este se puede medir a través de la obtención de distintos objetivos planificados, todo ellos alineados para soportar uno en común que es aseguramiento del resguardo y la maximización del uso de la información por parte de los técnicos del Upstream:
- Redefinición del modelo de metadatos, con la máxima integración entre el Gestor Documental y Archivos Técnicos.
- Alineación del modelo de metadatos con los modelos de los repositorios (BD) con información relacionada.
- Plataforma técnica estable y escalable.
- Flexibilidad y facilidades de integración de la herramienta con resto de sistemas base para el correcto funcionamiento de los flujos de proceso como así también nuevos requerimientos de valor para otros.
- Nuevas facilidades de los módulos de préstamos y devoluciones para la gestión de la información física de los Archivos de YPF.
- Posibilidad de consulta y gestión simultánea a la información digital / física de múltiples usuarios en diferentes ubicaciones.
- Búsqueda e identificación más precisa y rápida de la información. OCR de contenido y técnicas de manejo de información estructurada y no estructurada.
- Mejor gestión de intercambio entre las fuentes integradas y los usuarios.
- Simplificación y optimización los procesos de clasificación de la información.
- Modelo de denominaciones más consistentes en la catalogación, lo que permite un acceso más fácil.
- Facilita la implementación de políticas de destrucción de registros/documentos físicos, reduciendo los costos de almacenamiento físico.
- Permite homogeneizar las políticas de acceso y auditorías de contenido, como también indicadores y trazabilidad de uso del mismo.
Conclusiones
Dentro del gran abanico de información y tipos de datos que gestiona YPF en la industria del Upstream, el cambio de plataforma técnica de la gestión integrada de documentos y elementos físicos en gran volumen y distribuidos geográficamente presentó desafíos no menores.
Fue fundamental analizar ampliamente la lógica de clasificación que se utilizaría teniendo en cuenta los metadatos no solo como como identificación interna de los elementos, sino la relación con el resto de los repositorios relacionados y manteniendo en lo posible la terminología históricamente usada para referirse a la información. Todo esto dentro de un marco que permitiera la extensión del modelo para incorporar nuevos tipos de documentos o elementos que se requieran en el tiempo.
Por otro lado, la incorporación de una aplicación basada en la nube heredó todos los beneficios de acceso, disponibilidad, nuevas funcionalidades y manejo de nuevos tipos de datos que las nuevas tecnologías brindan hoy día.
El conjunto de estas mejoras transformó dos ambientes de información técnica separados en uno solo donde las nuevas facilidades de uso y conectividad entre usuarios y administradores lo convierten conceptualmente en un ambiente colaborativo de explotación de la información. |