| Por Juan Coria, Gonzalo Sisto, Rodolfo Figueroa y Marcelo Giaquinta (YPF) y Ricardo Handson (Axonier). Un repaso por la estrategia de la operadora argentina para integrar los numerosos archivos físicos y digitales generados a través de su amplia e histórica operatoria. Planteo del problema  Dentro del ámbito de la  información técnica de Upstream, YPF posee una veintena de Archivos Físicos  conteniendo más de un millón y medio de elementos distribuidos en las distintas  operaciones del país y un Gestor Documental con más de dos millones de  documentos digitales. Respecto de los Archivos Físicos, no existía  una solución integrada y centralizada para gestionarlos conjuntamente, por  consiguiente, la catalogación de los elementos carecía de validaciones  estándares y dificultaba la implementación de un proceso homogéneo de gestión  de préstamos y devoluciones. Esto generaba -entre otros- inconsistencias en la  clasificación entre los diferentes archivos técnicos e impedimento de consultas  en forma remota de existencia de material en los distintos sitios lo que  impactaba en la disponibilidad y uso de la información. Sobre el Gestor Documental se requería  una reorganización de los metadatos para poder soportar nuevas clasificaciones  y una actualización de la aplicación para incorporar nuevas funcionalidades. En este contexto se implementó un  proyecto para integrar estos ambientes de información y ampliar las facilidades  de búsqueda, explotación y administración del contenido.  Se comenzó con la revisión,  reorganización e integración de los metadatos del Gestor Documental como del  catálogo de los Archivos Físicos y continuó con la búsqueda e implementación de  una única plataforma que debía reemplazar a las dos existentes, que estuviera  acorde con los avances tecnológicos actuales, que incorporara nuevas funcionalidades  y que sea “amigable” tanto con usuarios finales como así también con los  administradores del contenido de estas. Desarrollo técnico del trabajo Análisis  y redefinición del modelo de metadatos basado en Dimensiones Con el objetivo de  clasificar la información estratégica proveniente de los diferentes sectores y  nuevas áreas incorporadas a la compañía a través del tiempo, se buscó unificar los  criterios de clasificación de la información física y digital, ya que no solo  se busca almacenar el contenido de los documentos y los elementos físicos, sino  que también se deben de clasificar correctamente dentro de la estructura  documental y dotarlos de los metadatos necesarios para garantizar su  accesibilidad, integridad y autenticidad.  El proceso requiere que previamente se  haya definido el modelo de clasificación, el cual en estos ambientes se basa en  la definición de un conjunto de metadatos tanto para la identificación de  contenido como para resto de la gestión de los mismos.
 La premisa fue obtener un modelo de  clasificación lógica con el propósito de encontrar la información de manera más  rápida y eficiente y que no se basara solamente en “navegar” a través de una  jerarquía de documentos o los datos de un elemento físico, sino que cada  elemento o documento debe estar descripto a partir de meta atributos  integrados, comunes y únicos, que permitan accederlos directamente.Para  el desarrollo del nuevo modelo de metadatos y la migración del actual al mismo,  se trabajó en base a:
 
              Análisis de las clasificaciones  existentes del Gestor Documental, de los Archivos Físicos y de otros entornos  como bases de datos con información relacionada    
              Usos del lenguaje y nombres locales: los  términos históricamente utilizados en YPF fueron tomados en cuenta –por  relevamiento- para ajustar el modelo; ya que a través de ellos se clasifican,  interpretan el contenido y busca la información por parte de los usuarios  
              Asegurar el orden, clasificación y relación  con otros entornos que modelo existente resolvía: en el modelo del Gestor  Documental, cada documento estaba asociado a 65 metadatos, que reflejaban las  distintas maneras, usos y necesidades de ordenar, clasificar y buscar la  información que se fueron necesitando al través del tiempo. Algunos definidos  por los administradores y otras necesarias por la lógica de las aplicaciones  que los gestionaban.    
              Modelos estándares: se revisaron las  definiciones, metodologías y sugerencias de estándares de la industria y otros  (PPDM, Energistics, Dublin Core, etc) y como también de otros proveedores de  taxonomías  
              Requerimientos Legales: establecidos por las Autoridades de  Aplicación (Nacionales y Provinciales, Entes de Control, etc) y procesos del  negocio relacionados con dichos requerimientos.   
              Compatibilidad: el nuevo modelo de clasificación debía ser  compatible con los propios modelos de repositorios (BD) existentes, dado que en  general los documentos y elementos físicos están asociados con grandes  volúmenes de información digital almacenadas en dichas bases de datos y que  poseen sus modelos de metadatos y mediante el cual es accedida por los  usuarios. En  función de estos criterios de análisis se generó un nuevo modelo basado en  “dimensiones”. El concepto trata de agrupar los metadatos que en subconjuntos  de la misma “naturaleza”, esto es identificar el sentido con el cual se definió  y utiliza cada metadato. A modo de ejemplo, se identificaron dimensiones para  la gestión de los elementos/documentos, para la administración de seguridad,  para la asociación con procesos del negocio, para las ubicaciones geográficas, para  la relación con otros repositorios, etc. Esto simplifica el diseño, mantenimiento y extensión del modelo completo. Por  otro lado, si los elementos de cada subdimensión tienen una relación de  jerarquía entre los mismos, permite -por cada dimensión- la creación de  “facetas” (facets) lo que brinda -de ser necesario- distintos “árboles de  navegación” en jerarquías especializadas y consistentes, evitando así la  definición de una única jerarquía para todos los metadatos, que en general es  muy difícil de lograr sin sacrificar niveles de clasificaciones. En resumen, las  facetas permiten que un mismo elemento pueda ser encontrado “navegando”  jerarquías de metadatos de distintas naturalezas. Una  de las dimensiones más importante está formada por los metadatos que describen  la asociación de los (contenidos de) documentos/elementos con el Upstream. Para  mantener la simplicidad del modelo, se dividió la posible información del Upstream  a gestionar en “activos o maestros” por especialidad y de esta manera luego se  utiliza metadatos de “tipo y subtipo” específica. El modelo resultante fue aplicado,  soportando la información técnica existente y permitiendo la integración entre  los ambientes Documental y de Archivos Técnicos.  
 Evaluación  de arquitecturas y elección de la nueva plataforma técnica   Siguiendo los lineamientos estratégicos de la  Compañía, se analizaron algunas herramientas disponibles en el mercado que  fueran capaces de cubrirlos y además resolver los procesos de negocio actuales,  cubrir las deficiencias o faltantes y sentar las bases en un punto que permita  el crecimiento, incorporar nuevos orígenes y una fácil evolución hacia nuevas  herramientas y plataformas con la respectiva integración.   Para este fin, de debía lograr integrar,  no solo dos procesos claves de Upstream, sino además la información de los  Archivos Físicos que estaba soportada en sistemas stand- alone, lo cual  representaba un fuerte trabajo en normalización y posterior migración de  información. Dentro de la evaluación se ponderaron  ciertos requisitos de mínima, que fueron: plataforma en la nube, la cual debía  ser factible de elegir por YPF, ser líder en la industria, con amplia  experiencia a nivel internacional en implementaciones que la envergadura de YPF  requiere y que agilice y facilite la integración, tanto en la misma nube como  contra sistemas on-premise para el intercambio de información, sea API  compatible trabajando vía servicios. El logro de encontrar esta combinación de  componentes aseguró estar en un punto óptimo, tanto tecnológico como de  capacidad de crecimiento para encarar los nuevos desafíos que la industria requiere  día a día. La evaluación consistió en la ejecución  de pruebas de concepto de empresas que disponían plataformas con estas  características, las cuales fueron evaluadas por especialistas de las distintas  áreas involucradas para poder analizar la factibilidad de las mismas, entre las  que se destacaron: Tecnología de Operaciones, Data Management, Data Governance,  Seguridad, Ciberseguridad, Arquitectura, Infraestructura, Especialidades  Técnicas y SSII. Esta fue una de las primeras  implementaciones de aplicaciones de Upstream de YPF en el mundo de “la nube”,  lo cual representó un desafío adicional no solo tecnológicamente, sino  que en paralelo se estaban desarrollando los conocimientos técnicos, definición de políticas  y demás temas implicados en la transformación. Esto brindó un sinfín de  lecciones aprendidas y experiencias adquiridas para los nuevos desafíos. Resultados obtenidos  Luego de la ejecución de  un proyecto donde participaron una variedad de equipos técnicos, el éxito de  este se puede medir a través de la obtención de distintos objetivos planificados,  todo ellos alineados para soportar uno en común que es aseguramiento del resguardo  y la maximización del uso de la información por parte de los técnicos del  Upstream: 
              Redefinición  del modelo de metadatos, con la máxima integración entre el Gestor Documental y  Archivos Técnicos.Alineación  del modelo de metadatos con los modelos de los repositorios (BD) con  información relacionada.Plataforma  técnica estable y escalable. Flexibilidad  y facilidades de integración de la herramienta con resto de sistemas base para  el correcto funcionamiento de los flujos de proceso como así también nuevos  requerimientos de valor para otros.Nuevas facilidades de los módulos de  préstamos y devoluciones para la gestión de la información física de los  Archivos de YPF.Posibilidad  de consulta y gestión simultánea a la información digital / física de múltiples  usuarios en diferentes ubicaciones.Búsqueda  e identificación más precisa y rápida de la información. OCR de contenido y  técnicas de manejo de información estructurada y no estructurada.Mejor gestión de intercambio entre las  fuentes integradas y los usuarios.Simplificación  y optimización los procesos de clasificación de la información.Modelo  de denominaciones más consistentes en la catalogación, lo que permite un acceso  más fácil.Facilita la implementación de políticas  de destrucción de registros/documentos físicos, reduciendo los costos de  almacenamiento físico.Permite homogeneizar las políticas de  acceso y auditorías de contenido, como también indicadores y trazabilidad de  uso del mismo.   Conclusiones Dentro del gran abanico de información y  tipos de datos que gestiona YPF en la industria del Upstream, el cambio de  plataforma técnica de la gestión integrada de documentos y elementos físicos en  gran volumen y distribuidos geográficamente presentó desafíos no menores.  Fue fundamental analizar ampliamente la  lógica de clasificación que se utilizaría teniendo en cuenta los metadatos no  solo como como identificación interna de los elementos, sino la relación con el  resto de los repositorios relacionados y manteniendo en lo posible la  terminología históricamente usada para referirse a la información. Todo esto  dentro de un marco que permitiera la extensión del modelo para incorporar  nuevos tipos de documentos o elementos que se requieran en el tiempo.
 Por otro lado, la incorporación de una  aplicación basada en la nube heredó todos los beneficios de acceso,  disponibilidad, nuevas funcionalidades y manejo de nuevos tipos de datos que  las nuevas tecnologías brindan hoy día.
 El conjunto de estas mejoras transformó  dos ambientes de información técnica separados en uno solo donde las nuevas facilidades  de uso y conectividad entre usuarios y administradores lo convierten  conceptualmente en un ambiente colaborativo de explotación de la información. |