Análisis

Capítulo 4
Análisis

Como fase de comienzo en el proyecto es necesario realizar el análisis de requisitos junto la organización del conocimiento necesario para su implantación. En la fase de análisis se determinarán los plazos que se requieren para su puesta en marcha. Dicha información se contrastará con cada Jefe de Área utilizando documentación existente y reuniones en las que se expondrán el alcance.

4.1. Toma de requerimientos

La toma de requerimientos o Análisis de requerimientos es necesaria para determinar las necesidades del sistema y posteriormente extraer los casos de uso.

En esta fase extraeremos los requisitos del sistema. Divididos en requisitos funcionales y no funcionales tal como se detalla a continuación.

Se diferenciará entre requisitos funcionales y requisitos no funcionales. Los requisitos funcionales son las declaraciones de los servicios que debe proporcionar el sistema. Es necesario especificar tanto lo que el programa debe hacer como las limitaciones funcionales que le impidan lo que el programa no debe hacer. Los requisitos no funcionales son aquellos que describen las facilidades que debe proporcionar el sistema en cuanto a rendimiento. Estos últimos definen propiedades y restricciones del sistema: tiempos de respuesta, requisitos de almacenamiento, etc.

4.1.1. Requisitos funcionales

  • RF - 1: El sistema guardará información acerca de los productos concretos tales como: nombre, garantía, modelo, además será necesario identificar cada producto de forma unívoca a través del S/N (Serial Number). Como es natural, pueden existir varios modelos para un mismo producto. Por ello será necesario poder recabar información de cada modelo, como puede ser la versión o el año de creación.
  • RF - 2: Para los clientes el sistema ha de manejar sus datos personales: nombre, apellidos, fecha de nacimiento,… así como un atributo adicional para identificarlo y distinguirlo del resto de clientes.
  • RF - 3: El sistema recogerá información acerca de las acciones de los clientes
  • RF - 4: El aprendizaje del sistema es importante para determinar de qué forma suele actuar cada cliente. Esto nos permite averiguar cuáles son sus preferencias y en general los patrones de comportamiento. Los datos se extraerán bien de la forma de actuar de cada cliente o mediante cuestionarios. A partir de estos datos podemos crear perfiles de clientes que actúen de la misma forma.
  • RF - 5: El sistema registrará cada incidencia que el cliente plantee. Cada incidencia recogerá datos como modelo afectado, cliente, así como alguna información extra relacionada con la forma de proceder o solventar. Además se extraerán datos relevantes relacionados con el funcionamiento de cada producto y sobre el uso que cada usuario hace. Dependiendo del tipo de incidencia puede llevarse a cabo distintas alternativas para la solución de la misma como por ejemplo sustituir el producto por otro de características similares. Incluso dependiendo del tipo de cliente (por ejemplo un VIP) que tiene la incidencia se puede actuar de distinta forma como por ejemplo ofrecer un modelo superior a un VIP.
  • RF - 6: Otro aspecto importante a destacar es el funcionamiento de cada modelo. Muchas veces los clientes no entienden el funcionamiento de un producto y existen dudas bastantes comunes. Por ello se crean manuales de usuario que ayuden a comprender su funcionamiento y contienen una lista de preguntas más frecuentes (FAQ). Además si de manera usual una duda sobre el uso del producto lleva a otra duda el sistema indicará la respuesta a la 2ª duda relacionada con la 1ª.

4.1.2. Requisitos no funcionales

Requisitos de sistema
  • RSi - 1: El sistema deberá ser capaz de acceder a los datos de la BBDD en un tiempo razonable. No es lógico que tarde varios minutos cuando se produzca un consulta simple a la BBDD.
Requisitos de seguridad
  • RSe - 1: En los casos que se registre una incidencia, deberá ser solucionada en el menor tiempo posible, haciendo uso de los recursos de la empresa que sean oportunos, siempre que la importancia de la incidencia y el cliente lo permita.
  • RSe - 2: Cada semana se deberá realizar una copia de seguridad de todos los datos con el fin de poder recuperarlos en el caso de que se pierdan por un motivo inesperado.
Requisitos de eficiencia
  • REf - 1: El sistema debe ser capaz de manejar un gran volumen da datos de manera escalable y eficiente. Primando en la complejidad de los algoritmos utilizados ya que el tamaño de los datos es elevado.

4.2. Análisis predictivo

El Análisis predictivo utiliza estadística junto con algoritmos de minería de datos. Se basan en el análisis de los datos actuales e históricos para hacer predicciones sobre futuros eventos. Dichas predicciones raramente suelen ser afirmaciones absolutas, pareciéndose más a eventos y su probabilidad de que suceda en el futuro.

En el mundo de los negocios los modelos predictivos explotan los patrones de comportamiento encontrados en el pasado para poder identificar riesgos y oportunidades. Los modelos capturan las relaciones entre muchos factores permitiendo capturar riesgos potenciales asociados a un conjunto de condiciones, guiando así a la toma de decisiones.

En la banca, típicamente, antes de conceder un crédito, préstamo o hipoteca, evalúan el perfil de riesgo de la persona usando un modelo de puntuación. Los modelos de puntuación tienen en cuenta el comportamiento histórico del cliente, como puede ser el saldo de su cuenta bancaria a lo largo del tiempo, descubiertos, impagados, así como datos “estáticos” del cliente.

El análisis predictivo se utiliza en multitud de campos, aseguradoras, telecomunicaciones, agencias de viaje, farmacéuticas, médicas, etc.

4.2.1. Tipos de análisis predictivos

Para llevar a cabo el análisis predictivo existen 3 modelos que pasaremos a describir:

Modelos predictivos:
Los modelos predictivos analizan los resultados anteriores para evaluar qué probabilidad tiene un cliente para mostrar un comportamiento específico en el futuro con el fin de mejorar la eficacia de marketing. Esta categoría también incluye modelos que buscan patrones discriminatorios de datos para responder a las preguntas sobre el comportamiento del cliente, tales como la detección de tipos de fraudes. Los modelos de predicción a menudo realizan cálculos en tiempo real, durante las operaciones, por ejemplo, para evaluar el riesgo o la oportunidad de un determinado cliente o transacción, a fin de orientar una decisión.
Modelos descriptivos:
Los modelos descriptivos describen las relaciones en los datos para poder clasificar a los clientes en grupos. A diferencia de modelos de predicción que se centran en predecir el comportamiento de un único cliente (como el riesgo de crédito), los modelos descriptivos identifican diferentes relaciones entre clientes o productos. Pero los modelos descriptivos no clasifican a los clientes según su probabilidad de tomar una acción en particular. Los modelos descriptivos se utilizan a menudo “offline” por ejemplo, clasificar a los clientes por las preferencias de los productos según la etapa de la vida. Las herramientas de modelado descriptivo pueden ser utilizadas para desarrollar modelos basados en agentes simulando una gran cantidad de agentes individuales pudiendo predecir acciones futuras.
Modelos de decisión:
Los modelos de decisión describen la relación entre todos los elementos de una decisión – los datos conocidos (incluidos los resultados de los modelos de predicción), la decisión y el plan de variables y valores que determinan la decisión – con el fin de predecir los resultados de las decisiones de muchas variables. Estos modelos pueden ser utilizados en optimización.
Para obtener unos buenos resultados en las acciones propuestas a los usuarios es necesario llevar un seguimiento exhaustivo de todos los movimientos realizados por el cliente. Además resultará de gran importancia datos adicionales que describan el perfil del cliente con el objetivo de poder proponerle acciones más adecuadas, no solo atendiendo a su interacción con el CRMI si no también atendiendo a su edad, profesión, condición social, etc.

Llevar esto acabo es una tarea compleja y requiere de gran cantidad de datos para que los resultados sean fiables. El sistema hará uso de distintas herramientas para obtener todo el conocimiento que necesita. Las distintas herramientas serán:
  • Herramientas estadísticas
  • Data Mining
  • Análisis de archivos de traza

4.3. Información de los clientes

El sistema realiza un seguimiento continuo de todas las interacciones de los clientes con el sistema. De forma conceptual los datos sobre los clientes pueden provenir de distintas fuentes. Por ello el módulo de análisis (mediante técnicas de Data Mining) recuperará distintos datos para describir al cliente:
  • Quién es el cliente (Datos personales, etc)
  • Qué promociones se ofrecieron al cliente (¿Qué acciones se le han hecho al cliente?)
  • Cómo reaccionó el cliente a estas promociones (¿Qué reacciones ha tenido el cliente?)

Figura 4.1: Tres tipos de datos sobre clientes

Conociendo estos 3 tipos de datos sobre un cliente, sería suficiente para que el sistema a través de técnicas de Data Mining pueda buscar patrones de comportamiento y conocer posibles comportamientos futuros. Sin saber quien es el cliente, qué se hizo con él y cómo reaccionó es imposible que el sistema pueda aprender e inferir nuevos comportamientos.
  • Quién es el cliente
    Tanto para optimizar y rentabilizar las interacciones con los clientes como para optimizar el rendimiento del sistema CRMI, es necesario poder distinguir entre clientes buenos y malos, rentables y no rentables. Para ello, es imprescindible conocer quiénes son y cómo se diferencian.
  • Qué promociones se ofrecieron al cliente (acciones realizadas sobre el cliente)
    Para saber si las inversiones en promociones son rentables, hay que tener presente qué se hizo para cada cliente. El departamento de marketing suele llevar a cabo muchas pequeñas promociones y necesita poder diferenciarlas, para poder valorar cuáles funcionan y cuáles no.
  • Cómo reaccionó el cliente a estas promociones (reacciones del cliente)
    Para juzgar el valor real del sistema hay que saber evaluar los resultados. Para ello, es imprescindible saber si el resultado de la promoción fue bueno o malo, información que puede utilizarse para mejorar el sistema en el futuro.
Esta manera de agrupar los datos no es casual. Reflejará las diferencias entre distintos tipos de datos reales almacenados la base de datos. Además, este enfoque permite asegurarse de que el sistema esta siendo abastecido con los tipos de datos necesarios para la herramienta de DM, cuyas conclusiones, a su vez, permiten llevar a cabo la optimización del sistema de CRMI.

Figura 4.2: Información suficiente para realizar Data Mining

4.3.1. Datos descriptivos

Los datos descriptivos proporcionan información sobre el cliente. Suele ser algún tipo de datos resumidos. Normalmente se almacenan en la base de datos en una sola tabla. La descripción del cliente no es un tipo de datos que cambie muy a menudo, dado que recoge parámetros como edad, sexo, domicilio, número de hijos, e-mail, beneficios familiares e individuales, etc. Esta información se debe contrastar periódicamente con fuentes externas. Además sería deseable pero no siempre posible que la información sea revisada de manera periódica (p.e. una vez al año) para comprobar la validez de los mismos. Debido a las dimensiones de la BBDD dicho proceso podría ser irrealizable.
Los datos promocionales incluyen información sobre las acciones emprendidas para cada cliente. La riqueza de este tipo de datos depende de la sofisticación del sistema de CRM. Puede ser una simple lista de promociones (acciones) realizadas para el cliente, por ejemplo, envío de catálogos, muestras gratuitas, descuentos, regalos, etc. Además puede ser una información muy precisa e individualizada, por ejemplo, e-mails enviados y las visitas de clientes a las páginas web sugeridas en estos.

Resumiendo, se pueden obtener los siguientes tipos de información:

  • Tipo de promociónVentas, marketing, publicidad impresa, en radio, en Internet, descuentos, regalos.
  • Descripción de la promociónColor de tarjeta postal, contenido del anuncio radiofónico.
  • Medio
    Mercados por los que circula la publicidad, portales en Internet que muestran los banners.
  • Tiempo
    Fecha y quizá hora de la promoción.
  • Descripción del intento
    Una breve descripción del cliente para el que se concibió la promoción y las razones por las que se eligió la música de fondo utilizada.
  • Financiero
    Coste fijo y variable de la promoción.
Los datos transaccionales engloban los datos referentes a una interacción con el cliente. Pueden incluirlo, desde las llamadas telefónicas realizadas, hasta una el estado de ánimo en cada una de las llamadas, pasando por la lista de productos/servicios adquiridos por el cliente. Estos datos, al igual que los datos promocionales, cambian muy rápidamente. Por ello, se suelen almacenar en estructuras que permiten actualizar y cambiarlos con mucha facilidad. Es un tipo de información muy diferente de la descriptiva, en la que el tipo de datos almacenados no cambia casi nunca. La estructura de los datos transaccionales puede variar drásticamente en un corto período de tiempo, por ejemplo, la introducción de nuevos productos para la venta y la baja de productos más viejos que ya no se venden. Normalmente responden a procesos que estimulan la conducta del cliente, aletargando (sin generar respuesta) o activando su comportamiento.
Los datos del cliente se pueden recoger de diferentes fuentes. La partición de los datos, como se comentó anteriormente, tiene su interés ya que el agrupamiento indica de cierta forma de dónde se pueden obtener los datos. Los datos descriptivos provienen de lo que los propios clientes proporcionan o si no de bases de datos adquiridas a proveedores. La información contenida en las bases de datos puede contener tanto información geográfica como preferencias personales informando de la afinidad hacia ciertos sectores o artículos.
Un CRM es utilizado frecuentemente por el departamento de marketing, ellos son quienes deciden las políticas de la empresa, campañas a realizar, etc. Por este motivo será fácil obtener datos promocionales, tan solo hace falta que el departamento de marketing lleve control de las acciones realizadas a los clientes.
El volumen de datos que se puede obtener de internet es cada vez mayor. Esto es debido a que cada día mas promociones y transacciones ocurren a través de internet. Además internet es perfecto como medio difusor y observador. Por poner un ejemplo, cualquier acción que realice el cliente con el sistema queda registrada, las páginas que visita, los productos que compra, el tiempo que se detiene en cada página, en cada producto, etc. Toda esta información se guarda en un fichero log para posteriormente ser analizada.

Existen diseños de páginas web que su navegación responde a perfiles definidos de cliente, de forma que conduzca en un mínimo número de accesos a la oferta que realmente está interesado el potencial cliente.

De este modo se genera un rico sistema de información en el cual se pueden medir distintas variables sobre el cliente ( sectores de interés, capacidad de compra, etc.) Aún así hay cuestiones que la herramienta de Data Mining no es capaz de inferir con seguridad, por ejemplo: ¿Se pueden obtener las verdaderas motivaciones que hicieron a un cliente elegir un determinando artículo?

Actualmente existen en el mercado herramientas capaces de analizar ficheros log. Son capaces de separar los acontecimientos significativos de los que no lo son.
El almacén de datos (Data Warehouse, DW) es un repositorio que se encarga de conectar y aunar distintas fuentes de información sobre los clientes. El DW suele estar implementado con una única base de datos. En nuestro caso utilizamos una base de datos para el DW para almacenar todos los datos de origen heterogéneo. Además por simplicidad en la misma BBDD se han incorporado algunas tablas que contienen información de gestión para el propio CRMI así como los datos promocionales y transaccionales. El DW solo alberga datos de los clientes que son interesantes para la toma de decisiones. Por rendimiento y prestaciones suele estar alojado en una gran servidor de base de datos que soporte transacciones. El DW servirá de soporte para la toma de decisiones de negocios conforme con los datos almacenados. De ahí radica la importancia de la completitud y exhaustividad de los datos recogidos y almacenados de los clientes.

Un DW necesita identificar al cliente, por lo que se podrá hacer fácilmente utilizado el atributo (Clave primaria ) asignada de cada cliente. Dicha clave primaria coincidirá con su número de DNI.

El DW será una de tantas fuentes que utilice la herramienta de Data Mining para el sistema CRMI. Esto se debe a que el DW almacena gran cantidad de datos haciendo que su capacidad para cambiar se vea mermada. Por otro lado los datos transaccionales y promocionales proporcionan más dinamismo, pudiéndose adaptar más rápidamente a los cambios de mercado y de la competencia. Por este motivo los datos del DW no estarán tan actualizados como debieran, pero debido a su carácter monolítico sería muy costoso actualizarlo constantemente. Algunas partes del DW serán estáticas y otras dinámicas, de esta forma se facilita su actualización.
Los conectores son pequeñas piezas software que permiten interconectar fuentes de datos incompatibles entre si. De tal forma que pueda usarse la herramienta de DM y el CRMI. Estas aplicaciones proporcionan capas de abstracción entre la aplicación y los datos. De esta forma se permite:

  • Incorporar nuevas y cambiantes fuentes de datos.
  • Cambiar el formato de alguna de las fuentes de datos de forma transparente para la aplicación.
  • Permitir el traslado de los datos de manera consistente y reproducible de manera que haya posibilidad de validación.
En nuestro proyecto sólo utilizamos un conector de datos: Connector/J proporcionado por MySQL para conectar la BBDD en MySQL desde Java. En caso de cambiar el diseño del sistema, toda la información referente a los datos se encuentra debidamente separada. Esto ha sido posible mediante la utilización de una librería de etiquetas para recuperar información de la BBDD.

Una gran ventaja de utilizar conectores de datos es la separación del diseño y los datos. De tal forma que se facilite el acceso a los mismos por parte del CRMI y DM. Estos conectores puede ser simple código SQL o enteras aplicaciones software proporcionadas por terceros.
Un árbol de decisión (decision tree) es un método de análisis que se usa para discriminar información en función de atributos (variables) con un grado de significancia determinada , lo que permitirá identificar la estrategia más apropiada y lograr la eficiencia en el trato que se dará al cliente en curso. Para ellos se genera un grafo (árbol) y sus posibles consecuencias asociando a cada una de ellas la probabilidad que ocurra.

El árbol de decisión usa conjuntamente técnicas de minería de datos (Data Mining, DM) y aprendizaje automático para crear un modelo predictivo, esto es, relacionar las observaciones con las conclusiones. Dentro de los árboles de decisión hay varios tipos (árboles de clasificación, árboles de regresión, etc.), cada uno de ellos sirve para un determinado objetivo. En todos estos tipos de árboles las hojas representan la clasificación y las ramas representan conjunciones de características.

Características

  • La decisión sigue un único camino hasta tomar la decisión.
  • No es posible cuánto de adecuada es una decisión tomada.
  • Necesita muchos criterios para tomar una decisión.

Figura 4.3: Ejemplo de árbol de decisión que permite decidir si se oferta un determinado producto a un determinado cliente.

4.7. Árboles de decisión alternativos

Un árbol de decisión alternativo (ADTree) es un método de clasificación. Se comportan como una generalización de los árboles de decisión anteriormente explicados.

Su funcionamiento es similar al de un árbol de decisión, pero contiene algunas modificaciones que aportan mas flexibilidad y mejores características que un árbol de decisión. De tal forma que en cada momento se evalúan alguna de las características de la muestra pero no siempre en el mismo orden ya que no siempre tendrá sentido evaluar todas las características de la muestra dependiendo de sus valores. Además tras cada evaluación se le asigna un valor heurístico. La suma de todos los valores heurísticos o cualquier otra combinación lineal proporciona una medida cuantitativa de la bondad de la muestra. Se establecen intervalos (tranchas) para clasificar los valores de atributos continuos (edad, salario, saldo de cuenta corriente) De este modo se establecen intervalos como valores que permitan preguntar por si los valores corresponden a un intervalo u otro. También es significativo poder definir comportamientos o pesos no absolutos (1 ó 0), sino valores que corresponden a una ecuación lineal, ya que el poder dar un valor al extremo de un intervalo en cierto modo debe mostrar su cercanía al valor del intervalo contiguo.

Además y lo más importante para el proyecto es que a cada clase, en nuestro caso sería <tipo cliente> se le podría asignar a un conjunto de acciones que podrán ser aplicadas de acuerdo a otros criterios del cliente concreto.

Características

  • La decisión puede seguir más de un camino hasta tomar la decisión.
  • Proporciona una heurística de la bondad de la muestra suministrada.
  • El número de criterios para tomar una decisión depende de las características de la muestra.

Unos de los objetivos del CRMI es aumentar los beneficios de la empresa en la que se implanta. Esto es posible por la clasificación de los clientes en grupos. Y a cada uno de los grupos tomar acciones concretas para sacar el máximo beneficio. Como ejemplo clásico e ilustrativo se propone la siguiente clasificación de los clientes, en 4 grupos. En un ejemplo práctico esta aproximación grosso modo podría valer, aunque a posteriori, cada subgrupo y dependiendo del campo de negocio de la empresa podrían aparecer nuevas clasificaciones y políticas. Centrándonos en el ejemplo, el conjunto de clientes se particiona en 4 posibles grupos, aunque el objetivo ideal es que los clientes acaben solo en 2 grupos, el grupo que maximiza la fidelidad y rentabilidad o aquel que la minimiza en cuyo caso dichos clientes la empresa los catalogaría como no deseables y tratará de que dejen de formar parte de los clientes de la empresa ya que no traerán mas que problemas y malos resultados. Entre el blanco y el negro existe una gran variedad de grises correspondiente a los otros 2 grupos aquel en que los clientes son fieles pero no rentables, por lo que habría que proponer acciones para estimular su rentabilidad y el otro grupo compuesto por clientes rentables pero no fieles cuyo objetivo sea aumentar su fidelidad mediante las acciones correspondientes.

Figura 4.4: Ejemplo de un árbol de decisión alternativo que permite obtener una puntuación, evaluando así cómo de apto es el cliente para una determinada acción.

En la figura 4.5 se muestra un diagrama de los 4 grupos con unas pequeñas leyendas de las estrategias a seguir para cada clase. Los círculos de color negro representan clientes concretos. Además se incorporan flechas que indican el movimiento de los clientes a través del espacio bidimensional en función de las variables fidelidad y rentabilidad. Como se puede notar las flechas conducen a los clientes a 2 grupos como se comento anteriormente.

Figura 4.5: Explotación CRMI


No hay comentarios:

Publicar un comentario