El equipo de organización de Codemotion está preparando su próxima conferencia para Abril de este año, por lo que ha abierto la convocatoria para participar en ella como expositor.
¿Tienes un tema para compartir?
¡Apúntate ahora mismo!
La temática de Codemotion no es sólo Inteligencia Artificial y Machine Learning, sino que es mucho más amplia, con temas como: Frontend, Backend, Ciberseguridad, AI/ML, Mobile, IoT, UX, y ¡mucho más!
Hasta ahora lo has hecho genial. Has conseguido los datos, los has filtrado y limpiado, y tienes claro el problema a resolver. Te ha tomado un gran esfuerzo llegar hasta este punto.
Tu próximo paso es seleccionar el modelo a utilizar, lo que puede llegar a ser una tarea algo compleja si tienes en cuenta que existen decenas de modelos para elegir, cada uno con sus detalles y particularidades.
Este resumen de los 8 modelos más utilizados te será muy útil para tener una referencia y orientarte rápidamente. Encontrarás que son muy versátiles y pueden utilizarse de formas muy creativas con excelentes resultados, motivo por el cual se encuentran entre los preferidos de muchos científicos de datos y equipos de Inteligencia Artificial.
Regresión lineal (Linear Regression)
Este algoritmo de aprendizaje supervisado posee excelentes prestaciones por su velocidad de entrenamiento y facilidad de comprensión. Se utiliza cuando hay una relación o dependencia lineal entre las variables independientes y dependientes, obteniendo los coeficientes de una recta que explique el comportamiento de los datos.
Regresión logística (Logistic Regression)
En este caso, el modelo se utiliza con datos discretos y no continuos realizando una clasificación de los datos dependientes en función de las características independientes, obteniendo también una excelente velocidad de entrenamiento. Como resultado se obtiene una probabilidad que los nuevos datos cumplan con el criterio de entrenamiento.
K-medias (K Means Clustering)
Es excelente para trabajar con datos no etiquetados y por lo tanto dentro del conjunto de aprendizaje no supervisado, donde se realiza la agrupación de los mismos en un número K de grupos. Los elementos que conforman los grupos se determinan en base a la distancia entre ellos.
Máquinas de vector soporte (SVM - Support Vector Machine)
Este increíble algoritmo de aprendizaje supervisado se puede utilizar tanto para datos continuos como discretos y es adecuado tanto para regresión como para clasificación. Por medio de una optimización de descenso de gradiente se intenta encontrar una línea que separe las características con una gran distancia para que las suposiciones probabilísticas se puedan hacer con mayor precisión.
Clasificador bayesiano ingenuo (Naive Bayes)
Se puede entrenar de manera muy eficiente en un entorno de aprendizaje supervisado y funciona, en términos simples, asumiendo que la presencia o ausencia de una característica particular no está relacionada con la presencia o ausencia de cualquier otra característica, dada la variable dependiente. Otra ventaja es que solo se requiere una pequeña cantidad de datos de entrenamiento para estimar los parámetros necesarios para la clasificación.
K vecinos más cercanos (KNN - K Nearest Neighbors)
A diferencia de K-medias, este algoritmo es utilizado para realizar clasificación en un entorno de aprendizaje supervisado. Es algo similar a SVM en el sentido de que también intenta dibujar un límite de separación para identificar las entidades. La predicción para un nuevo punto de datos se realiza encontrando los puntos de datos vecinos más similares, y de allí su nombre.
Árbol de decisión (Decision Tree)
Este modelo agrupa las variables independientes agrupando desde las características más comunes hacia las más específicas, creando una serie de ramificaciones hasta las variables dependientes. Es un modelo muy gráfico y fácil de comprender pero hay un inconveniente ya que funciona bien con los datos de entrenamiento, pero cuando se incluyen nuevos datos de prueba, es posible que los resultados no sean tan buenos.
Bosque aleatorio (Random Forest)
Es una combinación de árboles de decisión tal que cada árbol depende de los valores de un vector aleatorio probado independientemente y con la misma distribución para cada uno de estos. De esta manera se resuelve el posible problema del primero respecto del sobreajuste (overfitting). Se utiliza ampliamente ya que es uno de los algoritmos de aprendizaje más certeros que hay disponible. Para un set de datos lo suficientemente grande produce un clasificador muy certero.
Estos algoritmos son ampliamente utilizados por empresas de todos los tamaños para resolver tareas de diferente complejidad. Cada uno de ellos posee sus propias particularidades por lo que es necesario que desarrolles una cierta experiencia con cada modelo, para conocer los métodos con los que lograr el ajuste de sus parámetros de forma más adecuada.
Si dominas estos 8 modelos de Machine Learning podrás resolver el 80% de los proyectos a los que te enfrentes, logrando resultados excelentes.
Continuando con las posibilidades que brinda el campo de la Inteligencia Artificial responsable, es importante que tengas en cuenta que muchas veces el futuro del trabajo se describe con frecuencia como dominado por un aparato robótico y una gran cantidad de algoritmos que dicen ser personas.
Esta visión corresponde más a la ciencia ficción que a la realidad actual, ya que la adopción de la Inteligencia Artificial se ha pensado, en gran medida, para hacer que los procesos sean más efectivos, y también actualizar y crear productos y servicios.
Por ejemplo, en un estudio de Deloitte que ha consultado a ejecutivos de varias empresas, se ha visto que la disminución de la plantilla es uno de los objetivo menos significativos a la hora de adoptar soluciones de Machine Learning.
El objetivo de proveer a los sistemas de Inteligencia Artificial de un sentido común pueden favorecer y facilitar muchas tareas. No por ello el reto es menor, sino todo lo contrario. A nivel de los humanos todavía se sigue analizando qué es el sentido común.
Pero ten en cuenta el siguiente ejemplo, en un futuro remoto. Te encuentras enfermo y no puedes salir de la cama, por lo tanto le pides a tu robot asistente, que puede hacer muchas cosas, que vaya por el medicamento hasta la farmacia que está muy cerca de tu casa.
El robot, que puede tener una forma de un robot aspirador con alguna extensión, establece el camino hasta la farmacia de manera muy fácil. Va hasta allí, coge el medicamento y regresa, haciendo todas estas tareas de una forma eficiente y en el menor tiempo posible.
Éxito asegurado. ¿O no?
En todo este proceso, tu robot ha pasado por alto un importante detalle de sentido común: ha robado el medicamento, ya que no se ha interesado en la construcción social de intercambiar el dinero por el producto.
El conocimiento del sentido común, en la forma de un procedimiento o conjunto de estos, es un motivo importante a desarrollar en la teoría de la mente para interactuar con humanos.
Existen muchas ideas de cómo este uso puede impactar en diferentes áreas de uso habitual. En radiología, por ejemplo, puede llamar rápidamente la atención sobre determinados hallazgos, así como resaltar determinadas áreas que probablemente no serían captadas fácilmente por el ojo humano. El centrado en el ser humano de la Inteligencia Artificial responsable se convierte en un factor integral cuando los médicos y los pacientes, no las máquinas, toman una decisión final sobre el tratamiento. A fin de cuentas, el aumento de los profesionales médicos con un conocimiento cuantitativo profundo les proporciona datos invaluables para tener en cuenta la decisión.
Al mantener a los humanos actualizados, las organizaciones pueden decidir con mayor probabilidad de éxito el grado de automatización y aumento que necesitan, y controlar el impacto definitivo de la Inteligencia Artificial en su fuerza laboral.
Por lo tanto, las empresas pueden reducir enormemente su riesgo y desarrollar una comprensión más profunda de qué tipo de circunstancias podrían ser las más desafiantes para sus implementaciones de Inteligencia Artificial y aplicaciones
Quieres enviar un email, abres una página web, haces login, lo escribes y lo envías. O quieres poner una foto en Instagram. Lo abres desde el ordenador y ya está. O ingresas desde el móvil. Y eso que habías visto en tu casa ahora se lo quieres mostrar a la gente del trabajo.
Todo esto que haces cada día, desde diferentes dispositivos y en diferentes ubicaciones, forma parte de lo que eres tú en las redes sociales, o en diferentes servicios.
Y todas estas acciones tienen un elemento en común: tu identidad online.
Al acceder a cada uno de estos servicios o aplicaciones, de alguna manera se identifica que quien está accediendo efectivamente seas tú, por medio de una contraseña, de un mensaje al móvil, revisando tu ubicación y por otros métodos.
¿Pero qué sucede si alguien se quiere hacer pasar por tí? ¿Cómo puede un servicio online verificar que tú eres realmente tú y no otra persona que intenta acceder al servicio en tu nombre, con diferentes objetivos?
Estas tareas entran dentro del campo de la ciberseguridad, donde Machine Learning puede ayudar mucho, ya que la suplantación de identidad es un tipo de amenaza que muestra una tasa muy alta de crecimiento y vulnerabilidad, de acuerdo al estudio de Identity Defined Security Alliance (IDSA) titulado "Identity Security: A Work in Progress", realizado con responsables de seguridad de TI o de la gestión de acceso a la identidad en grandes empresas.
Estos son algunos de los datos más importantes que debes conocer:
- Seguridad en evitar un ataque: 26%
Sólo el 26% de las empresas dicen estar muy seguras de que pueden frustrar una suplantación de identidad, aunque es cierto que el 70% está "algo seguro" de poder lograrlo. Un factor clave en este aspecto es el tener que verificar identidades humanas e identidades virtuales, como es el caso de aplicaciones que utilicen un acceso a datos por medio de una API. En el primer caso ya se cuentan con diferentes protocolos para su verificación, pero en el caso del acceso a una API la verificación de identidad es una tarea más compleja.
- Violaciones relacionadas con la identidad: 94%
Prácticamente todos las empresas encuestadas han sufrido un evento de este tipo, lo que es realmente alarmante. Un detalle no menor está relacionado con el tiempo de detección de este problema, que se encuentra, en promedio, en los 206 días para identificar la intrusión inicial, y otros 73 días para resolverla. Esto implica no sólo un problema de imagen hacia los clientes sino también importantes multas. Por ejemplo, las empresas que han logrado detectar y contener una violación de identidad en menos de 200 días gastaron 1,23 millones de dólares menos en costes de infracción.
- Phising y robo de credenciales: +667%
Estos tipos de ataques son los responsables de la mayoría de las violaciones de identidad en los últimos dos años. Desde finales de Febrero de 2020 y en tan sólo 6 meses, los ataques por correo electrónico utilizando estas técnicas relacionándolas con el COVID19, ha aumentado un 667%.
Estos datos muestran una clara oportunidad donde puedes aplicar tus conocimientos de Machine Learning para ayudar que las aplicaciones y los servicios sean cada vez más seguros.
La Inteligencia Artificial se está desarrollando rápidamente como una innovación increíblemente sorprendente, y con un campo de aplicación aparentemente ilimitado. La consolidación de la imaginación y la creatividad humanas con la adaptabilidad de Machine Learning está impulsando nuestra base de conocimientos y comprensión a un ritmo notable.
Sin embargo, la Inteligencia Artificial genera preocupaciones en numerosos frentes debido a su posible efecto disruptivo. Estos miedos incluyen el desarraigo de la fuerza laboral, la pérdida de protección, posibles sesgos en la toma de decisiones y la falta de control sobre los sistemas automatizados y los robots. Si bien estos problemas son dignos de mención, también se pueden abordar con la planificación, supervisión y gobernanza correctas.
A la hora de trabajar con sistemas de Machine Learning que interactúen con personas, ya sea en forma directa o indirecta, es importante que tengas en cuenta cómo se comportan estas personas y qué necesitan. Esto los hará más valiosos y, además, más seguros de utilizar.
Tienes, como mínimo, dos motivos por los que comprender a las personas puede beneficiar a los sistemas inteligentes.
El primer motivo está relacionado con la obtención de datos, ya que muchos sistemas automáticos están diseñados para recoger los datos personales, como fechas de nacimiento y direcciones. Pero se ha visto que las personas no siempre dicen lo que quieren decir, y a veces proporcionan datos falsos o incorrectos.
Otro motivo que debes revisar está relacionado con la interacción con las personas, ya que muchas veces se pasa por alto el simple hecho de no comprender el habla humana o el lenguaje escrito. Esto se puede percibir por las personas como un elemento desmotivador y hasta decepcionante, si parte de la conversación u objetivos son implícitos o públicamente conocidos.
La investigación sobre Inteligencia Artificial responsable es un campo en alza que aboga por mejores prácticas y técnicas en la implementación de modelos de Machine Learning. El objetivo es generar confianza y, al mismo tiempo, limitar los riesgos potenciales no sólo para las organizaciones que implementan estos modelos, sino también para los usuarios que los utilizan.
La Inteligencia Artificial responsable busca reunir las prácticas básicas que permitan garantizar el uso ético, transparente y responsable de las tecnologías de Inteligencia Artificial, de una manera predecible y cumpliendo con las expectativas del usuario, los estándares de calidad, las leyes vigentes y los estándares culturales.
La Inteligencia Artificial responsable puede proteger contra la utilización de información o algoritmos unilaterales, garantizar que las decisiones automatizadas sean defendidas y razonables, y ayudar a mantener la confianza del usuario y la privacidad individual. Al dar reglas claras de participación, la Inteligencia Artificial responsable permite a las empresas bajo el escrutinio público y de las autoridades gubernamentales, mejorar y comprender la capacidad innovadora de la Inteligencia Artificial que es a la vez convincente y responsable.
Machine Learning centrado en las personas es uno de los conceptos más importantes del mercado hasta la fecha. Organizaciones líderes como por ejemplo Stanford y MIT, están creando laboratorios explícitamente para fomentar esta ciencia.
El MIT define este concepto como "el diseño, desarrollo e implementación de sistemas de información que aprenden y colaboran con los humanos de una manera profunda y significativa".
Este campo está en sus comienzos, pero es muy importante que lo tengas en cuenta, tanto para especializarte en esta nueva ciencia como también para implementar este paradigma en tus proyectos.