Concepto de Inteligencia:

No existe una definición universal de la inteligencia y existen diferentes tipos de inteligencia.

Es la capacidad mental general que, entre otras cosas, compromete la habilidad de cada persona para razonar, planificar, resolver, pensar de manera abstracta, comprender ideas complejas, aprender con rapidez y aprender de la experiencia. Prof. Linda Gottfredson

Inteligencia es pensar, percibir, actuar…

Es la habilidad para conseguir objetivos complejos

La inteligencia implica ciertas actividades mentales como:

  • Aprendizaje: es la habilidad para obtener y procesar nueva información
  • Razonamiento: es la capacidad de manipular información de diferentes maneras
  • Comprensión o entendimiento: es como se considera el resultado de manipular la información
  • Establecer relaciones: determinar cómo los datos validados interactúan con otros datos
  • Separar los hechos de las creencias

Los humanos no tenemos un solo tipo de inteligencia sino inteligencias múltiples que nos permiten llevar a cabo diferentes tipos de actividades (Howard Gardner)

Comencemos definiendo que no es Inteligencia Artificial (IA):

  • Un robot no es IA, un robot es un contenedor de IA, es la computadora dentro del robot (la IA es el cerebro, el robot es el cuerpo). Esta interpretación de lo que la IA puede lograr se basa en lo que una gran cantidad de libros, películas y medios de comunicación crean esas expectativas en las personas.

La IA es la teoría y el desarrollo de sistemas de computación capaces de desarrollar actividades que requieren inteligencia humana como el reconocimiento visual, reconocimiento de la voz, toma de decisiones y traducir idiomas.

Inteligencia Artificial:

La IA no tiene que ver con la inteligencia humana, lo que hace es simularlo. La simulación es la capacidad de predecir lo que es más probable que pase en una situación. Constituye la manera de asociar la búsqueda de un objetivo, el procesamiento de datos para lograr ese objetivo y el proceso de adquisición de datos para entender mejor ese objetivo. La IA se soporta en algoritmos (procedimientos,métodos) que están creados específicamente para lograr estos objetivos. Existe una interfase entre buscar el objetivo, el procesar datos para lograr un determinado objetivo y la manera de adquirir esos datos, utilizarlos para entender el objetivo final. La IA se trata de representaciones para apoyar modelos de pensamientos, percepciones y acciones.

La IA es una rama de las ciencias de computación dedicada a la creación de sistemas que puedan ejecutar tareas que requieren clásicamente de la inteligencia humana

El principio Rumpelstiltskin o Enano Saltarín: al nombrar algo adquieres poder, es decir se tiene el poder de categorizar algo.

Si una máquina se comporta en todos los aspectos como inteligente, entonces debe ser inteligente

Alan Turing

Historia de la IA

  • 1950: fue uno de los años clave para el desarrollo del concepto de IA. Alan Turing exploró la posibilidad de crear máquinas que piensen y creo lo que se conoce como la Prueba de Turing que se utiliza para determinar si una computadora puede pensar de manera inteligente como el ser humano.
  • 1951: Christopher Strachey escribió un programa para jugar ajedrez utilizando una computadora que representa la primera vez que se intenta desarrollar esta posibilidad.
  • 1956: John McCarthy, en la conferencia de Dartmouth, describió por primera vez el término IA.
  • 1959: primer laboratorio de IA en el Instituto Tecnológico de Massachussets.
  • 1960: se introdujo el primer robot en la línea de ensamblaje de General Motors.
  • 1997: Deep Blue desarrollada por IBM vence al campeón mundial de ajedrez Kasparov. Sin embargo esta computadora solo fue capaz de vencer al campeón de ajedrez a pesar de su impresionante hardware y software.

La IA actualmente tiene gran demanda debido a mayor poder computacional, gran cantidad de datos, mejores algoritmos (deep learning), inversiones de grandes compañías.

Lo más importante para la IA son los datos…

Empresas que aplican IA en el área de salud: IBM

Aplicaciones en Gastroenterología

Computer-aided detection (CADe):

  • Algoritmos de Machine learning aplicados para la detección primaria de condiciones patológicas como la detección de pólipos.
  • Es el área más desarrollada en la aplicación de machine learning y deep learning en gastroenterología.
  • Se aplica tanto en Endoscopia como en Colonoscopia.

Computer-aided diagnosis (CADx):

Se puede categorizar la IA de 4 maneras:

  • Actuar de manera humana: para Turing, la IA existirá cuando cuando no seamos capaces de distinguir entre un ser humano y un programa de una computadora en una conversación a ciegas. Se puede utilizar en tecnologías como el procesamiento natural del lenguaje, representación del conocimiento, razonamiento automatizado y machine learning.

En el CAPTCHA (Completely Automated Public Turing Test to Tell Computers and Humans Apart) se aplica la prueba de Turing.

  • Pensar de manera humana: cuando una computadora piensa como un humano, es capaz de realizar tareas que requieren inteligencia, como el hecho de conducir un vehículo. Para determinar si un programa puede pensar debemos contar con un método de como pensamos los humanos basados en un modelado cognitivo: introspección (técnicas para lograr objetivos), pruebas psicológicas (observar la conducta de las personas ya agregarla al banco de datos de conductas similares) y método de imagen del cerebro (monitorear la actividad cerebral por métodos de imagen)
  • Pensar de manera racional: se estudia cómo piensa el ser humano para crear guías que permitan describir la conducta humana. El objetivo es resolver los problemas de forma lógica de ser posible.
  • Actuar de manera racional: se estudia cómo los humanos actúan en situaciones determinadas y nos permite determinar que técnicas son más eficientes y efectivas.

Los procesos humanos difieren de los procesos racionales en su evolución. Un proceso es racional si siempre ejecuta una acción adecuada basado en la información actual (se asume que la información es correcta). Los procesos humanos incluyen instinto, intuición y otras variable y pueden no considerar la información previa.

Categorías de la IA:

  • Inteligencia artificial limitada: es la IA que se especializa en una sola área. Por ejemplo existe un tipo de IA creada para derrotar al campeón mundial de ajedrez pero eso es lo único que hace, Alexa representa también un ejemplo de IA limitada. Se le conoce como IA débil.
  • Inteligencia artificial general o IA a nivel humano: es la IA en la que la computadora es tan inteligente como el humano, es la que puede funcionar intelectualmente como el ser humano incluso el aprendizaje. Las máquinas no poseen actualmente las habilidades del ser humano. Se le conoce como IA fuerte y representa el holy grail para el desarrollo de la IA. Si le digo a la computadora que vaya al otro extremo de la habitación y encienda la luz eso no será posible a pesar de que puede realizar operaciones aritméticas complejas en cuestión de minutos.
  • Superinteligencia artificial: se define superinteligencia aquella que es más inteligente que los mejores cerebros humanos en todos los campos incluyendo creatividad científica, conocimiento general y habilidades sociales.

El objetivo fundamental es construir inteligencia artificial general que sea capaz de manera virtual cualquier objetivo, incluyendo el de aprender.

Paradoja de Moravec: de forma antiintuitiva, el pensamiento razonado humano (el pensamiento inteligente y racional, requiere de poca computación, mientras que las habilidades sensoriales y motoras no conscientes y compartidas con muchos animales, requieren grandes esfuerzos computacionales

Hans Moravec

Un proceso es racional cuando siempre hace lo correcto basado en la información disponible, tomando en cuenta una medida de rendimiento que sea eficaz…

Aprendizaje de Máquinas (Machine Learning)

El término fue descrito por primera vez por Arthur Samuel en 1959. Es una tecnología que ayuda a las máquinas aprender de los datos, esto implica que no dependa de un programador para realizar operaciones sino derivarlos directamente a partir de ejemplos que muestran cómo la computadora debe comportarse. Es un conjunto de métodos computacionales que se basa en el uso de modelos matemáticos para aprender cómo capturar la estructura de los datos. Representa el estudio de algoritmos que mejoran con la experiencia. Cómo se produce gran cantidad de datos esta modalidad permite analizarlos con la finalidad de establecer modelos predictivos que tienen utilidad en muchos contextos. Las máquinas mejoran con la experiencia sin necesidad de algoritmos adicionales.

La inteligencia artificial y el machine learning no son lo mismo. La IA es un método que permite que las máquinas sean inteligentes y machine learning consiste en dar la capacidad a la maquina, posterior al ingreso de una gran cantidad de datos, pueda tomar sus propias decisiones. El machine learning se utiliza para tareas específicas mientras la IA es un término más general.

El machine learning no solo permite el análisis de grandes cantidades de datos, modelos predictivos sino también la resolución de problemas complejos.

Algoritmo

Es una serie de reglas y técnicas estadísticas que se utilizan para aprender patrones de datos y obtener información de los mismos. Los algoritmos son secuencias de operaciones para encontrar soluciones a los problemas en un tiempo razonable.

Un algoritmo es un procedimiento (secuencia de operaciones), usualmente relacionado con la computadora, que permite encontrar la solución correcta a un problema en un tiempo finito y puede predecir si realmente no existe solución a dicho problema

Modelo

El modelo se entrena en base a los algoritmos utilizados en el machine learning.

Hiperparametros: todos los modelos de machine learning (ML) son regulados por lo que se conoce como hiperparametros que gobiernan la arquitectura del modelo y su proceso de entrenamiento. Como ejemplo de hiperparametros en redes neuronales son el número de capas y la tasa de aprendizaje. Estos parámetros no pueden generalmente ser optimizados durante el proceso de entrenamiento y se escogen basados en en número de ensayos.

Variables

Variables de respuesta:

Variables de predicción:

Datos

Training data: es la utilizada para crear el modelo de machine learning que son esenciales para crear la salida o output.

Testing data: es la utilizada para evaluar qué tan efectivo es el modelo para predecir los resultados. Evalúa la eficiencia del modelo.

Proceso

Se trata de construir un modelo predictivo.

  • Definir el objetivo
  • Recolectar datos: es un proceso que toma tiempo, existen herramientas en la Web que permiten la obtención de los datos de forma rápida y confiable ( Cargill)
  • Preparar datos o limpiar datos
  • Explorar datos: trata de conseguir patrones en el conjunto de datos, es una parte muy importante en machine learning
  • Construir un modelo en base a training data (80%) y testing data (20%). Entre más datos en training data se supone que mejor es el testing data. Se definen las variables de acuerdo al tipo de datos y los resultados esperados.
  • Evaluar y optimizar el modelo (testing data)
  • Predecir: variables categóricas o variables continuas

Tipos de Machine Learning

  • Aprendizaje supervisado: se enseña la máquina para utilizar datos que están bien categorizados. Por ejemplo cuando los datos se categorizan en displásicos o no displásicos en el caso de los pólipos. Este tipo de aprendizaje ayuda a predecir las categorías basados en datos bien categorizados. Se utiliza en problemas tipo regresión o para clasificación de datos, amerita supervisión externa. El modelo es aportar datos (input) para obtener datos (output). Utiliza algoritmos tipo regresion lineal, regresion logistica, soporte de vectores,etc.
  • Aprendizaje no supervisado: se enseña a la máquina a utilizar datos que no están bien categorizados lo que permite que el algoritmo actúe sobre esa información aportada sin ningún tipo de guia, por lo tanto no amerita supervisión. En base a la estructura de los datos se predice que datos son similares, puede ser útil cuando no se cuenta con un gold standard para una prueba determinada. El modelo se basa en entender patrones para descubrir output. Utiliza algoritmos tipo promedio-K, promedio-C.
  • Aprendizaje con reforzamiento: es muy diferente cuando se compara con el aprendizaje supervisado y no supervisado. En este caso un agente se pone en un ambiente y aprende a comportarse en este entorno, si obtiene recompensas esto hace que su aprendizaje se oriente a obtenerlas. No se utiliza datos para alimentar este tipo de aprendizaje, no existe supervisión. Sigue el modelo de ensayo y error. Utiliza algoritmos de Q-learning, SARSA. Este tipo de aprendizaje se utiliza en Alfago y Tesla.

TIPOS DE PROBLEMAS EN MACHINE LEARNING

REGRESIÓNCLASIFICACIÓNCLUSTERING
APRENDIZAJE SUPERVISADOAPRENDIZAJE SUPERVISADOAPRENDIZAJE NO SUPERVISADO
OUTPUT ES UNA VARIABLE CONTINUAOUTPUT ES UNA VARIABLE CATEGÓRICASE AGRUPAN LOS DATOS
EL OBJETIVO ES PREDECIREL OBJETIVO ES CATEGORIZAREL OBJETIVO ES AGRUPAR
EJEMPLO: EJEMPLO: PREDECIR SPAMDETECTAR TRANSACCIONES FRAUDULENTAS
ALGORITMO: REGRESIÓN LINEALALGORITMO: REGRESIÓN LOGÍSTICAALGORITMO: K-MEANS
Tipos de Problemas

Algoritmos Supervisados

  • Regresión lineal: es un método para predecir una variable dependiente basado en los valores de variables independientes, se utiliza para predecir cantidades continuas.
  • Regresión logística
  • Árbol de toma de decisiones
  • Bosque aleatorio
  • Clasificador de Bayes
  • Máquinas de soporte de vectores

Deep Learning

Es una tecnología, rama del machine learning, que trata de imitar el cerebro humano utilizando redes neuronales con diferentes capas. En medicina se ha aplicado a un conjunto de problemas clínicos como la detección de cáncer de mama en la mamografia, diagnostico de cáncer de piel y retinopatía diabética. En el campo de la gastroenterología se aplica a un amplio rango de problemas clínicos y de interpretación de imágenes en el área de endoscopia.

Una red neuronal es un grupo de neuronas interconectadas que tienen la capacidad de tener influencia sobre el comportamiento de otras. La diferencia con el machine learning es que las características y las relaciones son aprendidas a partir de los datos disponibles.