Los 10 mejores algoritmos de aprendizaje automático: ¿por qué son tan importantes en 2021?
Publicado: 2019-06-10Tabla de contenido
Por la madriguera del aprendizaje automático
Aplicaciones de la vida real
¿Qué se entiende por algoritmos de aprendizaje automático?
Tipos de aprendizaje automático
Los 10 mejores algoritmos de aprendizaje automático
Envolver
En 2021, las computadoras no solo pueden ver , sino que también pueden leer y escribir por sí mismas.
Bueno, echemos un vistazo a la historia de terror moderna en la que realmente vivimos.
Por ejemplo, ¿cómo reaccionaría si alguien le dijera que pronto el 30% de los trabajos serán reemplazados por la automatización? Es indignante, ¿no?
¿Y eso qué tiene que ver con los algoritmos de aprendizaje automático ?
Afortunadamente, hay una luz al final del túnel. Déjame guiarte a través de esto.
En 2021, las computadoras pueden:
- Reconocer voces, rostros y caligrafía. (Estilo CSI…)
- Subtítulos de imágenes automáticamente.
- Aprenda a reconocer el contenido de una imagen y clasificarlo según una característica específica.
- Haz tareas por ti. (Y cree los algoritmos necesarios para llevarlos a cabo).
La lista continúa, por supuesto.
Todos los días hacemos búsquedas en la web, visitamos sitios web y redes sociales. Y nunca nos hacemos la pregunta fundamental:
¿Hasta dónde ha llegado la tecnología de la IA?
¡Aquí vamos!
Los logros de la tecnología están planteando interrogantes sobre el futuro de la humanidad.
Quizás estos hechos nos den una idea:
(Fuente: Futurism , Dezyre )
- En Corea del Sur, de cada 100 trabajadores, 4,78 en promedio son robots .
- El 88% de los empleados en Etiopía corren el riesgo de perder su trabajo debido a los robots.
- En la ciudad de Nueva York, los empleados en peligro son el 40,7% .
- Se necesitan 9 líneas de código para escribir un programa de aprendizaje automático.
- El 97% de los trabajos de cocina de comida rápida serán reemplazados por máquinas.
- El 98% de los agricultores perderán su trabajo a causa de las máquinas.
- El aprendizaje automático puede generar hasta mil millones de dólares al año en la industria farmacéutica.
- En los próximos 10 años, se estima que el aprendizaje automático reemplazará el 25% de los trabajos.
En 2021 podremos tener un robot en casa.
Puede tener una conversación fluida con Jibo o Tapia . Se les llama robots sociales por una razón.
Recuerdan los nombres, rostros y voces de sus amigos y familiares (¡lo cual no es para nada espeluznante!), Pueden cuidar a su hijo (¡oh, sí!), Y si tiene un accidente en casa, llamarán al 911 para usted. Ese último puede ser especialmente útil cuando no hay nadie más alrededor. Pero llegaremos a eso más tarde.
Hoy en día, los algoritmos pueden “aprender por sí mismos” idiomas e incluso traducir el inglés hablado al chino escrito simultáneamente con la fluidez del hablante nativo de chino promedio. Tarde o temprano, el estudio de idiomas extranjeros se volverá inevitablemente obsoleto.
Y que tal esto:
Nuestros teléfonos inteligentes nos están espiando literalmente ... ¡Estoy seguro de que sabes exactamente de lo que estoy hablando! Imagínese: en el almuerzo de la oficina mencionas (¡verbalmente!) Que quieres empezar a ver a Lucifer . De vuelta en tu escritorio, abres Pinterest o Facebook en tu teléfono, y ahí está él, el diablo mismo ... (Sí, Tom Ellis es un sueño, ¡pero ese no es el punto!).
Los sistemas de recomendación están a nuestro alrededor. Si ingresa una búsqueda de "Lego", las imágenes relacionadas que aparecen y se clasifican como Lego, han sido reconocidas como tales por una IA. En otras palabras, no fueron anotados manualmente como bloques de Lego por un humano ...
El algoritmo se había enseñado a sí mismo qué es esto al mirar millones de imágenes.
¡Piel de gallina!
Todas esas capacidades y MUCHO más, ya están siendo utilizadas por las empresas.
Las implicaciones aquí son:
Primero, las computadoras ¡Enséñese a sí mismos , muchachos! Piense en todos los trabajadores robotizados del futuro. Aprenderán y realizarán tareas MUCHO más rápido que los trabajadores humanos.
Y segundo , sé lo que estás pensando, Dios mío, ¡la humanidad está condenada!
Mucha gente reacciona de esta manera.
Muchos autores durante el último siglo han escrito sobre un futuro en el que los robots dominen a los humanos. La inteligencia artificial está floreciendo, los robots gobernarán el mundo y se alimentarán de los humanos. La singularidad está cerca.
Bien, este es un buen lugar para detenerse.
Ahora que hemos sacado eso de nuestro sistema, veamos lo que es realmente cierto.
Por la madriguera del aprendizaje automático
Primero necesitamos algo de contexto.
Hace 15.000 años se inventó uno de los juegos más queridos del mundo. En algún momento entre los siglos XII y XIV, ese juego se conoció como ajedrez .
Tiene 10 elevado a 40 resultados posibles (es decir, 1 con 40 ceros al final).
En 2017, el algoritmo AlphaZero de Google utilizó el aprendizaje automático para aprender a jugar y ganar el juego.
Todo el proceso, desde la introducción del juego al algoritmo, hasta que ganó su primera partida contra Stockfish, uno de los motores de ajedrez más potentes del mundo, requirió:
(¡Prepárate!)
4 horas.
¡Ay!
Sí, estamos al borde de una revolución del aprendizaje automático .
Mirando hacia atrás, esta no es la primera interrupción de este tipo. La revolución industrial de finales del siglo XIX y principios del XX también causó trastornos sociales, pero finalmente, la humanidad y las máquinas lograron un equilibrio.
Sí, las cosas están cambiando, ¡y eso es realmente algo bueno!
El software de aprendizaje automático posee el poder de ver un problema con ojos nuevos y navegar a través de entornos desconocidos.
Entonces, como vamos a ver, no es una historia de terror después de todo.
Más como un milagro tecnológico.
Ahora:
¿Por qué es tan importante la clasificación?
Para empezar, ¿qué es el aprendizaje automático por definición ?
Básicamente, una máquina está programada para enseñarse a sí misma cómo producir un programa y crear soluciones. El aprendizaje automático siempre produce los números más precisos (y, si es necesario, predicciones) posibles.
Piense en una tecnología que pueda resolver una amplia gama de problemas completamente diferentes.
¡Y esa es la belleza!
El objetivo principal del sistema es clasificar . Esto también se llama visión por computadora . Aprenderá por sí solo a hacer distinciones. Y la cantidad de problemas diferentes en el mundo que pueden reducirse a la aparentemente simple tarea de clasificación, es absolutamente alucinante.
Imagínese la capacidad de clasificar entre:
- Posiciones de ajedrez buenas y malas (juego)
- Oraciones gramaticalmente correctas e incorrectas (traducción)
- Una carretera vacía y una con automóviles o peatones en ella (automóviles autónomos)
- Una célula sana y una célula cancerosa (diagnóstico médico)
Esa es exactamente la razón por la que los expertos en muchas áreas se volverán obsoletos. No es necesario ser un experto para crear un código que realice estas tareas. Los chicos que escribieron el programa de traducción simultánea de inglés a chino no hablaban ni una palabra de chino.
El algoritmo se enseñará por sí mismo a ser un experto.
Y sí, es importante aprender sobre ellos y llegar a conocerlos… la forma en que llegamos a conocer las computadoras al principio.
Ahora somos buenos con las computadoras. Tan bueno que tendemos a antropomorfizarlos (¿o tal vez soy solo yo?).
Parece que este es el momento de preguntarnos:
¿Qué pasará con todas esas personas, que eventualmente perderán sus trabajos debido a la inteligencia artificial y los programas de aprendizaje automático?
¿Ha oído hablar de una pequeña cosa llamada Renta Básica Universal?
Aquí va:
En el futuro, los ciudadanos tendrán ingresos que no les impliquen ningún trabajo. El dinero provendrá de la increíble eficiencia que proporcionará la automatización y los ahorros que se derivan de ella.
O esto o, en un escenario un poco más realista, surgirán muchos nuevos tipos de trabajos. A finales del siglo XIX, aproximadamente el 50% de la población de Estados Unidos se dedicaba a la agricultura. Ahora, gracias a las potentes máquinas, menos del 2% son agricultores y, sin embargo, hay personas empleadas.
Ahora bien, ¿para qué se puede utilizar el aprendizaje automático ?
Aplicaciones de la vida real
El aprendizaje automático se puede utilizar para deducir nuevos hechos de una base de datos.
Veamos algunas de las áreas en las que el aprendizaje automático marcará una gran diferencia:
- Conducción asistida : los automóviles pueden presionar el freno automáticamente por usted cuando se acerca al vehículo que está frente a usted. Y así, en algún momento en el futuro, la humanidad casi olvidará lo que significa un accidente automovilístico . Los autos sin conductor están en camino.
- Cuidado de la salud : mejora la eficiencia de los profesionales médicos. El reconocimiento y el diagnóstico de enfermedades serán mucho más fáciles y precisos con la ayuda del aprendizaje automático. Por ejemplo, los programas no solo pueden escanear e identificar imágenes de tejido canceroso mejor que los humanos, sino que también pueden calcular las tasas de supervivencia de los pacientes basándose en enormes bases de datos de registros médicos. (Vea el trabajo de Jeremy Howard y su proyecto llamado Enlitic . ¡Es increíble!)
- Invención de medicamentos : con la ayuda del aprendizaje automático, cada paciente puede recibir un tratamiento diseñado específicamente para él.
- Agricultura : la agricultura se automatizará con visión por computadora y control robótico: calidad y predicción de cultivos, detección de enfermedades, bienestar del ganado y producción.
- Capacidades de lenguaje impulsadas por IA : en un futuro cercano podremos comunicarnos verbalmente con traducción en tiempo real utilizando IA .
El aprendizaje automático es solo una herramienta y seguirá siéndolo en el futuro previsible.
Entonces, no hay necesidad de preocuparse. Siéntate y relájate.
Ahora que hemos visto qué es el aprendizaje automático, hagamos la siguiente pregunta:
¿Qué se entiende por algoritmos de aprendizaje automático?
Entonces, después de establecer cuán importante y beneficioso es para nuestro futuro aprendizaje automático, echemos un vistazo más de cerca a los algoritmos que hacen que la magia suceda.
Una excelente manera de explicar los algoritmos de aprendizaje automático es compararlos con la programación tradicional.
En la programación tradicional , el programador trabaja en equipo con un experto en el campo, para lo cual se está desarrollando el software. Cuanto más compleja sea la tarea, más largo será el código y más difícil será su escritura.
Los algoritmos de aprendizaje automático funcionan de manera bastante diferente. El algoritmo recibe un conjunto de datos para la entrada y uno opcional para la salida. Luego lo analiza (o ellos) y elabora el proceso que debe tener lugar para que se produzca un resultado útil. Hoy, este es un trabajo reservado para un programador humano. En el futuro, eso también cambiará.
Tipos de aprendizaje automático
Hay 4 tipos diferentes de algoritmos de aprendizaje automático .
Aquí están:
1. Aprendizaje supervisado
Los datos de entrada en los algoritmos de aprendizaje supervisado están etiquetados y la salida es conocida y precisa. Para utilizar esta clase de algoritmos, necesitaría una gran cantidad de datos etiquetados. Y puede que no siempre sea una tarea fácil.
Los algoritmos supervisados se dividen en dos categorías: regresión y clasificación . Cada uno examina diferentes conjuntos de datos.
Los algoritmos de regresión son los que hacen predicciones y pronósticos. Entre otros, estos incluyen previsiones meteorológicas, crecimiento de la población y estimaciones de esperanza de vida, previsiones de mercado.
Los algoritmos de clasificación se utilizan para el diagnóstico, la detección de fraudes de identidad, la retención de clientes y, como su nombre indica, la clasificación de imágenes.
2. Aprendizaje no supervisado
Ocurre cuando los datos de entrada no están etiquetados. Organizan los datos en estructuras de grupos. Por lo tanto, cualquier dato de entrada está inmediatamente listo para su análisis.
Dado que los datos no están etiquetados, no hay forma de evaluar la precisión del resultado. Dicho esto, no es la precisión lo que los algoritmos no supervisados están diseñados para perseguir. Los grupos que crea el algoritmo no son de ninguna manera familiares para el programa. Entonces, la idea es ingresar datos, analizarlos y agruparlos en grupos.
Al igual que los algoritmos supervisados, sus primos no supervisados se dividen en 2 categorías: reducción de dimensionalidad y agrupamiento .
Obviamente, los algoritmos de agrupación en clústeres son parte de todo esto. Es útil agrupar datos en categorías, por lo que no tiene que lidiar con cada pieza por sí solo. Estos algoritmos se utilizan sobre todo para la segmentación de clientes y el marketing dirigido.
Los algoritmos de reducción de dimensionalidad se utilizan para el descubrimiento de estructuras, visualización de big data, obtención de características y compresión significativa. Si la agrupación es una cara de la moneda, la reducción de la dimensionalidad sería la otra. Al agrupar los datos en grupos, los algoritmos reducen inevitablemente el número de variables significativas (dimensiones) que describen el conjunto de datos.
Ahora, hay una clase de algoritmos de aprendizaje automático que combina las 2 clases anteriores:
3. Aprendizaje semi-supervisado
Se encuentra entre los algoritmos supervisados con datos etiquetados y los algoritmos no supervisados con datos no etiquetados .
Los algoritmos semi-supervisados utilizan una pequeña cantidad de datos etiquetados y una gran cantidad de datos no etiquetados. Esto puede conducir a una mejora en la precisión del aprendizaje.
También es un gran alivio en términos de recopilación de datos, ya que se necesitan una gran cantidad de recursos para generar datos etiquetados.
4. Aprendizaje por refuerzo
A diferencia de los 3 tipos anteriores, los algoritmos de refuerzo eligen una acción en función de un conjunto de datos. Luego evalúan el resultado y cambian la estrategia si es necesario.
En los algoritmos de refuerzo, creas una red y un bucle de acciones, y eso es todo. Sin crear una base de datos, tiene un ganador. ¿Por qué?
Bueno, fueron los algoritmos de refuerzo los que descubrieron los juegos de damas, ajedrez y Go.
El aprendizaje por refuerzo trabaja sobre el principio de prueba y error. El sistema recibirá una recompensa de algún tipo que le ayudará a medir su tasa de éxito. En el caso de los juegos, la recompensa será el marcador. Siempre que el sistema gana un punto, lo evalúa como un movimiento exitoso y el estado de este movimiento se vuelve más alto. Seguirá repitiendo el ciclo hasta que todos sus movimientos tengan éxito.
Y así es como tenemos un algoritmo que puede dominar el juego de ajedrez en 4 horas.
¡Ahora sabemos!
Bien. Echemos un vistazo a los propios algoritmos:
Los 10 mejores algoritmos de aprendizaje automático
Ahora, antes de comenzar, echemos un vistazo a uno de los conceptos básicos del aprendizaje automático. La regresión , cuando se trata de algoritmos de regresión de aprendizaje automático , significa que el algoritmo intentará establecer una relación entre dos variables.
Hay muchos tipos de regresión: lineal, logística, polinomial, de mínimos cuadrados ordinarios, etc. Hoy solo cubriremos los primeros 2 tipos porque, de lo contrario, esto se publicará mejor como un libro que como un artículo.
Como veremos en un momento, la mayoría de los 10 algoritmos principales son algoritmos de aprendizaje supervisado y se utilizan mejor con Python.
Aquí viene la lista de los 10 mejores algoritmos de aprendizaje automático :
1. Regresión lineal
Es uno de los algoritmos de aprendizaje automático más populares. Funciona para establecer una relación entre dos variables ajustando una ecuación lineal a través de los datos observados.
En otras palabras, este tipo de algoritmos observa varias características para llegar a una conclusión. Si el número de variables es mayor que dos, el algoritmo se denominará regresión lineal múltiple.
La regresión lineal también es uno de los algoritmos de aprendizaje automático supervisados que funcionan bien en Python . Es una poderosa herramienta estadística y se puede aplicar para predecir el comportamiento del consumidor, estimar pronósticos y evaluar tendencias. Una empresa puede beneficiarse de realizar un análisis lineal y pronosticar las ventas para un período de tiempo futuro.
Entonces, si tenemos dos variables, una de ellas es explicativa y la otra es la dependiente . La variable dependiente representa el valor sobre el que desea investigar o hacer una predicción. La variable explicativa es independiente. La variable dependiente siempre cuenta con la explicativa.
El objetivo del aprendizaje automático lineal es ver si existe una relación significativa entre las dos variables y, si la hay, ver exactamente qué representa.
La regresión lineal se considera un algoritmo de aprendizaje automático simple y, por lo tanto, es popular entre los científicos.
Ahora, hay regresión lineal y regresión logística. Echemos un vistazo a la diferencia:
2. Regresión logística
Este es uno de los algoritmos básicos de aprendizaje automático . Es un clasificador binomial que tiene solo 2 estados, o 2 valores, a los que puede asignar los significados de Los datos de entrada se comprimen y luego se analizan.
A diferencia de la regresión lineal, los algoritmos logísticos hacen predicciones utilizando una función no lineal. Los algoritmos de regresión logística se utilizan para la clasificación y no para las tareas de regresión. La "regresión" en el nombre sugiere que los algoritmos usan un modelo lineal y lo incorporan al espacio futuro.
La regresión logística es un algoritmo de aprendizaje automático supervisado que, al igual que la regresión lineal, funciona bien en Python. Desde un punto de vista matemático, si se espera que los datos de salida de la investigación sean en términos de enfermedad / salud o cáncer / sin cáncer, entonces una regresión logística es el algoritmo perfecto para usar.
A diferencia de la regresión lineal donde los datos de salida pueden tener valores diferentes, la regresión logística puede tener como salida solo 1 y 0.
Hay 3 tipos de regresión logística, basados en la respuesta categórica. Estos son:
- Regresión logística binaria : este es el tipo que se usa con más frecuencia si el resultado es una variedad de "sí" / "no".
- Regresión logística multinominal : cuando existe la posibilidad de 3 o más respuestas sin orden.
- Regresión logística ordinal : nuevamente 3 o más respuestas, pero con orden. Por ejemplo, cuando los resultados esperados están en una escala del 1 al 10.
Veamos otro gran algoritmo de clasificación:
3. Análisis discriminante lineal
Este método encuentra combinaciones lineales de características que separan diferentes datos de entrada. El propósito de un algoritmo LDA es examinar una variable confiable como una unión lineal de características. Es una gran técnica de clasificación .
Este algoritmo examina las cualidades estadísticas de los datos de entrada y realiza cálculos para cada clase. Mide el valor de la clase y luego la varianza entre todas las clases.
Durante el proceso de modelado de las diferencias entre clases, el algoritmo examina los datos de entrada de acuerdo con variables independientes.
Los datos de salida contienen información sobre la clase con el valor más alto. Los algoritmos de análisis discriminante lineal funcionan mejor para separar entre categorías conocidas . Cuando es necesario dividir matemáticamente varios factores en categorías, utilizamos un algoritmo LDA.
4. K- Vecinos más cercanos
El algoritmo kNN es uno de los mejores algoritmos de aprendizaje automático para principiantes . Hacen predicciones basadas en datos antiguos disponibles, con el fin de clasificar los datos en categorías basadas en diferentes características.
Está en la lista de algoritmos de aprendizaje automático supervisados, que se utiliza principalmente para la clasificación. Almacena los datos disponibles y los utiliza para medir similitudes en casos nuevos.
La K en kNN es un parámetro que denota el número de vecinos más cercanos que se incluirán en el “proceso de votación por mayoría”. De esta manera, los vecinos de cada elemento “votan” para determinar su clase.
Una de las mejores formas de utilizar el algoritmo kNN es cuando tiene un conjunto de datos pequeño y sin ruido y todos los datos están etiquetados. El algoritmo no es rápido y no se enseña por sí mismo a reconocer datos no limpios. Cuando el conjunto de datos es más grande, no es una buena idea usar kNN.
El algoritmo kNN funciona así: primero, se especifica el parámetro K, después de lo cual el algoritmo crea una lista de entradas, que está cerca de la nueva muestra de datos. Luego encuentra la clasificación más común de las entradas y, finalmente, da una clasificación a la nueva entrada de datos.
En términos de aplicaciones de la vida real, los motores de búsqueda utilizan algoritmos kNN para establecer si los resultados de la búsqueda son relevantes para la consulta. Son el héroe olvidado que ahorra tiempo a los usuarios cuando realizan una búsqueda.
Luego viene el Tree-Trio: Regression Trees , Random Forest y AdaBoost .
Aquí vamos:
5. Árboles de regresión (también conocidos como árboles de decisión)
Sí, se llaman árboles , pero como estamos hablando de algoritmos de aprendizaje automático, imagínelos con las raíces en la parte superior y las ramas y hojas en la parte inferior.
Los árboles de regresión son un tipo de algoritmo de aprendizaje supervisado que, sorpresa, funciona bien en Python. (La mayoría de los algoritmos de ML lo hacen, por cierto).
Estos "árboles" también se denominan árboles de decisión y se utilizan para el modelado predictivo . Requieren relativamente poco esfuerzo por parte del usuario en términos de la cantidad de datos de entrada.
Su representación es un árbol binario y resuelven problemas de clasificación. Como sugiere el nombre, este tipo de algoritmo utiliza un modelo de decisiones en forma de árbol. Realizan cribado variable o selección de características. Los datos de entrada pueden ser tanto numéricos como categóricos.
¡Traducción por favor!
Seguro. Cada vez que toma una decisión, pasa a una nueva situación, con nuevas decisiones que tomar. Cada una de las posibles rutas que puede tomar es una "rama", mientras que las decisiones en sí mismas son los "nodos". Su punto de partida inicial es el nodo principal.
Así es como un algoritmo de árbol de decisión crea una serie de nodos y hojas. Lo importante aquí es que todos provienen de un nodo. (Por el contrario, los algoritmos de bosque aleatorios producen varios árboles, cada uno con su nodo principal).
En términos de aplicación en la vida real, los árboles de regresión se pueden usar para predecir las tasas de supervivencia, las primas de seguros y el precio de los bienes raíces, en función de varios factores.
Los árboles de regresión “hacen crecer” ramas de decisiones hasta que se alcanza un criterio de parada. Funciona mejor con pequeñas cantidades de datos de entrada porque, de lo contrario, es posible que obtenga un conjunto de datos de salida sesgado.
El algoritmo decide dónde dividir y formar una nueva rama a partir de una decisión, basándose en múltiples algoritmos. Los datos se dividen en regiones de subnotas, que se reúnen en torno a todas las variables disponibles.
6. Bosque aleatorio
El algoritmo de bosque aleatorio es otra forma de aprendizaje automático supervisado . Produce varios árboles de decisión, en lugar de solo uno, como los árboles de regresión. Los nodos se distribuyen aleatoriamente y su orden no tiene importancia para los datos de salida. Cuanto mayor sea la cantidad de árboles, más preciso será el resultado.
Este tipo de algoritmo se puede utilizar tanto para clasificación como para regresión. Una de las características asombrosas del algoritmo de bosque aleatorio es que puede funcionar cuando falta una gran proporción de los datos . También tiene el poder de trabajar con un gran conjunto de datos.
En el caso de la regresión, estos algoritmos no son la mejor opción, porque no tiene mucho control sobre lo que hace el modelo.
Los algoritmos de Random Forest pueden resultar muy útiles en el comercio electrónico. Si necesita establecer si a sus clientes les gustará un par de zapatos en particular, solo necesita recopilar información sobre sus compras anteriores.
Incluye el tipo de zapatos, si tenían tacón o no, el sexo del comprador y el rango de precios de los pares anteriores que pidieron. Estos serán sus datos de entrada.
El algoritmo generará suficientes árboles para proporcionarle una estimación precisa.
¡De nada!
Y aquí viene el último algoritmo del sistema de árboles:
7. AdaBoost
AdaBoost es la abreviatura de Adaptive Boosting. El algoritmo ganó el premio Godel en 2003 para sus creadores.
Como los dos anteriores, este también usa el sistema de árboles. Solo que en lugar de múltiples nodos y hojas, los árboles en AdaBoost producen solo 1 nodo y 2 hojas, también conocido como un tocón .
Los algoritmos de AdaBoost difieren sustancialmente de los árboles de decisión y los bosques aleatorios .
Vamos a ver:
Un algoritmo de árbol de decisión utilizará muchas variables antes de producir una salida. Un muñón solo puede usar 1 variable para tomar una decisión.
En el caso de algoritmos forestales aleatorios , todos los árboles son igualmente importantes para la decisión final. Los algoritmos AdaBoost dan prioridad a algunos tocones sobre otros.
Y por último, pero no menos importante, los árboles forestales aleatorios son más caóticos , por así decirlo. Lo que significa que la secuencia de árboles es irrelevante. El resultado no depende del orden en que se produjeron los árboles. Por el contrario, para los algoritmos AdaBoost, el orden es esencial.
El resultado de cada árbol es la base del siguiente. Entonces, si hay un error en el camino, todos los árboles posteriores se verán afectados.
Muy bien, entonces, ¿qué puede hacer este algoritmo en la vida real?
Los algoritmos AdaBoost ya brillan en la atención médica, donde los investigadores los utilizan para medir los riesgos de enfermedades. Tienes los datos, pero diferentes factores tienen diferente gravedad. (Imagine que se cayó sobre su brazo y sus médicos usan un algoritmo para determinar si está roto o no. Si los datos de entrada contienen tanto la radiografía de su brazo como una foto de su uña rota ... bueno, es bastante obvio qué muñón se le dará más importancia a.)
Ahora, estamos fuera del bosque, por así decirlo, así que echemos un vistazo a otros 3 tipos de algoritmos de aprendizaje automático:
8. Bayes ingenuo
Este es útil cuando tiene un problema de clasificación de texto . Es el algoritmo de aprendizaje automático que se utiliza cuando uno tiene que lidiar con conjuntos de datos de gran dimensión, como la filtración de spam o la clasificación de artículos de noticias.
El algoritmo lleva este nombre de firma porque considera que cada variable es independiente. En otras palabras, considera que las diferentes características de los datos de entrada no tienen ninguna relación. Esto lo convierte en un clasificador probabilístico simple y eficaz.
La parte "Bayes" del nombre se refiere al hombre que inventó el teorema utilizado para el algoritmo, a saber, Thomas Bayes. Su teorema, como puede sospechar, examina la probabilidad condicional de eventos.
Las probabilidades se calculan en dos niveles. Primero, la probabilidad de cada clase. Y segundo, la probabilidad condicional según un factor dado.
9. Aprendizaje de la cuantificación de vectores
El algoritmo Learning Vector Quantization, o LVQ, es uno de los algoritmos de aprendizaje automático más avanzados .
A diferencia del kNN, el algoritmo LVQ representa un algoritmo de red neuronal artificial . En otras palabras, tiene como objetivo recrear la neurología del cerebro humano.
El algoritmo LVQ utiliza una colección de vectores de libro de códigos como representación. Esas son básicamente listas de números, que tienen las mismas cualidades de entrada y salida que sus datos de entrenamiento.
10. Máquinas de vectores de soporte
Estos son uno de los algoritmos de aprendizaje automático más populares .
El algoritmo Support Vector Machines es adecuado para casos extremos de clasificaciones . Significado: cuando el límite de decisión de los datos de entrada no está claro. La SVM sirve como una frontera que segrega mejor las clases de entrada.
Las SVM se pueden utilizar en conjuntos de datos multidimensionales. El algoritmo transforma el espacio no lineal en un espacio lineal. En 2 dimensiones puede visualizar las variables como una línea y así tener más facilidad para identificar las correlaciones.
Las SVM ya se han utilizado en una variedad de campos en la vida real:
- En imágenes médicas y tareas de clasificación médica.
- Estudiar la calidad del aire en zonas muy pobladas.
- Para ayudar con el análisis financiero
- En algoritmos de clasificación de páginas para motores de búsqueda
- Para reconocimiento de texto y objetos.
Suena como el cuchillo suizo de los algoritmos ML, ¿no es así?
Envolver
Los seres humanos y las computadoras pueden trabajar juntos con éxito.
Los investigadores aseguran que esto puede asociación, y darán resultados sorprendentes. Los algoritmos de aprendizaje automático ya están ayudando a la humanidad de varias maneras.
Una de las funciones más importantes del aprendizaje automático y los algoritmos de IA es clasificar.
Veamos los 10 mejores algoritmos de aprendizaje automático una vez más en pocas palabras:
- Regresión lineal : se utiliza para establecer la relación entre 2 variables: una Regresión logística : un clasificador binomial, solo hay 2 resultados posibles de cada consulta.
- Análisis discriminante lineal : funciona mejor para clasificar datos entre categorías conocidas.
- Vecino más cercano : clasifica los datos en categorías.
- Árboles de regresión : se utilizan para el modelado predictivo.
- Bosque aleatorio : se utiliza con grandes conjuntos de datos y cuando falta una gran proporción de los datos de entrada.
- AdaBoost : clasificaciones binarias.
- Naive Bayes : modelado predictivo.
- Learning Vector Quantization : un algoritmo de red neuronal artificial.
- Support Vector Machines : casos extremos de clasificación en un conjunto de datos multidimensional.
Todos estos algoritmos (más los nuevos que están por venir) sentarán las bases para una nueva era de prosperidad para la humanidad. Hará posible (e incluso necesario) una renta básica universal para asegurar la supervivencia de las personas menos capaces. (¿Quién de otra manera se rebelará y arruinará nuestra sociedad. Oh, bueno).
Bueno, ¿quién hubiera pensado que un artículo sobre algoritmos de aprendizaje automático sería tan sorprendente? Bueno, eso fue todo por hoy.
¡Nos vemos pronto chicos!
Preguntas más frecuentes
El aprendizaje automático es asombroso y arroja luz sobre el futuro de la tecnología. Eso tiene algunos costos. Por ejemplo, las computadoras que albergan programas de aprendizaje automático consumen enormes cantidades de electricidad y recursos. Otra deficiencia del aprendizaje automático hasta ahora ha sido la desambiguación ocasional de entidades. A veces, las máquinas no pueden distinguir entre, digamos, el nombre de Anne Hathaway y el valor de las acciones de Berkshire Hathaway. Cada vez que la actriz recibe atención de los medios, la empresa gana dinero ...
El aprendizaje automático es un método de cálculo. Mientras que los algoritmos "tradicionales" necesitan un programador para escribirlos, los de aprendizaje automático básicamente se entrenan a sí mismos. ¡Sí, no es broma!
Eso depende de la tarea que deba realizar. La elección del mejor algoritmo para la tarea en cuestión depende del tamaño, la calidad y la diversidad de su entrada, así como del tipo de datos de salida que solicita el usuario.
Como cualquier otra cosa, el proceso comienza con conocer los conceptos básicos del algoritmo que ha elegido para su problema. Deberá consultar diferentes fuentes de aprendizaje y elegir la que mejor se adapte a sus necesidades. Luego, comience dividiendo el algoritmo en unidades pequeñas. Comience con un ejemplo simple, y cuando domine las cosas, valide con una implementación confiable. Y luego completas todo el proceso. Probablemente suene más difícil de lo que es. ¡Pero vale la pena intentarlo!